數(shù)據(jù)集中存在錯誤標(biāo)注怎么辦? 置信學(xué)習(xí)幫你解決
點擊上方“小白學(xué)視覺”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時間送達

多標(biāo)簽圖像(藍色):在圖像中有多個標(biāo)簽 本體論問題(綠色):包括“是”或 “有”兩種關(guān)系,在這些情況下,數(shù)據(jù)集應(yīng)該包含其中一類 標(biāo)簽錯誤(紅色):數(shù)據(jù)集別的類的標(biāo)簽比給定的類標(biāo)簽更適合于某個示例

什么是置信學(xué)習(xí)?
描述標(biāo)簽噪聲 查找標(biāo)簽錯誤 學(xué)習(xí)噪聲標(biāo)簽 發(fā)現(xiàn)本體論問題

樣本外預(yù)測概率(矩陣大?。侯惖臉颖緮?shù)) 噪聲標(biāo)簽(矢量長度:示例數(shù))
估計給定噪聲標(biāo)簽和潛在(未知)未損壞標(biāo)簽的聯(lián)合分布,以充分描述類條件標(biāo)簽噪聲 查找并刪除帶有標(biāo)簽問題的噪音示例 去除訓(xùn)練誤差,通過估計潛在先驗重新加權(quán)實例
置信學(xué)習(xí)的優(yōu)點
直接估計噪聲和真標(biāo)簽的聯(lián)合分布 適用于多類數(shù)據(jù)集 查找標(biāo)簽錯誤(錯誤按最有可能到最不可能的順序排列) 是非迭代的(在 ImageNet 中查找訓(xùn)練標(biāo)簽錯誤需要 3 分鐘) 在理論上是合理的(現(xiàn)實條件下準確地找到標(biāo)簽誤差和聯(lián)合分布的一致估計) 不假設(shè)標(biāo)簽噪聲是隨機均勻的(在實踐中通常行不通) 只需要預(yù)測概率和噪聲標(biāo)簽(可以使用任何模型) 不需要任何真實(保證不損壞)的標(biāo)簽 自然擴展到多標(biāo)簽數(shù)據(jù)集 作為 cleanlab Python 包,它是免費、開源的,用于描述、查找和學(xué)習(xí)標(biāo)簽錯誤
置信學(xué)習(xí)的原則
剪枝以搜索標(biāo)簽錯誤。例如,通過損失重加權(quán)使用軟剪枝,以避免迭代重標(biāo)記的收斂陷阱。 對干凈數(shù)據(jù)進行統(tǒng)計訓(xùn)練,避免在不完全預(yù)測概率的情況下重新加權(quán)損失(Natarajan et al.,2017),從而避免學(xué)習(xí)模型權(quán)重中的錯誤傳播。 對訓(xùn)練期間使用的示例進行排序,以允許使用不規(guī)范概率或 SVM 決策邊界距離進行學(xué)習(xí)。
置信學(xué)習(xí)是如何工作的?


使用標(biāo)簽噪聲的聯(lián)合分布查找標(biāo)簽問題
將聯(lián)合分布矩陣乘以示例數(shù)。讓我們假設(shè)我們的數(shù)據(jù)集中有 100 個示例。所以,在上圖中(右邊的 Q 矩陣),有 10 個標(biāo)記為 dog 的圖像實際上是狐貍的圖像。 將 10 張標(biāo)記為 dog 的圖片標(biāo)記為標(biāo)簽問題,其中屬于 fox 類的可能性最大。 對矩陣中的所有非對角項重復(fù)此操作。
置信學(xué)習(xí)的實際應(yīng)用




最后的想法
好消息!
小白學(xué)視覺知識星球
開始面向外開放啦??????
下載1:OpenCV-Contrib擴展模塊中文版教程 在「小白學(xué)視覺」公眾號后臺回復(fù):擴展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴展模塊教程中文版,涵蓋擴展模塊安裝、SFM算法、立體視覺、目標(biāo)跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。 下載2:Python視覺實戰(zhàn)項目52講 在「小白學(xué)視覺」公眾號后臺回復(fù):Python視覺實戰(zhàn)項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實戰(zhàn)項目,助力快速學(xué)校計算機視覺。 下載3:OpenCV實戰(zhàn)項目20講 在「小白學(xué)視覺」公眾號后臺回復(fù):OpenCV實戰(zhàn)項目20講,即可下載含有20個基于OpenCV實現(xiàn)20個實戰(zhàn)項目,實現(xiàn)OpenCV學(xué)習(xí)進階。 交流群
歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學(xué)影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關(guān)微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~
評論
圖片
表情

