吳恩達(dá)的二八定律:80%的數(shù)據(jù)+20%的模型=更好的機(jī)器學(xué)習(xí)

新智元報(bào)道
【新智元導(dǎo)讀】模型好就能碾壓一切嗎?吳恩達(dá)潑冷水,機(jī)器學(xué)習(xí)發(fā)展80%依靠數(shù)據(jù)集的進(jìn)步!這也激起了業(yè)內(nèi)對(duì)MLOps工具鏈的關(guān)注。


MLOps是什么?

MLOps的最重要任務(wù)是提供高質(zhì)量數(shù)據(jù)。 標(biāo)簽的一致性也很重要。檢驗(yàn)標(biāo)簽是否有自己所管轄的明確界限,即使標(biāo)簽的定義是好的,缺乏一致性也會(huì)導(dǎo)致模型效果不佳。 系統(tǒng)地改善baseline模型上的數(shù)據(jù)質(zhì)量要比追求具有低質(zhì)量數(shù)據(jù)的最新模型要好。 如果訓(xùn)練期間出現(xiàn)錯(cuò)誤,那么應(yīng)當(dāng)采取以數(shù)據(jù)為中心的方法。 如果以數(shù)據(jù)為中心,對(duì)于較小的數(shù)據(jù)集(<10,000個(gè)樣本),則數(shù)據(jù)容量上存在很大的改進(jìn)空間。 當(dāng)使用較小的數(shù)據(jù)集時(shí),提高數(shù)據(jù)質(zhì)量的工具和服務(wù)至關(guān)重要。






評(píng)論
圖片
表情
