無需人力標(biāo)注!悉尼大學(xué)華人團(tuán)隊提出「GPT自監(jiān)督標(biāo)注」范式,完美解決標(biāo)注成本、偏見、評估問題

??新智元報道??
??新智元報道??
【新智元導(dǎo)讀】最近,來自悉尼大學(xué)的研究人員提出了一種GPT自監(jiān)督注釋方法,能夠?qū)?shù)據(jù)注釋為簡潔摘要,并在各種注釋任務(wù)中展現(xiàn)出卓越的性能。



數(shù)據(jù)標(biāo)注困難重重
在美國,數(shù)據(jù)標(biāo)注員的平均年薪約為39,000美元,最高可達(dá)49,803美元[2]。即使在印度,數(shù)據(jù)標(biāo)注員的平均年薪約為2.0 Lakhs盧比,約合2,670美元[3]。

全新標(biāo)注方法


作者通過調(diào)整不同的預(yù)訓(xùn)練獎勵模型來評估標(biāo)注的質(zhì)量,并引入不同的評價指標(biāo)來間接評估摘要的還原能力。?
作者在三個具有挑戰(zhàn)性的數(shù)據(jù)集上進(jìn)行了大量實驗,并從各種角度進(jìn)行了詳細(xì)的消融研究。
結(jié)果表明,這種自我監(jiān)督范式在獎勵模型和還原數(shù)據(jù)能力的得分的評估中始終表現(xiàn)出很高的性能。?
另外,作者應(yīng)用該框架生成了兩個新的數(shù)據(jù)集,對基于不同計算操作符的神經(jīng)網(wǎng)絡(luò)架構(gòu)進(jìn)行的描述。?
作者通過調(diào)用OpenAI的API在各種類型的GPT模型上進(jìn)行了基準(zhǔn)測試。
表1展示了davinci,text-curie-001,text-davinci-003,gpt-3.5-turbo在不同評估標(biāo)準(zhǔn)下標(biāo)注數(shù)據(jù)質(zhì)量的得分。




評論
圖片
表情
