數(shù)據(jù)掃黃,是怎樣發(fā)現(xiàn)你的?






尾
擴(kuò)展閱讀
在諸多審查工具中,“AI 鑒黃”是最新也最高效的一種。
簡(jiǎn)單來(lái)說(shuō),“AI 鑒黃”就是通過(guò)深度神經(jīng)網(wǎng)絡(luò),按照各種描述特征來(lái)提取圖像中的關(guān)鍵點(diǎn),比如是否出現(xiàn)皮膚裸露等等,將色情圖片與正常圖片進(jìn)行分類。
讀到這里,大家可能會(huì)發(fā)現(xiàn),“AI 鑒黃”還存在一些嚴(yán)峻的挑戰(zhàn),比如:
1.色情圖像和正常圖像有很多相似之處,判斷非常復(fù)雜。游泳、比基尼等圖片中同樣也有大量裸露皮膚,被錯(cuò)誤地歸類為色情并刪除,很可能影響用戶網(wǎng)上沖浪的體驗(yàn)。
2.判斷色情的標(biāo)準(zhǔn)不同。法官斯圖爾特曾有句名言,我無(wú)法定義色情,但當(dāng)我看到它時(shí),我就知道了。對(duì)色情內(nèi)容的監(jiān)測(cè)也有一定的主觀性,AI 往往會(huì)根據(jù)特征對(duì)裸露身體的大衛(wèi)塑像而“痛下殺手”,卻對(duì)部分軟色情輕松放過(guò)。
3.依賴訓(xùn)練數(shù)據(jù)帶來(lái)的風(fēng)險(xiǎn)。那么,是不是給 AI 盡可能多地語(yǔ)料就能幫助它提升識(shí)別的準(zhǔn)確率呢?答案也不行。基于深度學(xué)習(xí)的黑箱性,攻擊者如果知道 AI 鑒黃是根據(jù)哪些數(shù)據(jù)訓(xùn)練出來(lái)的,就可以有針對(duì)性地攻擊、對(duì)抗這個(gè)模型,使其很快失效。
這也是為什么,人工鑒黃師,即人類審查員,依然還需要兢兢業(yè)業(yè)地在崗位上為沖浪護(hù)航。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
(完)
覺(jué)得不錯(cuò),請(qǐng)點(diǎn)個(gè)在看
