大數(shù)據(jù)是怎么發(fā)現(xiàn)你嫖娼的?
福利, 強烈推薦這個神器!
作者:數(shù)據(jù)不吹牛 鏈接:https://www.163.com/dy/article/HF5UJGGH05319928.html






尾
擴展閱讀
在諸多審查工具中,“AI 鑒黃”是最新也最高效的一種。
簡單來說,“AI 鑒黃”就是通過深度神經(jīng)網(wǎng)絡(luò),按照各種描述特征來提取圖像中的關(guān)鍵點,比如是否出現(xiàn)皮膚裸露等等,將色情圖片與正常圖片進行分類。
讀到這里,大家可能會發(fā)現(xiàn),“AI 鑒黃”還存在一些嚴峻的挑戰(zhàn),比如:
1.色情圖像和正常圖像有很多相似之處,判斷非常復(fù)雜。游泳、比基尼等圖片中同樣也有大量裸露皮膚,被錯誤地歸類為色情并刪除,很可能影響用戶網(wǎng)上沖浪的體驗。
2.判斷色情的標(biāo)準(zhǔn)不同。法官斯圖爾特曾有句名言,我無法定義色情,但當(dāng)我看到它時,我就知道了。對色情內(nèi)容的監(jiān)測也有一定的主觀性,AI 往往會根據(jù)特征對裸露身體的大衛(wèi)塑像而“痛下殺手”,卻對部分軟色情輕松放過。
3.依賴訓(xùn)練數(shù)據(jù)帶來的風(fēng)險。那么,是不是給 AI 盡可能多地語料就能幫助它提升識別的準(zhǔn)確率呢?答案也不行。基于深度學(xué)習(xí)的黑箱性,攻擊者如果知道 AI 鑒黃是根據(jù)哪些數(shù)據(jù)訓(xùn)練出來的,就可以有針對性地攻擊、對抗這個模型,使其很快失效。
這也是為什么,人工鑒黃師,即人類審查員,依然還需要兢兢業(yè)業(yè)地在崗位上為沖浪護航。
驚喜!強烈推薦這個神器!