點(diǎn)擊上方“程序員大白”，選擇“星標(biāo)”公眾號(hào)
重磅干貨，第一時(shí)間送達(dá)

文 | 成指導(dǎo)
源 | 知乎

背景

推薦系統(tǒng)中大量使用用戶行為數(shù)據(jù)，作為系統(tǒng)學(xué)習(xí)的標(biāo)簽或者說(shuō)信號(hào)。但用戶行為數(shù)據(jù)天生存在各式各樣的偏差（bias），如果直接作為信號(hào)的話，學(xué)習(xí)出的模型參數(shù)不能準(zhǔn)確表征用戶在推薦系統(tǒng)中的真實(shí)行為意圖，造成推薦效果的下降。
因此，本篇聊一聊推薦系統(tǒng)中常見(jiàn)的偏差，與相應(yīng)的去偏思路與方法。本篇的主要脈絡(luò)依據(jù)中科大何向南教授、合工大汪萌教授聯(lián)合在 TKDE 上的一篇綜述文章展開(kāi)：Bias and Debias in Recommender System: A Survey and Future Directions。

常見(jiàn)偏差

數(shù)據(jù)偏差

顯式反饋數(shù)據(jù) - Selection Bias

定義：當(dāng)用戶可以自由選擇 item 進(jìn)行評(píng)分，可觀測(cè)到的評(píng)分并不是所有評(píng)分的有代表性樣本。換而言之，評(píng)分?jǐn)?shù)據(jù)是“非隨機(jī)缺失”（missing not at random, MNAR）的

這個(gè)偏差的來(lái)源比較好理解，我們也可以想想自己是不是也是這樣：傾向于評(píng)分喜愛(ài)的 item（例如，熱衷粉絲的電影、歌曲等），傾向于評(píng)分特別好或者特別差的 item（例如，去看電影很想夸好片，很想噴爛片）

顯式反饋數(shù)據(jù) - Conformity Bias

定義：用戶評(píng)分傾向于與其他人相似，即使是完全基于他們自己的判斷，也會(huì)受到影響

這個(gè)偏差是由從眾心理導(dǎo)致的。對(duì)于大眾一致喜歡/討厭的 item，個(gè)體用戶做判斷時(shí)經(jīng)常會(huì)受到外界聲音的影響

隱式反饋數(shù)據(jù) - Exposure Bias

定義：僅有一部分特定 item 曝光給了用戶，因此沒(méi)有觀測(cè)到的交互行為并不直接等同于是訓(xùn)練中的負(fù)例

可以想一想，對(duì)于沒(méi)有產(chǎn)生交互行為（沒(méi)有點(diǎn)擊、購(gòu)買(mǎi)等行為）的數(shù)據(jù)樣本而言，其實(shí)是由 2 個(gè)原因造成：

用戶的確不喜歡當(dāng)前 item；
當(dāng)前 item 沒(méi)有曝光給用戶（對(duì)于從沒(méi)刷到過(guò)的視頻，我們無(wú)法確定自己是否喜歡）

對(duì)于數(shù)據(jù)曝光問(wèn)題，之前的研究有幾個(gè)角度：

當(dāng)前版本的曝光取決于上一個(gè)推薦系統(tǒng)版本的策略，決定了如何展現(xiàn)；
因?yàn)橛脩魰?huì)主動(dòng)搜索或?qū)ふ?strong>感興趣的 item，因此用戶選擇成為了影響曝光的因素，使得高度相關(guān)/吸引力（例如標(biāo)題黨、美女圖片類(lèi)新聞）的 item 更容易被曝光；
用戶的背景關(guān)系是影響曝光的一個(gè)因素，例如好友、社區(qū)、地理位置等因素會(huì)影響曝光；
流行的 item 會(huì)更容易曝光給用戶，因此 Popularity Bias 是另一種形式 Exposure Bias

隱式反饋數(shù)據(jù) - Position Bias

定義：用戶傾向于無(wú)視相關(guān)性地去對(duì)推薦列表中更高位置上的 item 產(chǎn)生交互行為

位置偏差在搜索系統(tǒng)中是一個(gè)經(jīng)典并持續(xù)存在的偏差，同樣在推薦系統(tǒng)中也會(huì)存在，用戶普遍會(huì)對(duì)于頭部觀測(cè)到的 item 產(chǎn)生更多點(diǎn)擊（還沒(méi)有產(chǎn)生審美疲勞？）。尤其會(huì)對(duì)“用戶點(diǎn)擊行為”作為正例信號(hào)進(jìn)行學(xué)習(xí)的模型，位置偏差會(huì)在訓(xùn)練、評(píng)估階段產(chǎn)生錯(cuò)誤影響

模型偏差

Inductive Bias

偏差不一定總是有害的，實(shí)際上一些歸納偏差被故意加入到模型設(shè)計(jì)中為了實(shí)現(xiàn)某些特性

定義：為了模型更好地學(xué)習(xí)目標(biāo)函數(shù)并且泛化到訓(xùn)練數(shù)據(jù)上，會(huì)設(shè)置一些模型假設(shè)。假設(shè)未必都是準(zhǔn)確的，會(huì)產(chǎn)生一些偏差

列舉某些經(jīng)典的假設(shè)（未必造成有害影響）：

用戶交互行為可以由向量?jī)?nèi)積表示
Adaptive negative sampler 提出用于增加學(xué)習(xí)速度，即使結(jié)果損失函數(shù)不同于最初分布
CNN 網(wǎng)絡(luò)的局部特征重要性

反饋閉環(huán)加劇各類(lèi)偏差

User->Data->Model->User 的不斷循環(huán)，會(huì)在已有偏差的基礎(chǔ)上，進(jìn)一步放大偏差

這篇文章簡(jiǎn)單介紹了一些推薦系統(tǒng)中常見(jiàn)的偏差 bias，并進(jìn)行了一些簡(jiǎn)單的分類(lèi)。這里的分類(lèi)體系并非絕對(duì)合理但卻具有一定代表性。

推薦閱讀
國(guó)產(chǎn)小眾瀏覽器因屏蔽視頻廣告，被索賠100萬(wàn)（后續(xù)）
年輕人“不講武德”：因看黃片上癮，把網(wǎng)站和786名女主播起訴了
中國(guó)聯(lián)通官網(wǎng)被發(fā)現(xiàn)含木馬腳本，可向用戶推廣色情APP
張一鳴：每個(gè)逆襲的年輕人，都具備的底層能力

關(guān)于程序員大白

程序員大白是一群哈工大，東北大學(xué)，西湖大學(xué)和上海交通大學(xué)的碩士博士運(yùn)營(yíng)維護(hù)的號(hào)，大家樂(lè)于分享高質(zhì)量文章，喜歡總結(jié)知識(shí)，歡迎關(guān)注[程序員大白]，大家一起學(xué)習(xí)進(jìn)步！

聊聊推薦系統(tǒng)中的偏差

背景

推薦的反饋閉環(huán)

User -> Data

Data -> Model

Model -> User