<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          快手因果推斷與實(shí)驗(yàn)設(shè)計(jì)

          共 5250字,需瀏覽 11分鐘

           ·

          2021-08-20 17:21

          導(dǎo)讀:理解和識(shí)別用戶行為指標(biāo)的相互關(guān)系是實(shí)驗(yàn)分析的目標(biāo)。在社區(qū)氛圍下,影響用戶行為的因素更為復(fù)雜,關(guān)系識(shí)別更為困難,如何使用各種學(xué)科的方法,對(duì)社區(qū)進(jìn)行宏觀或微觀的建模分析,系統(tǒng)性的評(píng)估各種策略的長(zhǎng)期生態(tài)影響,是所要解決的重要問題。

          本文金雅然博士將以快手直播的現(xiàn)實(shí)任務(wù)為例進(jìn)行展開,介紹快手因果推斷與實(shí)驗(yàn)設(shè)計(jì)的相關(guān)工作,主要內(nèi)容包括:① 快手直播場(chǎng)景中遇到的因果推斷問題及技術(shù)框架;② 基于觀測(cè)數(shù)據(jù)或?qū)嶒?yàn)數(shù)據(jù)的因果推斷技術(shù)案例;③ 涉及到網(wǎng)絡(luò)效應(yīng)的復(fù)雜實(shí)驗(yàn)設(shè)計(jì)。
          01
          快手直播場(chǎng)景中遇到的因果推斷問題及技術(shù)框架
          在快手我們主要會(huì)遇到這四類問題:用戶激勵(lì)設(shè)計(jì)、推薦策略評(píng)估、產(chǎn)品功能迭代以及預(yù)估產(chǎn)品和方向的長(zhǎng)期價(jià)值。
          遇到這些問題我們通常有幾種方式來解決:
          • 基于觀測(cè)數(shù)據(jù)的因果推斷,即從已有實(shí)驗(yàn)和非實(shí)驗(yàn)數(shù)據(jù)中提煉因果關(guān)系;

          • 在產(chǎn)品設(shè)計(jì)上構(gòu)建正確的AB實(shí)驗(yàn),合理計(jì)算指標(biāo),度量產(chǎn)品功能和迭代的影響;

          • 通過經(jīng)濟(jì)模型、機(jī)器學(xué)習(xí)算法和數(shù)據(jù)、實(shí)驗(yàn)的結(jié)合構(gòu)造反事實(shí)推理來回答長(zhǎng)期效應(yīng)問題。

          解決這些問題的核心是使用因果推斷方法。
          因果推斷的核心是在數(shù)據(jù)中存在關(guān)聯(lián)關(guān)系的前提下,考慮數(shù)據(jù)之間的因果關(guān)系。任務(wù)是在給定的假設(shè)中,選擇模型框架,將因果關(guān)系從關(guān)聯(lián)中分割,對(duì)因果分析的大小作出正確的估計(jì),并且通過統(tǒng)計(jì)推斷的方法,驗(yàn)證推斷的正確度,并回答推斷結(jié)果存在多大波動(dòng)。
          在因果推斷中,我們通常應(yīng)用以下兩種框架:
          Rubin虛擬事實(shí)模型(Potential Outcome)的核心是尋找合適的對(duì)照組。通常情況下,我們想要度量用戶是否被實(shí)驗(yàn)影響到的兩者差異是多少,而對(duì)于同一個(gè)用戶,我們只能觀測(cè)到被影響/不被影響一個(gè)狀態(tài),因此需要尋找合適的對(duì)照組,估計(jì)無法被觀測(cè)到的影響。我們通常會(huì)構(gòu)造一些識(shí)別實(shí)驗(yàn),比如,經(jīng)濟(jì)學(xué)上通過RCT實(shí)驗(yàn),互聯(lián)網(wǎng)常使用AB實(shí)驗(yàn),或者根據(jù)觀測(cè)數(shù)據(jù)使用恰當(dāng)?shù)姆椒▉韺ふ覍?duì)照組。
          Pearl因果圖模型(Causal Graph Model)使用有向圖描述變量之間的因果關(guān)系。通過計(jì)算因果圖中的條件分布,獲得變量之間的因果關(guān)系。有向圖指導(dǎo)我們使用這些條件分布來消除估計(jì)偏差,其核心也是估計(jì)檢驗(yàn)分布、消除其他變量帶來的偏差。
          Pearl框架和Rubin框架有一些關(guān)聯(lián),簡(jiǎn)單圖中,Potential Outcome模型中通過工具變量和匹配法消除估計(jì)偏差和Pearl的框架思想是一致的。
          但是Pearl的框架可以處理多個(gè)變量之間相互作用的復(fù)雜關(guān)系。
          總結(jié)來說,Potential Outcome和Causal Graph是兩種互補(bǔ)的推測(cè)虛擬事實(shí)的方法,目的都是為了計(jì)算存在混淆變量時(shí),干預(yù)變量時(shí)對(duì)結(jié)果的影響,都需要對(duì)因果關(guān)系作假設(shè),以及控制帶來偏差的變量;不同點(diǎn)在于Rubin框架估計(jì)的因果效應(yīng)主要是干預(yù)前后的期望差值,而Pearl框架下,我們估計(jì)的是干預(yù)前后的分布差異,Rubin框架解決的問題是因果效應(yīng)的估計(jì)和統(tǒng)計(jì)推斷,Pearl框架更偏向于因果關(guān)系的識(shí)別。
          從這兩種框架延伸,在不同情景下,快手會(huì)使用不同工具解決實(shí)際問題,AB實(shí)驗(yàn)幫助我們觀測(cè)策略或產(chǎn)品變動(dòng)影響,在一些不能做實(shí)驗(yàn)或者多個(gè)實(shí)驗(yàn)相結(jié)合的場(chǎng)景下,會(huì)有一些其他的方法,下面會(huì)對(duì)具體方法展開介紹。
          02
          基于觀測(cè)數(shù)據(jù)或?qū)嶒?yàn)數(shù)據(jù)的因果推斷技術(shù)案例
          1. 產(chǎn)品功能的評(píng)估:DID及其拓展案例
          雙重差分適用于存在不可觀測(cè)的個(gè)體固定效應(yīng)場(chǎng)景,通過差分消除固定效應(yīng),其關(guān)鍵假設(shè)是,政策干擾前存在平行趨勢(shì),且實(shí)驗(yàn)干擾效應(yīng)不隨時(shí)間變化。雙重差分可以用來消除那些對(duì)后期可能存在干擾因素,得到實(shí)驗(yàn)效果估計(jì)。

          雙重差分假設(shè)用戶開始受影響的時(shí)間是一樣的,實(shí)驗(yàn)處理效應(yīng)對(duì)用戶的影響是一樣的,而這些假設(shè)難以滿足。比如穿云箭紅包,當(dāng)實(shí)驗(yàn)效果上線后,用戶的行為會(huì)發(fā)生變化,且不同用戶的行為是不一致的,當(dāng)不同表現(xiàn)用戶都在實(shí)驗(yàn)組,傳統(tǒng)的DID模型估計(jì)實(shí)驗(yàn)效應(yīng)會(huì)產(chǎn)生偏差。因此我們?cè)贒ID方法上進(jìn)行修正,按照用戶的狀態(tài)是否更改分為不同類型,對(duì)不同類型用戶分別做DID估計(jì),再進(jìn)行加權(quán)平均,得到修正后DID實(shí)驗(yàn)效果值。
          當(dāng)treatment施加到一個(gè)群體或者地區(qū)上時(shí),很難找到單一的對(duì)照組,這種時(shí)候采用合成控制方法構(gòu)造虛擬對(duì)照組進(jìn)行比較,原理是構(gòu)造一個(gè)虛擬的對(duì)照組,通過treatment前的數(shù)據(jù)上學(xué)習(xí)的權(quán)重,擬合實(shí)驗(yàn)組在實(shí)驗(yàn)開始前的數(shù)據(jù),模擬實(shí)驗(yàn)組用戶在沒有接受實(shí)驗(yàn)情況下的結(jié)果,構(gòu)造合成控制組,實(shí)驗(yàn)開始后,評(píng)估實(shí)驗(yàn)組和合成控制組之間的差異。
          2. 推薦策略的評(píng)估:因果推斷與機(jī)器學(xué)習(xí)
          因果分析與機(jī)器學(xué)習(xí)存在一些差異點(diǎn)。因果分析的語言,核心在于因果關(guān)系的識(shí)別,即合理的估計(jì)處理前和處理后現(xiàn)有條件期望的差異,也可以是一種處理缺失數(shù)據(jù)的問題,在因果推斷上我們非常關(guān)心的是如何準(zhǔn)確的估計(jì)結(jié)果以及結(jié)果的方差。而在機(jī)器學(xué)習(xí)中,我們使用準(zhǔn)確度來衡量機(jī)器學(xué)習(xí)模型的好壞,其目標(biāo)是在訓(xùn)練集上估計(jì)一個(gè)條件期望,使得測(cè)試集上MSE最小。機(jī)器學(xué)習(xí)可以通過cross-validation(模型參數(shù))的方法去數(shù)據(jù)驅(qū)動(dòng)的選擇一個(gè)最佳模型形式,與傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)方法相比不需要復(fù)雜的假設(shè),例如function form的假設(shè),從這種意義上機(jī)器學(xué)習(xí)能夠更準(zhǔn)確的預(yù)測(cè)。
          但是在因果推斷問題上,機(jī)器學(xué)習(xí)的局限性在于,無論用什么機(jī)器學(xué)習(xí)方法,因果識(shí)別的條件都不能被放松;同時(shí)在機(jī)器學(xué)習(xí)模型通常使用的正則化和過擬合處理,會(huì)帶來有偏估計(jì),因此我們需要消除這種估計(jì)的偏差;在統(tǒng)計(jì)推斷上,機(jī)器學(xué)習(xí)的局限性在于,有些模型不能直接計(jì)算方差,并且有時(shí)即使可以計(jì)算,方差的收斂速度也未必能夠達(dá)到預(yù)期,所以針對(duì)這些問題,下面介紹了幾種方法。
          ① 雙重機(jī)器學(xué)習(xí)模型
          很多時(shí)候因果推斷會(huì)遇到混淆變量的問題,比如想要去分析直播推薦多樣性對(duì)用戶活躍度的影響,但是這些都和用戶歷史相關(guān)。傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)方法可以解決這個(gè)問題,但是依賴很多強(qiáng)假設(shè),強(qiáng)假設(shè)下,得到的估計(jì)不一定合理,雙重機(jī)器學(xué)習(xí)為這個(gè)問題提供了解決的思路。
          雙重機(jī)器學(xué)習(xí)假設(shè)所有混淆變量都可以被觀測(cè),其正則化過程能夠達(dá)到高維變量選擇的目的,與Frisch-Waugh-Lovell定理相似,模型通過正交化解決正則化帶來的偏差。
          除了上面所描述的,還有一些問題待解決,比如在ML模型下存在偏差和估計(jì)有效性的問題,這個(gè)時(shí)候可以通過Sample Splitting 和 Cross Fitting的方式來解決,具體做法是我們把數(shù)據(jù)分成一個(gè)訓(xùn)練集和估計(jì)集,在訓(xùn)練集上我們分別使用機(jī)器學(xué)習(xí)來擬合影響,在估計(jì)集上我們根據(jù)擬合得到的函數(shù)來做殘差的估計(jì),通過這種方法,可以對(duì)偏差進(jìn)行修正。在偏差修正的基礎(chǔ)上,我們可以對(duì)整個(gè)估計(jì)方法去構(gòu)造一個(gè)moment condition,得到置信區(qū)間的推斷,從而得到一個(gè)有良好統(tǒng)計(jì)的估計(jì)。
          ② 因果隨機(jī)森林模型
          我們通常探究策略對(duì)于不同用戶異質(zhì)性的影響,即哪些用戶更容易被影響以及影響有多大,傳統(tǒng)做法是多維分析,但是效率低,容易犯錯(cuò)。這時(shí)可以結(jié)合機(jī)器學(xué)習(xí)的方法,這里選擇了決策樹方法,因?yàn)闆Q策樹的分桶特性能夠幫助解決異質(zhì)性問題,相對(duì)于傳統(tǒng)方法因果樹做了兩點(diǎn)改動(dòng):
          • 把數(shù)據(jù)分成訓(xùn)練集和估計(jì)集,一部分訓(xùn)練集去構(gòu)造樹,另一部分估計(jì)集去估計(jì)因果效應(yīng)和方差;

          • 在樹的分區(qū)方式上,使用各個(gè)節(jié)點(diǎn)的方差對(duì)目標(biāo)函數(shù)加以修正。

          通常情況下,我們結(jié)合實(shí)驗(yàn)來做分析。比如在實(shí)驗(yàn)中,通過因果樹得到因果效應(yīng)的分布,然后挑選出來那些實(shí)驗(yàn)效果顯著的用戶,去分析他們的特征,以及找到敏感用戶,幫助我們了解策略的影響,作出下一步迭代。
          ③ Meta-Learner for Uplift Modeling
          Uplift-modeling是另一種定位敏感人群的方法,和因果樹的步驟有差別。核心是利用實(shí)驗(yàn)數(shù)據(jù)對(duì)實(shí)驗(yàn)結(jié)果變量建模,利用得到的模型估計(jì)條件平均處理效果。Uplift-modeling具有不同的學(xué)習(xí)方式,主要有S-Learner 、T-Learner和X-learner。和因果樹相比,Meta-Learner是一種間接建模方式,實(shí)現(xiàn)快但一些場(chǎng)景下誤差較大。
          3. 用戶行為鏈路的研究:因果圖
          我們通常通過因果圖來進(jìn)行用戶行為鏈路的研究。Rubin流派常用來估計(jì)變量之間的一度關(guān)系,但當(dāng)我們面對(duì)一些未知問題時(shí),我們想了解的是有哪些變量真正影響我們關(guān)心的結(jié)果變量,以及變量之間的相互影響和用戶行為鏈路是什么,有效過程指標(biāo)是什么,這些時(shí)候我們用到因果圖的方法。
          在生成因果圖中,常遇到的限制是算法層面的,比如我們?cè)趦?yōu)化目標(biāo)函數(shù)的時(shí)候,需要遍歷所有的因果圖,是一個(gè)NP-hard問題,我們需要有效的算法得到想要的估計(jì),市面上的算法大概分為兩類:
          • Constraint-based Algorithms

          • Score-based Algorithms

          03
          復(fù)雜實(shí)驗(yàn)設(shè)計(jì)
          在實(shí)驗(yàn)設(shè)計(jì)上我們通常遇到的難點(diǎn)是網(wǎng)絡(luò)效應(yīng)的檢測(cè)和應(yīng)對(duì),在直播下,網(wǎng)絡(luò)效應(yīng)有好多種表現(xiàn)方式,在這種網(wǎng)絡(luò)效應(yīng)存在的情況下嘗試了一些方式,比如說:雙邊實(shí)驗(yàn)、時(shí)間片輪轉(zhuǎn)實(shí)驗(yàn)、合成控制方法。
          1. 雙邊實(shí)驗(yàn)設(shè)計(jì)
          在雙邊實(shí)驗(yàn)中,同時(shí)進(jìn)行了主播側(cè)和觀眾側(cè)的分流,主播側(cè)一部分是上了掛件,觀眾側(cè)一部分能看到一部分看不到,雙邊實(shí)驗(yàn)的優(yōu)點(diǎn)是可以同時(shí)檢測(cè)兩端的效果,同時(shí)可以幫助檢測(cè)到組間的轉(zhuǎn)移和溢出。在了解到組間溢出和干擾下,通過雙邊實(shí)驗(yàn)我們可以更加準(zhǔn)確的測(cè)算處理效應(yīng),在掛件場(chǎng)景下,我們認(rèn)為N3是代表完全沒有處理過的效果,Y代表處理后的結(jié)果,N3和Y進(jìn)行差分,計(jì)算產(chǎn)品功能推全后的影響,而且,雙邊實(shí)驗(yàn)?zāi)軌蚋玫膸椭覀儦w因。
          然而雙邊實(shí)驗(yàn)只能描述簡(jiǎn)單的組間溢出,在個(gè)體和個(gè)體之間存在干擾的復(fù)雜情況下,雙邊實(shí)驗(yàn)是無法幫助我們判斷實(shí)驗(yàn)效果,例如直播PK暴擊時(shí)刻這種情況下,我們通過時(shí)間片輪轉(zhuǎn)實(shí)驗(yàn)解決,即在一定實(shí)驗(yàn)對(duì)象上進(jìn)行實(shí)驗(yàn)組策略和對(duì)照組策略的反復(fù)切換。
          2. 時(shí)間片輪轉(zhuǎn)實(shí)驗(yàn)
          時(shí)間片輪轉(zhuǎn)的核心在于:
          • 時(shí)間片的選擇

          • 實(shí)驗(yàn)總周期選擇

          • 隨機(jī)切換時(shí)間點(diǎn)是什么樣子的

          當(dāng)時(shí)間粒度約粗糙,時(shí)間上的干擾造成的偏差會(huì)越小,但是方差會(huì)越大,影響實(shí)驗(yàn)的檢驗(yàn)效果,針對(duì)這個(gè)問題,采取的方案是最優(yōu)設(shè)計(jì)。
          最優(yōu)設(shè)計(jì)的核心假設(shè)是:
          • Outcome有一個(gè)絕對(duì)上界

          • 用戶無法知曉下一個(gè)時(shí)間是否是實(shí)驗(yàn)組

          • 如果時(shí)間片之間存在干擾,干擾的影響是固定且有限的

          當(dāng)我們不知道一個(gè)時(shí)間片實(shí)驗(yàn)時(shí)間節(jié)點(diǎn)如何設(shè)計(jì)時(shí),通常采取的步驟是,預(yù)估一個(gè)時(shí)間,通過實(shí)驗(yàn)確定carry over的階數(shù)下限是多少,根據(jù)階數(shù)下限,找到最優(yōu)切換時(shí)間點(diǎn),再進(jìn)行一次實(shí)驗(yàn),通過實(shí)驗(yàn)組和對(duì)照組的選擇來進(jìn)行因果效應(yīng)的估計(jì)。其缺點(diǎn)在于,實(shí)驗(yàn)周期長(zhǎng),沒有辦法觀測(cè)到HTE (heterogeneous treatment estimation)。
          04
          問答環(huán)節(jié)
          Q:DID和ABtest有什么區(qū)別?什么時(shí)候用DID不用ABtest?
          A:兩種不同維度的方法,ABtest是說,在實(shí)驗(yàn)對(duì)象上做出一些隨機(jī)的對(duì)照,然后進(jìn)行比較,即便是這種AB實(shí)驗(yàn),我們遇到AB效果比較大的時(shí)候,也可以用DID來進(jìn)行,DID不一定基于實(shí)驗(yàn)來進(jìn)行,可以比如根據(jù)不同用戶群來比較。
          Q:雙重機(jī)器學(xué)習(xí)和PSM的結(jié)果有什么區(qū)別?
          A:兩種不同維度的方法,PSM的核心假設(shè)是,我們先去估計(jì)了propensity Score ,基于propensity Score我們認(rèn)為propensity Score相似的情況下treat與control組可以計(jì)算因果效應(yīng),雙重機(jī)器學(xué)習(xí)是說,我們針對(duì)于混淆變量對(duì)于treatment的影響和混淆變量對(duì)于outcome的影響的function form是未知的,涉及到高維變量選擇的問題,同時(shí)需要兩步的估計(jì),來得到我們想要估計(jì)的因果變量,是主要的差異。
          Q:CIA假設(shè)往往不能滿足,應(yīng)該如何降低影響?
          A:現(xiàn)在很多的包括雙重機(jī)器學(xué)習(xí)等方法都有很多的擴(kuò)展,比如當(dāng)有些合適的工具變量會(huì)有些合適的拓展的工具方法,另外可以通過一些matching的方法去構(gòu)造些滿足條件的樣本,但是這個(gè)東西也不是完全精確,很多時(shí)候需要靠人為的邏輯判斷。
          Q:因果圖的結(jié)構(gòu)是預(yù)設(shè)的還是模型結(jié)構(gòu)輸出的?
          A:主要是模型輸出的,但是在算法中我們可以限定哪些變量是父節(jié)點(diǎn),哪些是子節(jié)點(diǎn),如果最后結(jié)果與假設(shè)相悖,會(huì)發(fā)現(xiàn)假設(shè)的父節(jié)點(diǎn)下是沒有任何子節(jié)點(diǎn)的。
          Q:如何評(píng)價(jià)因果圖判斷的準(zhǔn)確性?
          A:過模擬數(shù)據(jù)看準(zhǔn)確性;通過實(shí)驗(yàn)數(shù)據(jù),在有限的檢驗(yàn)方式下,我們發(fā)現(xiàn)其結(jié)論是比較Robust,當(dāng)然理論上可能還需要些證明。
          ·················END·················

          推薦閱讀

          1. 我在字節(jié)做了哪些事

          2. 寫給所有數(shù)據(jù)人。

          3. 從留存率業(yè)務(wù)案例談0-1的數(shù)據(jù)指標(biāo)體系

          4. 數(shù)據(jù)分析師的一周

          5. 超級(jí)菜鳥如何入門數(shù)據(jù)分析?


          歡迎長(zhǎng)按掃碼關(guān)注「數(shù)據(jù)管道」

          瀏覽 100
          點(diǎn)贊
          評(píng)論
          1收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          1收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲三级久久 | 国产精品扒开腿做爽爽爽A片唱戏 | 牛牛视频在线观看 | 高清操逼| 成人网站视频在线免费观看 |