丁鵬:多角度回顧因果推斷的模型方法

來源:集智俱樂部 本文約23000字,建議閱讀20+分鐘 本文整理自丁鵬老師的8篇短文,從多角度回顧了因果推斷的各種模型方法。

[ 導(dǎo)讀 ] 推斷因果關(guān)系,是人類思想史與科學(xué)史上的重要主題?,F(xiàn)代因果推斷的研究,始于約爾-辛普森悖論,經(jīng)由魯賓因果模型、隨機(jī)試驗(yàn)等改進(jìn),到朱力亞·珀?duì)柕囊蚬锩?,如今因果科學(xué)與人工智能的結(jié)合正掀起熱潮。
目錄
1. 因果推斷簡介之一:
從 Yule-Simpson’s Paradox 講起
在國內(nèi)的時(shí)候,向別人介紹自己是研究因果推斷(causal inference)的,多半的反應(yīng)是:什么?統(tǒng)計(jì)還能研究因果?這確實(shí)是一個問題:統(tǒng)計(jì)研究因果,能、還是不能?直接給出回答,比較冒險(xiǎn);如果有可能,我需要花一些篇幅來闡述這個問題。
目前市面上能夠買到的相關(guān)教科書僅有 2011 年圖靈獎得主 Judea Pearl 的 Causality: Models, Reasoning, and Inference。Harvard 的統(tǒng)計(jì)學(xué)家 Donald Rubin 和 計(jì)量經(jīng)濟(jì)學(xué)家 Guido Imbens 合著的教科書歷時(shí)多年仍尚未完成;Harvard 的流行病學(xué)家 James Robins 和他的同事也在寫一本因果推斷的教科書,本書目前只完成了第一部分,還未出版。我本人學(xué)習(xí)因果推斷是從 Judea Pearl 的教科書入手的,不過這本書晦澀難懂,實(shí)在不適合作為入門的教科書。Donald Rubin 對 Judea Pearl 提出的因果圖模型(causal diagram)非常反對,他的教科書中杜絕使用因果圖模型。我本人雖然腦中習(xí)慣用圖模型進(jìn)行思考,但是還是更偏好 Donald Rubin 的風(fēng)格,因?yàn)檫@對于入門者,可能更容易。不過這一節(jié),先從一個例子出發(fā),不引進(jìn)新的統(tǒng)計(jì)符號和概念。

天才的高斯在研究天文學(xué)時(shí),首次引進(jìn)了最大似然和最小二乘的思想,并且導(dǎo)出了正態(tài)分布(或稱高斯分布)。其中最大似然有些爭議,比如 Arthur Dempster 教授說,其實(shí)高斯那里的似然,有貝葉斯或者信仰推斷(fiducial inference)的成分。高斯那里的 “統(tǒng)計(jì)” 是關(guān)于 “誤差” 的理論,因?yàn)樗芯康膶ο笫?“物理模型” 加“隨機(jī)誤差”。大約在 100 多年前,F(xiàn)rancis Galton 研究了父母身高和子女身高的 “關(guān)系”,提出了“(向均值)回歸” 的概念。眾所周知,他用的是線性回歸模型。此時(shí)的模型不再是嚴(yán)格意義的“物理模型”,而是“統(tǒng)計(jì)模型” — 用于刻畫變量之間的關(guān)系,而不一定是物理機(jī)制。之后,Karl Pearson 提出了“相關(guān)系數(shù)”(correlation coefficient)。
后世研究的統(tǒng)計(jì),大多是關(guān)于 “相關(guān)關(guān)系” 的理論。但是關(guān)于 “因果關(guān)系” 的統(tǒng)計(jì)理論,非常稀少。據(jù) Judea Pearl 說,Karl Pearson 明確的反對用統(tǒng)計(jì)研究因果關(guān)系;有意思的是,后來因果推斷為數(shù)不多的重要文章(如 Rosenbaum and Rubin 1983; Pearl 1995)都發(fā)表在由 Karl Pearson 創(chuàng)刊的 Biometrika 上。下面講到的悖論,可以說是困擾統(tǒng)計(jì)的根本問題,我學(xué)習(xí)因果推斷便是由此入門的。


Table 1 中,處理組和對照組中,男性的比例分別為多少?這對悖論的產(chǎn)生有什么樣的影響?反過來考慮處理的 “分配機(jī)制”(assignment mechanism),計(jì)算P(Treatment∣Male)和 P(Treatment∣Female)。 假如(X,Y,Z)服從三元正態(tài)分布,X和Y正相關(guān),Y和Z正相關(guān),那么X和Z是否正相關(guān)?(北京大學(xué)概率統(tǒng)計(jì)系 09 年《應(yīng)用多元統(tǒng)計(jì)分析》期末第一題) 流行病學(xué)的教科書常常會講各種悖論,比如混雜偏倚 (confounding bias)和入院率偏倚(Berkson’s bias)等,本質(zhì)上是否與因果推斷有關(guān)?
計(jì)量經(jīng)濟(jì)學(xué)中的 “內(nèi)生性”(endogeneity)怎么定義?它和 Yule-Simpson 悖論有什么聯(lián)系?
2. 因果推斷簡介之二:
Rubin Causal Model (RCM) 和隨機(jī)化試驗(yàn)

設(shè)
表示個體 i接受處理與否,處理取1,對照取0 (這部分的處理變量都討論二值的,多值的可以做相應(yīng)的推廣);
表示個體 i的結(jié)果變量。另外記
表示個體 i接受處理或者對照的潛在結(jié)果 (potential outcome),那么
表示個體 i 接受治療的個體因果作用。不幸的是,每個個體要么接受處理,要么接受對照,
中必然缺失一半,個體的因果作用是不可識別的。觀測的結(jié)果是
。但是,在Z做隨機(jī)化的前提下,我們可以識別總體的平均因果作用 (Average Causal Effect; ACE):


可以由觀測的數(shù)據(jù)估計(jì)出來。其中第一個等式用到了期望算子的線性性(非線性的算子導(dǎo)出的因果度量很難被識別!);第二個式子用到了隨機(jī)化,即
表示獨(dú)立性。由此可見,隨機(jī)化試驗(yàn)對于平均因果作用的識別起著至關(guān)重要的作用。




需要非常強(qiáng)的假定,通常不具有可行性。“可識別性”(identifiability)在統(tǒng)計(jì)中是怎么定義的? 醫(yī)學(xué)研究者通常認(rèn)為,隨機(jī)對照試驗(yàn)(randomized controlled experiment)是研究處理有效性的黃金標(biāo)準(zhǔn),原因是什么呢?隨機(jī)化試驗(yàn)為什么能夠消除 Yule-Simpson 悖論?
在隨機(jī)化下是可識別的。另外一個和它“對偶”的量是 Ju and Geng (2010) 提出的分布因果作用(distributional causal effect: DCE):
,在隨機(jī)化下也可以識別。即使完全隨機(jī)化,
也不可識別。也就是說,經(jīng)濟(jì)學(xué)家提出的具有“經(jīng)濟(jì)學(xué)意義”的量,很難用觀測數(shù)據(jù)來估計(jì)。這種現(xiàn)象在實(shí)際中常常發(fā)生:關(guān)心實(shí)際問題的人向統(tǒng)計(jì)學(xué)家索取的太多,而他們提供的數(shù)據(jù)又很有限。
3. 因果推斷簡介之三:
R. A. Fisher 和 J. Neyman 的分歧

R.A.Fisher
坦白地說,這個零假設(shè)是我見過的最奇怪的零假設(shè),沒有之一。現(xiàn)行的統(tǒng)計(jì)教科書中,講到假設(shè)檢驗(yàn),零假設(shè)都是針對某些參數(shù)的,而 Fisher 的 sharp null 看起來卻像是針對隨機(jī)變量的。這里需要講明白的是,當(dāng)我們關(guān)心有限樣本 (finite sample)的因果作用時(shí),每個個體的潛在結(jié)果
都是固定的,觀測變量
結(jié)果向量為

為處理組中的總數(shù)。這里的“條件期望”并不是說 
,計(jì)算此時(shí)的檢驗(yàn)統(tǒng)計(jì)量
;如此重復(fù)多次n不大時(shí),可以窮盡所有的置換,便可以模擬出統(tǒng)計(jì)量在零假設(shè)下的分布,計(jì)算出 p 值。
J. Neyman




在 sharp null下,Neyman 方法下構(gòu)造的 T 統(tǒng)計(jì)量,是否和 Fisher randomization test 構(gòu)造的統(tǒng)計(jì)量相同?分布是否相同?
Fisher randomization test 中的統(tǒng)計(jì)量可以有其他選擇,比如 Wilcoxon 秩和統(tǒng)計(jì)量等,推斷的方法類似。
當(dāng)Y是二值變量時(shí),上面 Fisher 的方法就是教科書中的 Fisher exact test。在沒有學(xué)習(xí) potential outcome 這套語言之前,理解 Fisher exact test 是有些困難的。
證明
。假定n個個體是一個超總體(super-population)的隨機(jī)樣本,超總體的平均因果作用定義為
那么 Neyman 的方法得到估計(jì)量是超總體平均因果作用的無偏估計(jì),且方差的表達(dá)式是精確的;而 sharp null 在超總體的情形下不太適合。
觀察性研究,可忽略性和傾向得分
成立,這保證了平均因果作用
成立,因?yàn)橹挥性诮o定協(xié)變量X后,處理的分配機(jī)制才是完全隨機(jī)化的。比如,男性和女性中,接受處理的比例不同,但是這個比例是事先給定的。

成立,那么
就表示平均因果作用。線性模型比較容易實(shí)現(xiàn),實(shí)際中人們比較傾向這種方法。但是他的問題是:(1)假定個體因果作用是常數(shù);(2)對于處理和對照組之間的不平衡(unbalance)沒有很好的檢測,常常在對觀測數(shù)據(jù)外推(extrapolation)。
容易驗(yàn)證,在可忽略性下,它滿足性質(zhì)
(在數(shù)據(jù)降維的文獻(xiàn)中,稱之為“充分降維”,sufficient dimension reduction) 和
(給定傾向得分下的可忽略性)。根據(jù)前面的推導(dǎo),顯然有 ACE=E[E(Y|e(X), Z=1)]-E[E(Y|e(X),Z=0)] 。此時(shí),傾向得分是一維的,我們可以根據(jù)它分層 (Rosenbaum 和 Rubin 建議分成 5 層),得到平均因果作用的估計(jì)。連續(xù)版本的分層,就是下面的加權(quán)估計(jì):


時(shí), 第一個估計(jì)量是因果作用的相合估計(jì);當(dāng)
時(shí),第二個估計(jì)量是因果作用的相合估計(jì)。根據(jù)實(shí)際問題的背景,我們應(yīng)該選擇哪個估計(jì)量呢?到此為止,回答這個問題有些似是而非(選擇調(diào)整的估計(jì)量?),更進(jìn)一步的回答,請聽下回分解:因果圖(causal diagram)。如果X是二值的變量(如性別),那么匹配或者傾向的分都導(dǎo)致如下的估計(jì)量: 
這個公式在流行病學(xué)中非?;?,即根據(jù)混雜變量進(jìn)行分層調(diào)整。在后面的介紹中將講到,這個公式被 Judea Pearl 稱為“后門準(zhǔn)則”(backdoor criterion)。 傾向得分的加權(quán)形式, 
本質(zhì)上是抽樣調(diào)查中的 Horvitz-Thompson 估計(jì)。在流行病學(xué)的文獻(xiàn)中,這樣的估計(jì)量常被稱為“逆概加權(quán)估計(jì)量”(inverse probability weighting estimator; IPWE)。 直觀上,為什么估計(jì)的傾向得分會更好?想想偏差和方差的權(quán)衡(bias-variance tradeoff)。
5. 因果推斷簡介之五: 因果圖 (Causal Diagram)

一、 有向無環(huán)圖和 do 算子
。這里用
表示連續(xù)變量的密度函數(shù)和離散變量的概率函數(shù)。有兩種觀點(diǎn)看待一個 DAG:一是將其看成表示條件獨(dú)立性的模型;二是將其看成一個數(shù)據(jù)生成機(jī)制。當(dāng)然,本質(zhì)上這兩種觀點(diǎn)是一樣的。在第一種觀點(diǎn)下,給定 DAG 中某個節(jié)點(diǎn)的“父親”節(jié)點(diǎn),它與其所有的非“后代”都獨(dú)立。根據(jù)全概公式和條件獨(dú)立性,DAG 中變量的聯(lián)合分布可以有如下的遞歸分解:
表示
的“父親”集合,即所有指向
的節(jié)點(diǎn)集合。
Figure 1: An Example of Causal Diagram
可以有兩種分解
和
因此,我們從觀測變量的聯(lián)合分布,很難確定“原因”和“結(jié)果”。在下一節(jié)圖模型結(jié)構(gòu)的學(xué)習(xí)中,我們會看到,只有在一些假定和特殊情形下,我們可以從觀測數(shù)據(jù)確定“原因”和“結(jié)果”。
(也可以記做
),表示如下的操作:將
中指向
的有向邊全部切斷,且將
的取值固定為常數(shù)
. 如此操作,得到的新
的聯(lián)合分布可以記做
可以證明,干預(yù)后的聯(lián)合分布為
在絕大多數(shù)情況下是不同的。
的“原因”,“條件”和“干預(yù)
,對應(yīng)
的分布相同。但是在 Figure 2 (2) 中,有. 由于
的“結(jié)果”,“條件”(或者“給定”)“結(jié)果”,“原因”的分布不再等于他的邊緣分布,但是人為的“干預(yù)”“結(jié)果
,并不影響“原因
的分布。
對于
的平均因果作用定義為“I must take the opportunity to acknowledge four colleagues who saw clarity shining through the do(x) operator before it gained popularity: Steffen Lauritzen, David Freedman, James Robins and Philip David. Phil showed special courage in pringting my paper in Biometrika, the journal founded by causality’s worst adversary – Karl Pearson.” (Pearl, 2000)

表示潛在結(jié)果。要想說明兩個模型的等價(jià)性,可以將潛在結(jié)果嵌套在 DAG 所對應(yīng)的數(shù)據(jù)生成機(jī)制之中,所有的潛在結(jié)果
都由這個非參數(shù)結(jié)構(gòu)方程模型產(chǎn)生:
表
除的父親節(jié)點(diǎn)。上面的方程表示:
的值強(qiáng)制z時(shí),DAG 系統(tǒng)所產(chǎn)生
值。這個意義下,do 算子導(dǎo)出的結(jié)果,就是“潛在結(jié)果”。二、 d分離,前門準(zhǔn)則和后門準(zhǔn)則
是 DAG 中不相交的節(jié)點(diǎn)集合,
為一條連接
中某節(jié)點(diǎn)到
中某節(jié)點(diǎn)的路徑 (不管方向)。如果路徑
上某節(jié)點(diǎn)滿足如下的條件:在路徑 上,w點(diǎn)處為v 結(jié)構(gòu) (或稱沖撞點(diǎn),collider),且W及其后代不在Z中; 在路徑
上,w點(diǎn)處不是v 結(jié)構(gòu),且 w在 中,
進(jìn)一步,如果 Z阻斷了X到 Y的所有路徑,那么稱 z d 分離 X和Y,記為

Z中節(jié)點(diǎn)不能是的后代; Z阻斷了之間所有指向
的路徑(這樣的路徑可以稱為后門路徑);
后門準(zhǔn)則。進(jìn)一步,Z相對于變量的有序
滿足后門準(zhǔn)則,其中
是中的任意節(jié)點(diǎn);那么稱變量的集Z相對于節(jié)點(diǎn)集合的有序?qū)?/span>
滿足后門準(zhǔn)則。
滿足后門準(zhǔn)則,那X和Y的因果作用是可以識別的,且為了理解因果圖的概念,下面的簡短證明是很有必要的。Z切斷了所有 X到Y(jié) 的直接路徑; X到Z 沒有后門路徑; 所有 Z到Y(jié) 的后門路徑都被X 阻斷。
X和Y的因果作用可識別,為
。
之間的后門路徑被
或者
阻斷,而前門路徑被
阻斷。上面的兩個準(zhǔn)則表明,要識別從
的因果作用,我們不需要觀測到所有的變量,只需要觀測到切斷后門路徑或者前門路徑的變量即可。三、 回到 Yule-Simpson’s Paradox

之間形成了一個V結(jié)構(gòu):雖然 T和U之間是獨(dú)立的,但是給定 X之后,T和U不再獨(dú)立。四、 討論
現(xiàn)實(shí)的問題,是否能用一個有向無環(huán)圖表示?大多數(shù)生物學(xué)家看到 DAG 的反應(yīng)是“能不能用圖表示反饋?”的確,DAG 作為一種簡化的模型,在復(fù)雜系統(tǒng)中可能不完全適用。要想將 DAG 推廣到動態(tài)的系統(tǒng),或者時(shí)間序列中,還有待研究。 Pearl 引入的 do 算子,是他在因果推斷領(lǐng)域最主要的貢獻(xiàn)。所謂 “do”,就是“干預(yù)”,Pearl 認(rèn)為干預(yù)就是從系統(tǒng)之外人為的控制某些變量。但是,這依賴于一個假定:干預(yù)某些變量并不會引起 DAG 中其他結(jié)構(gòu)的變化。這個假定常常會受到質(zhì)疑,但是質(zhì)疑歸質(zhì)疑,Pearl 的這個假定雖然看似很強(qiáng),但根據(jù)觀測數(shù)據(jù)卻不可檢驗(yàn)。這種質(zhì)疑并不是 Pearl 的理論獨(dú)有的缺陷,這事實(shí)上是一切研究的缺陷。比如,我們用完全隨機(jī)化試驗(yàn)來研究處理的作用,我們要想將實(shí)驗(yàn)推廣到觀察性的數(shù)據(jù)或者更大的人群中去,也必須用到一些不可驗(yàn)證的假定。 很多人看了 Pearl 的理論后就嘲笑他:難道我們可以在 DAG 中干預(yù)“性別”?確實(shí),離開了實(shí)際的背景,干預(yù)性別似乎是不太合理的。那這個時(shí)候,根據(jù) Pearl 的 do算子得到的因果作用意味著什么呢?可以從幾個方面回答這個問題。 很多問題,我們不能談?wù)摗案深A(yù)性別”,也不能談?wù)摗靶詣e”的“因果作用”?!靶詣e”的特性是“協(xié)變量”(covariate),對于這類變量(如身高、膚色等),談?wù)撘蚬饔貌缓线m,因?yàn)槲覀儾荒芟胂蟪鲆粋€可能的“實(shí)驗(yàn)”,干預(yù)這些變量。 上面的回答基于“實(shí)驗(yàn)學(xué)派”(experimentalists’)的觀點(diǎn),認(rèn)為不可干預(yù),就沒有“因果”。但是,如果認(rèn)為只要有數(shù)據(jù)的生成機(jī)制,就有因果關(guān)系,那么算出性別的因果作用也不奇怪。(計(jì)量經(jīng)就學(xué)一直有爭議,以 Joshua Angrist、Guido Imbens 等為首的“實(shí)驗(yàn)派”,和以 James Heckman 為首的“結(jié)構(gòu)方程模型”派,有過很激烈的討論。) 有些問題中性別的因果作用是良好定義的。比如,我們可以人工的修改應(yīng)聘者簡歷上的名字(隨機(jī)的使用男性和女性名字),便可以研究性別對于求職的影響,是否存在性別歧視等等(已有研究使用過這種實(shí)驗(yàn)設(shè)計(jì))。 一個更為嚴(yán)重的問題是,實(shí)際工作中,我們很難得到一個完整的 DAG,用于闡述變量之間的因果關(guān)系或者數(shù)據(jù)生成機(jī)制,使得 DAG 的應(yīng)用受到的巨大的阻礙。不過,從觀測數(shù)據(jù)學(xué)習(xí) DAG 的結(jié)構(gòu),確實(shí)是一個很有趣且重要的問題,這留待下回分解。
在何種意義下,后門準(zhǔn)則的條件,等價(jià)于可忽略性,即
?在第一節(jié)的 Yule-Simpson’s Paradox 中,我們最終選擇調(diào)整的估計(jì)量,還是不調(diào)整的估計(jì)量?
工具變量(instrumental variable)







(隨機(jī)化)Zi⊥{Di(1),Di(0),Yi(1),Yi(0)}




CACE.IV(Y, D, Z)$CACE[1] 0.07914375$se.CACE[,1][1,] 0.02273439$p.value[,1][1,] 0.0004991073$prob.complier[1] 0.2925123$se.complier[1] 0.004871619
五、R code
## function for complier average causal effectCACE.IV <- function(outcome, treatment, instrument) {Y <- outcomeD <- treatmentZ <- instrumentN <- length(Y)Y1 <- Y[Z == 1]Y0 <- Y[Z == 0]D1 <- D[Z == 1]D0 <- D[Z == 0]mean.Y1 <- mean(Y1)mean.Y0 <- mean(Y0)mean.D1 <- mean(D1)mean.D0 <- mean(D0)prob.complier <- mean.D1 - mean.D0var.complier <- var(D1) / length(D1) + var(D0) / length(D0)se.complier <- var.complier^0.5CACE <- (mean.Y1 - mean.Y0) / (mean.D1 - mean.D0)## COVpi1 <- mean(Z)pi0 <- 1 - pi1Omega <- c(var(Y1) / pi1, cov(Y1, D1) / pi1, 0, 0,cov(Y1, D1) / pi1, var(D1) / pi1, 0, 0,0, 0, var(Y0) / pi0, cov(Y0, D0) / pi0,0, 0, cov(Y0, D0) / pi0, var(D0) / pi0)Omega <- matrix(Omega, byrow = TRUE, nrow = 4)## GradientGrad <- c(1, -CACE, -1, CACE) / (mean.D1 - mean.D0)COV.CACE <- t(Grad) %*% Omega %*% Grad / Nse.CACE <- COV.CACE^0.5p.value <- 2 * pnorm(abs(CACE / se.CACE), 0, 1, lower.tail = FALSE)## resultsres <- list(CACE = CACE,se.CACE = se.CACE,p.value = p.value,prob.complier = prob.complier,se.complier = se.complier)return(res)}
第一個統(tǒng)計(jì)學(xué)家,采取了一種很簡單的方法。如圖所示,橫軸表示 1963 年 6 月入學(xué)前的體重X,縱軸表示 1964 年 6 月前放假的體重Y。個體上來看,男女入學(xué)前和入學(xué)后一年體重都會有些變化,男女學(xué)生體重的散點(diǎn)圖分別用綠色和紅色標(biāo)出。從男女學(xué)生生平均體重來看,男生入學(xué)前后一年平均體重均是 150 磅(圖中右上角的黑點(diǎn)),女生入學(xué)前后一年平均體重均為 130 磅(圖中左下角的黑點(diǎn))。圖中的虛線是對角線Y=X,兩個黑點(diǎn)均位于對角線上。因此,第一個統(tǒng)計(jì)學(xué)家的結(jié)論是食堂對于男女學(xué)生體重都沒有影響,因此對男女學(xué)生體重的作用相同。

注:橫軸表示 1963 年 6 月入學(xué)前的體重X,縱軸表示 1964 年 6 月前放假的體重Y;虛線是對角線Y=X;男女學(xué)生體重的散點(diǎn)圖分別用綠色和紅色標(biāo)出。圖中數(shù)據(jù)生成機(jī)制如下:男學(xué)生(X,Y)~二元正態(tài)分布,均值(150,150),協(xié)方差矩陣;女學(xué)生(X,Y)~二元正態(tài)分布,均值(130,130),協(xié)方差矩陣
。生成這幅圖的 R 代碼可以在這里下載:Rcodehttps://uploads.cosx.org/2013/09/Rcode2.txt。由于樣本量 3000,樣本均值非常接近理論均值,因此落在了對角線上。)








吸煙是否導(dǎo)致肺癌?Fisher versus Cornfield
一、Cornfield 條件或者 Cornfield 不等式




(圖注:J Cornfield)

… if cigarette smokers have 9 times the risk of nonsmokers for developing lung cancer, and this is not because cigarette smoke is a causal agent, but only because cigarette smokers produce hormone X, then the proportion of hormone-X producers among cigarette smokers must be at least 9 times greater than nonsmokers. If the relative prevalence of hormone-X-producers is considerably less than ninefold, then hormone-X cannot account for the magnitude of the apparent effect.



Bickel, P. J. and Hammel, E. A. and O’Connell, J. W. (1975) Sex bias in graduate admissions: Data from Berkeley. Science, 187, 398-404.
Pearl, J. (2000) Causality: models, reasoning, and inference. Cambridge University Press。
Rosenbaum, P.R. and Rubin, D.B. (1983) The central role of the propensity score in observational studies for causal effects. Biometrika, 70, 41-55.
Rothman, K., Greenland, S. and Lash, T. L. (2008) Modern Epidemiology. Lippincott Williams & Wilkins.
Neyman, J. (1923) On the application of probability theory to agricultural experiments. Essay on principles. Section 9. reprint in Statistical Science. 5, 465-472.
Pearl, J. (1995) Causal diagrams for empirical research. Biometrika, 82, 669-688.
Pearl, J. (2000) Causality: models, reasoning, and inference. Cambridge University Press。
Rubin, D.B. (1978) Bayesian inference for causal effects: The role of randomization. The Annals of Statistics, 6, 34-58.
Neyman, J. (1923) On the application of probability theory to agricultural experiments. Essay on principles. Section 9. reprint in Statistical Science. 5, 465-472. with discussion by Donald Rubin.
Rosenbaum, P. R. and Rubin, D. B. (1983) The central role of the propensity score in observational studies for causal effects. Biometrika, 70, 41-55.
Rubin, D. B. (1976) Inference and missing data (with discussion). Biometrika, 63, 581-592.
Rubin, D. B. (1978) Bayesian inference for causal effects: The role of randomization. The Annals of Statistics, 6, 34-58.
Wooldridge, J. M. (2002) Econometric analysis of cross section and panel data. The MIT press.
Lord FM. A paradox in the interpretation of group comparisons. Psychol Bull. 1967;68:304–5. doi: 10.1037/h0025105.
Holland, P.W., Rubin, D.B. (1983). On Lord’s paradox. In: Wainer, H., Messick, S. (Eds.), Principals of Modern Psychological Measurement. Lawrence Erlbaum Associates, Hillsdale, NJ, pp. 3–25.
Cornfield 最早的論文發(fā)表于 1959 年;由于它的重要性,這篇文章又在 2009 年重印了一次(50 周年紀(jì)念)。于是參考文獻(xiàn)有兩篇,它們是一樣的;不過后者多了很多名人的討論。
Cornfield J et al. Smoking and lung cancer: recent evidence and a discussion of some questions. JNCI 1959;22:173-203.
Cornfield J et al. Smoking and lung cancer: recent evidence and a discussion of some questions. Int J Epidemiol 2009;38:1175-91.(本文邀請了 David R Cox 和 Joel B Greenhouse 等人討論。)
最近 Ding and VanderWeele 重新回訪了這個經(jīng)典問題,給出了更加廣泛的結(jié)果。Ding, Peng and Vanderweele, Tyler J. (2014). Generalized Cornfield conditions for the risk difference, Biometrika, 101:4, 971-977. https://doi.org/10.1093/biomet/asu030
編輯:于騰凱
校對:林亦霖

