在線調(diào)查的抽樣方法及注意事項(xiàng)
文章來源:東石筆記

“不做調(diào)查沒有發(fā)言權(quán)。不做正確的調(diào)查同樣沒有發(fā)言權(quán)?!?在萬物互聯(lián)的時代,如何運(yùn)用互聯(lián)網(wǎng)和其他信息技術(shù)進(jìn)行調(diào)查才能更好的支撐決策,避免對決策的誤導(dǎo)?
生活中會遇到各種在線調(diào)查問卷和結(jié)果。比如,看到上面這樣一則再常見不過的微博投票,該如何去認(rèn)識和解讀它?
對于一些學(xué)科的同學(xué)和研究者來說,在應(yīng)對新冠疫情的特殊時期,做在線調(diào)查可能成為一個更方便可行的數(shù)據(jù)收集渠道。
在線調(diào)查可以降低成本,方便數(shù)據(jù)的獲??;同時,為了更準(zhǔn)確的實(shí)現(xiàn)調(diào)查的目標(biāo)、增強(qiáng)樣本對總體的代表性,也需要更細(xì)致的了解在線調(diào)查的不同抽樣方法和注意事項(xiàng)。?
這里陸續(xù)摘錄、推出弗吉尼亞理工大學(xué)統(tǒng)計(jì)學(xué)系教授Ronald D. Fricker, Jr.《在線調(diào)查的抽樣方法》一文,今天先翻譯和推出一些預(yù)備內(nèi)容。?
?
1936年,《文學(xué)文摘》(The Literary Digest)雜志進(jìn)行美國總統(tǒng)大選的民調(diào)。雜志根據(jù)電話號碼本和機(jī)動車登記表組成了一個抽樣框。雖然在今天使用電話號碼可能會產(chǎn)生相當(dāng)有代表性的人口樣本,但在1936年,只有四分之一的家庭擁有電話,而它們一般都是更富裕的家庭。使用汽車登記表使抽樣框更加偏向高收入個體。
《文學(xué)文摘》寄出1000萬張民調(diào)選票,其中230萬張被退回,退回比例很高,而答復(fù)率不到25%。根據(jù)民調(diào)數(shù)據(jù),《文學(xué)文摘》預(yù)測,艾爾弗·蘭登將擊敗富蘭克林·羅斯福(預(yù)測得票率55% vs. 41%)。實(shí)際上,羅斯福以61%的得票率擊敗蘭登(37%)。這是有史以來主要民調(diào)的最大失誤,可能也是1938年《文學(xué)文摘》倒閉的原因之一。
?
抽樣是指從一個較大的總體(研究對象的全部)中選擇要調(diào)查的子集(樣本)。本文重點(diǎn)介紹網(wǎng)頁和電子郵件調(diào)查的抽樣方法,這些方法統(tǒng)稱為“在線”調(diào)查。在使用互聯(lián)網(wǎng)之前,大型調(diào)查的管理成本通常很高,因此專業(yè)調(diào)查人員會仔細(xì)考慮如何最好地進(jìn)行調(diào)查,以在最大程度地降低成本的同時最大化信息的準(zhǔn)確性。但是,互聯(lián)網(wǎng)現(xiàn)在可以輕松訪問大量的無憂調(diào)查軟件和數(shù)以百萬計(jì)的潛在調(diào)查對象,并且降低了其他成本和調(diào)查障礙。盡管這對調(diào)查研究人員來說是個好消息,但這些相同的因素也促進(jìn)了不良調(diào)查研究方法的泛濫。
圖?關(guān)于抽樣。如果不可能或無法直接觀測總體的統(tǒng)計(jì)數(shù)據(jù),則可以使用從總體中適當(dāng)抽取的樣本數(shù)據(jù)推斷出有關(guān)總體的信息。(來源:Fricker Jr., 2016)
?
例如,在線調(diào)查數(shù)據(jù)收集的邊際成本實(shí)際上可以為零。乍一看,這十分具有吸引力,似乎可以嘗試進(jìn)行普查,或者只需對大量個體進(jìn)行調(diào)查而不考慮個體是如何被選到樣本中的。實(shí)際上,這些方法的確在在線調(diào)查中被頻繁使用,而沒有充分考慮可替代的抽樣策略或此類選擇對調(diào)查結(jié)果準(zhǔn)確性的潛在影響。結(jié)果是,進(jìn)行不當(dāng)?shù)摹捌詹椤焙突诖笠?guī)模方便樣本(convenience samples)的調(diào)查的泛濫,這些樣本可能比進(jìn)行較小樣本、組織良好的調(diào)查所產(chǎn)生的準(zhǔn)確度更低。
與所有形式的數(shù)據(jù)收集一樣,進(jìn)行調(diào)查需要妥協(xié)。具體地,在可收集的數(shù)據(jù)量和所收集數(shù)據(jù)的準(zhǔn)確性之間幾乎總是要進(jìn)行折衷。因此,對于研究人員來說,在選擇一種用于收集數(shù)據(jù)的抽樣方法時,要把握好它們或隱含或明顯的優(yōu)劣權(quán)衡。
?
從總體中抽取樣本的方法有很多,抽樣也有許多出錯的可能。我們直觀地認(rèn)為一個好的樣本能夠代表總體。所謂“代表性”,并不一定意味著樣本在可觀測特征方面與總體匹配,而是從樣本數(shù)據(jù)獲取的結(jié)果與假如使用總體數(shù)據(jù)獲取的結(jié)果一致。
?
調(diào)查的主要目的是收集有關(guān)總體的信息。但是,即使在進(jìn)行普查的情況下,結(jié)果也可能會受到多種誤差(error)來源的影響。一個好的調(diào)查設(shè)計(jì)可以減少所有類型的誤差。下表列出了Groves(1989)提出和定義的調(diào)查誤差的四個類別。
調(diào)查抽樣可分為兩大類:基于概率的抽樣(也稱為“隨機(jī)抽樣”)和非概率抽樣?;诟怕实臉颖臼鞘褂媚撤N概率機(jī)制選擇受訪者的樣本,并且樣框總體的每個成員被抽中的概率已知。對于抽樣框的每個成員,被抽中的概率不一定必須相等。
概率樣本的類型包括:簡單隨機(jī)抽樣(SRS)、分層隨機(jī)抽樣、整群抽樣、系統(tǒng)抽樣。
當(dāng)每個個體被抽中的概率無法確定,或者個體能夠選擇是否參與調(diào)查時,就會出現(xiàn)非概率樣本(有時稱為方便樣本,convenience samples)。對于概率樣本,調(diào)查員使用某種概率機(jī)制選擇樣本,并且總體中的個體無法控制此過程。相反,網(wǎng)絡(luò)調(diào)查可以簡單地發(fā)布在網(wǎng)站上,由瀏覽該網(wǎng)站的人決定是否參加調(diào)查。顧名思義,這種非概率樣本因?yàn)楂@取方便,因此經(jīng)常被使用。
在基于概率的調(diào)查中,參與者可以選擇不參加調(diào)查,而嚴(yán)格的調(diào)查則試圖將決定不參加(即不答復(fù))的人數(shù)降至最低。在這兩種情況下,都有可能產(chǎn)生偏差(bias),但是在非概率調(diào)查中,偏差的可能性更大,因?yàn)檫x擇加入的個體可能無法代表總體。此外,在非概率調(diào)查中,通常沒有辦法評估偏差的大小,因?yàn)橥ǔ]有關(guān)于選擇不參加的個體的信息。
一般來說,獲取非概率樣本耗費(fèi)的時間和精力更少,因此生成成本更低,但它們通常不能支撐正式的統(tǒng)計(jì)推斷。但是,非概率樣本可能對研究有其他方面的幫助。例如,在研究的早期階段,采集方便樣本(convenience samples)對提出假設(shè)、識別問題、定義替代方案的范圍或收集其他種類的非推斷數(shù)據(jù)可能有用。有關(guān)將各種基于非概率的抽樣方法應(yīng)用于定性研究的詳細(xì)討論,請參見Patton(2002)。
非概率樣本的類型如下:
配額抽樣要求調(diào)查研究人員依據(jù)受訪者的特定特征分配采樣數(shù)額。對受訪者的實(shí)際選擇權(quán)交給了調(diào)查訪問員(interviewers),由他們來完成配額。細(xì)微的偏差可能會由此滲入樣本的選擇中。
滾雪球抽樣(受訪者驅(qū)動的抽樣,也譯作裙帶抽樣、推薦抽樣)。當(dāng)具有所需特征的樣本個體非常稀少,以至于通過其他方式(如簡單隨機(jī)抽樣)定位到足夠多的受訪者非常困難或昂貴時,常采用滾雪球抽樣。它依賴于最初受訪者的推薦,以產(chǎn)生更多的受訪者。盡管此技術(shù)可以大大降低搜索成本,但以引入偏差作為代價,該技術(shù)本身會大大增加樣本無法代表總體的可能性。
判斷抽樣(也譯作立意抽樣)是一種方便抽樣,研究人員根據(jù)自己的判斷選擇樣本。例如,即使所推斷的總體包括所有互聯(lián)網(wǎng)用戶,研究人員可能會決定只從一個“代表性”的互聯(lián)網(wǎng)用戶社群抽取整個隨機(jī)樣本。判斷抽樣還可以以結(jié)構(gòu)更簡單的方式進(jìn)行應(yīng)用,而無需應(yīng)用任何隨機(jī)抽樣。?????????
?
如果樣本在某種程度上不能從系統(tǒng)上代表所推斷的總體,那么所得到的分析可能會產(chǎn)生偏差。例如,對互聯(lián)網(wǎng)用戶進(jìn)行的有關(guān)電腦使用情況的調(diào)查結(jié)果不可能準(zhǔn)確量化一般人群的電腦使用情況,因?yàn)闃颖緝H由使用電腦的人組成。此外,應(yīng)當(dāng)認(rèn)識到,采集更大的樣本并不能自然而然的糾正偏差,大樣本也不能證明偏差就小。例如,不管調(diào)查了多少互聯(lián)網(wǎng)用戶,根據(jù)互聯(lián)網(wǎng)用戶樣本所估計(jì)的電腦平均使用率都很可能會高估總體人口的平均使用率。?
隨機(jī)化是指從感興趣的總體中隨機(jī)選擇受訪者,該方法可最大程度地減少偏差的幾率。其想法是,通過從整個總體中隨機(jī)選擇潛在的調(diào)查對象,抽樣得到的樣本將很可能“看起來像”總體,即使對于那些無法觀測或未知的特征。后一點(diǎn)值得強(qiáng)調(diào),概率樣本對于可觀測和不可觀測特征(observable and unobservable characteristics)均可降低抽樣偏差的機(jī)會。
另一方面,方差只是觀測數(shù)據(jù)變化的度量,可用于計(jì)算標(biāo)準(zhǔn)誤差。通過概率抽樣機(jī)制得出統(tǒng)計(jì)估計(jì)值的精度可通過增大樣本量來提高,因?yàn)椋ㄔ谒衅渌麠l件保持不變的情況下)更大的樣本量可帶來更小的標(biāo)準(zhǔn)誤差。
?
Groves, R. M. (1989)?Survey Errors and Survey Costs. New York: John Wiley.
Patton, M. Q. (2002)?Qualitative Evaluation and Research Methods, London: Sage.
