<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          對(duì)待數(shù)據(jù)的三大致命錯(cuò)誤

          共 3957字,需瀏覽 8分鐘

           ·

          2021-04-18 13:26


           · 譯者· 

          本文節(jié)選自The Atlantic(大西洋月刊)官網(wǎng)于3月16日發(fā)布的一篇文章,文章的兩位作者是疫情數(shù)據(jù)追蹤項(xiàng)目COVID Tracking Project的聯(lián)合發(fā)起人?;仡欉^(guò)去一年的經(jīng)歷,他們?cè)谥敝该绹?guó)政府和相關(guān)機(jī)構(gòu)抗疫不力的同時(shí),也反思了對(duì)待疫情數(shù)據(jù)的三大誤區(qū)。

          這些誤區(qū)在其他數(shù)據(jù)應(yīng)用場(chǎng)景中也同樣可能發(fā)生。我們翻譯了文章的主要內(nèi)容,希望能為大家?guī)?lái)一些啟發(fā)。


          2020年3月4日零點(diǎn)前的幾分鐘,我們發(fā)郵件給美國(guó)各州以及哥倫比亞特區(qū)政府,詢(xún)問(wèn)一個(gè)簡(jiǎn)單的問(wèn)題:經(jīng)過(guò)新冠病毒檢測(cè)的人到底有多少?

           

          當(dāng)時(shí),美國(guó)已有差不多150人確診、11人死亡。而CDC(美國(guó)疾病控制與預(yù)防中心)卻停止了公開(kāi)發(fā)布全國(guó)檢測(cè)數(shù)據(jù)。沒(méi)有這部分?jǐn)?shù)據(jù),也就無(wú)法對(duì)確診病例數(shù)據(jù)進(jìn)行解讀——是只有很少的人病了?還是只有很少的人做了檢測(cè)?令人震驚的是,我們發(fā)現(xiàn)得到檢測(cè)的人非常有限。

           

          我們意識(shí)到,缺乏檢測(cè)的結(jié)果可能是災(zāi)難性的。于是我們發(fā)起了The Atlantic的疫情數(shù)據(jù)追蹤項(xiàng)目。去年春天開(kāi)始,項(xiàng)目志愿者每天從美國(guó)的每個(gè)州和區(qū)域收集疫情數(shù)據(jù)。我們以為政府已經(jīng)擁有這些數(shù)據(jù),希望通過(guò)一些報(bào)道來(lái)督促政府公開(kāi)這些數(shù)據(jù)。

           

          但隨后,我們發(fā)現(xiàn)CDC的數(shù)據(jù)非常不完善,而白宮甚至在使用我們項(xiàng)目的數(shù)據(jù)。長(zhǎng)達(dá)幾個(gè)月的時(shí)間,美國(guó)政府完全不知道到底有多少人確診、多少人住院、多少人死亡。而這個(gè)臨時(shí)的、志愿的數(shù)據(jù)追蹤項(xiàng)目,卻成為了事實(shí)上的全美疫情數(shù)據(jù)來(lái)源。

           

          數(shù)據(jù)可能看上去是一個(gè)太技術(shù)的迷思。如果把疫情造成幾十萬(wàn)人死亡的原因歸結(jié)于數(shù)據(jù),看上去更像甩鍋。但是,政府正是通過(guò)數(shù)據(jù)來(lái)了解現(xiàn)狀的。某種意義上,數(shù)據(jù)就是聯(lián)邦政府眼中的現(xiàn)實(shí)。當(dāng)想象中應(yīng)該存在的數(shù)據(jù),與實(shí)際上存在的數(shù)據(jù)之間出現(xiàn)了巨大的鴻溝,就把全美國(guó)的抗疫政策與行動(dòng)帶到了溝里。

           

          (截止文章發(fā)出前一周)疫情數(shù)據(jù)追蹤項(xiàng)目統(tǒng)計(jì)了全美國(guó)范圍內(nèi)3.63億例檢測(cè)、2800萬(wàn)例確診和51.5148萬(wàn)例死亡。過(guò)去一年教訓(xùn)不斷,我們知道了美國(guó)公共衛(wèi)生政策癡迷于數(shù)據(jù),卻又遠(yuǎn)離數(shù)據(jù)。我們知道了這些政策背后的數(shù)據(jù)可能既無(wú)法理解,又不能指導(dǎo)行動(dòng)。我們知道了疫情數(shù)據(jù)的產(chǎn)生方式,決定著我們到底是否能全面了解疫情。

           

          而改變看待數(shù)據(jù)的方式,就能夠防止災(zāi)難再一次發(fā)生。

           

          1、所有數(shù)據(jù)都是創(chuàng)造出來(lái)的

          而不是直接存在的


          在2020年3月之前,美國(guó)并不缺疫情應(yīng)對(duì)預(yù)案,很多預(yù)案還強(qiáng)調(diào)數(shù)據(jù)驅(qū)動(dòng)決策制定的重要性。但是這些預(yù)案大多建立在詳細(xì)、可靠的數(shù)據(jù)已經(jīng)存在的基礎(chǔ)上。他們很少關(guān)心這些數(shù)據(jù)是如何產(chǎn)生的。


          去年3月份,政府停止公開(kāi)病毒檢測(cè)數(shù)據(jù)。當(dāng)我們開(kāi)始匯總各州的數(shù)據(jù),很快就發(fā)現(xiàn)檢測(cè)做的一團(tuán)糟。首先,由于CDC最初發(fā)放的新冠病毒檢測(cè)盒存在缺陷,并對(duì)什么人才能接受檢測(cè)制定了過(guò)于嚴(yán)格的標(biāo)準(zhǔn),導(dǎo)致各州基本檢測(cè)不了多少人。


          除了這些問(wèn)題外,還存在一大困擾。數(shù)據(jù)系統(tǒng)需要經(jīng)過(guò)精確的校準(zhǔn),才能產(chǎn)生詳細(xì)的統(tǒng)計(jì)數(shù)據(jù)。但是在美國(guó),各州分別“創(chuàng)造”了各自的數(shù)據(jù)并上報(bào)聯(lián)邦政府。這些數(shù)字在某種意義上可能都是“準(zhǔn)確”的,但是各州數(shù)據(jù)間的不統(tǒng)一,使得極難直接統(tǒng)計(jì)出全美國(guó)的數(shù)據(jù)。


          疫情數(shù)據(jù)追蹤項(xiàng)目最初的工作,就是去理解數(shù)據(jù)中的不一致并進(jìn)行調(diào)整,讓各州的數(shù)據(jù)可以統(tǒng)一起來(lái)。因?yàn)槊恳豁?xiàng)疫情數(shù)據(jù)的產(chǎn)生都經(jīng)過(guò)了曲折的過(guò)程。像檢測(cè)數(shù)據(jù),最初只是玻璃瓶或?qū)嶒?yàn)室機(jī)器中的分子反應(yīng),之后要經(jīng)過(guò)數(shù)層人類(lèi)觀測(cè)、鍵盤(pán)輸入、計(jì)算機(jī)處理,然后才到達(dá)政府。在從市、到州再到聯(lián)邦數(shù)據(jù)庫(kù)的過(guò)程中,數(shù)據(jù)可能經(jīng)過(guò)了各種不同方式的處理。經(jīng)過(guò)這個(gè)過(guò)程,最終形成了看似金玉其外卻可能敗絮其中的數(shù)據(jù)。


          理想的疫情應(yīng)對(duì)措施,建立在這些數(shù)據(jù)完全可靠、輸入到高度優(yōu)化的流行病學(xué)模型中、并能指導(dǎo)行動(dòng)的前提下?!癈DC的缺位讓我們?cè)跀?shù)周里因?yàn)槿鄙俦匾臋z測(cè)而盲目行事,”退伍軍人事務(wù)部的一位醫(yī)學(xué)顧問(wèn)表示,“模型與現(xiàn)實(shí)的區(qū)別是,在模型中我們根據(jù)已知情況來(lái)設(shè)定參數(shù),而現(xiàn)實(shí)中的參數(shù)卻是一本糊涂賬?!?/span>


          后續(xù)的學(xué)術(shù)研究發(fā)現(xiàn),早期的確診病例數(shù)只是實(shí)際數(shù)量的10%、甚至5%。盡管已經(jīng)有現(xiàn)成預(yù)案可以進(jìn)行數(shù)據(jù)分析,但政府(錯(cuò)誤的)認(rèn)為這些數(shù)據(jù)很容易獲得,導(dǎo)致沒(méi)能夠在一開(kāi)始就將實(shí)際情況暴露出來(lái)。

           

          2、數(shù)據(jù)是一張照片,而不是一扇窗戶


          去年春末,疫情數(shù)據(jù)追蹤項(xiàng)目開(kāi)發(fā)出一種簡(jiǎn)單的可視化方式,來(lái)一覽疫情數(shù)據(jù)——通過(guò)一排四個(gè)圖表來(lái)分別體現(xiàn)檢測(cè)數(shù)、住院數(shù)、死亡數(shù)。


          圖:美國(guó)全國(guó)新冠疫情統(tǒng)計(jì)(七天平均線)

          四個(gè)維度分別為(從左至右):日檢測(cè)數(shù)、日病例數(shù)、當(dāng)前住院數(shù)、日死亡數(shù)


          這個(gè)圖表看起來(lái)權(quán)威并且全面。但這些數(shù)據(jù)的產(chǎn)生過(guò)程教育我們,每個(gè)維度的數(shù)據(jù)都只能代表某一個(gè)特定時(shí)刻。當(dāng)你看著這些圖表,你看到的不是當(dāng)下的實(shí)況,而是對(duì)過(guò)去某個(gè)瞬間的記錄。


          項(xiàng)目研究發(fā)現(xiàn),不同維度的數(shù)據(jù)是按照不同速度發(fā)展的。以病例數(shù)和檢測(cè)數(shù)為例,根據(jù)這兩個(gè)數(shù)據(jù)可以算出“檢測(cè)陽(yáng)性率”,像封城、重啟等抗疫措施經(jīng)常是基于這一數(shù)據(jù)做出的。但是,病例數(shù)可能會(huì)增長(zhǎng)很快,檢測(cè)為陰性的數(shù)據(jù)變化的則慢一些。除此之外,檢測(cè)與確診的日期也可能并不一致。獨(dú)立的州比較容易校正這類(lèi)問(wèn)題,但是跨州之間就比較難。更甚,當(dāng)檢測(cè)為陰性的結(jié)果出來(lái)的有所延遲,會(huì)讓檢測(cè)陽(yáng)性率看上去比實(shí)際情況更高,影響學(xué)校和商業(yè)的重啟。


          死亡數(shù)也會(huì)受到上報(bào)系統(tǒng)流程的影響,而很多人可能都沒(méi)有意識(shí)到這一點(diǎn)。根據(jù)CDC的預(yù)估,死亡中位數(shù)可能要在人死亡了20天之后才會(huì)匯報(bào)到州政府,中間存在巨大的時(shí)間差。約四分之一的死亡病例會(huì)在6天之內(nèi)上報(bào),但也有另外四分之一的上報(bào)時(shí)間是在45天之后。而且,根據(jù)一位流行病學(xué)家對(duì)加利福尼亞州數(shù)據(jù)的研究,這種延遲還不是恒定的。數(shù)據(jù)反映的可能是好幾周前的情況,這個(gè)問(wèn)題讓疫情爆發(fā)期的實(shí)際死亡人數(shù)難以得到準(zhǔn)確評(píng)估。


          我們最信任、也認(rèn)為不會(huì)有大問(wèn)題的數(shù)據(jù),是受到衛(wèi)生與公共服務(wù)部監(jiān)管的住院數(shù)據(jù)。實(shí)際上,目前所有醫(yī)院都被要求匯報(bào)給衛(wèi)生與公共服務(wù)部,我們可以很好的了解到全美范圍內(nèi)有多少新冠患者被收治入院。


          這讓聯(lián)邦政府可以針對(duì)性提供幫助,為最有需要的醫(yī)院提供人員、藥品和防護(hù)用品。這才是用精準(zhǔn)數(shù)據(jù)幫助政策制定者的良好范例。


          3、數(shù)據(jù)只不過(guò)是一種信息


          數(shù)據(jù)似乎極大程度上代表了真相。政策制定者以“數(shù)據(jù)驅(qū)動(dòng)”為榮,并發(fā)誓要“遵循科學(xué)”。但花了一年深入數(shù)據(jù)后,我們認(rèn)為數(shù)據(jù)沒(méi)什么特別的。


          數(shù)據(jù)只是以定量方法得出的定性結(jié)論。數(shù)據(jù)驅(qū)動(dòng)思維并不一定比其他形式的推論更精確,尤其是當(dāng)沒(méi)搞清楚數(shù)據(jù)從何而來(lái),數(shù)據(jù)中的不一致甚至?xí)a(chǎn)生誤導(dǎo)。


          這個(gè)問(wèn)題從一開(kāi)始就為抗疫帶來(lái)了阻礙。在去年三月初,很明顯新冠病毒應(yīng)該已經(jīng)擴(kuò)散到美國(guó)。而CDC還在嚴(yán)格控制什么人才能接受檢測(cè),缺乏清晰檢測(cè)數(shù)據(jù),意味著政府根本還沒(méi)認(rèn)清現(xiàn)實(shí)。


          今天,問(wèn)題依舊存在。在2021年3月1日舉辦的記者會(huì)上,CDC主任提醒公眾注意病毒新變種。她暗示,全美國(guó)范圍內(nèi)的病例數(shù)和死亡數(shù)都在上升,可能就是由于病毒新變種。但是通過(guò)疫情數(shù)據(jù)追蹤項(xiàng)目,我們知道這個(gè)“新變種引發(fā)疫情新高潮”的說(shuō)法并不成立。如果死亡數(shù)現(xiàn)在上升,說(shuō)明病例數(shù)的上升應(yīng)該在一個(gè)月前。而實(shí)際上,一個(gè)月前的病例數(shù)是快速下降的,這并不相符。


          相反,通過(guò)對(duì)數(shù)據(jù)的密切跟進(jìn)可以了解到,由于要檢查死亡證明,很多州的數(shù)據(jù)上報(bào)存在嚴(yán)重延遲。同時(shí),德州等地又被暴風(fēng)雪擊垮了。這使得他們的上報(bào)數(shù)據(jù)直線下降,死亡數(shù)反常的快速減少,而當(dāng)工作完全恢復(fù)后,數(shù)據(jù)便又快速反彈。不出所料,CDC主任發(fā)言后,日均死亡數(shù)很快就回落了25%。


          換句話說(shuō),并不是這些州的疫情在2月份變?cè)懔?,而是?2月延續(xù)到1月的高峰期遠(yuǎn)比當(dāng)時(shí)認(rèn)為的更嚴(yán)重。不應(yīng)該在沒(méi)有充分考慮數(shù)據(jù)產(chǎn)生背景的情況下,就直接解讀眼前的數(shù)據(jù)。

           

          數(shù)據(jù)是極具魅力的。你看著圖表或者表格,可能會(huì)感覺(jué)自己像掌握了制勝密碼一樣無(wú)所不能。但事實(shí)上,你更像是一個(gè)清潔工,看著水從下水道流向污水處理廠。當(dāng)然,久而久之你也能知道哪個(gè)下水道口格外難聞,而哪個(gè)離污水處理廠更近,但你不應(yīng)該自欺欺人,以為自己了解水里都有什么。


          為了避免下一次數(shù)據(jù)災(zāi)難,除了花精力塑造未來(lái),我們的公共衛(wèi)生系統(tǒng)也必須要花同樣的精力去理解當(dāng)下。疫情或任何危機(jī)的管理,就在于根據(jù)盡可能好的信息,做出盡可能不壞的決策。這些信息可能是各種形式的,不是只有數(shù)據(jù)。但一旦你要參考數(shù)據(jù),就一定要知道數(shù)據(jù)是如何產(chǎn)生的,不然就很有可能會(huì)被誤導(dǎo)。

           

          原文來(lái)源:The Atlantic 翻譯:TalkingData

          原文標(biāo)題:《Why the Pandemic Experts Failed——We’re still thinking about pandemic data in the wrong ways.》

          原文鏈接:https://www.theatlantic.com/science/archive/2021/03/americas-coronavirus-catastrophe-began-with-data/618287

          作者:Robinson Mayer、Alexis C. Madrigal(The Atlantic撰稿人,疫情數(shù)據(jù)追蹤項(xiàng)目COVID Tracking Project聯(lián)合發(fā)起人

          推薦閱讀:

          Excel不是萬(wàn)能的!新冠疫情教我們的數(shù)據(jù)課

          數(shù)據(jù)應(yīng)用新理念:以場(chǎng)景釋放價(jià)值、以閉環(huán)驅(qū)動(dòng)增長(zhǎng)

          統(tǒng)計(jì)無(wú)用論?來(lái)看看統(tǒng)計(jì)學(xué)在大數(shù)據(jù)中的價(jià)值

          TalkingData——用數(shù)據(jù)說(shuō)話

          每天一篇好文章,歡迎分享關(guān)注

          瀏覽 24
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  小嫩苞一区二区三区 | 伊人久久免费 | 在线播放亚洲高清 | 成人高清尤物精品在线观看 | 欧美V日韩V国产V |