<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          27歲華裔小伙一戰(zhàn)成名!搞出美國(guó)新冠最準(zhǔn)預(yù)測(cè)模型,一人干翻專(zhuān)業(yè)機(jī)構(gòu),彭博:Superstar

          共 3640字,需瀏覽 8分鐘

           ·

          2021-03-07 12:24

          金磊 曉查 發(fā)自 凹非寺 
          量子位 報(bào)道 | 公眾號(hào) QbitAI

          年僅27歲的他,被彭博評(píng)價(jià)為“新冠病毒數(shù)據(jù)超級(jí)明星”

          為什么?

          一己之力,僅用一周時(shí)間打造的新冠預(yù)測(cè)模型,準(zhǔn)確度方面碾壓那些數(shù)十億美元、數(shù)十年經(jīng)驗(yàn)加持的專(zhuān)業(yè)機(jī)構(gòu)。

          他就是Youyang Gu,擁有 MIT 電氣工程和計(jì)算機(jī)科學(xué)碩士學(xué)位,以及數(shù)學(xué)學(xué)位。

          但值得注意的是,他在醫(yī)學(xué)和流行病學(xué)等方面卻是一個(gè)小白

          他的模型,甚至被著名數(shù)據(jù)科學(xué)家、fast.ai創(chuàng)始人Jeremy Howard高度評(píng)價(jià)道:

          唯一看起來(lái)合理的模型。

          他是唯一一個(gè)真正查看數(shù)據(jù),并且做得正確的人。

          不僅如此,他的模型還被美國(guó)疾控中心采用。

          到底是個(gè)怎樣的預(yù)測(cè)模型?

          時(shí)間點(diǎn)要追溯到去年年初。

          當(dāng)時(shí)疫情已然在全球蔓延開(kāi)來(lái),于是公眾試圖用建模的方式,來(lái)預(yù)測(cè)接下來(lái)疫情會(huì)帶來(lái)的影響。

          大多數(shù)的目光都將希望投向了2家專(zhuān)業(yè)機(jī)構(gòu)打造的預(yù)測(cè)系統(tǒng)——倫敦帝國(guó)理工學(xué)院、總部位于西雅圖的健康指標(biāo)與評(píng)估研究所(IHME)

          但2家機(jī)構(gòu)給出的預(yù)測(cè)結(jié)果卻是天差地別

          • 倫敦帝國(guó)理工學(xué)院:到夏天,美國(guó)因新冠病毒而死亡的人數(shù)將達(dá)到200萬(wàn)

          • IHME:預(yù)計(jì)到8月,死亡人數(shù)將達(dá)到6萬(wàn)

          (后來(lái)的事實(shí)證明,死亡人數(shù)是16萬(wàn)。)

          2家專(zhuān)業(yè)機(jī)構(gòu)給出的預(yù)測(cè)數(shù)據(jù),差距為何能夠如此之大?

          這就讓當(dāng)時(shí)年僅26歲的Youyang Gu引起了注意。

           Youyang Gu

          雖然他沒(méi)有任何醫(yī)學(xué)或流行病方面的經(jīng)驗(yàn),但他堅(jiān)信,數(shù)據(jù)預(yù)測(cè)在此時(shí)會(huì)派上大用場(chǎng)。

          于是,大約在4月中旬,Youyang Gu便在家里僅花了一周時(shí)間,打造出了自己的預(yù)測(cè)器,以及一個(gè)可以顯示相關(guān)信息的網(wǎng)站

          Youyang Gu創(chuàng)建的網(wǎng)站

          但Gu在這個(gè)過(guò)程中所用到的方法,并不是說(shuō)有多么的高級(jí),相反,恰恰是比較簡(jiǎn)單的那種。

          他首先考慮的是新冠病毒檢測(cè)數(shù)、住院人數(shù)和其他因素之間的關(guān)系,但在這個(gè)過(guò)程中,Gu卻發(fā)現(xiàn)各個(gè)州和聯(lián)邦政府所提供的數(shù)據(jù)是存在不一致的現(xiàn)象。

          此時(shí),問(wèn)題就來(lái)了——什么樣的數(shù)據(jù)才是靠譜的?

          Gu認(rèn)為,最靠譜的數(shù)據(jù),似乎就是每天的死亡人數(shù)

          其他的模型用到了很多數(shù)據(jù)源,但我決定用過(guò)去的死亡人數(shù),來(lái)預(yù)測(cè)未來(lái)的死亡人數(shù)。

          至于這樣做的原因,Gu給出的解釋是“將它作為唯一的輸入,有助于在噪音中過(guò)濾信號(hào)”。

          那么,預(yù)測(cè)結(jié)果如何?

          可以說(shuō)是相當(dāng)?shù)木珳?zhǔn)了。

          在模型剛剛完成時(shí),他預(yù)測(cè)在5月9日,美國(guó)將有8萬(wàn)人死亡,當(dāng)天的實(shí)際死亡人數(shù)為79926。

          而同樣來(lái)自IHME的預(yù)測(cè)數(shù)據(jù)卻是“2020年一整年的死亡人數(shù)將不超過(guò)8萬(wàn)”。

          Gu還預(yù)測(cè)在5月18日,死亡人數(shù)將達(dá)到9萬(wàn);5月27日,死亡人數(shù)將達(dá)到10萬(wàn)。

          事實(shí)證明,他的這兩次預(yù)測(cè)再次“押中”

          除了精準(zhǔn)數(shù)字的預(yù)測(cè)外,Gu基于許多州從封鎖狀態(tài)逐步轉(zhuǎn)變開(kāi)放狀態(tài),預(yù)測(cè)將出現(xiàn)第二波大規(guī)模感染和死亡。

          而在Gu發(fā)出這樣的預(yù)測(cè)當(dāng)天,特朗普所發(fā)表的言論卻是“IHME所預(yù)測(cè)的6萬(wàn)死亡人數(shù)表明,疫情很快將結(jié)束”……

          或許正是因?yàn)镚u的模型預(yù)測(cè)之精準(zhǔn),越來(lái)越多人開(kāi)始關(guān)注他的作品。

          在Twitter上,Gu不僅@了各路記者,還給流行病學(xué)專(zhuān)家發(fā)郵件,讓他們核實(shí)自己的數(shù)據(jù)。

          去年4月底,華盛頓大學(xué)著名生物學(xué)家Carl Bergstrom便在Twitter上發(fā)布了Gu的模型。

          不久之后,美國(guó)疾病控制和預(yù)防中心,也在其新冠預(yù)測(cè)網(wǎng)站上發(fā)布了Gu的數(shù)據(jù)。

          不僅如此,隨著疫情的發(fā)展,身為中國(guó)移民的Gu,還參與了由美國(guó)專(zhuān)家團(tuán)隊(duì)組織的定期會(huì)議,每個(gè)人都想更好的改善他的模型。

          他的網(wǎng)站訪(fǎng)問(wèn)量也呈現(xiàn)出爆炸式增長(zhǎng),每天都有數(shù)百萬(wàn)人來(lái)看他的數(shù)據(jù)。

          通常情況下,Gu的模型所預(yù)測(cè)的數(shù)據(jù),基本在幾周后便會(huì)達(dá)到,與實(shí)際的死亡人數(shù)非常接近。

          隨著類(lèi)似的預(yù)測(cè)模型逐漸增多,阿默斯特馬薩諸塞大學(xué)生物統(tǒng)計(jì)學(xué)和流行病學(xué)系的副教授Nicholas Reich,便統(tǒng)計(jì)了50個(gè)這樣的模型:

          Gu的模型一直位居前列。

          但到了去年11月,Gu卻做出了令人意外的一個(gè)決定——結(jié)束他的預(yù)測(cè)任務(wù)。

          對(duì)此,Reich這樣評(píng)價(jià)道:

          Youyang Gu是一個(gè)非常謙卑的人,他看到其他人的模型也做得很好,便覺(jué)得自己的工作已經(jīng)完成了。

          而在Gu決定停止項(xiàng)目的前一個(gè)月,他預(yù)測(cè)11月1日死亡人數(shù)將達(dá)到231000人,而實(shí)際人數(shù)為230995人。

          但I(xiàn)HME的Chris Murray認(rèn)為:

          Gu使用的機(jī)器學(xué)習(xí)方法,在短期預(yù)測(cè)方面的效果比較良好,但不太理解“大局中發(fā)生了什么”。

          對(duì)此,Gu沒(méi)有針對(duì)模型的評(píng)價(jià)做出回應(yīng),相反,他這樣表態(tài):

          我非常感謝 Chris Murray 醫(yī)生和他的團(tuán)隊(duì)所做的工作;沒(méi)有他們,我就不會(huì)有今天的成就。

          在休息了一段時(shí)間之后,Gu重新投入到了這份事業(yè)當(dāng)中。

          這一次,他要做的預(yù)測(cè)是“美國(guó)有多少人感染了新冠病毒”、“疫苗推出的速度有多快”、“美國(guó)可能何時(shí)(如果可能的話(huà))達(dá)到群體免疫”等。

          他的預(yù)測(cè)表明,到今年6月,大約61%的美國(guó)人口應(yīng)該獲得某種形式的免疫力——無(wú)論是疫苗還是因過(guò)去的感染。

          ……

          Gu一直希望能夠找到一份能對(duì)社會(huì)產(chǎn)生巨大影響的工作,同時(shí)避免政治、偏見(jiàn)以及大型機(jī)構(gòu)有時(shí)會(huì)帶來(lái)的負(fù)擔(dān)。他認(rèn)為:

          在這個(gè)領(lǐng)域,有很多缺點(diǎn)可以通過(guò)我這種背景的人來(lái)改善。

          誰(shuí)是Youyang Gu?

          Youyang Gu出身于美國(guó)華裔移民家庭,在伊利諾伊州和加州長(zhǎng)大。

          Gu從小喜歡數(shù)學(xué)和科學(xué),直到高中畢業(yè)時(shí),才真正接觸計(jì)算機(jī)科學(xué)。而他能夠進(jìn)入這個(gè)行業(yè)得益于他的父親,因?yàn)樗母赣H是一名計(jì)算機(jī)從業(yè)者。

          正在做化學(xué)實(shí)驗(yàn)的Gu Youyang(圖片來(lái)自2010年克拉克獎(jiǎng)學(xué)金項(xiàng)目)

          Gu本科和碩士都在MIT就讀,在那里他獲得了計(jì)算機(jī)科學(xué)與數(shù)學(xué)雙學(xué)士學(xué)位,以及計(jì)算機(jī)科學(xué)的碩士學(xué)位。

          畢業(yè)后他繼續(xù)在MIT著名的CSAIL實(shí)驗(yàn)室的NLP組進(jìn)行了一年的研究,同年在EMNLP 2016上發(fā)表了論文。

          這也是他第一次接觸大數(shù)據(jù),并由此建立統(tǒng)計(jì)模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。

          不過(guò)他沒(méi)有因此繼續(xù)學(xué)術(shù)研究,而是進(jìn)入產(chǎn)業(yè)界。從MIT離開(kāi)后,他加入了金融行業(yè),為高頻交易系統(tǒng)編寫(xiě)算法。

          在那里,他的數(shù)據(jù)建模能力得到了進(jìn)一步磨練,因?yàn)樵诮鹑诮灰字校瑪?shù)據(jù)必須非常定量并盡可能地準(zhǔn)確。

          之后,他又進(jìn)入了體育界,繼續(xù)進(jìn)行大數(shù)據(jù)方面的研究。這也為他提供了豐富的跨學(xué)科經(jīng)驗(yàn),使他能夠成功應(yīng)對(duì)新地領(lǐng)域,懂得如何更加準(zhǔn)確地建模。

          用他自己的話(huà)來(lái)說(shuō),他的專(zhuān)長(zhǎng)是使用機(jī)器學(xué)習(xí)來(lái)理解數(shù)據(jù),將信號(hào)與噪聲分離并做出準(zhǔn)確的預(yù)測(cè)。

          在建立新冠死亡模型時(shí),他起初考慮了確診數(shù)量、住院數(shù)量和其他因素之間的關(guān)系。然后他發(fā)現(xiàn)各州和聯(lián)邦政府報(bào)告的數(shù)據(jù)不一致,最可靠的數(shù)字是每天的死亡人數(shù)。

          Gu認(rèn)為,如果輸入數(shù)據(jù)質(zhì)量很低,那么數(shù)據(jù)越多,輸出的性能就越差。

          在一周的時(shí)間里,他就根據(jù)死亡數(shù)據(jù)便建立了一個(gè)簡(jiǎn)單模型,并將預(yù)測(cè)網(wǎng)站上線(xiàn)。

          從去年4月以來(lái),Gu已經(jīng)自愿在這個(gè)項(xiàng)目中投入了幾千個(gè)小時(shí),而且是無(wú)償?shù)摹?/p>

          在接受醫(yī)學(xué)網(wǎng)站Medscape主編Eric Topol采訪(fǎng)時(shí),Gu表示自己現(xiàn)在全職投入到新冠預(yù)測(cè)網(wǎng)站上,沒(méi)有兼職、沒(méi)有收入,他靠著過(guò)去的積蓄生活。

           Gu Youyang接受Medscape主編Eric Topol視頻采訪(fǎng)

          然而就是這樣一個(gè)公益的項(xiàng)目卻遭到了一些Twitter網(wǎng)友非議,但是他還是堅(jiān)持了下來(lái)。

          從12月開(kāi)始,covid19-projections.com接受網(wǎng)友的捐贈(zèng)幫助,現(xiàn)在已經(jīng)完成了5萬(wàn)美元的籌款目標(biāo)。

          除了感染人數(shù)外,Gu的新冠網(wǎng)站又有了一個(gè)新的功能。從去年12月起,covid19-projections.com開(kāi)始跟蹤和模擬疫苗接種情況以及群體免疫的途徑。

          這個(gè)月,Gu又將“群體免疫”改成了“恢復(fù)常態(tài)”,因?yàn)樗哪P皖A(yù)測(cè)表明,美國(guó)不太可能在2021年達(dá)到理論上的群體免疫。

          未來(lái)的路怎么走?疫情結(jié)束后,Gu的職業(yè)規(guī)劃如何?

          他說(shuō)現(xiàn)在還為時(shí)過(guò)早,雖然他現(xiàn)在的工作是預(yù)測(cè)疫情發(fā)展,但是他很難預(yù)測(cè)自己3個(gè)月或1年后要做什么。

          因?yàn)檫@項(xiàng)工作,世界各地的高校和企業(yè)已經(jīng)向他拋出了橄欖枝。

          參考鏈接:

          https://www.bloomberg.com/news/articles/2021-02-19/covid-pandemic-how-youyang-gu-used-ai-and-data-to-make-most-accurate-prediction
          https://youyanggu.com/
          https://twitter.com/youyanggu
          https://covid19-projections.com/
          https://www.medscape.com/viewarticle/944778

          —  —

          另外,關(guān)注公眾號(hào)互聯(lián)網(wǎng)架構(gòu)師,在后臺(tái)回復(fù):2T,可以獲取我整理的 Java 系列面試題和答案,非常齊全。

          瀏覽 37
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日日夜夜青青草 | 国产精品美女一区二区三区 | 精品久久久久久久久久久 | 亚洲精品午夜成人片DY888 | xxx.一区|