鐘南山團(tuán)隊(duì)攜手騰訊研發(fā)新冠重癥AI預(yù)測模型,登上Nature子刊
鐘南山院士團(tuán)隊(duì)與騰訊AI Lab一起,共同研發(fā)了一個(gè)預(yù)測COVID-19患者病情發(fā)展的AI模型。
這個(gè)模型可以分別預(yù)測5天、10天和30天內(nèi)病情危重的概率,能更合理地對病人分別進(jìn)行診治。
眾所周知,輕度的新冠患者通常是自限性的。
自限性,指疾病在發(fā)展到一定程度后,靠著機(jī)體調(diào)節(jié)控制病情發(fā)展、并逐漸恢復(fù)痊愈。
但并不是所有人都擁有非常強(qiáng)大的抵抗力。

研究顯示,6.5%的新冠患者可能會突然發(fā)展為重癥患者。
這些忽然轉(zhuǎn)化為重癥的患者不僅需要大量的醫(yī)護(hù)資源,而且死亡率高達(dá)49%。
因此,盡早識別有重癥風(fēng)險(xiǎn)的患者,及早進(jìn)行病情干預(yù),對于預(yù)測病情發(fā)展、以及醫(yī)療資源高效分配至關(guān)重要。
而這個(gè)模型,是基于AI對大數(shù)據(jù)的分析實(shí)現(xiàn)的。
基于深度學(xué)習(xí)的患者數(shù)據(jù)分析
事實(shí)上,準(zhǔn)確預(yù)測重癥患者的風(fēng)險(xiǎn)并非易事。
研究發(fā)現(xiàn),臨床上與重癥患者相關(guān)的特征多達(dá)74個(gè),如果要采用傳統(tǒng)方法建立預(yù)測模型,恐怕難以實(shí)現(xiàn)。
經(jīng)過考量后,團(tuán)隊(duì)決定采用深度學(xué)習(xí),對大數(shù)據(jù)進(jìn)行分析。
之所以采用深度學(xué)習(xí),是因?yàn)樗梢酝ㄟ^神經(jīng)網(wǎng)絡(luò),對特征進(jìn)行高階非線性組合,從而更深層次地建立特征與目標(biāo)函數(shù)之間的映射。
為了更精確地建模這10項(xiàng)特征與重癥風(fēng)險(xiǎn)的關(guān)系,團(tuán)隊(duì)采用了結(jié)合Cox生存分析算法與LASSO算法的方式,來挖掘數(shù)據(jù)之中的隱含聯(lián)系,進(jìn)而計(jì)算病人的重癥風(fēng)險(xiǎn)系數(shù)。
數(shù)據(jù)表明,研究團(tuán)隊(duì)一共對來自全國575家醫(yī)院的1590名患者的數(shù)據(jù)進(jìn)行了建模。
最終,經(jīng)過分析,團(tuán)隊(duì)確定了10項(xiàng)能很好預(yù)測重癥風(fēng)險(xiǎn)的患者特征:
10項(xiàng)特征包括:年齡、是否氣促、是否有惡性腫瘤病史、是否有慢性肺阻、合并癥數(shù)量、是否有 X 光平片異常、血液中性粒細(xì)胞與淋巴細(xì)胞比例、血液乳酸脫氫酶含量、血液直接膽紅素含量、血液肌酸激酶含量。
這10項(xiàng)特征都可以通過正常檢測途徑獲得,可用于預(yù)測重癥病情的風(fēng)險(xiǎn)。

從這10項(xiàng)特征的單因素進(jìn)行分析,可以發(fā)現(xiàn),年齡是新冠肺炎發(fā)展至重癥最大的風(fēng)險(xiǎn)之一。
事實(shí)上,超過60歲的新冠患者,病情發(fā)展成重癥的概率明顯更高。(老人更要保護(hù)好自己)
直觀了解風(fēng)險(xiǎn)系數(shù)
研究團(tuán)隊(duì)在訓(xùn)練好的模型基礎(chǔ)上,增加了一層線性Cox模型,便于產(chǎn)生可供醫(yī)生解讀的最終結(jié)果。
這層線性模型會按重要性,分別對深度學(xué)習(xí)模型的預(yù)測值與10項(xiàng)特征的值賦予不同的權(quán)重,并通過求和,得到最終風(fēng)險(xiǎn)系數(shù)。
模型可以通過諾模圖手動進(jìn)行計(jì)算。
諾模圖,在臨床上經(jīng)常被用來綜合各項(xiàng)數(shù)值換算最終評估分?jǐn)?shù)。
通過諾模圖,醫(yī)生可以很直觀地了解各項(xiàng)觀察值與風(fēng)險(xiǎn)系數(shù)之間的關(guān)系,同時(shí)也可以在沒有電腦的情況下手動計(jì)算風(fēng)險(xiǎn)系數(shù)。

上圖是基于訓(xùn)練好的模型,對一位新冠肺炎患者的身體數(shù)據(jù)進(jìn)行分析后,所得到的諾模圖。
可以看見,這名患者的總體諾模圖分?jǐn)?shù)為 209,未來 5、10、30 天的總體重癥概率分別為 0.58、0.62、0.69,因此被歸類為有較高的重癥風(fēng)險(xiǎn)。
更好的預(yù)測效果
實(shí)驗(yàn)證明,這個(gè)AI模型相比于此前的經(jīng)典Cox模型,具有更高的預(yù)測準(zhǔn)確性。
經(jīng)過訓(xùn)練,模型在測試集上的準(zhǔn)確性(C-index)從0.876提升到了0.894,AUC(用于衡量檢測方法真實(shí)性)從 0.889 提升到了 0.911。
不僅如此,采用這種模型對另外1393個(gè)外部檢驗(yàn)患者的數(shù)據(jù)進(jìn)行分析后,發(fā)現(xiàn)預(yù)測的效果非常好。
在這1393個(gè)患者中,共有106個(gè)患者發(fā)展成重癥,只有2例數(shù)據(jù)異常的患者被錯(cuò)誤地劃分到了低風(fēng)險(xiǎn)組。

除此之外,研究團(tuán)隊(duì)還對不同地理區(qū)域、衛(wèi)生資源的三組數(shù)據(jù)進(jìn)行了測試,包括武漢940例、湖北省武漢市以外的地區(qū)380例,以及廣東73例,準(zhǔn)確性分別為0.878、0.769和0.967。
排除10個(gè)臨床特征參數(shù)缺失超過3個(gè)以上的患者后,準(zhǔn)確性上升為0.890、0.852和0.967,表明這項(xiàng)模型具有很好的普適性。
除此之外,這個(gè)AI預(yù)測模型還有更多優(yōu)勢,例如可以自動填補(bǔ)缺失的數(shù)據(jù),以及可以隨著應(yīng)用數(shù)據(jù)的增加而不斷進(jìn)化,令準(zhǔn)確性再一步提高。
研究于2020年7月15日發(fā)表在國際頂級期刊「Nature」的子刊「Nature Communications」上,目前已開源。(項(xiàng)目鏈接見文末)

感興趣的小伙伴們,可以戳下方傳送門查看項(xiàng)目代碼~
作者介紹
一作有兩位,分別是梁文華博士與姚建華博士。
梁文華博士,來自廣州醫(yī)科大學(xué)附屬第一醫(yī)院,專業(yè)方向?yàn)榉伟┘胺尾拷Y(jié)節(jié)的綜合診治,尤其基因檢測、靶向治療及免疫治療、術(shù)后跟蹤等。
姚建華博士來自騰訊AI Lab,目前在醫(yī)療中心就任首席科學(xué)家。
與此同時(shí),鐘南山院士、廣州呼吸健康研究院院長何建行、騰訊AI Lab醫(yī)療中心負(fù)責(zé)人黃俊洲也為共同作者。
傳送門
網(wǎng)站鏈接:
https://aihealthcare.tencent.com/COVID19-Triage_en.html
