流行病的簡(jiǎn)單數(shù)學(xué)
日期:2020年08月04日
正文共:4199字0圖
預(yù)計(jì)閱讀時(shí)間:11分鐘
作者:李昭輝
疾病是人類生活中無(wú)處不在的一大組成部分。許多疾病癥狀輕微,例如普通感冒,只會(huì)給人造成輕微的困擾;而另外某些疾病,例如埃博拉病毒或艾滋病卻令人感到恐懼。正是疾病這種看不見(jiàn)、看上去不可預(yù)測(cè)的性質(zhì)(某些人會(huì)被感染,而另一些人則免于感染)引發(fā)了人們無(wú)窮的聯(lián)想。從史前到今天,疾病一直是人類社會(huì)中很多恐懼和迷信的根源,隨著自然科學(xué)的逐漸興起,在過(guò)去的一個(gè)世紀(jì)里,數(shù)學(xué)開(kāi)始越來(lái)越多地被科學(xué)家們用來(lái)理解和預(yù)測(cè)疾病的傳播,并將重要的公共衛(wèi)生問(wèn)題與若干基本的感染參數(shù)建立了關(guān)聯(lián)。在本文中,將和大家一起回顧幾個(gè)最簡(jiǎn)單的關(guān)于疾病的數(shù)學(xué)模型,并考慮在未來(lái)如何令其往更加“數(shù)學(xué)化”的方向發(fā)展——這些發(fā)展將提高我們對(duì)疾病的理解,并強(qiáng)化我們預(yù)測(cè)疾病的能力。
關(guān)于“疾病的數(shù)學(xué)”,自然是一個(gè)會(huì)涉及大量數(shù)據(jù)的話題。盡管目前科學(xué)家們已經(jīng)完成了一些純理論上的工作,但該研究領(lǐng)域的關(guān)鍵問(wèn)題是要能夠建立起數(shù)學(xué)模型和數(shù)據(jù)之間的關(guān)系。醫(yī)生的病例報(bào)告為我們提供了最詳細(xì)的生物學(xué)數(shù)據(jù)來(lái)源之一,我們利用計(jì)算機(jī)和網(wǎng)絡(luò)可以很方便地查到某些國(guó)家和地區(qū)幾十年來(lái)許多種疾病的病例數(shù)。和疾病有關(guān)的數(shù)據(jù)往往還涉及一些具有社會(huì)影響的特性,例如出生率、性別比和死亡率的變化等。因此,要想全面了解疾病的動(dòng)態(tài),就需要用到各種各樣的數(shù)學(xué)工具,從模型創(chuàng)建到求解微分方程,再到統(tǒng)計(jì)分析。
幾乎所有關(guān)于疾病的數(shù)學(xué)模型都基于相同的基本前提:可以將人群按照若干特征分為不同的組,具體取決于我們對(duì)疾病的了解程度。在此類模型中,最簡(jiǎn)單的模型是將個(gè)體分為易感者(susceptible)、感染者(infectious)和康復(fù)者(recovered)三大類,取首字母將這類模型稱為“SIR模型”。對(duì)一個(gè)個(gè)體而言,其在出生后被認(rèn)為是“易感者”,易感者人群從未接觸過(guò)某種疾病,并且能夠感染該疾??;一旦患病,便成了“感染者”,具有傳染性的個(gè)體感染者會(huì)將疾病傳播給易感者人群,并在成為“康復(fù)者”之前在“感染者”階段停留一段時(shí)間(稱為“傳染期”)。還有一點(diǎn)需要注意的是,在SIR模型中,假定康復(fù)的個(gè)體可以終生免疫這種疾病。

通過(guò)為每個(gè)類別(易感者、感染者和康復(fù)者)中個(gè)體的數(shù)量比例確定一個(gè)微分方程,我們可以使對(duì)這一感染過(guò)程的描述更加數(shù)學(xué)化(具體的方程見(jiàn)下圖)。對(duì)SIR疾病數(shù)學(xué)模型的計(jì)算機(jī)模擬與純數(shù)學(xué)理論計(jì)算結(jié)果非常吻合,因此可以預(yù)測(cè)患病人數(shù)逐漸減少階段的反彈和振蕩情況(其曲線特征與在彈簧中觀察到的阻尼振蕩情況有些類似)。因此,盡管SIR模型表明在最初階段會(huì)以一定的間隔定期發(fā)生大流行,但最終感染者人數(shù)會(huì)穩(wěn)定在一個(gè)恒定值上下。

上圖就是描述易感者、感染者和康復(fù)者三個(gè)類別中人數(shù)比例的數(shù)學(xué)微分方程。式中,B表示出生率,等號(hào)右側(cè)的d表示死亡率,g表示康復(fù)率,β表示傳染率,t表示時(shí)間,S表示易感者人數(shù),I表示感染者人數(shù),R表示康復(fù)者人數(shù),R0見(jiàn)下文。在大多數(shù)模型中,假定人群的出生率和死亡率相同,因此人口總數(shù)保持恒定。下圖是SIR模型的“阻尼振蕩”曲線:

圖中,橫軸表示時(shí)間,縱軸表示感染者的比例。
對(duì)于簡(jiǎn)單的SIR疾病數(shù)學(xué)模型,科學(xué)家們已經(jīng)證明了許多有趣且有用的結(jié)果,但在探索這一豐富的主題領(lǐng)域之前,我們需要進(jìn)一步了解一下其他的流行病學(xué)數(shù)學(xué)表示法。就疾病的傳播而言,有一個(gè)參數(shù)是非常重要的,而且該參數(shù)還與疾病流行的長(zhǎng)期行為和根除疾病所必需的疫苗接種水平有關(guān),這個(gè)參數(shù)被稱為“基本傳染數(shù)”,用R0表示。流行病學(xué)家們將R0定義為“在完全易感人群中,由感染性個(gè)體引起的平均繼發(fā)病例數(shù)”。也就是說(shuō),R0這個(gè)參數(shù)能告訴我們某種疾病在一代人中的初始增長(zhǎng)率:當(dāng)R0大于1時(shí),這種疾病可以感染完全易感的人群,病例數(shù)將增加;而當(dāng)R0小于1時(shí),這種疾病將始終無(wú)法傳播開(kāi)來(lái)。因此,參數(shù)R0以最簡(jiǎn)單的形式告訴了我們某個(gè)人群是否有罹患某種特定疾病的風(fēng)險(xiǎn)。幾種知名疾病的R0如下表所示:
疾病名稱 | R0 |
艾滋病 | 2~5 |
天花 | 3~5 |
麻疹 | 16~18 |
瘧疾 | >100 |
在上表中,第三行的麻疹在兒童中較為常見(jiàn),患兒的肺泡可因麻疹病毒的感染而出現(xiàn)透明膜,阻斷肺泡內(nèi)的氣體交換,導(dǎo)致呼吸衰竭。下圖是患病兒童肺部的組織學(xué)切片在光學(xué)顯微鏡下的表現(xiàn)(尸檢):

前面提到,對(duì)SIR疾病數(shù)學(xué)模型的計(jì)算機(jī)模擬與純數(shù)學(xué)理論計(jì)算結(jié)果是非常吻合的,下面就是腺鼠疫(也稱“腹股溝淋巴結(jié)鼠疫”)和麻疹的SIR模型曲線與實(shí)際流行情況曲線之間的比較,可見(jiàn)二者非常契合:

上圖:英國(guó)布里斯托爾市每周的麻疹患者數(shù),橫坐標(biāo)為年份,縱坐標(biāo)為患病人數(shù),藍(lán)線為實(shí)際人數(shù),紅線為理論模擬結(jié)果。

上圖:澳大利亞悉尼市1900年發(fā)生腺鼠疫疫情時(shí)的情況,橫坐標(biāo)為1~8月,縱坐標(biāo)為每天的患者數(shù),藍(lán)線為實(shí)際人數(shù),紅線為理論模擬結(jié)果。
參數(shù)R0的第二個(gè)用途是查看某次疫情爆發(fā)的情況。我們假設(shè),一種新型流感病毒在完全易感的人群中傳播開(kāi)來(lái)了,簡(jiǎn)單的直覺(jué)告訴我們,這種疾病將在整個(gè)人群中迅速傳播,并在很短的時(shí)間內(nèi)感染大部分人口。如果我們認(rèn)為這種疾病不會(huì)致命且傳播到整個(gè)人群的時(shí)間很短,因此完全可以忽略總?cè)丝谥械某錾退劳銮闆r,而只關(guān)注疾病的傳播動(dòng)力學(xué)。對(duì)于這類短期流行病而言,最初的病例數(shù)呈指數(shù)增長(zhǎng),我們?cè)O(shè)感染者人數(shù)為時(shí)間t的函數(shù)I(t),那么存在這樣的關(guān)系式:

然而,隨著越來(lái)越多的人成為康復(fù)者,并且易感者越來(lái)越少,這種疾病的傳播也將變得越來(lái)越“困難”,最終導(dǎo)致病例數(shù)的下降。由于出現(xiàn)了這種下降,因此并非所有的人都會(huì)在這種疾病消失之前受到感染。通過(guò)研究SIR模型的長(zhǎng)期行為,1927年,科學(xué)家克馬克(Kermack)和麥肯德里克(McKendrick)共同提出了一個(gè)傳染病模型,該模型可以預(yù)測(cè)人群中能夠免受疾病感染的個(gè)體的比例。我們?cè)O(shè)這一比例為S∞,則其有如下的關(guān)系式:

盡管對(duì)這一關(guān)系式的研究還有待深入,但通過(guò)圖表法,即在同一張圖表中繪出S∞和exp([1-S∞]R0)兩條曲線,并比較兩條曲線的交點(diǎn),我們可以清楚地看出,隨著R0的增加,免受疾病感染的人數(shù)比例S∞減少。通過(guò)數(shù)字計(jì)算可知,當(dāng)R0=2時(shí),S∞的值大約為20%;而當(dāng)R0=5時(shí),S∞的值大約僅為0.7%。因此,R0的值增加會(huì)嚴(yán)重影響疾病爆發(fā)時(shí)免受感染的個(gè)體的比例。

上圖:用圖表的方法“計(jì)算”能夠免遭疾病感染的人數(shù)的百分比。
最后,如果我們希望對(duì)某種地方性的流行病建模,即這種疾病在人群中無(wú)限期地存在,那么我們的SIR模型中還必須包括出生率,以“補(bǔ)充”易感人群的人數(shù)。在這種情況下,該疾病的長(zhǎng)期行為可以再次與參數(shù)R0建立相關(guān)性:一旦“振蕩”消失,人群中易感者的比例S*將長(zhǎng)期保持在以下水平:

因此,在人群中,某種疾病傳播得越快,即R0越大,其易感個(gè)體越少。有趣的是,疾病的長(zhǎng)期感染人數(shù)水平I*并不取決于參數(shù)R0,而是取決于出生率和傳染期。
接種疫苗是為了減少易感者的比例,直到讓疾病無(wú)法繼續(xù)流行下去。就長(zhǎng)期人群中易感者的比例S*而言,每個(gè)感染個(gè)體平均會(huì)再引起1例繼發(fā)病例(如果感染個(gè)體引起的病例數(shù)多于或少于1個(gè),那么感染水平將上升或下降,因此疾病的流行情況將無(wú)法保持穩(wěn)定)。也就是說(shuō),如果我們可以進(jìn)一步減少易感者的數(shù)量,那么疾病的傳播就會(huì)更加困難,我們就可以開(kāi)始著手徹底消滅這種疾病。因此,徹底根除某種疾病所需的疫苗接種閾值比例VT為:

現(xiàn)在我們就可以清楚地知道,為什么接種疫苗使我們徹底根除了天花這種疾?。ㄆ?/span>R0的值約為4,接種比例約為75%),而盡管進(jìn)行了大規(guī)模的疫苗接種,很多國(guó)家仍然有麻疹流行(其R0的值約為17,接種比例約為94%),以及為什么很難控制瘧疾(其R0的值超過(guò)100,接種比例近乎100%)。更重要的是,通過(guò)上面的公式我們意識(shí)到,不需要為了根除某種疾病而對(duì)所有的人進(jìn)行疫苗接種——只要有人接種了疫苗,其所在社區(qū)周圍的人感染疾病的風(fēng)險(xiǎn)一樣會(huì)降低。因此,接種疫苗不僅可以保護(hù)個(gè)人,而且可以為其所在的整個(gè)社區(qū)提供一定的保護(hù)。
進(jìn)入21世紀(jì)后,在英國(guó)曾爆發(fā)了口蹄疫疫情并發(fā)生了蔓延,這也為用數(shù)學(xué)建模的方法研究疾病的人員提供了將前述相關(guān)理論付諸實(shí)踐的機(jī)會(huì)。

上圖:英國(guó)人將染病的疫畜焚化,以控制口蹄疫的傳播。
口蹄疫是一種能感染牛、豬、綿羊和一些其他牲畜的疾病,幸運(yùn)的是,這種疾病不會(huì)感染人類。這種疾病在非洲和亞洲地區(qū)曾相當(dāng)常見(jiàn),但距上一次在英國(guó)國(guó)內(nèi)大爆發(fā)已經(jīng)有三十多年了。口蹄疫的傳播非常迅速,可以通過(guò)農(nóng)場(chǎng)內(nèi)部或在市場(chǎng)上的密切接觸傳播,也可以通過(guò)空氣傳播更遠(yuǎn)的距離。在牛和豬中,這種疾病會(huì)引發(fā)災(zāi)難性的后果,因此對(duì)這種疾病的傳播進(jìn)行數(shù)學(xué)建模并加深了解對(duì)經(jīng)濟(jì)建設(shè)非常重要。

上圖:計(jì)算機(jī)生成的口蹄疫病毒的圖像。
口蹄疫這種疾病也可以通過(guò)簡(jiǎn)單的SIR模型來(lái)描述。不過(guò),由于其在農(nóng)場(chǎng)中的傳播速度非常迅速,因此大多數(shù)模型將整個(gè)農(nóng)場(chǎng)作為研究單位,將農(nóng)場(chǎng)分為易感性、感染性和康復(fù)性三類。這些以農(nóng)場(chǎng)為單位的模型的R0的值約為50??刂瓶谔阋叩膫鞑ナ呛芾щy的,因?yàn)樾枰扇》浅?yán)格的措施來(lái)克服其巨大的R0值。疫苗接種也不是太有用,因?yàn)橐呙缰荒芴峁┎糠直Wo(hù),并且必須每4~6個(gè)月就重復(fù)接種一次。相反,人們更多地希望通過(guò)焚化所有感染的動(dòng)物并限制牲畜的活動(dòng),以此來(lái)充分減少農(nóng)場(chǎng)之間的傳播,借此消滅這種疾病。
前面概述的理論只是揭示了用數(shù)學(xué)建模的方法研究流行病的傳播和持久性的一點(diǎn)皮毛而已。很多對(duì)疾病的研究已經(jīng)成功地應(yīng)用了數(shù)學(xué)理論,因?yàn)榇蠖鄶?shù)疾病都符合簡(jiǎn)單數(shù)學(xué)模型背后的假設(shè)。不過(guò),為了開(kāi)展進(jìn)一步的研究(如目前的新冠病毒肺炎疫情),對(duì)SIR一類的模型需要引入一些復(fù)雜性因素,這可以使模型能夠更好地表現(xiàn)疾病流行的動(dòng)力學(xué)特征,并回答更多的應(yīng)用問(wèn)題。以下是若干已在實(shí)踐中成功地應(yīng)用SIR疾病模型時(shí)加入其他因素的例子:
(1)麻疹或水痘等許多疾病,其主要是兒科疾病。通過(guò)將人群進(jìn)一步細(xì)分為不同的年齡段,研究人員已經(jīng)能夠更詳細(xì)地了解疾病的年齡結(jié)構(gòu)傳播。
(2)對(duì)于此類兒童時(shí)期的傳染性疾病,在上學(xué)期間會(huì)有更大的人群混雜(接觸率更高)。當(dāng)疾病在高接觸和低接觸狀態(tài)(例如上學(xué)和放假)之間“振蕩”時(shí),會(huì)導(dǎo)致其出現(xiàn)周期性的流行或更復(fù)雜的動(dòng)態(tài)。
(3)在模擬艾滋病病毒的傳播情況時(shí),至關(guān)重要的一點(diǎn)是按照性取向和毒品使用情況來(lái)細(xì)分人群。
(4)對(duì)于某些疾病而言,其他一些生物體也參與了傳播。例如,蚊子對(duì)瘧疾的傳播是必不可少的,大多數(shù)腺鼠疫是由老鼠和跳蚤共同傳播的。對(duì)于此類疾病,我們需要將人類的SIR模型與其他生物的SIR模型相耦合。
—?THE END —

