<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          兩道例題詳解貝葉斯定理

          共 4260字,需瀏覽 9分鐘

           ·

          2020-10-14 05:53


          導(dǎo)讀:本文首先講解條件概率及貝葉斯定理,之后有兩道例題,看看你都能答對嗎?


          作者:基思·斯坦諾維奇(Keith E. Stanovich)、理查德·韋斯特(Richard F. West)、瑪吉·托普拉克(Maggie E. Toplak)
          來源:大數(shù)據(jù)DT(ID:hzdashuju)




          首先來看一些概率的重要準(zhǔn)則,這些準(zhǔn)則大多數(shù)都和我們的直覺相符。

          • 概率在0~1之間變化,即0≤P(A)≤1,其中P(A)代表事件A發(fā)生的概率。
          • 如果事件確定發(fā)生,則其發(fā)生概率為1。即,當(dāng)事件A確定發(fā)生時,P(A)=1。
          • 如果事件確定不會發(fā)生,則其發(fā)生概率為0。即,當(dāng)事件A確定不發(fā)生時,P(A)=0。
          • 如果事件A和事件B不能同時發(fā)生,則稱它們是互斥的。當(dāng)事件A和事件B互斥時,任一事件(事件A或事件B)發(fā)生的概率就是每個事件發(fā)生概率之和,即:P(A或B)=P(A)+P(B)

          概率計(jì)算規(guī)則中還有一個重要的概念是條件概率(conditional probability)。條件概率是指當(dāng)某一事件(B)發(fā)生時,另一事件(A)發(fā)生的概率,即P(A|B)。當(dāng)事件A和事件B互斥時,則有:P(A|B)=0,因?yàn)槿绻录﨎發(fā)生,事件A就不可能發(fā)生(同樣地,P(B|A)=0)。當(dāng)事件A和事件B不互斥時,條件概率的表達(dá)公式為:


          需要注意的是,一般來說P(A|B)不一定與P(B|A)相等,因?yàn)楹笳叩谋磉_(dá)公式中分母不同:


          但是,我們可以根據(jù)條件概率P(A|B)推算出條件概率P(B|A),反之亦然。這樣,通過一個簡單的代數(shù)運(yùn)算后,我們就得出了決策理論界最著名的定理之一——貝葉斯定理,有時也稱為貝葉斯規(guī)則。18世紀(jì),英格蘭坦布里奇韋爾斯(Tunbridge Wells)城的牧師托馬斯·貝葉斯首先提出此定律:


          上面公式中僅有“~A”符號前面未出現(xiàn)過,“~A”表示“非A”,即事件A不發(fā)生。因此,P(~A)是指事件A不發(fā)生的概率。

          所有這些概率規(guī)則都很重要,而對于判斷和決策來說,貝葉斯定理尤為重要。貝葉斯定理是我們應(yīng)該如何基于新證據(jù)來更新我們的特定信念的準(zhǔn)則。將公式中的A替換為“焦點(diǎn)假設(shè)”(標(biāo)記為H),將B替換為“一組收集的與假設(shè)相關(guān)的數(shù)據(jù)”(標(biāo)記為D),就會得到下面的公式:


          公式中,P(H)是指在收集數(shù)據(jù)之前焦點(diǎn)假設(shè)為真的概率估計(jì),P(~H)是指在收集數(shù)據(jù)之前的備擇假設(shè)(即~H)為真的概率估計(jì)。

          公式中還包括其他一些條件概率:P(H|D)表示焦點(diǎn)假設(shè)在觀察到特定數(shù)據(jù)之后為真的概率(有時稱為后驗(yàn)概率), P(D|H)是在焦點(diǎn)假設(shè)為真的情況下觀察到特定數(shù)據(jù)的概率,P(D|~H)是在備擇假設(shè)為真的情況下觀察到特定數(shù)據(jù)的概率。

          需要強(qiáng)調(diào)的是,P(D|H)和P(D|~H)并不是互補(bǔ)的(它們加起來不等于1.0)。因?yàn)閿?shù)據(jù)有時會看起來既支持焦點(diǎn)假設(shè)也支持備擇假設(shè),或者兩者都不支持。

          在一些實(shí)際案例中,人們常常很難遵守貝葉斯法則。但需要強(qiáng)調(diào)的是,當(dāng)人們在貝葉斯推理上犯了錯誤時,并不是指他們計(jì)算錯誤,或得到的數(shù)據(jù)不準(zhǔn)確,而是指他們在概率估計(jì)過程中犯了嚴(yán)重的性質(zhì)上的錯誤。

          簡而言之,這些案例考察人們是否具有貝葉斯思維的意識,即他們是否對呈現(xiàn)的重要信息和正確的思考方向有足夠的敏銳度。標(biāo)準(zhǔn)貝葉斯統(tǒng)計(jì)必然包括計(jì)算在內(nèi),但要避免概率相關(guān)的思維錯誤,人們只需要學(xué)會如何基于概率邏輯正確思考即可。

          下面兩個案例將詳細(xì)介紹一些常見概率推理錯誤。


          01?出租車問題

          第一個被稱為出租車問題,學(xué)術(shù)界對這個問題的研究已經(jīng)超過30年。

          某個夜晚,一輛出租車肇事后逃逸。該城市共有兩家出租車公司,一家公司的出租車均為綠色(“綠色”公司),擁有出租車數(shù)量為全市出租車總數(shù)的85%;另一家公司的出租車均為藍(lán)色(“藍(lán)色”公司),擁有出租車數(shù)量為全市出租車總數(shù)的15%。一名目擊者稱肇事出租車是“藍(lán)色”公司的。法院對目擊者的證詞進(jìn)行了測試,發(fā)現(xiàn)目擊者在出事當(dāng)時那種情況下正確識別兩種顏色的概率是80%。那么肇事出租車是藍(lán)色的概率是多少(用百分?jǐn)?shù)表示,范圍從0%到100%)?

          被試被告知不必精確計(jì)算答案,只需要給出一個大致的估計(jì)值。考察的關(guān)鍵點(diǎn)不在于答案的精確度,而在于人們的估計(jì)是否在一個大致正確的范圍內(nèi)。很遺憾,許多人的答案并不在這個范圍內(nèi)。

          在出租車問題上,貝葉斯定理提供了一個最佳方法,即將給定的以下兩條信息結(jié)合起來分析:

          1. 15%的出租車是藍(lán)色。
          2. 目擊者認(rèn)為該出租車是藍(lán)色的(識別準(zhǔn)確率為80%)。

          大多數(shù)人并不能自然地將兩條信息綜合考慮。事實(shí)上,很多人在知道了肇事出租車為藍(lán)色的概率只有0.41后感到很震驚,因?yàn)樗麄儧]有意識到盡管目擊者聲稱肇事車輛是藍(lán)色的,但是肇事出租車仍更可能是綠色的(0.59),而非藍(lán)色的(0.41)。原因是出租車是綠色的先驗(yàn)概率(85%)高于目擊者識別出租車為藍(lán)色的可信度(80%)。

          如果不使用貝葉斯計(jì)算公式,我們來看一下0.41的概率是如何得到的:

          在100起此類事故中,15輛出租車是藍(lán)色的,而目擊者能夠正確辨認(rèn)其中的80%(12輛);同樣在這100起事故中,有85輛出租車是綠色的,而目擊者會將其中的20%(17輛)辨認(rèn)為藍(lán)色。因此,將會有29(12+17)輛出租車被辨認(rèn)為藍(lán)色,而事實(shí)上只有12輛是藍(lán)色的,所以肇事出租車是藍(lán)色的概率為41%。

          根據(jù)貝葉斯法則,計(jì)算公式如下:


          只有不到一半的被試給出的答案介于0.20~0.70,而大部分答案接近0.80。簡而言之,他們的答案依據(jù)的是目擊者正確辨認(rèn)的概率,而沒有根據(jù)較低的先驗(yàn)概率(0.15)對目擊者的判斷概率打折扣。

          大多數(shù)人高估了肇事出租車是藍(lán)色的可能性,因?yàn)樗麄儗⒆⒁饬性谀繐粽叩谋嬲J(rèn)上,而忽視了藍(lán)色出租車的基礎(chǔ)概率。在需要結(jié)合抽象概率信息進(jìn)行判斷時,人們往往會傾向于高估具體的鮮活的個案信息。


          02?醫(yī)療風(fēng)險(xiǎn)評估

          第二個例子與出租車問題的邏輯相同,但是更貼近日常生活,涉及醫(yī)療風(fēng)險(xiǎn)評估的問題,同樣被許多研究所關(guān)注:

          假設(shè)XYZ病毒能夠引起嚴(yán)重的疾病,該病發(fā)病率為千分之一。假設(shè)有一種化驗(yàn)方法,可以精準(zhǔn)地檢測到該病毒。也就是說,如果一個人攜帶XYZ病毒,一定可以被檢測出來。但是該項(xiàng)化驗(yàn)的假陽性率為5%,即健康人接受該項(xiàng)化驗(yàn),會有5%的可能性被誤診為病毒攜帶者。假設(shè)從人群中隨機(jī)選擇一人進(jìn)行檢測,化驗(yàn)結(jié)果為陽性(陽性意味著受檢者可能是XYZ病毒攜帶者)。那么,在不考慮具體癥狀、病史等情況下,此人攜帶XYZ病毒的概率是多少?(用百分?jǐn)?shù)表示,范圍從0到100%。)

          最常見的答案是95%,而正確答案是約為2%!人們極大地高估了陽性結(jié)果代表個體為XYZ病毒攜帶者的概率,這與出租車問題一樣,人們傾向于重視具體信息,而忽視基礎(chǔ)概率信息。

          盡管使用貝葉斯法則能夠計(jì)算出正確答案,但是簡單的數(shù)學(xué)推理也能幫助我們厘清基礎(chǔ)概率對預(yù)估結(jié)果產(chǎn)生的巨大影響。我們已知的信息是:每1000人中只有1人是真正的XYZ病毒攜帶者。如果另外999位未攜帶病毒者全部接受化驗(yàn),由于化驗(yàn)的假陽性率為5%,那么將有約50人的檢測結(jié)果呈假陽性(0.05乘以999),因此有51人檢測結(jié)果呈陽性,而實(shí)際上只有1人(約2%)為真的病毒攜帶者。

          總之,由于XYZ病毒的基礎(chǔ)感染率非常低,絕大多數(shù)人并未感染,再加上較高的化驗(yàn)假陽性率,因此可以推斷大部分檢查結(jié)果為陽性的人并非病毒攜帶者。

          根據(jù)貝葉斯法則,計(jì)算如下:



          小結(jié)

          在以上兩個例子中,很多人高估了個案證據(jù),而低估了統(tǒng)計(jì)證據(jù)。對大多數(shù)人來說,個案證據(jù)(目擊者辨認(rèn)、實(shí)驗(yàn)室化驗(yàn)結(jié)果)看起來更“具體”、更“觸手可及”、更“活靈活現(xiàn)”。相比來說,概率證據(jù)看起來好像太過抽象了,因而無法使用!

          這種想法當(dāng)然是錯誤的,因?yàn)閭€案證據(jù)本身也是概率性的。目擊者只能在一定程度上做出正確辨認(rèn),臨床檢驗(yàn)也有一定程度的誤診率。人們?nèi)粝胱龀稣_決策,就必須同時考慮情境中涉及的兩種概率:個案證據(jù)正確的概率和先驗(yàn)概率。

          在所有的基礎(chǔ)概率問題中,若想做出正確決策,人們必須將個案證據(jù)的判斷概率與先驗(yàn)概率結(jié)合起來。正確的做法是,要么用貝葉斯公式進(jìn)行計(jì)算,要么基于貝葉斯法則將基礎(chǔ)概率和個案信息結(jié)合起來進(jìn)行推理。

          對于貝葉斯推理的討論,我們并不是期望人們使用貝葉斯公式進(jìn)行具體計(jì)算,而只是希望人們學(xué)會從定性的角度進(jìn)行“貝葉斯式思考”,或者形成“貝葉斯直覺”。

          比如,僅僅意識到基礎(chǔ)概率的重要性,就足以使人們洞察到隱藏在XYZ病毒問題中的關(guān)鍵點(diǎn):假陽性率較高的檢查方法應(yīng)用于基礎(chǔ)發(fā)病率很低的疾病時,多數(shù)檢查結(jié)果呈陽性的個體其實(shí)可能并未患病。

          簡而言之,這部分題目測量的是人們對概率的自然判斷是否或近似遵循了貝葉斯定理。很明顯,人們的概率判斷往往采用“大致估計(jì)”的策略。我們提倡在“大致估計(jì)”時,應(yīng)遵循貝葉斯法則。遵循貝葉斯法則無須知道貝葉斯公式,也不需要進(jìn)行任何有意識的計(jì)算。

          關(guān)于作者:基思·斯坦諾維奇(Keith E.Stanovich),加拿大多倫多大學(xué)人類發(fā)展與應(yīng)用心理學(xué)終身榮譽(yù)教授,曾任加拿大應(yīng)用認(rèn)知科學(xué)首席科學(xué)家。他的研究領(lǐng)域是推理、決策和閱讀的心理學(xué)機(jī)制,至今已發(fā)表200多篇科學(xué)論文,出版8部著作。丹尼爾·卡尼曼在其諾貝爾獎致辭中也多次引用斯坦諾維奇的研究成果。

          本文摘編自理商:如何評估理性思維》,經(jīng)出版方授權(quán)發(fā)布。

          延伸閱讀理商:如何評估理性思維
          點(diǎn)擊上圖了解及購買
          轉(zhuǎn)載請聯(lián)系微信:DoctorData

          推薦語:《超越智商》作者基思·斯坦諾維奇新作,諾貝爾獎得主卡尼曼力薦!介紹了世界上第一個評估理性的工具——理性思維綜合評估測驗(yàn)。顛覆傳統(tǒng)智商觀念,引領(lǐng)人類邁入理性時代。


          劃重點(diǎn)?


          干貨直達(dá)?


          更多精彩?

          在公眾號對話框輸入以下關(guān)鍵詞
          查看更多優(yōu)質(zhì)內(nèi)容!

          PPT?|?讀書?|?書單?|?硬核?|?干貨?|?講明白?|?神操作
          大數(shù)據(jù)?|?云計(jì)算?|?數(shù)據(jù)庫?|?Python?|?可視化
          AI?|?人工智能?|?機(jī)器學(xué)習(xí)?|?深度學(xué)習(xí)?|?NLP
          5G?|?中臺?|?用戶畫像?|?1024?|?數(shù)學(xué)?|?算法?|?數(shù)字孿生

          據(jù)統(tǒng)計(jì),99%的大咖都完成了這個神操作
          ?


          瀏覽 21
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  狠狠操狠狠撸 | 欧美成人在线网址 | 久久欠久久久久久九秃大奖励 | 亚洲A V网站 | 婷婷久久小说网 |