<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【概率論】最簡(jiǎn)單的五個(gè)智慧

          共 4448字,需瀏覽 9分鐘

           ·

          2022-02-26 22:58


          ??點(diǎn)擊關(guān)注|設(shè)為星標(biāo)|干貨速遞??

          編輯:數(shù)學(xué)算法俱樂(lè)部??來(lái)源?:羅輯思維

          ?在我認(rèn)為人人都應(yīng)該學(xué)一些概率知識(shí),它現(xiàn)在是公民的必備知識(shí)。

          現(xiàn)在的世界比過(guò)去復(fù)雜得多,其中有大量不確定性,是否理解概率,直接決定一個(gè)人的開(kāi)化程度。

          01

          隨機(jī):有些事情是無(wú)緣無(wú)故地發(fā)生的




          這個(gè)思想對(duì)我們的世界觀有顛覆的意義。


          古人沒(méi)有這個(gè)思想,認(rèn)為一切事物都是有因果的,甚至可能都是有目的的。人們?cè)?jīng)認(rèn)為世界像一個(gè)鐘表一樣精確地運(yùn)行。但真實(shí)世界不是鐘表,它充滿(mǎn)不可控的偶然。?


          更嚴(yán)格地說(shuō),有些事情的發(fā)生,跟他之前發(fā)生的任何事情,都可以沒(méi)有因果關(guān)系。不論我們做什么都不能讓它一定發(fā)生,也不能讓它一定不發(fā)生。?


          一個(gè)人考了好大學(xué),人們會(huì)說(shuō)這是他努力的結(jié)果;一個(gè)人事業(yè)成功,人們會(huì)說(shuō)這是他努力工作的結(jié)果??墒侨绻粋€(gè)人買(mǎi)彩票中了大獎(jiǎng),這又是為什么呢?


          答案是沒(méi)有任何原因,這完全是一個(gè)隨機(jī)事件??倳?huì)有人買(mǎi)彩票中獎(jiǎng),而這一期彩票中獎(jiǎng),跟他是不是好人,他在之前各期買(mǎi)過(guò)多少彩票,他是否關(guān)注中獎(jiǎng)號(hào)碼的走勢(shì),沒(méi)有任何關(guān)系。?


          若一個(gè)人總是買(mǎi)彩票,他中獎(jiǎng)的概率會(huì)比別人大點(diǎn)吧?的確,他一生之中中一次獎(jiǎng)的概率比那些只是偶然買(mǎi)一次彩票的人大。但是當(dāng)他跟上千萬(wàn)個(gè)人一起面對(duì)一次開(kāi)獎(jiǎng)的時(shí)候,他不具備任何優(yōu)勢(shì)。他之前所有的努力,對(duì)他在這次開(kāi)獎(jiǎng)中的運(yùn)氣沒(méi)有任何幫助。一個(gè)此前沒(méi)有買(mǎi)過(guò)任何彩票的人,完全有可能,而且有同樣大的可能,在某一次開(kāi)獎(jiǎng)中把最高獎(jiǎng)金拿走。?


          中獎(jiǎng),既不是他個(gè)人努力的結(jié)果,也不是“上天”對(duì)他有所“垂青”;不中,也不等于任何人與他做對(duì)。這就是“隨機(jī)”,你沒(méi)有任何辦法左右結(jié)果。?



          但大多數(shù)事情并不是完全的隨機(jī)事件。偶然和必然結(jié)合在一起,就沒(méi)那么容易理解了。人們經(jīng)常錯(cuò)誤的理解偶然,總想用必然去解釋偶然。


          體育比賽是最典型的例子。球隊(duì)贏了球,人人有功,記者幫著分析取勝之道;輸了球,人人有責(zé),里里外外都要進(jìn)行反思,甚至反思能上升到國(guó)民素質(zhì)的層次。但比賽其實(shí)是充滿(mǎn)偶然的事件,你所能做的就是盡可能爭(zhēng)取勝利。哪怕準(zhǔn)備的再好,總有一些因素是不確定的,也就是我們常說(shuō)的運(yùn)氣。很少有記者把輸球或贏球的原因歸結(jié)于運(yùn)氣,人們被隨機(jī)性所迷惑,狂喜狂怒從不淡定,甚至不惜人身攻擊。實(shí)際上,現(xiàn)代職業(yè)化競(jìng)技體育中,參賽者之間的實(shí)力差距并不是天壤之別,決定比賽結(jié)果的偶然性因素非常大。強(qiáng)隊(duì)也會(huì)輸給弱隊(duì),這是現(xiàn)代體育的重要特征,也是魅力所在。若強(qiáng)隊(duì)一定勝利,比賽還有什么懸念?所以偶然因素不值得較真,只要輸少贏多依然還是強(qiáng)隊(duì)。


          理解隨機(jī)性,我就知道很多事情發(fā)生就發(fā)生了,沒(méi)有太大可供解讀的意義。我們不能從這件事獲得什么教訓(xùn),不值得較真,甚至不值得采取行動(dòng)。比如,再完美的交通工具也不可能百分百安全,我們會(huì)因?yàn)闃O小的事故概率不坐飛機(jī)嗎?我們只需要確定事故概率比其他旅行方式小就可以了。甚至連這都不需要,只需要確定這個(gè)小概率事件我們能夠容忍就可以了。避免一朝被蛇咬十年怕井繩。


          2

          誤差


          既然絕大多數(shù)事情都同時(shí)包含偶然因素和必然因素,我們自然就想排除偶然去發(fā)現(xiàn)背后的必然。


          偶然的失敗和成功都不必大驚小怪,我根據(jù)必然因素去發(fā)現(xiàn)判斷,這總可以吧?


          可以,但是必須先理解誤差。


          歷史上最早的科學(xué)家曾經(jīng)不承認(rèn)實(shí)驗(yàn)可以有誤差,認(rèn)為所有的測(cè)量必須都是精確的,把任何誤差歸結(jié)為錯(cuò)誤。后來(lái)人們才漸漸意識(shí)到偶然因素是永遠(yuǎn)存在的,即使實(shí)驗(yàn)條件再精確也無(wú)法完全避免隨機(jī)干擾的影響,所以做科學(xué)實(shí)驗(yàn)往往要測(cè)量多次,用取平均值之類(lèi)的統(tǒng)計(jì)手段得出結(jié)果。


          多次測(cè)量確實(shí)是一個(gè)排除偶然因素的好辦法。國(guó)足輸?shù)舯荣愐院蠼?jīng)常抱怨偶然因素,裁判不公、主力不在、不適應(yīng)客場(chǎng)氣候,草皮太軟、草皮太硬,等等。關(guān)鍵是,如果經(jīng)常輸球,我還是可以得出國(guó)足是個(gè)弱隊(duì)的結(jié)論。


          即便科學(xué)實(shí)驗(yàn)也是如此,科學(xué)家哪怕是測(cè)量一個(gè)定義明確的物理參數(shù),也不能給出最后的“真實(shí)答案”,他們總在測(cè)量結(jié)果上加一個(gè)誤差范圍比如最近發(fā)現(xiàn)的希格斯粒子質(zhì)量為125.3±0.4(stat) ±0.5(sys) GeV意思是質(zhì)量125.3,但其中有0.4的統(tǒng)計(jì)誤差,還有0.5的系統(tǒng)誤差。真實(shí)的質(zhì)量其實(shí)只有一個(gè),但這個(gè)數(shù)字是多少,我不知道,它可以是這個(gè)誤差范圍內(nèi)的任何一個(gè)數(shù)字。事實(shí)上,甚至可能是誤差范圍外的一個(gè)數(shù)字。這是因?yàn)檎`差范圍是一個(gè)概率計(jì)算的結(jié)果,這個(gè)范圍的意思是說(shuō)物理學(xué)家相信真實(shí)值落在這個(gè)范圍以外的可能性非常非常小。


          所以真實(shí)值非常不易得。而且,別忘了科學(xué)實(shí)驗(yàn)是非常理想化的,大多數(shù)事情根本沒(méi)有機(jī)會(huì)多次測(cè)量。若只能測(cè)一次,那么對(duì)這一次測(cè)量的結(jié)果該怎么解讀?


          只能根據(jù)以往經(jīng)驗(yàn)和類(lèi)似案例,來(lái)估計(jì)一個(gè)大致的范圍。


          有了誤差的概念,就要學(xué)會(huì)忽略誤差范圍內(nèi)的任何波動(dòng)。


          例子:中國(guó)的統(tǒng)計(jì)數(shù)據(jù),2013年全國(guó)居民收入的基尼系數(shù)為0.473,新聞報(bào)道說(shuō),該數(shù)據(jù)較2012年0.474略有回落,回落有多大?0.001,從統(tǒng)計(jì)角度來(lái)說(shuō),其實(shí)沒(méi)有什么意義,可能測(cè)量的誤差就大大超過(guò)0.001.




          3

          賭徒謬誤



          假如你在賭場(chǎng)玩老虎機(jī),一上來(lái)運(yùn)氣不太好,連輸好幾把。這時(shí)候你是否有種強(qiáng)烈的感覺(jué),你很快該贏了?



          買(mǎi)股票、期貨、彩票都是一樣。連續(xù)好幾把上來(lái)就虧損的情況下,是不是覺(jué)得下一把掙錢(qián)的概率很大?



          這完全是一種錯(cuò)覺(jué)。賭博完全是獨(dú)立的隨機(jī)事件,這意味著下一把的結(jié)果和以前所有的結(jié)果都沒(méi)有任何聯(lián)系,已經(jīng)發(fā)生了的事情不會(huì)影響將來(lái)。



          “大數(shù)定律”說(shuō),如果進(jìn)行足夠多的抽獎(jiǎng),那么各種不同結(jié)果出現(xiàn)的頻率就會(huì)等于他們的概率。



          人們常常錯(cuò)誤地理解為,隨機(jī)就意味著均勻。如果過(guò)去一段時(shí)間內(nèi)發(fā)生的事情不均勻,人們就錯(cuò)誤的以為未來(lái)的事情會(huì)盡量往“抹平”的方向走。如果連輸幾把,那么下一把就應(yīng)該會(huì)贏。



          但大數(shù)定律的工作機(jī)制不是和過(guò)去搞平衡,它的真實(shí)意思是說(shuō)如果未來(lái)進(jìn)行非常多次的抽獎(jiǎng),你輸非常多次、贏非常多次,以至于他們此前的一點(diǎn)點(diǎn)差異就會(huì)變得微不足道。



          · 有個(gè)笑話說(shuō)一個(gè)人乘坐飛機(jī)時(shí)總帶著一顆炸彈,他認(rèn)為這樣就不會(huì)被恐怖分子炸飛機(jī)了,因?yàn)橐患茱w機(jī)上有兩顆炸彈的可能性非常小。



          · 戰(zhàn)場(chǎng)上士兵有個(gè)說(shuō)法,如果戰(zhàn)斗中炸彈在你身邊爆炸,你應(yīng)該迅速跳進(jìn)那個(gè)彈坑,因?yàn)閮深w炸彈不大可能打到同一個(gè)地方。



          這都是不理解獨(dú)立隨機(jī)事件導(dǎo)致的。



          4

          在沒(méi)有規(guī)律的地方發(fā)現(xiàn)規(guī)律



          理解了隨機(jī)性和獨(dú)立隨機(jī)事件,我們可以得到一個(gè)結(jié)論:獨(dú)立隨機(jī)事件的發(fā)生是沒(méi)有規(guī)律和不可預(yù)測(cè)的,這是一個(gè)非常重要的智慧。


          彩票分析師,相信中獎(jiǎng)號(hào)碼存在走勢(shì),相信其中的規(guī)律,所以近期多次出現(xiàn)的組合可能會(huì)繼續(xù)出現(xiàn),或者按照這個(gè)趨勢(shì)可以預(yù)測(cè)下一個(gè)號(hào)碼。?


          但這里根本沒(méi)有規(guī)律,是完全隨機(jī)的現(xiàn)象,即便存在缺陷,也需要大量的開(kāi)獎(jiǎng)后才能發(fā)現(xiàn),而且缺陷的結(jié)果也很簡(jiǎn)單,無(wú)非是某個(gè)特定號(hào)碼出現(xiàn)的可能性略大一些,完全談不上什么復(fù)雜規(guī)律。?


          明明沒(méi)有規(guī)律,這些彩票分析師是怎么看出規(guī)律來(lái)的呢?也許他們不是故意騙人,而很可能他們真的相信自己找到了彩票的規(guī)律。


          發(fā)現(xiàn)規(guī)律是人的本能。


          春天過(guò)后是夏天,烏云壓頂常下雨,大自然中很多事情的確是有規(guī)律的。我們的本能工作得如此之好,以至于我們?cè)诿髅鳑](méi)有規(guī)律的地方也能找出規(guī)律來(lái)。人腦很擅長(zhǎng)理解規(guī)律,但是很不擅長(zhǎng)理解隨機(jī)性。?


          在沒(méi)有規(guī)律的地方發(fā)現(xiàn)規(guī)律是很容易的事情,只要你愿意忽略所有不符合你這個(gè)規(guī)律的數(shù)據(jù)。而且如果數(shù)據(jù)夠多,我們可以找到任何我們想要的規(guī)律。?


          · 有人拿圣經(jīng)做字符串游戲,聲稱(chēng)這是圣經(jīng)對(duì)后世的預(yù)言。問(wèn)題是,這些預(yù)言可以完美的解釋已經(jīng)發(fā)生的事情,但在預(yù)測(cè)未發(fā)生的事情時(shí)就不好使了。關(guān)鍵是圣經(jīng)中有很多很多字符,如果仔細(xì)尋找,尤其是借助計(jì)算機(jī)的話,總能找到任何想要的東西。


          · 把圣經(jīng)換成毛選也一樣,你會(huì)發(fā)現(xiàn)毛選也早就預(yù)言了中國(guó)后世發(fā)生的所有大事。


          未來(lái)是不可被精確預(yù)測(cè)的,這個(gè)世界也并不像鐘表那樣運(yùn)行。



          5

          小數(shù)定律



          現(xiàn)在我們知道,數(shù)據(jù)足夠多的話,人們可以找到任何自己想要的重要規(guī)律,只要他不在乎這些規(guī)律的嚴(yán)格性和自洽性。那么在數(shù)據(jù)足夠少的情況下又會(huì)如何?


          如果數(shù)據(jù)足夠少,有些規(guī)律會(huì)自己跳出來(lái),你甚至不相信都不行。


          人們抱著游戲或者認(rèn)真的態(tài)度總結(jié)了世界杯足球賽的各種“定律”。比如——


          · “巴西隊(duì)的禮物”:只要巴西奪冠,下一屆的冠軍就將是主辦大賽的東道主,除非巴西隊(duì)自己將禮物收回。這一定律在2006年被破解。

          · “1982軸心定律”:世界杯奪冠球隊(duì)以1982年世界杯為中心呈對(duì)稱(chēng)分布,這個(gè)定律在2006年被破解。



          還有一些未被破解的定律,比如——



          · 凡是獲得聯(lián)合會(huì)杯或美洲杯,就別想在下一屆世界杯奪冠。

          · 中國(guó)隊(duì)的“王治郅定律”:只要王治郅參加季后賽,八一隊(duì)必然得總冠軍,以及“0:2”落后無(wú)人翻盤(pán)定律。



          如果仔細(xì)研究這些定律,會(huì)發(fā)現(xiàn)不易破解的定律其實(shí)都有一定的道理。王治郅和八一隊(duì)都很強(qiáng),0:2落后的確很難翻盤(pán),而獲得世界杯冠軍是個(gè)非常不容易的事情,更別說(shuō)同時(shí)獲得聯(lián)合會(huì)杯、美洲杯和世界杯。但不容易不等于不會(huì)發(fā)生,他們終究會(huì)被破解。



          那些看似沒(méi)有道理的神奇定律(正因?yàn)闆](méi)道理,所以顯得神奇),則大多數(shù)已經(jīng)被破解。之所以神奇,是因?yàn)榧儗偾珊?。世界杯總共才進(jìn)行了80多年,20多屆。只要數(shù)據(jù)足夠少,我們總能發(fā)現(xiàn)一些沒(méi)有破解的規(guī)律。



          如果數(shù)據(jù)少,隨機(jī)現(xiàn)象可以看上去很不隨機(jī)。甚至非常整齊,感覺(jué)好像真有規(guī)律一樣。



          問(wèn)題的關(guān)鍵是,隨機(jī)分布不等于均勻分布。要想均勻分布,必須要樣本總數(shù)非常大的時(shí)候才有效。一旦不均勻,人們就認(rèn)為其中必有緣故(陰謀論),而事實(shí)卻是這可能只是偶然事件。



          · iPod最早推出“隨機(jī)播放”功能的時(shí)候,用戶(hù)發(fā)現(xiàn)有些歌曲會(huì)被重復(fù)播放,他們據(jù)此認(rèn)為播放根本不隨機(jī)。蘋(píng)果公司只好放棄真正的隨機(jī)算法,用喬布斯本人的話說(shuō),就是改進(jìn)以后的算法使播放“更不隨機(jī)以至于讓人感覺(jué)更隨機(jī)”。



          如果統(tǒng)計(jì)數(shù)據(jù)很少,就很容易出現(xiàn)特別不均勻的情況。這個(gè)現(xiàn)象被諾獎(jiǎng)得主丹尼爾·卡尼曼戲稱(chēng)為“小數(shù)定律”??崧f(shuō),如果我們不理解小數(shù)定律,就不能真正理解大數(shù)定律。



          大數(shù)定律是我們從統(tǒng)計(jì)數(shù)字中推測(cè)真相的理論基礎(chǔ)。大數(shù)定律說(shuō)如果統(tǒng)計(jì)樣本足夠大,那么事物出現(xiàn)的頻率就能無(wú)限接近他的理論概率——也就是他的“本性”。而小數(shù)定律說(shuō)如果樣本不夠大,那么他就表現(xiàn)為各種極端情況,而這些情況可以跟他的本性一點(diǎn)關(guān)系都沒(méi)有。



          · 一個(gè)只有二十人的鄉(xiāng)村中學(xué)某年突然有兩人考上清華,跟一個(gè)有兩千人的中學(xué)每年都有兩百人考上清華,完全沒(méi)有可比性。



          如果統(tǒng)計(jì)樣本不夠大,就什么也說(shuō)明不了。



          正因?yàn)槿绱耍覀儾挪荒苤粦{自己的經(jīng)驗(yàn),哪怕加上家人和朋友的經(jīng)驗(yàn),去對(duì)事物做出判斷。我們的經(jīng)驗(yàn)非常有限。別看個(gè)例,看大規(guī)模統(tǒng)計(jì)。有的人聽(tīng)說(shuō)兩三個(gè)負(fù)面新聞就敢寫(xiě)文章把社會(huì)批得一文不值,這樣的人非常無(wú)知。

          1. 準(zhǔn)備寫(xiě)本書(shū)

          2. 如何評(píng)判一個(gè)深度學(xué)習(xí)框架?

          3. 機(jī)器學(xué)習(xí)理論基礎(chǔ)到底有多可靠?

          4. 吳恩達(dá)最新采訪:以數(shù)據(jù)為中心的AI

          5. 【機(jī)器學(xué)習(xí)基礎(chǔ)】?jī)?yōu)化背后的數(shù)學(xué)基礎(chǔ)

          瀏覽 33
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  日韩激情成人网 | 日本a在线 | 五月婷婷激情视频 | 贵州18一20女人毛片毛片 | 欧美在线大香蕉 |