導(dǎo)讀:本文帶你了解各種形式的平均值,并理解其重要性。
作者:尼爾·布朗(Neil Browne)、斯圖爾特·基利(Stuart Keeley)
來(lái)源:大數(shù)據(jù)DT(ID:hzdashuju)
-
一個(gè)快速致富的方法就是做一名職業(yè)橄欖球員,2015年美國(guó)國(guó)家橄欖球聯(lián)盟球星的平均收入是220萬(wàn)美元。
-
為在大學(xué)里取得好成績(jī),學(xué)生需要付出的努力越來(lái)越少了。根據(jù)最近一項(xiàng)調(diào)查,大學(xué)生每周平均花在學(xué)習(xí)上的時(shí)間是12.8小時(shí),和20年前大學(xué)生的學(xué)習(xí)時(shí)長(zhǎng)相比,前者大概只有后者的一半。
兩個(gè)例子當(dāng)中都使用了“平均”這個(gè)詞,但是實(shí)際上有三種不同的方法來(lái)測(cè)定平均值,而且在大多數(shù)情況下,每種方法都會(huì)給出不同的數(shù)值。
-
第一種方法是把所有數(shù)值相加,然后用總數(shù)除以相加的數(shù)值的數(shù)目。這種方法所得的結(jié)果就是平均數(shù)(mean)。
-
第二種方法是將所有數(shù)值從高到低排列,然后找到位于最中間的數(shù)值,這個(gè)中間數(shù)值就是中位數(shù)(median)。一半的數(shù)值在中位數(shù)之上,另一半在中位數(shù)之下。
-
第三種方法是將所有數(shù)值排列好,計(jì)算每個(gè)不同數(shù)值出現(xiàn)的次數(shù)或每個(gè)不同數(shù)值范圍出現(xiàn)的次數(shù),出現(xiàn)頻率最高的數(shù)值就叫作眾數(shù)(mode),這是第三種平均值。
-
平均數(shù):通過(guò)把所有數(shù)值相加然后用總數(shù)除以相加的數(shù)值的數(shù)目來(lái)測(cè)定
-
中位數(shù):通過(guò)將所有數(shù)值從高到低排列,然后找到位于最中間的數(shù)值來(lái)測(cè)定
-
眾數(shù):通過(guò)計(jì)算不同數(shù)值出現(xiàn)的次數(shù),然后找出出現(xiàn)頻率最高的數(shù)值來(lái)測(cè)定
一個(gè)寫作者所用的術(shù)語(yǔ)“平均值”談?wù)摰氖瞧骄鶖?shù)、中位數(shù)還是眾數(shù)?這會(huì)產(chǎn)生很大的區(qū)別。
02 平均數(shù)、中位數(shù)還是眾數(shù)?
在第一個(gè)例子中,哪一種平均值最能說(shuō)明問(wèn)題?請(qǐng)考慮一下職業(yè)化運(yùn)動(dòng)當(dāng)中大牌球星的收入與一般球員收入的對(duì)比。最大牌的球星,比如說(shuō)橄欖球明星四分衛(wèi),收入比球隊(duì)里大部分其他球員要高出很多。
事實(shí)上,2015年薪酬最高的橄欖球運(yùn)動(dòng)員年收入超過(guò)3500萬(wàn)美元——遠(yuǎn)遠(yuǎn)高于平均值。這樣高的收入將會(huì)急劇拉高平均數(shù),但是對(duì)于中位數(shù)或眾數(shù)而言影響不大。
舉例來(lái)說(shuō),美國(guó)國(guó)家橄欖球聯(lián)盟的球員2015年工資平均數(shù)是220萬(wàn)美元,但是其工資中位數(shù)卻只有83萬(wàn)美元。因此,對(duì)于大部分職業(yè)運(yùn)動(dòng),運(yùn)動(dòng)員工資平均數(shù)要比中位數(shù)或者眾數(shù)高出很多。所以,如果有人想讓工資水平顯得非常非常高,他就會(huì)選擇平均數(shù)作為平均值。
現(xiàn)在讓我們來(lái)仔細(xì)看看第二個(gè)例子。如果這里列舉的平均值是中位數(shù)或眾數(shù),我們就有可能低估了平均學(xué)習(xí)時(shí)間。有些學(xué)生很可能花了極多的時(shí)間學(xué)習(xí),比如一周30或40個(gè)小時(shí),這會(huì)提高平均數(shù)的數(shù)值,但是不影響中位數(shù)或者眾數(shù)的數(shù)值。學(xué)習(xí)時(shí)間的眾數(shù)數(shù)值可能遠(yuǎn)低于或遠(yuǎn)高于中位數(shù),主要取決于多長(zhǎng)的學(xué)習(xí)時(shí)間對(duì)學(xué)生而言最為常見(jiàn)。
當(dāng)你見(jiàn)到平均值的時(shí)候,一定要記得問(wèn)一下:“這是平均數(shù)、中位數(shù)還是眾數(shù)?平均值的含義不同會(huì)不會(huì)產(chǎn)生什么影響?”在回答這些問(wèn)題時(shí),請(qǐng)想一想平均值的不同含義會(huì)給信息的意義帶來(lái)怎樣的變化。
不僅判斷一個(gè)平均值是平均數(shù)、中位數(shù)還是眾數(shù)非常重要,判定最小數(shù)值和最大數(shù)值之間的差距(即全距(range))以及每個(gè)數(shù)值出現(xiàn)的頻率(即數(shù)值分布),常常也很重要。
下面我們來(lái)看一個(gè)例子,在這個(gè)例子里知道數(shù)值的全距和數(shù)值分布就非常重要。
醫(yī)生對(duì)20歲的病人說(shuō):你所患癌癥的預(yù)后不容樂(lè)觀?;纪瑯影┌Y的病人存活時(shí)間的中位數(shù)是10個(gè)月。所以剩下來(lái)的這幾個(gè)月你想做什么就做點(diǎn)什么吧,不必有什么顧慮了。
病人聽(tīng)到醫(yī)生給出這樣的診斷結(jié)果,對(duì)自己的未來(lái)該做出怎樣可怕的預(yù)期呢?首先,我們確定知道的是獲得這種診斷的病人有一半不到10個(gè)月就去世了,還有一半人存活時(shí)間超過(guò)了10個(gè)月。
但是我們并不知道活下來(lái)的那部分人的存活時(shí)間的全距和數(shù)值分布。也許這些信息會(huì)顯示,有些人甚至很多人存活的時(shí)間遠(yuǎn)遠(yuǎn)超過(guò)了10個(gè)月。其中有些人甚至很多人可能活到了80歲以上呢!知道病人存活情況的完整分布可能會(huì)改變這個(gè)癌癥患者對(duì)未來(lái)的看法。
一般來(lái)說(shuō),病人應(yīng)該考慮不同的醫(yī)院對(duì)于他的疾病的存活率記錄是不是有不同的全距和數(shù)值分布。這樣,他應(yīng)該考慮選擇在有最樂(lè)觀的數(shù)值分布情況的醫(yī)院就診。
當(dāng)你遇到平均值的時(shí)候記住全距和數(shù)值分布的一個(gè)總體好處,就是提醒你大多數(shù)人或事并不符合確切的平均值,與平均值差異極大的結(jié)果也在預(yù)料之中。
關(guān)于作者:尼爾·布朗(Neil Browne),美國(guó)博林格林州立大學(xué)的杰出經(jīng)濟(jì)學(xué)教授。獲有托雷多大學(xué)法學(xué)博士學(xué)位和得克薩斯大學(xué)的博士學(xué)位。曾與合作者合著七本書(shū),并在專業(yè)期刊發(fā)表一百余篇研究論文。威斯康星大學(xué)、印第安納大學(xué)、科羅拉多大學(xué)等幾十所大學(xué)曾經(jīng)聘請(qǐng)布朗教授,協(xié)助培養(yǎng)教職員批判性思維技巧。
斯圖爾特·基利(Stuart Keeley),美國(guó)伊利諾伊大學(xué)心理學(xué)博士?,F(xiàn)為博林格林州立大學(xué)心理學(xué)教授。
本書(shū)摘編自《學(xué)會(huì)提問(wèn)(原書(shū)第12版)》,經(jīng)出版方授權(quán)發(fā)布。
延伸閱讀《學(xué)會(huì)提問(wèn)》(原書(shū)第12版)
轉(zhuǎn)載請(qǐng)聯(lián)系微信:DoctorData
推薦語(yǔ):批判性思維入門經(jīng)典,授人以漁的智慧之書(shū),暢銷百萬(wàn)冊(cè),豆瓣8.3高分。美團(tuán)四大名著之一。樊登、俞敏洪、學(xué)長(zhǎng)LEO等力薦。隨書(shū)贈(zèng)手繪思維導(dǎo)圖、70頁(yè)讀書(shū)筆記PPT。
在公眾號(hào)對(duì)話框輸入以下關(guān)鍵詞
PPT | 讀書(shū) | 書(shū)單 | 硬核 | 干貨 | 講明白 | 神操作
大數(shù)據(jù) | 云計(jì)算 | 數(shù)據(jù)庫(kù) | Python | 爬蟲(chóng) | 可視化
AI | 人工智能 | 機(jī)器學(xué)習(xí) | 深度學(xué)習(xí) | NLP
5G | 中臺(tái) | 用戶畫(huà)像 | 1024 | 數(shù)學(xué) | 算法 | 數(shù)字孿生
據(jù)統(tǒng)計(jì),99%的大咖都關(guān)注了這個(gè)公眾號(hào)