當(dāng)我大呼:“西安美女真多呀!”以后……
西安的美女,多?不多?
反正我覺得很多!

五一期間,陳老師去西安旅游,被城墻、游船、表演、仿古建筑,以及穿梭其中的大量漂亮小姐姐深深吸引了。還有很多小姐姐穿著漢服,打扮得像從畫里走出來的一樣。于是陳老師在學(xué)員群里大呼一聲:“西安美女真多呀!”
于是,群里炸了!
排除部分群友強(qiáng)烈呼吁“不要BB,上照片”的言論,大部分人在感慨:“一個(gè)做數(shù)據(jù)的,居然在不認(rèn)真分析之前,發(fā)出如此不靠譜的評(píng)論。”然后,在假期閑得無聊的群友們,圍繞著:“西安美女到底是不是非常多”進(jìn)行了激烈的辯論。
1
這個(gè)數(shù)據(jù),該咋分析!
關(guān)于:“西安美女是不是真的多”,大家的觀點(diǎn)可以分作三派:
美女真的多派:
這一派認(rèn)為西安就是美女多,有2種表現(xiàn)
情況1,凈人數(shù)很多。舉例,西安有100萬人,廣州有90萬人。
情況2,比例很高。舉例,西安30%的女生都是美女,廣州20%。
這一派不但振振有詞,而且連理論根據(jù)都列出來了,比如:這是以前帝國首都,全世界美女都往這里送所以人的基因好/米脂婆姨綏德漢,呂布貂蟬都在陜。聽起來是很有道理的。
美女集中派:
這一派認(rèn)為西安的美女并不特別多,但是集中度高,表現(xiàn)為:
情況3,西安是旅游城市,西安集中的是全國各地的美女
情況4,陳老師去的都是景點(diǎn),景點(diǎn)集中的是全西安的美女
這一派也很有道理,特別是得知了陳老師住的酒店就在大唐不夜城周圍,那邊就是景區(qū),平時(shí)就有很多小姐姐穿著漢服去拍照,更不用說假期了。
美女不存在派:
這一派認(rèn)為“美”的標(biāo)準(zhǔn)是有問題的,可能:
情況5:因?yàn)橛械赜虿町?,西安的女生個(gè)子高/皮膚白,加上陳老師600度近視,所以一眼掃過去都是美女
情況6:地域差異是不存在的,純粹是陳老師這個(gè)土鱉沒見過漢服,所以覺得好看
情況7:漢服的影響也是不存在的,純純是陳老師這個(gè)老色批,看啥都美……
如果用MECE法梳理邏輯,則如下圖所示:
最終,美女不存在派大獲全勝,因?yàn)殛惱蠋煹奶珗?jiān)決支持情況7,而且老婆的觀點(diǎn)就是對(duì)的。然而,大家卻都很好奇:如果真的用數(shù)據(jù)驗(yàn)證,到底該咋做呢?
2
數(shù)據(jù)論證,到底咋做?
注意,如果認(rèn)真討論這個(gè)問題的話,情況1和情況2是無解的。因?yàn)榇撟C的問題:“美女”是一個(gè)主觀評(píng)價(jià)。主觀評(píng)價(jià)是無法套用到宏觀數(shù)據(jù)上的。
根據(jù)7普的統(tǒng)計(jì)公報(bào),西安常駐人口1296萬;根據(jù)西安文旅局公布數(shù)據(jù),西安五一期間接待游客數(shù)1690萬人次,指望人工標(biāo)注:美女/非美女,根本不可能,因此從源頭上,這兩個(gè)觀點(diǎn)無解。
注意!在論證類似問題時(shí),學(xué)統(tǒng)計(jì)學(xué)的同學(xué),很有可能傾向于用一個(gè)現(xiàn)成的統(tǒng)計(jì)指標(biāo),代替“美女”。
比如在陜西省統(tǒng)計(jì)年鑒里,可以查到各年齡段性別比。因此有同學(xué)會(huì)用類似:“18-24歲女性人數(shù)”這種指標(biāo),用來分析。計(jì)算各個(gè)城市該年齡段人口比例。這種做法可以得出一個(gè)結(jié)論,但已經(jīng)修改了問題判斷標(biāo)準(zhǔn)。很有可能遭人質(zhì)疑:“誰規(guī)定的18-24歲就一定是美女!”
情況3、4、5理論上是有解的。因?yàn)槠淇紤]的并非全量數(shù)據(jù),而是抽樣數(shù)據(jù)。抽樣數(shù)據(jù)的覆蓋范圍小,因此可以用人工打標(biāo)注的方法獲取數(shù)據(jù)。但為了避免抽樣偏差,需要細(xì)心設(shè)計(jì)抽樣方式。為了能對(duì)比出結(jié)論,最好還有合適的參照組設(shè)計(jì)。
在調(diào)研抽樣的時(shí)候,考慮越復(fù)雜,執(zhí)行成本就越高。即使只考慮兩個(gè)因素:
1、景區(qū)/非景區(qū)
2、假期/非假期
至少得設(shè)2個(gè)訪問點(diǎn):一個(gè)在景區(qū),一個(gè)在非景區(qū)。同時(shí)需要2個(gè)觀察時(shí)間,假期一個(gè),非假期一個(gè)。每個(gè)訪問點(diǎn)的訪問員、QC、現(xiàn)場(chǎng)督導(dǎo),都少不了。如果要計(jì)算“美女”在總?cè)巳旱谋壤?,還得配專門的計(jì)數(shù)員統(tǒng)計(jì)人流。至于場(chǎng)地租金、問卷、計(jì)數(shù)設(shè)備、訪問小禮品,都得準(zhǔn)備好。
很多同學(xué)覺得問問題很尷尬,其實(shí)問問題是最簡單的一步。比這更奇葩的調(diào)查陳老師都做過,比如丐幫的、小偷的、失足婦女的……。只要有小禮品+適當(dāng)?shù)貍窝b問題,都能得到配合。
比如調(diào)查失足婦女的就能把問卷偽裝成避孕套廠商的產(chǎn)品訪問……真正難的是設(shè)計(jì)抽樣條件。因?yàn)橛刑嘁蛩啬芨蓴_調(diào)研結(jié)果,考慮太粗,質(zhì)量不行;考慮太細(xì),費(fèi)用爆炸。
所以在采用調(diào)研手段的時(shí)候,企業(yè)和政府處理問題的思路完全不一樣。企業(yè)往往舍量保質(zhì),比如一個(gè)企業(yè)了解西安美女多不多,是想開美容院。那么可以直接在西安地圖上圈出幾個(gè)自己預(yù)計(jì)進(jìn)駐的商圈,然后通過調(diào)研鎖定2、3個(gè)商圈里到底哪個(gè)目標(biāo)客戶更多。其他影響因素就去他大爺?shù)摹?/span>
如果是政府(比如統(tǒng)計(jì)局)大規(guī)模普查,往往保量舍質(zhì)。就直接用分層隨機(jī)抽樣,抽樣條件設(shè)計(jì)都很簡單,比如第六次人口普查,抽樣主要考慮的是地區(qū)維度,每個(gè)城市先選小區(qū),再選住戶,保障區(qū)域覆蓋,沒有考慮其他因素(詳見《第六次人口普查抽樣細(xì)則》)。
最好驗(yàn)證的,反而是情況6、7!因?yàn)榍闆r6、7跟事實(shí)沒有關(guān)系,只跟陳老師個(gè)人有關(guān)系。研究一堆人麻煩,研究一個(gè)人容易。比如,想驗(yàn)證:陳老師是不是老色批,可以看陳老師是不是:
● 去杭州旅游,發(fā):“杭州美女真多啊!”
● 去長沙旅游,發(fā):“長沙美女真多啊!”
● 去沈陽旅游,發(fā):“沈陽美女真多啊!”
● 去西安旅游,發(fā):“西安美女真多??!”
如果是,嗯!可以確認(rèn):陳老師是個(gè)發(fā)揮穩(wěn)定的老色批,所以其他情況都不用糾結(jié)了!
3
數(shù)據(jù)分析,難在哪里?
為啥要花一整篇文章,一本正經(jīng)地討論美女,是因?yàn)轭愃频膱?chǎng)景,在企業(yè)里非常普遍。在實(shí)際工作中,人們第一反應(yīng)就是說評(píng)價(jià),而不是說數(shù)據(jù)。
● 我看XX公司的業(yè)績發(fā)展挺好的!
● 我看XX產(chǎn)品功能設(shè)計(jì)挺好的!
● 我看XX地區(qū)人消費(fèi)力真高!
而這些主觀評(píng)價(jià),有可能成為引發(fā)內(nèi)部行動(dòng)的源頭(如下圖)

因此當(dāng)領(lǐng)導(dǎo)甩出一句:“為啥我們?cè)赬X地區(qū)發(fā)展不快?”的時(shí)候,專業(yè)的數(shù)據(jù)分析師,第一時(shí)間不是去跑數(shù),而是了解清楚問題的源頭源自哪里(如下圖)

就檢驗(yàn)判斷的難度而言
● 行業(yè)性數(shù)據(jù)≥競(jìng)爭對(duì)手?jǐn)?shù)據(jù)
● 競(jìng)爭對(duì)手?jǐn)?shù)據(jù)≥消費(fèi)者數(shù)據(jù)
● 消費(fèi)者數(shù)據(jù)≥內(nèi)部數(shù)據(jù)
● 內(nèi)部數(shù)據(jù)≥領(lǐng)導(dǎo)個(gè)性
所以在切入問題的時(shí)候,要特別關(guān)注解決問題的時(shí)間成本/經(jīng)費(fèi)投入,投入充足才保質(zhì)保量,投入不足就看舍質(zhì)保量還是舍量保質(zhì),甚至直接從領(lǐng)導(dǎo)習(xí)慣入手,直擊領(lǐng)導(dǎo)要害都是可以的(如下圖)

這些都是基本的工作方法,但很需要再和做數(shù)據(jù)的同學(xué)們強(qiáng)調(diào)一下。因?yàn)楝F(xiàn)在網(wǎng)絡(luò)上關(guān)于數(shù)據(jù)分析的文章太喜歡堆砌“AARRR模型”“拆解法”“對(duì)比法”這種抽象概念,完全不講如何溝通,如何梳理具體場(chǎng)景,誤導(dǎo)了很多新人。
具體問題,具體分析是做數(shù)據(jù)最基本的要求。所謂“具體”,第一順位要解決的就是各路人馬口中的“好/壞”“快/慢”“高/低”這些形容詞。遇到形容詞:
● 評(píng)價(jià)的源頭是啥?
● 判斷的標(biāo)準(zhǔn)是啥?
● 有沒有數(shù)據(jù)支持?
這些要第一時(shí)間梳理清楚,不然雞同鴨講,南轅北轍,都是常見的。比如90%的數(shù)據(jù)監(jiān)控、活動(dòng)評(píng)估、流程優(yōu)化分析做不好,都是因?yàn)榕袛鄻?biāo)準(zhǔn)沒整明白。有興趣的話,給陳老師點(diǎn)亮右下角的“在看,”本篇集齊60個(gè)在看,我們下一篇分享一個(gè)活動(dòng)評(píng)估的例子,敬請(qǐng)期待哦。
更多精彩原創(chuàng):
了解陳老師的視頻課程
