如何用中宏觀“小數(shù)據(jù)”進(jìn)行教育市場(chǎng)分析?
文/老黃 原力大數(shù)據(jù)產(chǎn)品部總監(jiān)
在“大數(shù)據(jù)”群雄逐鹿、行業(yè)間數(shù)據(jù)壁壘森嚴(yán)的當(dāng)下,整合和運(yùn)用這些大數(shù)據(jù)在有些行業(yè)和場(chǎng)景,幾乎是不可能的事情,或者需要耗費(fèi)巨量的資源和成本,卻達(dá)不到預(yù)期效果。那么,真正的“大數(shù)據(jù)”時(shí)代尚未到來,我們是否可以運(yùn)用一些中宏觀的“小數(shù)據(jù)”來解決實(shí)際問題呢?
中宏觀數(shù)據(jù)的價(jià)值
中宏觀數(shù)據(jù)的價(jià)值在于,它的變化決定大盤的長(zhǎng)期趨勢(shì)走向。這些數(shù)據(jù)主要來源于國家和各權(quán)威政府機(jī)構(gòu)的門戶網(wǎng)站,這些公開數(shù)據(jù)雖“措手可得”卻不容小覷,善加分析利用,通過深入橫向和縱向?qū)Ρ葦?shù)值,可以窺知政府政策走向和區(qū)域市場(chǎng)機(jī)會(huì),有著極其重要的作用。
解讀中宏觀數(shù)據(jù),
需要極強(qiáng)的業(yè)務(wù)能力
政府公開的中宏觀數(shù)據(jù)看似“措手可得”,卻要求數(shù)據(jù)分析師具備深厚的行業(yè)背景知識(shí)、極強(qiáng)的業(yè)務(wù)理解能力,才能正確解讀其中的奧妙:
難點(diǎn)一:數(shù)據(jù)源和格式繁雜是公開數(shù)據(jù)的特征之一,要弄清楚數(shù)據(jù)源的路徑,以及每個(gè)字段的可獲取性和獲取手段都要花一定的時(shí)間;
難點(diǎn)二:各個(gè)部門(如國家統(tǒng)計(jì)局和教育部對(duì)于某些數(shù)據(jù)指標(biāo))的統(tǒng)計(jì)口徑不一致,有時(shí)即便是同一個(gè)部門不同數(shù)據(jù)指標(biāo)也會(huì)有所變動(dòng),這要求分析師除了要對(duì)行業(yè)知識(shí)有深入了解之外,還需對(duì)數(shù)據(jù)高度敏感,也就是說有通過行業(yè)現(xiàn)狀反推數(shù)據(jù)合理性的能力,即如何把公開的數(shù)據(jù)轉(zhuǎn)化成可靠的數(shù)據(jù),而不是原封不動(dòng)的抄下來就完事了。
原力大數(shù)據(jù)曾通過宏觀數(shù)據(jù)和微觀數(shù)據(jù)對(duì)中國教育行業(yè)的市場(chǎng)格局(含學(xué)前教育、小學(xué)、中學(xué)、高中等)進(jìn)行深入研究,包括政府扶持、經(jīng)濟(jì)投入、區(qū)域市場(chǎng)競(jìng)爭(zhēng)和發(fā)展?jié)摿Α⒕W(wǎng)絡(luò)輿情、資本關(guān)注等,從中挖掘了大量有利于教育產(chǎn)品發(fā)展的區(qū)域、投資回報(bào)率最高的教育市場(chǎng)區(qū)域等有價(jià)值的情報(bào)。
一、案例背景
一大型教育企業(yè)正在推廣一款TO C類學(xué)前教育產(chǎn)品,商業(yè)目標(biāo)如下:
目標(biāo)1:尋找TO C類學(xué)前教育產(chǎn)品的重點(diǎn)推廣市場(chǎng);
目標(biāo)2:尋找開設(shè)新幼兒園的最佳地區(qū);
二、 結(jié)合行業(yè)背景,確認(rèn)數(shù)據(jù)分析的字段
首先,需要解讀商業(yè)目標(biāo)的潛臺(tái)詞:

接著,選擇數(shù)據(jù)分析的字段:
——這個(gè)時(shí)候,部分不懂行業(yè)背景的人就可能得到一個(gè)這樣的階段性結(jié)論:客戶的需求很簡(jiǎn)單,無非就是用到3個(gè)最原始的數(shù)據(jù):區(qū)域、學(xué)前教育適齡兒童人數(shù)、幼兒園數(shù)量。
——而稍微具備行業(yè)知識(shí)的分析師會(huì)知道,其實(shí)這個(gè)需求最終用到的是“區(qū)域”、“學(xué)前教育適齡兒童人數(shù)”、“幼兒園數(shù)量”、“幼兒園在校人數(shù)”、“學(xué)前教育毛入學(xué)率”5個(gè)數(shù)據(jù)指標(biāo)。
因?yàn)?——就我國目前的情況而言,區(qū)域經(jīng)濟(jì)較發(fā)達(dá)的地區(qū)對(duì)于學(xué)前教育的重視程度相對(duì)經(jīng)濟(jì)落后地區(qū)要高,而區(qū)域?qū)W前教育重視程度往往直接體現(xiàn)在入學(xué)率這一指標(biāo)上。另外,適齡兒童往往體現(xiàn)的是區(qū)域常規(guī)的市場(chǎng)空間,但是真正反映到學(xué)前教育機(jī)構(gòu)學(xué)生密度和飽和程度的需要觀察的是幼兒園的在校人數(shù)。
——其實(shí),如果還要更加深入分析的話,可能還會(huì)涉及到區(qū)域政府對(duì)學(xué)前教育經(jīng)費(fèi)的投入,各級(jí)別教育的支出分配比例等等,此處需要引入很多行業(yè)概念,所以就不一一進(jìn)行解析了。
此處引用某分析師“老黃”的話:“在做分析之前,不看超過50篇相關(guān)的專業(yè)文章,你寫出來的觀點(diǎn)都是無效的觀點(diǎn)”。
三、數(shù)據(jù)獲?。号廊≌泻暧^數(shù)據(jù)為主,人工采集補(bǔ)全
目前,我國80%的教育外部數(shù)據(jù)來源于國家統(tǒng)計(jì)局、國家教育部、各地市教育廳官網(wǎng)等,其結(jié)構(gòu)化程度較高,大部分都可以通過簡(jiǎn)單爬蟲或人工采集等方式去獲取。
還有20%有用的教育數(shù)據(jù)散落在各大教育相關(guān)站點(diǎn)、新聞傳媒、統(tǒng)計(jì)公報(bào)等非結(jié)構(gòu)化數(shù)據(jù)源,其數(shù)據(jù)獲取難度大、來源復(fù)雜,需要通過機(jī)器檢索或人工采集方式去補(bǔ)全。
四、報(bào)告結(jié)果
此處僅節(jié)選展示報(bào)告正文中有關(guān)目標(biāo)1和目標(biāo)2的關(guān)鍵結(jié)果頁面:
目標(biāo)1:尋找TO C類學(xué)前教育產(chǎn)品的重點(diǎn)推廣市場(chǎng)

2016年我國學(xué)前教育適齡人口(3~5歲)超過5000萬人,從各地區(qū)分布情況看,南部、東部和中部地區(qū)的學(xué)前教育適齡兒童人口總數(shù)明顯超過西部和北部地區(qū),對(duì)于幼兒園和幼兒教育產(chǎn)品的需求量會(huì)更大。
其中廣東、河南兩省的幼兒人數(shù)均超過350萬人,是TO C類學(xué)前教育產(chǎn)品的重點(diǎn)發(fā)展區(qū)域。另外,山東、四川、河北、湖南、廣西、江蘇也是值得拓展的市場(chǎng)。而東北、西北和北部地區(qū)進(jìn)行學(xué)前教育產(chǎn)品的推廣難度相對(duì)較高,且利潤(rùn)空間有限。
需求2:尋找開設(shè)新幼兒園的最佳地區(qū)

判斷是否需要增建幼兒園,需要看兩個(gè)基礎(chǔ)的數(shù)據(jù)指標(biāo),幼兒園園所數(shù)量和在園幼兒人數(shù)。
幼兒園在園人數(shù)密度過高(幼兒園在園人數(shù)/幼兒園機(jī)構(gòu)數(shù))時(shí),則說明地區(qū)的幼兒園數(shù)量已無法滿足學(xué)生人數(shù)就讀的需求,需要新增開設(shè)園所。主要有3種數(shù)據(jù)特點(diǎn),即“園少人多”或“園多人多且密度高”或“園少人少且密度高”。
“園少人多”:江蘇、安徽、湖北……
“園多人多且密度高”:廣東、河南、浙江……
“園少人少且密度高”:遼寧、上海、寧夏……
由于“園少人少且密度高”的地區(qū)的學(xué)前教育適齡人口基數(shù)少,市場(chǎng)拓展價(jià)值相對(duì)較低,建議有限在“園少人多”和“園多人多且密度高”的地區(qū)新增開設(shè)幼兒園。且上圖中偏離平均線(紅)的程度越高,則說明機(jī)構(gòu)飽和程度越低,市場(chǎng)發(fā)展?jié)摿υ酱螅?span style="font-size: 15px;color: rgb(232, 84, 37);">江蘇、廣東、河南、安徽、浙江、湖北。

教育部要求到2016年全國學(xué)前三年毛入園率達(dá)75%,以2015年末的數(shù)據(jù)來看還有15個(gè)省份未達(dá)標(biāo)。而在國家政策支持的形式下,入園率提升是必然趨勢(shì),因此學(xué)前教育結(jié)構(gòu)和相關(guān)產(chǎn)品的需求量也會(huì)更加明顯,故低入園率的教育大?。ㄈ绾幽?、廣東、四川等)的市場(chǎng)地位將顯得更加重要。
市場(chǎng)分析結(jié)論
1.廣東、河南、江蘇省是學(xué)前教育重點(diǎn)的拓展市場(chǎng),既有新辦幼兒園機(jī)構(gòu)的需求,又具備較大的適齡兒童基數(shù)可快速推廣學(xué)前教育產(chǎn)品,且未來的發(fā)展形勢(shì)利好;
2.山東、湖南、四川、河北、江西的學(xué)前教育機(jī)構(gòu)已經(jīng)近飽和或過飽和,不太適宜機(jī)構(gòu)類拓展,但適齡人口基數(shù)大,具備產(chǎn)品類市場(chǎng)發(fā)展?jié)摿Γ?/span>
3.遼寧、上海、寧夏等雖然適宜學(xué)前教育機(jī)構(gòu)拓展,但是教育產(chǎn)品市場(chǎng)發(fā)展的基數(shù)小,不適應(yīng)作為重點(diǎn);
4.西藏、青海、天津等不適宜進(jìn)行市場(chǎng)拓展,或是本身教育發(fā)展水平落后,或是本身發(fā)展空間有限。
(更多教育大數(shù)據(jù)解決方案請(qǐng)后臺(tái)調(diào)戲小編哦~)
寫在后面的話——
在大數(shù)據(jù)的光暈下,“小數(shù)據(jù)”其實(shí)也有它的魅力。畢竟我國的數(shù)據(jù)體系不像歐美等國家那么開放,很多個(gè)人數(shù)據(jù)短期內(nèi)難以獲取,更多的是集中在大型運(yùn)營商和互聯(lián)網(wǎng)等企業(yè)中。
而宏觀數(shù)據(jù)相對(duì)而言是可獲取性較強(qiáng)且完全公開的,在你沒有數(shù)據(jù)積累的情況下學(xué)會(huì)解讀它,能解決基本戰(zhàn)略層面的很多問題。
原力大數(shù)據(jù)(廣州帷策智能科技有限公司)
廣州帷策智能科技有限公司致力于大數(shù)據(jù)研究及應(yīng)用項(xiàng)目,積累了豐富且深入的大數(shù)據(jù)實(shí)踐經(jīng)驗(yàn)與成果。尤其擅長(zhǎng)基于大數(shù)據(jù)的分析建模、能力固化和產(chǎn)品研發(fā),力求幫助客戶透視業(yè)務(wù)全景,實(shí)現(xiàn)量化決策、精準(zhǔn)決策和科學(xué)決策,高效提升市場(chǎng)營銷及運(yùn)營管理能力。
推薦閱讀:
數(shù)據(jù)可視化圖表表達(dá)的10個(gè)錯(cuò)誤
用戶畫像、用戶標(biāo)簽和用戶分群有什么區(qū)別和聯(lián)系呢?
用python分析《三國演義》中的社交網(wǎng)絡(luò)
給新手:學(xué)數(shù)據(jù)分析沒數(shù)據(jù)練習(xí),推薦一款工具給你
更多精彩內(nèi)容,請(qǐng)?jiān)L問【大數(shù)據(jù)科學(xué)】小程序
點(diǎn)【在看】,不錯(cuò)過及時(shí)推薦↓↓
