Python+Tableau 母嬰商品銷量數(shù)據(jù)分析
為減少篇幅,本文將盡量少的配上源碼,在文末提供的源碼文件中已經(jīng)有詳細(xì)注釋。
本案例結(jié)合Python和Tableau,由于數(shù)據(jù)量及維度較少,所以更多的是使用Tableau進(jìn)行可視化處理。
源碼文件在公眾號(hào)后臺(tái)回復(fù):母嬰 下載。
項(xiàng)目介紹
項(xiàng)目背景
根據(jù)PEST框架,從四個(gè)角度簡(jiǎn)要分析:
政策Politics:國(guó)家發(fā)展改革委2013年5月28日表示,13個(gè)部門將出臺(tái)系列政策措施,從可信交易、移動(dòng)支付、網(wǎng)絡(luò)電子發(fā)票、商貿(mào)流通和物流配送共5個(gè)方面支持電子商務(wù)發(fā)展,有利于促進(jìn)在線母嬰商品市場(chǎng)快速發(fā)展。 經(jīng)濟(jì)Economy:隨著國(guó)內(nèi)經(jīng)濟(jì)的穩(wěn)定增長(zhǎng),2015年我國(guó)城鎮(zhèn)居民可支配收入增長(zhǎng)到31195元, 同期農(nóng)村居民可支配收入增長(zhǎng)到11422元。不斷提高的人均可支配收入將提升家庭的消費(fèi)意愿,2015年中國(guó)母嬰行業(yè)市場(chǎng)規(guī)模有望達(dá)到2萬億。 社會(huì)Society:對(duì)于一線城市居民來說,隨時(shí)隨地通過手機(jī)、電腦等電子網(wǎng)絡(luò)設(shè)備足不出門即可完成購(gòu)物的新型消費(fèi)方式更能適應(yīng)他們緊湊的生活節(jié)奏;而對(duì)于二三線城市以及農(nóng)村居民,物流上門配送帶來的便捷也使得網(wǎng)購(gòu)更具吸引力。 技術(shù)Technology:4G網(wǎng)絡(luò)的普及、手機(jī)和ipad等移動(dòng)設(shè)備快速升級(jí)迭代更新、網(wǎng)絡(luò)在線支付系統(tǒng)的發(fā)展,為電子商務(wù)迅速崛起注入強(qiáng)大的動(dòng)力。
分析目的
幫助在線商家針對(duì)不同的時(shí)間節(jié)點(diǎn)和場(chǎng)景做出不同的銷售和運(yùn)營(yíng)管理策略,幫助商家提高銷量和營(yíng)業(yè)額、減少經(jīng)營(yíng)成本。 根據(jù)孩子的信息(年齡、性別等)來預(yù)測(cè)用戶會(huì)購(gòu)買什么樣的商品。(暫未完成)
問題拆解

數(shù)據(jù)概覽
Ali_Mum_Baby是一個(gè)包含超過900萬兒童信息(生日和性別)的數(shù)據(jù)集,由消費(fèi)者提供,他們共享這些信息是為了獲得更好的推薦或搜索結(jié)果。本次數(shù)據(jù)共有兩個(gè)csv。嬰兒信息表
| Column | Description |
|---|---|
| user_id | user id |
| birthday | children's birthday |
| gender | 0-female,1-male,2-unknown |
交易記錄表
| Column | Description |
|---|---|
| item_id | item id |
| user_id | user id |
| cat_id | category id |
| cat1 | root category id |
| propery | property of the corresponding item |
| buy_mount | purchase quantity |
| day | timestamp |
數(shù)據(jù)準(zhǔn)備
導(dǎo)入數(shù)據(jù)
baby?=?pd.read_csv("./sam_tianchi_mum_baby.csv")
trade?=pd.read_csv("./sam_tianchi_mum_baby_trade_history.csv")
概覽數(shù)據(jù)
baby表只有3個(gè)維度,共953行數(shù)據(jù),無缺失值。 trade表有7個(gè)維度,共29971行數(shù)據(jù),無缺失值。 trade.property是商品屬性,由于全是數(shù)值字符串,所以我們先刪除。 
trade表中的buy_mount是我們關(guān)注的重要標(biāo)簽,從描述性統(tǒng)計(jì)以及圖像上來看,該數(shù)據(jù)的均值為2.5,標(biāo)準(zhǔn)差64,存在異常值,所以我們保存距離均值3個(gè)標(biāo)準(zhǔn)差內(nèi)的數(shù)據(jù),即[0,195]。
數(shù)據(jù)清洗
查看有無缺失值異常值,并進(jìn)行處理。 trade中的auction_id未指定是什么屬性,我們就將他默認(rèn)改為item_id。 數(shù)據(jù)集中的property全是數(shù)字,需要有對(duì)應(yīng)的字典才能知道對(duì)應(yīng)什么屬性,這邊先刪除。 day改成日期形式。
#?根據(jù)info()查看,本數(shù)據(jù)集無缺失值
#?列重命名
trade.rename({"auction_id":"item_id"},axis=1,inplace=True)
#?先將property暫且取出放在一邊,后續(xù)再分析
property?=?trade.property
trade.drop('property',axis=1,inplace=True)
#?日期類型轉(zhuǎn)換
baby['birthday']=pd.to_datetime(baby.birthday.astype('str'))
trade['day']?=?pd.to_datetime(trade.day.astype('str'))
經(jīng)過清洗后的數(shù)據(jù)保留下29942行。統(tǒng)計(jì)時(shí)間是2012/7/2-2015/2/5。整個(gè)數(shù)據(jù)集中共6個(gè)商品大類,662個(gè)商品分類,28394件商品,29915名用戶。
這是兩年多經(jīng)過刪減的數(shù)據(jù),由于缺少部分?jǐn)?shù)據(jù),所以我們只能根據(jù)這份數(shù)據(jù)集進(jìn)行分析。主要是思路。
數(shù)據(jù)分析
整體市場(chǎng)情況
2017/7-2015/2期間總銷量是49973件,從上圖我們可以看出淘寶和天貓平臺(tái)母嬰商品市場(chǎng)銷量整體呈現(xiàn)上升趨勢(shì),但是波動(dòng)較大。
2015年由于數(shù)據(jù)缺失,所以不能反應(yīng)2015年第一季度的真實(shí)銷量情況 每年第一季度的銷售額都會(huì)呈現(xiàn)一定幅度的下跌。每年第四季度的銷量都會(huì)呈現(xiàn)大幅度上升。

2013年和2014年的第一季度銷量都有所下滑,主要聚集在1、2月。 每年的5月、11月都會(huì)出現(xiàn)不同程度的銷量上漲。
第一季度銷量下降原因
假設(shè)第一季度下降原因是和春節(jié)有關(guān)。
2013/2/1-2013/2/15處于銷量谷底,2013年春節(jié)假期:2013/2/9-2013/2/15 2014/1/26-2014/2/4處于銷售谷底,2014年春節(jié)假期:2014/1/31-2014/2/6
2015年春節(jié)假期是2015/2/18-2015/2/24,數(shù)據(jù)集統(tǒng)計(jì)時(shí)間只到2015/2/5,所以就暫不分析2015年第一季度情況
臨近春節(jié)可能存在部分企業(yè)提早放假,快遞停運(yùn),銷售低谷時(shí)段與春節(jié)假期基本吻合,假期結(jié)束后購(gòu)買量和用戶量上升,所以可以認(rèn)為第一季度銷量下降是由春節(jié)假期造成的。
第四季度銷量上漲原因
假設(shè)和雙十一雙十二活動(dòng)有關(guān)。
可以很明顯看出2013年和2014年雙十一及雙十二當(dāng)天的銷量和銷售額都激增。 每年的雙十一活動(dòng)用戶量和銷量都比往年多,用戶量增長(zhǎng)為75%-80%。
所以可以認(rèn)為每年第四季度的銷量上漲和雙十一雙十二活動(dòng)有很大的關(guān)系。
復(fù)購(gòu)率

各月產(chǎn)品復(fù)購(gòu)率極低。各大類的復(fù)購(gòu)率也極低,均未有超過1%,其中大類38的復(fù)購(gòu)率最高為0.17%。考慮到用戶單次購(gòu)買量大多是一件,且復(fù)購(gòu)率低,說明用戶對(duì)單一商品的回購(gòu)欲望極低,商家應(yīng)該從產(chǎn)品角度進(jìn)行考慮,例如產(chǎn)品質(zhì)量及購(gòu)物體驗(yàn)等。
商品銷量情況
大類28和50008168銷量最佳,大類38雖然銷量低、子類數(shù)最少但是人均購(gòu)買量卻很高,說明用戶在購(gòu)買38大類下的產(chǎn)品時(shí)選擇余地較少,但同時(shí)用戶對(duì)此類產(chǎn)品的需求又很旺盛,可以適量的增加大類38下的子類產(chǎn)品,提高銷售量。12265008產(chǎn)品的銷量、人均需求量都不高。說明用戶對(duì)這類產(chǎn)品的需求低,建議減少進(jìn)貨,以免庫(kù)存積壓。
嬰兒情況
將兩張表inner連接后發(fā)現(xiàn)存在1984年的嬰兒,明顯屬于異常值,我們要剔除掉。
由于數(shù)據(jù)統(tǒng)計(jì)到2015/2,所以我們假定分析日期為2015/3,購(gòu)買母嬰商品的用戶中,嬰兒年齡主要集中在0-3歲。
購(gòu)買母嬰產(chǎn)品的用戶家庭中有47.1%是男嬰,52.9%是女嬰。
我們將嬰兒年齡進(jìn)行分組,分別是未出生、嬰兒期(0-12個(gè)月)、幼兒期(1-3歲)、學(xué)齡前期(3-7歲)、學(xué)齡期(7+)。
根據(jù)上圖我們不難看出嬰兒各階段的熱銷大類:
未出生:50014815、50022520、5008168、28 嬰兒期:50014815、50022520、5008168、28 幼兒期:50014815、50008168、28 學(xué)齡前期:50008168、28 學(xué)齡期:50008168
隨著嬰兒年齡增長(zhǎng)50008168大類的產(chǎn)品需求量逐漸增長(zhǎng)而50014815大類的產(chǎn)品需求量逐漸降低。
女嬰家庭的商品需求量明顯大于男性家庭,我們細(xì)分到商品類別看一下。
可以看到大類50014815下的50018831商品的銷售記錄中有71.05%都是由女嬰家庭購(gòu)買的。在購(gòu)買記錄中不乏某些高銷量產(chǎn)品的女嬰家庭購(gòu)買占比為100%的情況。
總結(jié)
產(chǎn)品銷售情況
母嬰產(chǎn)品銷量呈逐年增長(zhǎng)趨勢(shì),但是每月的波動(dòng)幅度較大。 每年受春節(jié)影響,第一季度的銷量會(huì)出現(xiàn)全年低點(diǎn);在雙十一及雙十二等活動(dòng)促銷下,第四季度銷量會(huì)達(dá)到全年峰值。 用戶復(fù)購(gòu)率極低,需要從產(chǎn)品質(zhì)量、價(jià)格及購(gòu)買體驗(yàn)等方面進(jìn)行考慮改善。 50014815、50008168和28是熱銷大類TOP3 大類38雖然銷量少但是人均用戶購(gòu)買量卻很大,可以考慮在該大類下新增子類,增加用戶選擇,提高銷量。
用戶畫像
幼兒期(1-3歲)的用戶需求量最大,隨著嬰兒年齡增長(zhǎng),母嬰商品需求量逐漸降低。 男女嬰兒家庭比例接近,但是女嬰家庭的購(gòu)買量明顯大于男嬰家庭。 部分商品的女嬰家庭購(gòu)買比例明顯大于男嬰家庭??蓪?duì)該類商品進(jìn)行進(jìn)一步的女嬰化改變,以促使更多的女嬰家庭購(gòu)買。
建議
在臨近春節(jié)前一個(gè)星期應(yīng)該減少產(chǎn)品推廣投入,減少進(jìn)貨量,保留低量庫(kù)存;雙十一及雙十二預(yù)熱階段需要加大力度推廣,豐富運(yùn)營(yíng)活動(dòng),吸引更多的客流量。同時(shí),要增加產(chǎn)品庫(kù)存,保證穩(wěn)定貨物供應(yīng)。要增加客服人員,及時(shí)與物流聯(lián)系,保證能夠及時(shí)解答用戶疑問并提高出貨效率,提高用戶購(gòu)買體驗(yàn)。 產(chǎn)品復(fù)購(gòu)率偏低。需要加強(qiáng)對(duì)已購(gòu)用戶的回訪,分析不回購(gòu)的原因,并對(duì)這些因素進(jìn)行改善。 女嬰家庭購(gòu)買量高于男嬰家庭,建議多推廣專為男嬰設(shè)計(jì)的產(chǎn)品,提高男嬰家庭的購(gòu)買量。 要擴(kuò)充各大類下的子類產(chǎn)品,特別是大類38,增加用戶選擇,提高子類商品銷量,進(jìn)而提高大類銷量。 減少12265008大類下的產(chǎn)品進(jìn)貨,以免庫(kù)存積壓。
參考文章
母嬰產(chǎn)品電商銷售情況的深入分析: https://zhuanlan.zhihu.com/p/129072269
源碼文件在公眾號(hào)后臺(tái)回復(fù):母嬰?下載。
我們的文章到此就結(jié)束啦,如果你喜歡今天的Python 實(shí)戰(zhàn)教程,請(qǐng)持續(xù)關(guān)注Python實(shí)用寶典。
有任何問題,可以在公眾號(hào)后臺(tái)回復(fù):加群,回答相應(yīng)紅字驗(yàn)證信息,進(jìn)入互助群詢問。
原創(chuàng)不易,希望你能在下面點(diǎn)個(gè)贊和在看支持我繼續(xù)創(chuàng)作,謝謝!
點(diǎn)擊下方閱讀原文可獲得更好的閱讀體驗(yàn)
Python實(shí)用寶典?(pythondict.com)
不只是一個(gè)寶典
歡迎關(guān)注公眾號(hào):Python實(shí)用寶典
