南方人過冬有多難?用Python帶你分析全網(wǎng)取暖器銷量數(shù)據(jù)
【導(dǎo)讀】
今天用Python分析一下取暖器的全網(wǎng)銷售數(shù)據(jù)。
公眾號(hào)后臺(tái),回復(fù)關(guān)鍵字“取暖器”獲取完整數(shù)據(jù)。?
點(diǎn)擊下方視頻,先睹為快:
???
如果說冬天對(duì)北方人來說只是一個(gè)季節(jié),而對(duì)南方人來說是一場“渡劫”。北方的冷是干冷,物理攻擊,多穿一點(diǎn)就好了。而且室內(nèi)有暖氣,在室內(nèi)可以穿著短袖吃冰棍。

而南方的冷是濕冷,魔法攻擊,穿再多沒有用。而且室內(nèi)還沒暖氣,各種段子也是層出不窮:
“你在北方的暖氣里四季如春,我在南方的寒冬下凍成冰棍兒”
“北方人過冬靠的是暖氣,南方人過冬靠的是一身正氣”
“我是一只來自北方的狼,來到南方卻被凍成了狗”

一到冬天南方人除了靠一身浩然正氣,空調(diào)、電熱毯、油汀、電暖氣等各類花式取暖電器都得安排上。
內(nèi)貿(mào)批發(fā)平臺(tái)1688上獲取的數(shù)據(jù)顯示,進(jìn)入11月以來,暖氣片在南方城市的銷量比去年同期增長了300%,平臺(tái)上取暖小家電品類整體營業(yè)額同比增幅達(dá)到200%,其中發(fā)熱墊的同比增速甚至高達(dá)600%。
據(jù)顯示,暖氣片和暖氣設(shè)備銷量貢獻(xiàn)最大的國內(nèi)客戶,主要都是來自長江沿線城市,以江浙滬、安徽、湖南、湖北、重慶、四川等地居多,一時(shí)間“南方取暖設(shè)備被買爆”話題登上了微博熱搜,讓人不禁感嘆南方人過個(gè)冬天實(shí)在是太難了。

用Python分析全網(wǎng)取暖器數(shù)據(jù)
我們使用Python獲取了淘寶網(wǎng)搜索關(guān)鍵詞暖氣片、取暖器、壁掛爐的商品數(shù)據(jù),并進(jìn)行了數(shù)據(jù)分析。
讀取數(shù)據(jù)
首先導(dǎo)入獲取的數(shù)據(jù)。
#?導(dǎo)入工具包
import?numpy?as?np?
import?pandas?as?pd?
from?pyecharts.charts?import?Bar,?Pie,?Map,?Page
from?pyecharts?import?options?as?opts
import?jieba?
#?讀取數(shù)據(jù)
df_all?=?pd.read_csv('../data/導(dǎo)出數(shù)據(jù).csv')
df_all.head()?

df_all.shape
(13212,?7)
數(shù)據(jù)清洗和整理
此處我們需要對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)清洗以便后續(xù)分析和可視化,主要工作內(nèi)容如下:
刪除記錄的重復(fù)值 goods_price列處理:提取數(shù)值 purchase_num列處理:提取數(shù)值 計(jì)算銷售額sales_volume = goods_price*purchase_num 刪除多余的列
代碼實(shí)現(xiàn)如下:
df?=?df_all.copy()
#?去除重復(fù)值
df.drop_duplicates(inplace=True)
df.shape
(6849,?7)
#?篩選記錄
df?=?df[df['purchase_num'].str.contains('人付款')]
#?goods_price列處理
df['goods_price']?=?df['goods_price'].str.extract('(\d+\.{0,1}\d*)')??
df['goods_price']?=?df['goods_price'].astype('float')
#?purchase_num列處理
df['num']?=?df['purchase_num'].str.extract('(\d+\.{0,1}\d*)')
df['num']?=?df['num'].astype('float')?
df['unit']?=?[10000?if?'萬'?in?i?else?1?for?i?in?df['purchase_num']]
#?計(jì)算銷量
df['purchase_num']?=?df['num']?*?df['unit']
#?計(jì)算銷售額
df['sales_volume']?=?df['goods_price']?*?df['purchase_num']
#?提取省份字段?
df['province_name']?=?df['location'].astype('str').str.split('?').apply(lambda?x:x[0])?
#?刪除多余的列
df.drop(['num',?'unit',?'detail_url'],?axis=1,?inplace=True)
#?重置索引
df?=?df.reset_index(drop=True)
df.head()?

數(shù)據(jù)可視化
此處我們對(duì)店鋪銷量、產(chǎn)地分布、商品價(jià)格等方面進(jìn)行可視化分析:
市場上的取暖器種類較多,有暖風(fēng)機(jī)、小太陽、電熱膜、油汀、快熱爐、踢腳線等取暖設(shè)備,我們首先看到這些取暖器的標(biāo)題詞云。
商品標(biāo)題詞云圖

可以看到"取暖器" "暖風(fēng)機(jī)" "暖氣片"都是出現(xiàn)的高頻詞。在特征方面"家用" "節(jié)能" "速熱"都十分常見。
接著,看到店鋪月銷量排名Top10。
店鋪月銷量排名Top10

可以看到店鋪銷量前十,凱瑞萊旗艦店位居第一。其后春尚電器專營店和蘇寧易購分別是第二第三名。排在前十的還有美的、tcl等品牌。
#?計(jì)算top10店鋪
shop_top10?=?df.groupby('shop_name')['purchase_num'].sum().sort_values(ascending=False).head(10)
全國各省份產(chǎn)地銷量排名Top10

這些取暖器的產(chǎn)地都在哪兒呢?經(jīng)過分析發(fā)現(xiàn),浙江是生產(chǎn)取暖器的頭號(hào)大省,在產(chǎn)地銷量排名中一騎絕塵位居第一。之后排在第二位的是廣東。湖南、江蘇、山東分別位居第三第四第五名。
#?計(jì)算銷量top10
province_top10?=?df.groupby('province_name')['purchase_num'].sum().sort_values(ascending=False).head(10)
不同價(jià)格區(qū)間的商品數(shù)量占比

取暖器都賣多少錢呢?經(jīng)過分析發(fā)現(xiàn),100元以下的商品是最多占比高達(dá)34.76%。其次是200-500元的商品,占比22.09%。
不同價(jià)格區(qū)間的銷量占比

與此同時(shí),在銷量方面,價(jià)格在100元以下和100-200元之間的取暖產(chǎn)品也是銷量最好的,全網(wǎng)銷售量分別占比37.49%和35.92%。
結(jié)語
有了各式各樣的取暖器,南方冬天就好過了嗎?并不,空調(diào)開久了干,踢腳線耗電高,油汀等電暖氣更適合局部取暖,大空間制熱效果差。
雖然近年來也有很多南方家庭選擇全房裝地暖的,然而電暖用起來一個(gè)月電費(fèi)就高達(dá)2、3千,這可能就是北方一個(gè)冬天的暖氣費(fèi)用了。這么對(duì)比起來,似乎還是開空調(diào)和取暖器實(shí)在啊。
對(duì)了,可以加下行哥微信好友,私聊回復(fù)「編程」可以領(lǐng)取5T編程資料哦
推薦閱讀
(點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)
點(diǎn)擊閱讀原文,可以積分換書哦

