蒙特利爾騎行數(shù)據(jù)分析 小案例

三步加星標(biāo)
你好,我是 zhenguo
Python 領(lǐng)域,數(shù)據(jù)分析的利器非 Pandas 莫屬,關(guān)于它的基本原理、數(shù)據(jù)結(jié)構(gòu)和 API,之前總結(jié)過不少這類文章。結(jié)合施工專題,這階段先總結(jié)數(shù)據(jù)分析的實踐相關(guān)話題,直接使用實際數(shù)據(jù)分析,解決實際問題。
今天參考github中的一個Pandas練習(xí),來做一把蒙特利爾的自行車騎行數(shù)據(jù)分析。
導(dǎo)入使用的包:
import?pandas?as?pd
import?matplotlib.pyplot?as?plt
讀入數(shù)據(jù):
fixed_df?=?pd.read_csv('../data/bikes.csv',?sep=';',?
encoding='latin1',?parse_dates=['Date'],?
dayfirst=True,?index_col='Date')
fixed_df[:3]
注意read_csv的幾個參數(shù):
此數(shù)據(jù)集使用;分割,
編碼方式為 latin1,parse_dates 參數(shù)表示解析哪些列為日期類型,
dayfirst參數(shù)是歐洲常用的一種時間格式,
index_col 參數(shù)指定使用Date作為行索引
展示Berri 1列,返回Series類型,Pandas表達(dá)鍵值對的一種數(shù)據(jù)結(jié)構(gòu),類似字典。
因為數(shù)據(jù)讀入時,指定Date為行索引,輸出結(jié)果時可以看到。鍵的值表示當(dāng)天騎自行車出行人數(shù):
fixed_df['Berri?1']
結(jié)果為:
Date
2012-01-01??????35
2012-01-02??????83
2012-01-03?????135
2012-01-04?????144
2012-01-05?????197
??????????????...?
2012-11-01????2405
2012-11-02????1582
2012-11-03?????844
2012-11-04?????966
2012-11-05????2247
Name:?Berri?1,?Length:?310,?dtype:?int64
畫畫日期與騎自行車出行人數(shù)的折線圖,此出直接使用Series自帶的 plot 方法,繪制 Berri 1 地區(qū)的騎行數(shù)據(jù)折線圖:
fixed_df['Berri?1'].plot()
繪制的折線圖如下:

看到1月、2月騎自行車出行人數(shù)不多。
實際上,我們可以直接繪制蒙特利爾所有地方的騎行數(shù)據(jù):
fixed_df.plot(figsize=(15,?10))
上圖觀察看到,如果某天騎行人數(shù)少,所有地區(qū)的情況就都會少。
以上就是導(dǎo)入數(shù)據(jù)后的一個簡單數(shù)據(jù)分析,如果你有興趣,獲取數(shù)據(jù)和源碼,微信我備注:騎行
