pandas創(chuàng)始人手把手教你利用Python進行數(shù)據(jù)分析(文末抽獎贈書)

導讀:Python是目前數(shù)據(jù)科學領域的王者語言,眾多科學家、工程師、分析師都使用它來完成數(shù)據(jù)相關的工作。由于Python具有簡單易學、語法靈活的特點,很多需要處理數(shù)據(jù)的人士想要學習,主要有兩大類:
財經(jīng)類、統(tǒng)計類背景人員,他們的日常工作有大量數(shù)據(jù)需要處理、分析,但對于學習使用計算機領域的編程語言Python又感到無從下手。
一些想要學習Python的計算機人員,他們工作較忙,沒有太多時間通過互聯(lián)網(wǎng)去系統(tǒng)學習Python數(shù)據(jù)技術
針對這兩類人員的需求,近期出版上市的《利用Python進行數(shù)據(jù)分析》第2版是很好的選擇。下面我們結合本書內容,大致介紹下如何利用Python進行數(shù)據(jù)分析。

01 Python數(shù)據(jù)分析流程及學習路徑
數(shù)據(jù)分析的流程概括起來主要是:讀寫、處理計算、分析建模和可視化四個部分。在不同的步驟中會用到不同的Python工具。每一步的主題也包含眾多內容。

根據(jù)每個部分需要用到的工具,Python數(shù)據(jù)分析的學習路徑如下:

02 利用Python讀寫數(shù)據(jù)
Python讀寫數(shù)據(jù),主要包括以下內容:

我們以一小段代碼來看:

可見,僅需簡短的兩三行代碼即可實現(xiàn)Python讀入EXCEL文件。
03 利用Python處理和計算數(shù)據(jù)

在第一步和第二步,我們主要使用的是Python的工具庫NumPy和pandas。其中,NumPy主要用于矢量化的科學計算,pandas主要用于表型數(shù)據(jù)處理。

▲NumPy

▲pandas
04 利用Python分析建模

在分析和建模方面,本書主要介紹了Statsmdels和Scikit-learn兩個庫。
.Statsmodels允許用戶瀏覽數(shù)據(jù),估計統(tǒng)計模型和執(zhí)行統(tǒng)計測試。可以為不同類型的數(shù)據(jù)和每個估算器提供廣泛的描述性統(tǒng)計,統(tǒng)計測試,繪圖函數(shù)和結果統(tǒng)計列表。

▲.Statsmodels
Scikit-leran則是著名的機器學習庫,可以迅速使用各類機器學習算法。

▲Scikit-leran
05 利用Python數(shù)據(jù)可視化

數(shù)據(jù)可視化是數(shù)據(jù)工作中的一項重要內容,它可以輔助分析也可以展示結果。本書主要介紹了Python眾多可視化庫中最為主流的Matplotlib:

06 總結:為什么要選這本書
《利用Python進行數(shù)據(jù)分析》第2版原作者是美國的數(shù)據(jù)科學家Wes McKinney,他畢業(yè)于麻省理工學院,是大名鼎鼎的Python數(shù)據(jù)技術類庫pandas的創(chuàng)始人,在多家投資銀行從事過數(shù)據(jù)科學類的工作。本書第一版由Wes McKinney寫于2010年,經(jīng)過7年的技術發(fā)展,第一版中的部分技術已不再適用,因此他于2017年發(fā)表了本書的第二版,對書中的大量技術、代碼、示例進行了更新。由于本書大受好評,國內旋即引進。
關于作者:徐敬一,是《利用Python進行數(shù)據(jù)分析》第2版的譯者,中國工商銀行的數(shù)據(jù)分析師,他在工作中大量使用各類Python數(shù)據(jù)技術,對于Python的數(shù)學科學技術棧十分了解,同時英語水平良好,使本書的翻譯質量得以保證。
延伸閱讀《利用Python進行數(shù)據(jù)分析》
轉載請聯(lián)系微信:togo-maruko
點擊文末右下角“寫留言”發(fā)表你的觀點
推薦語:適合剛學Python的數(shù)據(jù)分析師或剛學數(shù)據(jù)科學以及科學計算的Python編程者。閱讀本書可以獲得一份關于在Python下操作、處理、清洗、規(guī)整數(shù)據(jù)集的完整說明。

我們將向讀者免費贈送兩本《機器學習公式詳解》,你只需要點擊下方抽獎鏈接,并邀請好友為你點贊,其中集贊最多的兩位讀者朋友將會獲得這本書!
獲獎名額有限!想要的朋友們加油分享吧!
活動截止時間:2021年4月11號 晚8點整
【活動方式】
抽獎鏈接如下:
