?【Python基礎(chǔ)】介紹一本零基礎(chǔ)入門Python數(shù)據(jù)分析的書
??作者:Lemon
來源:Python數(shù)據(jù)之道
介紹一本零基礎(chǔ)入門
Python數(shù)據(jù)分析的書
有不少讀者在詢問如何入門Python、如何入門Python數(shù)據(jù)分析,之前跟大家分享了兩本零基礎(chǔ)入門Python的書籍:《Python編程從入門到實(shí)踐》 和《笨辦法學(xué)Python3》。
今天來給大家分享一本Python數(shù)據(jù)分析入門的書籍,書名是《Python數(shù)據(jù)分析基礎(chǔ)》。

本書面向的讀者
按照書中的介紹:
本書面向的讀者主要是那些經(jīng)常使用電子表格軟件進(jìn)行數(shù)據(jù)處理,但從未寫過一行代碼的人。
Lemon 覺得這個(gè)范疇還是很清晰的,當(dāng)然,Lemon 閱讀完這本書之后,覺得范圍也可以適當(dāng)?shù)耐貙捫ń?jīng)常處理電子表格的、需要定期生成報(bào)表的、有一定的數(shù)據(jù)可視化需求的、以及需要對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)性描述的,都可以參考下本書的部分內(nèi)容。
對(duì)于這點(diǎn),Lemon 也是深有感觸。前些年,Lemon 還沒有開始學(xué) Python ,當(dāng)時(shí)管理許多的項(xiàng)目,用 excel 處理數(shù)據(jù)感覺有些力不從心,于是開始尋找解決方案,找了一圈,最后用微軟的 access 用 sql 語(yǔ)句擼了一個(gè)小型的項(xiàng)目管理工具。現(xiàn)在看來,如果當(dāng)時(shí)會(huì) Python,會(huì)要方便很多。
書中的Python環(huán)境
書中的代碼使用的Python版本是 Python 3.5版,本書作者是在 windows 平臺(tái)對(duì)代碼進(jìn)行測(cè)試的, 如果你的電腦上的 Python 版本是 3.5 以及之上的,應(yīng)該是可以運(yùn)行的。
由于 Python 是跨平臺(tái)的,因此,windows、Linux 以及 MacOS 系統(tǒng)應(yīng)該都沒問題。
對(duì)用 Python 的安裝,書中推薦安裝 Anaconda , Lemon 一般也是直接安裝 Anaconda,主要是比較省事。
關(guān)于 Python 環(huán)境的安裝,這個(gè)還是需要自己去弄,不同的電腦環(huán)境,有時(shí)候會(huì)出現(xiàn)一些小小的問題,這個(gè)主要還是需要自己通過搜索來解決。
書中的代碼,原書作者已經(jīng)發(fā)布在其 Github 上,大家可以免費(fèi)去獲取,地址如下:
https://github.com/cbrownley/foundations-for-analytics-with-python
數(shù)據(jù)文件處理
書中花了比較大的篇幅來講解關(guān)于數(shù)據(jù)文件的處理,主要包括 csv文件、excel文件以及 數(shù)據(jù)庫(kù)。
對(duì)于數(shù)據(jù)分析入門而言,可能遇到比較多的文件類型還是 excel 和 csv ,所以書中對(duì)這兩類介紹也是比較多。
書中介紹了用純 Python、內(nèi)置模塊、第三方庫(kù)等途徑來操作這兩類文件,涉及到 內(nèi)置 csv模塊、xlrd、xlwt 等。對(duì)于需要讀取數(shù)據(jù),尤其是需要寫入數(shù)據(jù),用這些工具還是挺方便的。
如果只是讀取數(shù)據(jù),然后進(jìn)行數(shù)據(jù)清洗等處理,Lemon 一般喜歡用 Pandas 。
此外,對(duì)于數(shù)據(jù)庫(kù),書中也介紹了 內(nèi)置的 sqlite3 模塊,以及 以及流行的數(shù)據(jù)庫(kù) MySQL 。
數(shù)據(jù)可視化
主要涉及四個(gè)可視化庫(kù),分別是 Matplotlib、Pandas、ggplot 和 seaborn 。
除了 ggplot ,其余三個(gè), Lemon 也是經(jīng)常使用的。
下面分享一個(gè)隨書的案例:

運(yùn)行后效果如下:

關(guān)于 Matplotlib,前不久 Lemon 整理了一份 100個(gè)項(xiàng)目入門 Matplotlib 的內(nèi)容,有興趣的同學(xué)可以前往查看:
自動(dòng)運(yùn)行腳本
Lemon 覺得還有一個(gè)內(nèi)容估計(jì)大家是感興趣的,那就是使用 Python 來按計(jì)劃自動(dòng)運(yùn)行腳本,由于是在商業(yè)環(huán)境中,有一些需要定期上報(bào)的內(nèi)容,比如日?qǐng)?bào)、周報(bào)、月報(bào)、季報(bào)、年報(bào)等(特別煩!!!)。
前不久,阿里取消周報(bào),都能上熱搜,可見這些報(bào)表都么重要,又是多么招人厭!
如果你用 Python 來自動(dòng)運(yùn)行一些格式高度一致的內(nèi)容,那自然會(huì)省事很多。別人在埋頭苦干的時(shí)候,估計(jì)你就有功夫摸魚啦。
小結(jié)
在本書的封面,給本書的定位是“零基礎(chǔ)經(jīng)驗(yàn)也可學(xué)會(huì)用最火的Python語(yǔ)言進(jìn)行數(shù)據(jù)分析”,如果你對(duì)使用Python來進(jìn)行數(shù)據(jù)分析有興趣,本書可以作為初級(jí)參考書來使用。
如果你覺得這本書不錯(cuò),可以去購(gòu)買一本,仔細(xì)閱讀下。
往期精彩回顧
獲取本站知識(shí)星球優(yōu)惠券,復(fù)制鏈接直接打開:
https://t.zsxq.com/qFiUFMV
本站qq群704220115。
加入微信群請(qǐng)掃碼:
