Python數(shù)據(jù)處理
本書采用基于項目的方法,介紹用Python完成數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)探索、數(shù)據(jù)呈現(xiàn)、數(shù)據(jù)規(guī)模化和自動化的過程。主要內(nèi)容包括:Python基礎知識,如何從CSV、Excel、XML、JSON和PDF文件中提取數(shù)據(jù),如何獲取與存儲數(shù)據(jù),各種數(shù)據(jù)清洗與分析技術(shù),數(shù)據(jù)可視化方法,如何從網(wǎng)站和API中提取數(shù)據(jù)。
作者簡介:
Jacqueline Kazil
數(shù)據(jù)科學家,資深軟件開發(fā)者。活躍于Python軟件基金會、PyLadies等社區(qū)。曾參與美國總統(tǒng)創(chuàng)新伙伴項目,是美國政府技術(shù)組織18F的聯(lián)合創(chuàng)始人。曾擔任《華盛頓郵報》數(shù)據(jù)記者。
Katharine Jarmul
資深Python開發(fā)者,PyLadies聯(lián)合創(chuàng)始人。喜歡數(shù)據(jù)分析和獲取、網(wǎng)頁抓取、教人學習Python以及Unix,期望通過教育和培訓來促進Python和其他開源語言的多元化。
譯者簡介:
張亮(hysic)
畢業(yè)于北京大學物理學院,愛好機器學習和數(shù)據(jù)分析的核安全工程師。
呂家明
2016年畢業(yè)于哈爾濱工業(yè)大學,現(xiàn)就職于騰訊,從事搜索、Query分析等相關(guān)工作,熟悉大規(guī)模數(shù)據(jù)下的數(shù)據(jù)挖掘和機器學習實踐。
評論
圖片
表情
