pandas數(shù)據(jù)處理與分析
pandas是一個(gè)強(qiáng)大的數(shù)據(jù)處理與分析工具集!
本書梳理了pandas中常用的函數(shù),將函數(shù)之間的邏輯關(guān)系總結(jié)為“基礎(chǔ)知識(shí)+4類操作+4類數(shù)據(jù)”的模塊結(jié)構(gòu),展示了數(shù)據(jù)處理的宏觀體系,并針對(duì)數(shù)據(jù)分析中“怎么分析”“怎么處理”“怎么加速”3個(gè)核心問(wèn)題給出解決方案。
※編輯推薦:
本書結(jié)合大量代碼講解理論知識(shí),并通過(guò)“練一練”和章末的“習(xí)題”等形式提供高質(zhì)量的練習(xí),幫助讀者理解、強(qiáng)化和拓展所學(xué)知識(shí)。
本書不需要讀者掌握數(shù)據(jù)科學(xué)或數(shù)據(jù)分析的先驗(yàn)知識(shí),適合具有一定Python編程基礎(chǔ)、想要使用pandas進(jìn)行數(shù)據(jù)處理與分析的數(shù)據(jù)科學(xué)領(lǐng)域的從業(yè)者或研究人員閱讀。
※內(nèi)容簡(jiǎn)介:
本書以Python中的pandas庫(kù)為主線,介紹各類數(shù)據(jù)處理與分析方法。
本書共包含13章,第一部分介紹NumPy和pandas的基本內(nèi)容;第二部分介紹pandas庫(kù)中的4類操作,包括索引、...
pandas是一個(gè)強(qiáng)大的數(shù)據(jù)處理與分析工具集!
本書梳理了pandas中常用的函數(shù),將函數(shù)之間的邏輯關(guān)系總結(jié)為“基礎(chǔ)知識(shí)+4類操作+4類數(shù)據(jù)”的模塊結(jié)構(gòu),展示了數(shù)據(jù)處理的宏觀體系,并針對(duì)數(shù)據(jù)分析中“怎么分析”“怎么處理”“怎么加速”3個(gè)核心問(wèn)題給出解決方案。
※編輯推薦:
本書結(jié)合大量代碼講解理論知識(shí),并通過(guò)“練一練”和章末的“習(xí)題”等形式提供高質(zhì)量的練習(xí),幫助讀者理解、強(qiáng)化和拓展所學(xué)知識(shí)。
本書不需要讀者掌握數(shù)據(jù)科學(xué)或數(shù)據(jù)分析的先驗(yàn)知識(shí),適合具有一定Python編程基礎(chǔ)、想要使用pandas進(jìn)行數(shù)據(jù)處理與分析的數(shù)據(jù)科學(xué)領(lǐng)域的從業(yè)者或研究人員閱讀。
※內(nèi)容簡(jiǎn)介:
本書以Python中的pandas庫(kù)為主線,介紹各類數(shù)據(jù)處理與分析方法。
本書共包含13章,第一部分介紹NumPy和pandas的基本內(nèi)容;第二部分介紹pandas庫(kù)中的4類操作,包括索引、分組、變形和連接;第三部分介紹基于pandas庫(kù)的4類數(shù)據(jù),包括缺失數(shù)據(jù)、文本數(shù)據(jù)、分類數(shù)據(jù)和時(shí)間序列數(shù)據(jù),并介紹這4類數(shù)據(jù)的處理方法;第四部分介紹數(shù)據(jù)觀測(cè)、特征工程和性能優(yōu)化的相關(guān)內(nèi)容。本書以豐富的練習(xí)為特色,每章的最后一節(jié)為習(xí)題,同時(shí)每章包含許多即時(shí)性的練習(xí)(練一練)。讀者可通過(guò)這些練習(xí)將對(duì)數(shù)據(jù)科學(xué)的宏觀認(rèn)識(shí)運(yùn)用到實(shí)踐中。
耿遠(yuǎn)昊,威斯康星大學(xué)麥迪遜分校統(tǒng)計(jì)學(xué)碩士在讀,Datawhale成員,“Joyful Pandas”開(kāi)源項(xiàng)目作者。pandas貢獻(xiàn)者,活躍于pandas開(kāi)源社區(qū),主要貢獻(xiàn)涉及漏洞修復(fù)、功能實(shí)現(xiàn)與性能優(yōu)化等方面,對(duì)pandas在數(shù)據(jù)處理與分析中的應(yīng)用有豐富經(jīng)驗(yàn)。
