送書【新書】 |《Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通》
又到了每周三的送書時(shí)刻啦!本周我們送出的是《Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通》

(文末查看送書規(guī)則)
內(nèi)容簡(jiǎn)介
《Python數(shù)據(jù)分析與大數(shù)據(jù)處理從入門到精通》主要講解數(shù)據(jù)分析與大數(shù)據(jù)處理所需的技術(shù)、基礎(chǔ)設(shè)施、核心概念、實(shí)施流程。從編程語(yǔ)言準(zhǔn)備、數(shù)據(jù)采集與清洗、數(shù)據(jù)分析與可視化,到大型數(shù)據(jù)的分布式存儲(chǔ)與分布式計(jì)算,貫穿了整個(gè)大數(shù)據(jù)項(xiàng)目開發(fā)流程。本書輕理論、重實(shí)踐,目的是讓讀者快速上手。1篇首先介紹了Python的基本語(yǔ)法、面向?qū)ο箝_發(fā)、模塊化設(shè)計(jì)等,掌握Python的編程方式。然后介紹了多線程、多進(jìn)程及其相互間的通信,讓讀者對(duì)分布式程序有個(gè)基本的認(rèn)識(shí)。第2篇介紹了網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)存儲(chǔ)等技術(shù)。第3篇介紹了Python常用的數(shù)據(jù)分析工具,擴(kuò)展了更多的數(shù)據(jù)清洗、插值方法,為最終的數(shù)據(jù)可視化奠定基礎(chǔ)。第4篇是大數(shù)據(jù)分析的重點(diǎn)。首先介紹了Hadoop的框架原理、調(diào)度原理,MapReduce原理與編程模型、環(huán)境搭建,接著介紹了Spark框架原理、環(huán)境搭建方式,以及如何與Hive等第三方工具進(jìn)行交互,還介紹了新的結(jié)構(gòu)化流式處理技術(shù)。第5篇通過三個(gè)項(xiàng)目實(shí)例,綜合介紹了如何分析網(wǎng)頁(yè)、如何搭建分布式爬蟲、如何應(yīng)對(duì)常見的反爬蟲、如何設(shè)計(jì)數(shù)據(jù)模型、如何設(shè)計(jì)架構(gòu)模型、如何在實(shí)踐中綜合運(yùn)用前四篇涉及的技術(shù)。本書既適合非計(jì)算機(jī)專業(yè)的編程“小白”,也適合剛畢業(yè)或即將畢業(yè)走向工作崗位的廣大畢業(yè)生,以及已經(jīng)有編程經(jīng)驗(yàn),但想轉(zhuǎn)行做大數(shù)據(jù)分析的專業(yè)人士。同時(shí),還可以作為廣大職業(yè)院校、電腦培訓(xùn)班的教學(xué)參考用書。
作者簡(jiǎn)介
朱春旭,高級(jí)軟件工程師,長(zhǎng)期對(duì)企業(yè)、軟件開發(fā)公司、政府機(jī)構(gòu)培訓(xùn)大數(shù)據(jù)開發(fā)與應(yīng)用課程,對(duì)Python大數(shù)據(jù)處理與分析相關(guān)應(yīng)用有深入研究,并編寫有《極客內(nèi)參-大數(shù)據(jù)開發(fā)實(shí)戰(zhàn)》教程45篇,總共30000+字。
目錄
第1篇?Python程序設(shè)計(jì)?
?第1章?Python入門?3?
1.1 Python概述?4?
1.2 搭建Python開發(fā)環(huán)境?6?
1.3 Python開發(fā)工具介紹 11
1.4 Python軟件包的管理?13?
1.5 實(shí)訓(xùn):編寫“Hello World” 15
本章小結(jié)?16?
第2章?Python基礎(chǔ)?17?
2.1 變量?18?
2.2 標(biāo)識(shí)符?24?
2.3 代碼組織?26?
2.4 輸入與輸出?28?
2.5 運(yùn)算符與優(yōu)先級(jí)?30?
2.6 新手問答?30?
2.7 實(shí)訓(xùn):設(shè)計(jì)一個(gè)簡(jiǎn)易計(jì)算器 31
本章小結(jié)?31?
第3章?數(shù)據(jù)類型與流程控制?32?
3.1 數(shù)字類型?33?
3.2 字符串類型?37?
3.3 集合類型?40?
3.4 流程控制語(yǔ)句?45?
3.5 新手問答?47?
3.6 實(shí)訓(xùn):設(shè)計(jì)算法,輸出乘法表 49
本章小結(jié)?50?
第4章?函數(shù)、模塊、包?51?
4.1 自定義函數(shù)?52?
4.2 函數(shù)參數(shù)?55?
4.3 函數(shù)式編程?58?
4.4 模塊與包?63?
4.5 新手問答?65?
4.6 實(shí)訓(xùn):設(shè)計(jì)算法,對(duì)列表進(jìn)行排序 67
本章小結(jié)?68?
第5章?面向?qū)ο蟮某绦蛟O(shè)計(jì)?69?
5.1 面向?qū)ο?70?
5.2 自定義類?71?
5.3 屬性?73?
5.4 方法?79?
5.5 類的繼承?83?
5.6 可調(diào)用對(duì)象?86?
5.7 不可變對(duì)象?87?
5.8 新手問答?88?
5.9 實(shí)訓(xùn):設(shè)計(jì)算法,構(gòu)造一棵二叉樹 90?
本章小結(jié)?92?
第6章?高級(jí)主題?93?
6.1 生成器?94?
6.2 迭代器?96?
6.3 異步處理?97?
6.4 錯(cuò)誤、調(diào)試?103?
6.5 新手問答?108?
6.6 實(shí)訓(xùn):使用多進(jìn)程技術(shù)統(tǒng)計(jì)數(shù)據(jù)并匯總 109
本章小結(jié)?110?
第2篇?數(shù)據(jù)采集與數(shù)據(jù)清洗?
第7章?網(wǎng)絡(luò)數(shù)據(jù)采集?113?
7.1 HTTP請(qǐng)求概述?114?
7.2 XPath網(wǎng)頁(yè)解析?114?
7.3 Scrapy數(shù)據(jù)采集入門?119?
7.4 Scrapy應(yīng)對(duì)反爬蟲程序?126?
7.5 CrawlSpider類?131?
7.6 分布式爬蟲?132?
7.7 新手問答?136?
7.8 實(shí)訓(xùn):構(gòu)建百度云音樂爬蟲 136
本章小結(jié)?139?
第8章?數(shù)據(jù)清洗?140?
8.1 數(shù)據(jù)清洗的意義?141?
8.2 數(shù)據(jù)清洗的內(nèi)容?141?
8.3 數(shù)據(jù)格式與存儲(chǔ)類型?142?
8.4 數(shù)據(jù)清洗的步驟?145?
8.5 數(shù)據(jù)清洗的工具?147?
8.6 新手問答?151?
8.7 實(shí)訓(xùn):清洗百度云音樂數(shù)據(jù)并儲(chǔ)存到CSV 151
本章小結(jié)?152?
第3篇?數(shù)據(jù)分析與可視化?
第9章?NumPy數(shù)值計(jì)算?155?
9.1 NumPy基礎(chǔ)?156?
9.2 形狀操作?164?
9.3 副本、淺拷貝和深拷貝?166?
9.4 高級(jí)索引?168?
9.5 排序統(tǒng)計(jì)?171?
9.6 新手問答?173?
9.7 實(shí)訓(xùn):銷售額統(tǒng)計(jì) 174
本章小結(jié)?175?
第10章?Matplotlib可視化?176?
10.1 圖形的基本要素?177?
10.2 繪圖基礎(chǔ)?177?
10.3 設(shè)置樣式?186?
10.4 圖形樣例?189?
10.5 新手問答?198?
10.6 實(shí)訓(xùn):營(yíng)業(yè)數(shù)據(jù)可視化 199
本章小結(jié)?201?
第11章?Pandas統(tǒng)計(jì)分析?202?
11.1 Pandas數(shù)據(jù)結(jié)構(gòu)?203?
11.2 基礎(chǔ)功能?210?
11.3 統(tǒng)計(jì)分析?217?
11.4 時(shí)間數(shù)據(jù)?229?
11.5 數(shù)據(jù)整理?231?
11.6 高級(jí)功能?234?
11.7 讀寫MySQL數(shù)據(jù)庫(kù) 236
11.8 新手問答?237?
11.9 實(shí)訓(xùn):成績(jī)分析 237
本章小結(jié)?239?
第12章?Seaborn可視化?240?
12.1 Seaborn概述?241?
12.2 可視化數(shù)據(jù)關(guān)系?242?
12.3 根據(jù)數(shù)據(jù)分類繪圖?246?
12.4 單變量與雙變量?251?
12.5 線性關(guān)系?256?
12.6 新手問答?258?
12.7 實(shí)訓(xùn):成績(jī)分析可視化 258
本章小結(jié)?260?
第4篇?大數(shù)據(jù)存儲(chǔ)與快速分析篇?
第13章?Hadoop數(shù)據(jù)存儲(chǔ)與基本操作?263?
13.1 Hadoop概述?264?
13.2 Hadoop數(shù)據(jù)存儲(chǔ)與任務(wù)調(diào)度原理?268?
13.3 Hadoop基礎(chǔ)環(huán)境搭建?273?
13.4 Hadoop部署模式?294?
13.5 Hadoop常用操作命令?298?
13.6 新手問答?300?
13.7 實(shí)訓(xùn):動(dòng)手搭建Hadoop集群環(huán)境 301
本章小結(jié)?309?
第14章?Spark入門?310?
14.1 Spark概述?311?
14.2 Spark核心原理?312?
14.3 Spark基礎(chǔ)環(huán)境搭建?315?
14.4 Spark運(yùn)行模式?317?
14.5 新手問答?321?
14.6 實(shí)訓(xùn):動(dòng)手搭建Spark集群 322
本章小結(jié)?323?
第15章?Spark?RDD編程?324?
15.1 RDD設(shè)計(jì)原理?325?
15.2 RDD編程?328?
15.3 鍵值對(duì)RDD?335?
15.4 文件讀寫?340?
15.5 編程進(jìn)階?342?
15.6 新手問答?347?
15.7 實(shí)訓(xùn):統(tǒng)計(jì)海鮮銷售情況 348
本章小結(jié)?350?
第16章?Spark?SQL編程?351?
16.1 Spark SQL概述?352?
16.2 創(chuàng)建DataFrame對(duì)象?360?
16.3 DataFrame常用API?364?
16.4 保存DataFrame?370?
16.5 新手問答?372?
16.6 實(shí)訓(xùn):統(tǒng)計(jì)手機(jī)銷售情況 373
本章小結(jié)?375?
第17章?Spark流式計(jì)算編程?376?
17.1 流計(jì)算簡(jiǎn)介?377?
17.2 Discretized?Stream?379?
17.3 Structured?Streaming?385?
17.4 新手問答?397?
17.5 實(shí)訓(xùn):實(shí)時(shí)統(tǒng)計(jì)貸款金額 397
本章小結(jié)?398?
第5篇?項(xiàng)目實(shí)戰(zhàn)篇?
第18章?分析電商網(wǎng)站銷售數(shù)據(jù)?401?
18.1 目標(biāo)分析?402?
18.2 數(shù)據(jù)采集?405?
18.3 數(shù)據(jù)分析?411?
本章小結(jié)?416?
第19章?分析旅游網(wǎng)站數(shù)據(jù)?417?
19.1 目標(biāo)分析?418?
19.2 數(shù)據(jù)采集?420?
19.3 數(shù)據(jù)分析?425?
本章小結(jié)?429?
第20章?分析在售二手房數(shù)據(jù)?430?
20.1 目標(biāo)分析?431?
20.2 數(shù)據(jù)采集?434?
20.3 數(shù)據(jù)分析?440?
本章小結(jié)?446?
附錄:Python常見面試題精選 447
查看本書
送書規(guī)則
本次送書5本
掃一掃下方的二維碼回復(fù):送書? 即可!
