Python網(wǎng)絡(luò)數(shù)據(jù)采集
本書采用簡潔強(qiáng)大的Python語言,介紹了網(wǎng)絡(luò)數(shù)據(jù)采集,并為采集新式網(wǎng)絡(luò)中的各種數(shù)據(jù)類型提供了全面的指導(dǎo)。第一部分重點(diǎn)介紹網(wǎng)絡(luò)數(shù)據(jù)采集的基本原理:如何用Python從網(wǎng)絡(luò)服務(wù)器請求信息,如何對服務(wù)器的響應(yīng)進(jìn)行基本處理,以及如何以自動化手段與網(wǎng)站進(jìn)行交互。第二部分介紹如何用網(wǎng)絡(luò)爬蟲測試網(wǎng)站,自動化處理,以及如何通過更多的方式接入網(wǎng)絡(luò)。
Ryan Mitchell
數(shù)據(jù)科學(xué)家、軟件工程師,目前在波士頓LinkeDrive公司負(fù)責(zé)開發(fā)公司的API和數(shù)據(jù)分析工具。此前,曾在Abine公司構(gòu)建網(wǎng)絡(luò)爬蟲和網(wǎng)絡(luò)機(jī)器人。她經(jīng)常做網(wǎng)絡(luò)數(shù)據(jù)采集項(xiàng)目的咨詢工作,主要面向金融和零售業(yè)。另著有Instant Web Scraping with Java。
評論
圖片
表情
