精通Python爬蟲框架Scrapy
Scrapy是使用Python開發(fā)的一個快速、高層次的屏幕抓取和Web抓取框架,用于抓Web站點并從頁面中提取結構化的數據。《精通Python爬蟲框架Scrapy》以Scrapy 1.0版本為基礎,講解了Scrapy的基礎知識,以及如何使用Python和三方API提取、整理數據,以滿足自己的需求。
本書共11章,其內容涵蓋了Scrapy基礎知識,理解HTML和XPath,安裝Scrapy并爬取一個網站,使用爬蟲填充數據庫并輸出到移動應用中,爬蟲的強大功能,將爬蟲部署到Scrapinghub云服務器,Scrapy的配置與管理,Scrapy編程,管道秘訣,理解Scrapy性能,使用Scrapyd與實時分析進行分布式爬取。本書附錄還提供了各種軟件的安裝與故障排除等內容。
本書適合軟件開發(fā)人員、數據科學家,以及對自然語言處理和機器學習感興趣的人閱讀。
作者:[美]迪米特里奧斯 考奇斯-勞卡斯(Dimitrios Kouzis-Loukas) 譯者:李斌
Dimitrios Kouzis-Loukas作為一位軟件開發(fā)人員,已經擁有超過15年的經驗。同時,他還使用自己掌握的知識和技能,向廣大讀者講授如何編寫軟件。
他學習并掌握了多門學科,包括數學、物理學以及微電子學。他對這些學科的透徹理解,提高了自身的標準,而不只是“實用的解決方案”。他知道真正的解決方案應當是像物理學規(guī)律一樣確定,像ECC內存一樣健壯,像數學一樣通用。
Dimitrios目前正在使用新的數據中心技術開發(fā)低延遲、高可用的分布式系統(tǒng)。他是語言無關論者,不過對Python、C++和Java略有偏好。他對開源軟硬件有著堅定的信念,他希望他的貢獻能夠造福于各個社區(qū)和全人類。
關于譯者
李斌,畢業(yè)于北京科技大學計算機科學與技術專業(yè),獲得碩士學位...
作者:[美]迪米特里奧斯 考奇斯-勞卡斯(Dimitrios Kouzis-Loukas) 譯者:李斌
Dimitrios Kouzis-Loukas作為一位軟件開發(fā)人員,已經擁有超過15年的經驗。同時,他還使用自己掌握的知識和技能,向廣大讀者講授如何編寫軟件。
他學習并掌握了多門學科,包括數學、物理學以及微電子學。他對這些學科的透徹理解,提高了自身的標準,而不只是“實用的解決方案”。他知道真正的解決方案應當是像物理學規(guī)律一樣確定,像ECC內存一樣健壯,像數學一樣通用。
Dimitrios目前正在使用新的數據中心技術開發(fā)低延遲、高可用的分布式系統(tǒng)。他是語言無關論者,不過對Python、C++和Java略有偏好。他對開源軟硬件有著堅定的信念,他希望他的貢獻能夠造福于各個社區(qū)和全人類。
關于譯者
李斌,畢業(yè)于北京科技大學計算機科學與技術專業(yè),獲得碩士學位。曾任職于阿里巴巴,當前供職于凡普金科,負責應用安全工作。熱愛Python編程和Web安全,希望以更加智能和自動化的方式提升網絡安全。
