電影荒嗎?教你爬取豆瓣電影top250
點擊上方藍字關(guān)注我們
爬蟲目標(biāo)
項目準(zhǔn)備
軟件:Pycharm
第三方庫:requests,parsel,pandas,lxml,os
網(wǎng)站地址:https://movie.douban.com/top250?start=
網(wǎng)站分析
網(wǎng)站首頁如下:


反爬分析

鏈接分析
第一頁:https://movie.douban.com/top250?start=第二頁:https://movie.douban.com/top250?start=25&filter=第三頁:https://movie.douban.com/top250?start=50&filter=
可以發(fā)現(xiàn),每頁的電影信息會隨著網(wǎng)站鏈接末尾數(shù)字變化而變化。
代碼實現(xiàn)
1.獲取網(wǎng)頁源碼信息



25部電影信息打印如下:

數(shù)據(jù)保存
數(shù)據(jù)保存我們需要用到pandas,首先我們導(dǎo)入
import pandas as pd

效果展示

csv文件如下:

圖片文件如下:

想要學(xué)習(xí)或者對源碼有興趣的小伙伴掃碼回復(fù)'電影'即可
掃描二維碼
獲取更多精彩
python學(xué)前班
回復(fù)下方 「關(guān)鍵詞」,獲取優(yōu)質(zhì)資源
![]()
回復(fù)關(guān)鍵詞 「linux」,即可獲取 185 頁 Linux 工具快速教程手冊和154頁的Linux筆記。
回復(fù)關(guān)鍵詞 「Python進階」,即可獲取 106 頁 Python 進階文檔 PDF
回復(fù)關(guān)鍵詞 「Python面試題」,即可獲取最新 100道 面試題 PDF
回復(fù)關(guān)鍵詞 「python數(shù)據(jù)分析」,即可獲取47頁python數(shù)據(jù)分析與自然語言處理的 PDF
回復(fù)關(guān)鍵詞 「python爬蟲」,滿滿五份PPT爬蟲教程和70多個案例
回復(fù)關(guān)鍵詞 「Python最強基礎(chǔ)學(xué)習(xí)文檔」,即可獲取 168 頁 Python 最強基礎(chǔ)學(xué)習(xí)文檔 PDF,讓你快速入門Python
![]()
推薦我的微信號
來圍觀我的朋友圈,我的經(jīng)驗分享,技術(shù)更新,不定期送書,坑位有限,速速掃碼添加!
備注:開發(fā)方向_昵稱_城市,另送你10本Python電子書。![]()
![]()
點個在看你最好看
