不寫一行,自動生成爬蟲代碼
點(diǎn)擊上方 月小水長 并 設(shè)為星標(biāo),第一時(shí)間接收干貨推送
今天的話題是,如果不寫一行代碼,完成一份最小可運(yùn)行性的爬蟲代碼。
直接舉 com 微博評論爬蟲這個(gè)例子,打開下面這個(gè)網(wǎng)址
https://weibo.com/1192329374/Knsnj9B3D按照以下步驟來
在 Network 欄目 Filter 處輸入 ’build' 過濾請求,找到評論獲取的那個(gè)接口
在接口上右鍵,Copy --> Copy as cURL(cmd)
curl 是利用 URL 語法在命令行方式下工作的開源文件傳輸工具。它被廣泛應(yīng)用在 Unix、多種 Linux 發(fā)行版中,并且有 DOS 和 Win32、Win64 下的移植版本。 打開下面這個(gè)至關(guān)重要的網(wǎng)站(一定要收藏)
https://curl.trillworks.com/
選擇 Python 語言,把剛才復(fù)制的 curl cmd 粘貼到左邊框里,右邊框就自動生成 Python 代碼了。
把這個(gè)代碼復(fù)制到新建的 py 文件中,可以直接運(yùn)行,它完成了數(shù)據(jù)的最小抓取工作,后續(xù)再進(jìn)行解析即可。
流程也可以參考下面這個(gè)無聲純凈版視頻。
這就是今天要分享的,歡迎拍磚~
評論
圖片
表情
