這個(gè)網(wǎng)站,可以一鍵爬取網(wǎng)頁上的所有圖片!
大家好,我是崔慶才。
今天給大家推薦一個(gè)網(wǎng)站,可以一鍵下載分析和獲取網(wǎng)頁上的所有圖片,并且可以一鍵打包下載!
介紹
開門見山了,這個(gè)網(wǎng)站的鏈接是:https://extract.pics/
長這個(gè)樣子:
大家可以看到,打開之后就是一個(gè)醒目的輸入框,可以直接輸入一個(gè)網(wǎng)站鏈接,然后它就可以把網(wǎng)站上的圖片都爬取下來。
我們來做一個(gè)測試吧。
比如我隨便搜了一個(gè)包含一些手機(jī)壁紙圖片的鏈接:https://www.sohu.com/a/582693827_121123945
為方便大家查看,我把這個(gè)鏈接轉(zhuǎn)了下二維碼,可以掃描這個(gè)二維碼來直接查看這個(gè)樣例網(wǎng)站:
看完了吧,里面的好看的手機(jī)壁紙圖還不少吧~
那怎么快速保存下來呢?
我們就直接把這個(gè)鏈接貼到 https://extract.pics/ 就好了:
接下來,直接點(diǎn)擊 EXTRACT 按鈕即可。
這時(shí)候我們可以在網(wǎng)站下方看到一些“爬取”進(jìn)度,比如啟動(dòng)爬取器、分析、滾動(dòng)、提取等等。
稍等片刻,我們就可以發(fā)現(xiàn)所有的圖片都被分析出來了:
看,所有好看的壁紙都在這里了!
接下來我們可以直接選中想要的圖片,就可以直接下載到本地了,不用一個(gè)個(gè)保存~
當(dāng)然也可以自行選擇某張圖片下載,非常方便!
原理
好,其實(shí)這個(gè)網(wǎng)站基本功能就這么多,當(dāng)我們想要批量下載某個(gè)網(wǎng)頁上的圖片的時(shí)候,它就是一個(gè)不錯(cuò)的選擇~
下面我們看看這個(gè)網(wǎng)站的原理究竟是啥。
滾動(dòng)到頁面下方,其實(shí)可以看到網(wǎng)站的一些介紹內(nèi)容:
和我們理解的一樣,就是用來快速提取公開網(wǎng)站圖片的一個(gè)網(wǎng)站。
當(dāng)然網(wǎng)站還提供了排序、搜索功能,讓我們能更方便地找到想要的圖片,也可以多選直接將多張圖片以 zip 壓縮包的形式下載下來。
網(wǎng)站同時(shí)也是完全免費(fèi)的,當(dāng)然我們也可以選擇捐贈(zèng)支持。
怎么運(yùn)作的呢?
接著看。
其實(shí)原理也非常簡單了,其實(shí)背后就是開了一個(gè) Google Chrome 的瀏覽器,就是一個(gè) Headless 的 WebDriver,估計(jì)大概率就是基于 Selenium、Pyppeteer、Playwright 等做的,然后自動(dòng)化地把這個(gè)頁面渲染出來,然后提取所有的圖片并返回結(jié)果就行了。
似乎對(duì)于我們專門做爬蟲的程序員來說,沒什么稀奇的哈哈。
關(guān)于更多內(nèi)容大家也可以到網(wǎng)站里面去了解下。
今天的分享就先到這里啦,感謝大家!

End
崔慶才的新書《Python3網(wǎng)絡(luò)爬蟲開發(fā)實(shí)戰(zhàn)(第二版)》已經(jīng)正式上市了!書中詳細(xì)介紹了零基礎(chǔ)用 Python 開發(fā)爬蟲的各方面知識(shí),同時(shí)相比第一版新增了 JavaScript 逆向、Android 逆向、異步爬蟲、深度學(xué)習(xí)、Kubernetes 相關(guān)內(nèi)容,?同時(shí)本書已經(jīng)獲得 Python 之父 Guido 的推薦,目前本書正在七折促銷中!
內(nèi)容介紹:《Python3網(wǎng)絡(luò)爬蟲開發(fā)實(shí)戰(zhàn)(第二版)》內(nèi)容介紹

掃碼購買





