<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          手把手教你,抓取美女圖片(批量下載)—— 實(shí)戰(zhàn)篇

          共 1856字,需瀏覽 4分鐘

           ·

          2020-11-03 10:24

          d0dd8a7737e4becbe7afa1f161a15bab.webp

          2456c9fef0e98868bb66d01985cc4e3f.webp



          前言


          你還在為一個一個下載壁紙而煩惱嗎。那有沒有更加簡單的方法呢?跟著我,一起來看看我是如何批量下載美女圖片呢,我們以美桌壁紙為例,下載全部美女圖片。

          9f78c7347c94f3cd0965424e636baa0e.webp

          a338e9bd64859f6a4d7e8eed062e4040.webp



          01


          ????首先,你要安裝pycharm軟件,具體操作可以參考這篇文章:Pycharm安裝及創(chuàng)建項(xiàng)目教程,爬蟲主要工具可以參考這篇文章:Python主要爬蟲工具

          ????今天介紹如何在Pycharm安裝lxml模塊和requests模塊

          9ff83eb72f72d327478afd8fcf47c4cb.webp

          ?????依次點(diǎn)擊Project: (這里是你創(chuàng)建的名字),在點(diǎn)下面的Project?Interpreter,點(diǎn)擊 + 號進(jìn)行添加模塊

          ff2cd8b190f3c289e69da726ce000494.webp

          打開后,在空格里添加你要下載的模塊,點(diǎn)擊Install Package?進(jìn)行下載,下載過程會很慢,這時候我們添加國內(nèi)鏡像源

          清華:https://pypi.tuna.tsinghua.edu.cn/simple

          4462d958a01a70991c289edd868fdb3b.webp



          02


          ????爬蟲思路分析,進(jìn)入我們要分析的網(wǎng)頁,第一張圖片。右鍵檢查,到下面頁面。點(diǎn)擊連接,到下一個網(wǎng)頁

          f1679d4f89f2c0f8fe67ae28d2e7494a.webp

          ????這是鏈接下的高清圖片

          62a7e639960737398d1ac64e0a607064.webp

          該地址就是我們想要的數(shù)據(jù),我們發(fā)現(xiàn)data-original就是高清圖片地址

          4ff92e1a7a536861cd5657c72d0c6d01.webp



          03


          ????找到需要下載的鏈接地址,我們要把所有的高清圖片全部下載下來,接下來就是最重要的時刻了,編寫代碼過程

          ????鏈接地址:

          http://www.win4000.com/meinvtag4_1.html

          1. 導(dǎo)入requests,lxml模塊包

          import requestsfrom lxml import etree

          2.?確定url地址和請求頭

          url = "http://www.win4000.com/meinvtag4_1.html"headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36'}

          什么是請求頭

          ????簡單來說就是模擬瀏覽器

          ??? User-Agent:瀏覽器類型,如果Servlet返回的內(nèi)容與瀏覽器類型有關(guān)則該值非常有用。

          8f48a0de619073dc7f29580244c8d777.webp

          3.?請求數(shù)據(jù)并解析數(shù)據(jù)

          def get_data(imgs):    # 解析數(shù)據(jù)    html = etree.HTML(imgs)    href_list = html.xpath('//div[@class="Left_bar"]//ul/li/a/@href')    for href in href_list:        response01 = requests.get(href, headers=headers).text        html01 = etree.HTML(response01)        img_list = html01.xpath('//div[@class="pic-meinv"]/a/img/@data-original')[0]        # 請求圖片數(shù)據(jù)        img_url = requests.get(img_list, headers=headers).content

          ????這里使用了嵌套循環(huán),因?yàn)槟阍L問的是原網(wǎng)頁,網(wǎng)頁下還有,一個圖片專輯那里才是,我們的想要的高清圖片,所以要使用嵌套循環(huán)

          4. 保存數(shù)據(jù)

          def save_data():    file_name = img_list.split('/')[-1]     with open(r'Q:\xing\img\\' + file_name , mode="wb") as f:        print("正在下載圖片:" + file_name)        f.write(img_url)

          img_list.split('/')[-1]就是以下圖,圖片鏈接地址后半部分進(jìn)行分割,來定義為文件名稱。

          58f57d9442f0aefad749e4861ce288bd.webp

          查看我們保存的圖片

          a5d9ea9c0fe7385b99820c4e7554d7ea.webp


          總結(jié)



          ????本文介紹了,在pycharm中安裝模塊及使用,為什么要用請求頭,并分析網(wǎng)頁,得到我們想要的圖片,提前部署請求頭,模擬瀏覽器,針對反爬蟲提前做了準(zhǔn)備。


          創(chuàng)作不易,歡迎關(guān)注




          ????往期精彩,歡迎瀏覽

          ? ??

          ????Python抓取互聯(lián)網(wǎng)相關(guān)職位

          ????Pyhton抓取4K動漫壁紙

          ????Python抓取二手車信息

          ????Pyhton抓取全站酷6視頻



          6a38ecc3505baf17fffcde0bc3360660.webp


          454f22e6bbf7e0f464d1b28a815f8fdc.webp

          1bf0120475cb569d2653428848324f25.webp

          瀏覽 115
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  超碰免费在线97 | jlzz国产 | 亚洲操逼在线 | 操伊人久久 | 黄色电影网站在线免费观看 |