<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Python爬取網(wǎng)站圖片并保存的實現(xiàn)示例

          共 1977字,需瀏覽 4分鐘

           ·

          2021-02-26 11:37

          先看看結(jié)果吧,去bilibili上拿到的圖片=-=

          第一步,導(dǎo)入模塊

          1. import requests

          2. from bs4 import BeautifulSoup

          requests用來請求html頁面,BeautifulSoup用來解析html

          第二步,獲取目標html頁面

          1. hd = {'user-agent': 'chrome/10'} # 偽裝自己是個(chrome)瀏覽器=-=

          2.  

          3. def download_all_html():

          4. try:

          5. url = 'https://www.bilibili.com/' # 將要爬取網(wǎng)站的地址

          6. request = requests.get(url, timeout=30, headers=hd) # 獲取改網(wǎng)站的信息

          7. request.raise_for_status() # 判斷狀態(tài)碼是否為200,!=200顯然爬取失敗

          8. request.encoding = request.apparent_encoding # 設(shè)置編碼格式

          9. return request.text # 返回html頁面

          10. except:

          11. return ''

          第三步,分析網(wǎng)站html構(gòu)造

          1、顯示網(wǎng)站html代碼

          2、找到圖片位置

          3、分析


          第四步,直接上代碼注釋夠詳細=-=

          1. def parse_single_html(html):

          2. soup = BeautifulSoup(html, 'html.parser') # 解析html,可以單獨去了解一下他的使用

          3. divs = soup.find_all('div', class_='card-pic') # 獲取滿足條件的div,find_all(所有)

          4. for div in divs: # 瞞住條件的div有多個,我們單獨獲取

          5. = div.find('p') # 有源代碼可知,每個div下都有一個p標簽,存儲圖片的title,獲取p標簽

          6. if p == None:

          7. continue

          8. title = p['title'] # 獲取p標簽中的title屬性,用來做圖片的名稱

          9. img = div.find('img')['src'] # 獲取圖片的地址

          10. if img[0:6] != 'https:': # 根據(jù)源代碼發(fā)現(xiàn),有的地址缺少"https:"前綴

          11. img = 'https:' + img # 如果缺少,我們給他添上就行啦,都據(jù)情況而定

          12. response = requests.get(img) # get方法得到圖片地址(有的是post、put)基本是get

          13. with open('./Img/{}.png'.format(title), 'wb') as f: # 創(chuàng)建用來保存圖片的.png文件

          14. f.write(response.content) # 注意,'wb'中的b 必不可少!!

          15.  

          16.  

          17. parse_single_html(download_all_html()) # 最后調(diào)用我們寫的兩個函數(shù)就行啦,

          18.  

          查看結(jié)果

          到此這篇關(guān)于python爬取網(wǎng)站圖片并保存的實現(xiàn)示例的文章就介紹到這了

          掃下方二維碼加老師微信

          或是搜索老師微信號:XTUOL1988【切記備注學(xué)習(xí)Python】

          領(lǐng)取Python web開發(fā),Python爬蟲,Python數(shù)據(jù)分析,人工智能等學(xué)習(xí)教程。帶你從零基礎(chǔ)系統(tǒng)性的學(xué)好Python!

          也可以加老師建的Python技術(shù)學(xué)習(xí)教程qq裙:245345507,二者加一個就可以!

          歡迎大家點贊,留言,轉(zhuǎn)發(fā),轉(zhuǎn)載,感謝大家的相伴與支持


          萬水千山總是情,點個【在看】行不行

          *聲明:本文于網(wǎng)絡(luò)整理,版權(quán)歸原作者所有,如來源信息有誤或侵犯權(quán)益,請聯(lián)系我們刪除或授權(quán)事宜

          瀏覽 44
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  永久免费不收费的视频 | 黄片网在线观看 | 亚洲男人的天堂网 | 国内操逼| 做爱免费网站 |