<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          python爬蟲學(xué)習(xí)教程:爬取表情包【附源碼】

          共 1503字,需瀏覽 4分鐘

           ·

          2021-08-02 10:06

          1、創(chuàng)建請(qǐng)求頭,也被稱為偽裝瀏覽器


          如果不添加請(qǐng)求頭的話,可能會(huì)出現(xiàn)當(dāng)前網(wǎng)站沒(méi)有訪問(wèn)權(quán)限。


          2、使用requests 網(wǎng)絡(luò)請(qǐng)求庫(kù)完成網(wǎng)站數(shù)據(jù)請(qǐng)求


          3、獲取數(shù)據(jù)后使用bs4對(duì)頁(yè)面數(shù)據(jù)進(jìn)行提取


          需要用到一個(gè)非常好用的第三方包:bs4。


          4、實(shí)例

          import osimport requestsfrom bs4 import BeautifulSoup if not os.path.exists('./images/'):    os.mkdir('./images/') headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'} url = 'https://fabiaoqing.com/biaoqing/lists/page/1.html'response = requests.get(url, headers=headers).text '''lxml: html解析庫(kù),因?yàn)閜ython和html兩者沒(méi)有關(guān)系python沒(méi)有辦法直接控制html代碼我們就需要使用lxml這個(gè)庫(kù)將html代碼轉(zhuǎn)成python對(duì)象    需要大家去下載 pip install lxml'''soup = BeautifulSoup(response, 'lxml')img_list = soup.find_all('img', class_='ui image lazy')for img in img_list:img_url = img['data-original']img_title = img['title']print(img_url, img_title)try:     with open('./images/' + img_title + os.path.splitext(img_url)[-1], 'wb') as f:        '''        因?yàn)橐粡垐D片是二進(jìn)制數(shù)據(jù)            如果我們使用text文本形式返回            會(huì)對(duì)文件造成破壞                        使用content去返回原始數(shù)據(jù)                    '''         image = requests.get(img_url, headers=headers).content         # 寫入二進(jìn)制數(shù)據(jù) image這個(gè)變量是存儲(chǔ)requests返回的二進(jìn)制數(shù)據(jù)的         f.write(image)         print('保存成功:', img_title)except:     pass

          以上就是python爬蟲獲取表情包的方法,希望對(duì)大家有所幫助。

          搜索下方加老師微信

          老師微信號(hào):XTUOL1988切記備注學(xué)習(xí)Python

          領(lǐng)取Python web開發(fā),Python爬蟲,Python數(shù)據(jù)分析,人工智能等精品學(xué)習(xí)課程。帶你從零基礎(chǔ)系統(tǒng)性的學(xué)好Python!

          *聲明:本文于網(wǎng)絡(luò)整理,版權(quán)歸原作者所有,如來(lái)源信息有誤或侵犯權(quán)益,請(qǐng)聯(lián)系我們刪除或授權(quán)


          瀏覽 55
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  风间精品一区二区三区 | 欧美人兽在线 | 韩国一级特黄色片 | 国产三级图片 | 激情综合网五月 |