<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Python基礎(chǔ)進(jìn)階之海量表情包多線程爬蟲功能的實(shí)現(xiàn)

          共 2094字,需瀏覽 5分鐘

           ·

          2020-12-20 10:22

          這篇文章主要介紹了Python基礎(chǔ)進(jìn)階之海量表情包多線程爬蟲,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下

          一、前言

          在我們?nèi)粘A奶斓倪^程中會(huì)使用大量的表情包,那么如何去獲取表情包資源呢?今天老師帶領(lǐng)大家使用python中的爬蟲去一鍵下載海量表情包資源

          二、知識(shí)點(diǎn)

          requests網(wǎng)絡(luò)庫(kù)
          bs4選擇器
          文件操作
          多線程

          三、所用到得庫(kù)

          1. import?os

          2. import?requests

          3. from?bs4?import?BeautifulSoup

          四、 功能

          1. # 多線程程序需要用到的一些包

          2. # 隊(duì)列

          3. from?queue?import?Queue

          4. from?threading?import?Thread

          五、環(huán)境配置

          解釋器 python3.6
          編輯器 pycharm專業(yè)版 激活碼

          六、多線程類代碼

          1. # 多線程類

          2. class?Download_Images(Thread):

          3. # 重寫構(gòu)造函數(shù)

          4. def?__init__(self,?queue,?path):

          5. Thread.__init__(self)

          6. # 類屬性

          7. self.queue?=?queue

          8. self.path?=?path

          9. if?not?os.path.exists(path):

          10. os.mkdir(path)

          11. def?run(self)?->?None:

          12. while?True:

          13. # 圖片資源的url鏈接地址

          14. url?=?self.queue.get()

          15. try:

          16. download_images(url,?self.path)

          17. except:

          18. print('下載失敗')

          19. finally:

          20. # 當(dāng)爬蟲程序執(zhí)行完成/出錯(cuò)中斷之后發(fā)送消息給線程 代表線程必須停止執(zhí)行

          21. self.queue.task_done()

          七、爬蟲代碼

          1. # 爬蟲代碼

          2. def?download_images(url,?path):

          3. headers?=?{

          4. 'User-Agent':

          5. 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'

          6. }

          7. response?=?requests.get(url,?headers=headers)

          8. soup?=?BeautifulSoup(response.text,?'lxml')

          9. img_list?=?soup.find_all('img',?class_='ui image lazy')

          10. for?img?in?img_list:

          11. image_title?=?img['title']

          12. image_url?=?img['data-original']

          13. ?

          14. try:

          15. with?open(path?+?image_title?+?os.path.splitext(image_url)[-1],?'wb')?as?f:

          16. image?=?requests.get(image_url,?headers=headers).content

          17. print('正在保存圖片:',?image_title)

          18. f.write(image)

          19. print('保存成功:',?image_title)

          20. except:

          21. pass

          22. ?

          23. if?__name__?==?'__main__':

          24. _url?=?'https://fabiaoqing.com/biaoqing/lists/page/{page}.html'

          25. urls?=?[_url.format(page=page)?for?page?in?range(1,?201)]

          26. queue?=?Queue()

          27. path?=?'./threading_images/'

          28. for?x?in?range(10):

          29. worker?=?Download_Images(queue,?path)

          30. worker.daemon?=?True

          31. worker.start()

          32. for?url?in?urls:

          33. queue.put(url)

          34. queue.join()

          35. print('下載完成...')

          八、爬取效果圖片

          到此這篇關(guān)于Python基礎(chǔ)進(jìn)階之海量表情包多線程爬蟲的文章就介紹到這了

          掃下方二維碼加老師微信

          或是搜索老師微信號(hào):XTUOL1988【切記備注學(xué)習(xí)Python】

          領(lǐng)取Python web開發(fā),Python爬蟲,Python數(shù)據(jù)分析,人工智能等學(xué)習(xí)教程。帶你從零基礎(chǔ)系統(tǒng)性的學(xué)好Python!

          也可以加老師建的Python技術(shù)學(xué)習(xí)教程qq裙:245345507,二者加一個(gè)就可以!

          歡迎大家點(diǎn)贊,留言,轉(zhuǎn)發(fā),轉(zhuǎn)載,感謝大家的相伴與支持

          萬(wàn)水千山總是情,點(diǎn)個(gè)【在看】行不行

          *聲明:本文于網(wǎng)絡(luò)整理,版權(quán)歸原作者所有,如來(lái)源信息有誤或侵犯權(quán)益,請(qǐng)聯(lián)系我們刪除或授權(quán)事宜

          瀏覽 73
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产1234在线观看 | 国产黄片乱伦 | 天天日,天天干,天天操 | 考逼网站 | 97香蕉久久国产超碰青草专区 |