女人18片毛片90分钟在线播放,日本黄色电影免费在线播放,日韩无码破解电影,青青草操逼视频免费看,日韩69,天天干,天天干,日韩AV中文字幕在线播放,神马午夜三级片

1、創(chuàng)建請(qǐng)求頭，也被稱為偽裝瀏覽器

如果不添加請(qǐng)求頭的話，可能會(huì)出現(xiàn)當(dāng)前網(wǎng)站沒(méi)有訪問(wèn)權(quán)限。

2、使用requests 網(wǎng)絡(luò)請(qǐng)求庫(kù)完成網(wǎng)站數(shù)據(jù)請(qǐng)求

3、獲取數(shù)據(jù)后使用bs4對(duì)頁(yè)面數(shù)據(jù)進(jìn)行提取

需要用到一個(gè)非常好用的第三方包：bs4。

4、實(shí)例

import osimport requestsfrom bs4 import BeautifulSoup if not os.path.exists('./images/'):    os.mkdir('./images/') headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'} url = 'https://fabiaoqing.com/biaoqing/lists/page/1.html'response = requests.get(url, headers=headers).text '''lxml: html解析庫(kù),因?yàn)閜ython和html兩者沒(méi)有關(guān)系python沒(méi)有辦法直接控制html代碼我們就需要使用lxml這個(gè)庫(kù)將html代碼轉(zhuǎn)成python對(duì)象    需要大家去下載 pip install lxml'''soup = BeautifulSoup(response, 'lxml')img_list = soup.find_all('img', class_='ui image lazy')for img in img_list:img_url = img['data-original']img_title = img['title']print(img_url, img_title)try:     with open('./images/' + img_title + os.path.splitext(img_url)[-1], 'wb') as f:        '''        因?yàn)橐粡垐D片是二進(jìn)制數(shù)據(jù)            如果我們使用text文本形式返回            會(huì)對(duì)文件造成破壞                        使用content去返回原始數(shù)據(jù)                    '''         image = requests.get(img_url, headers=headers).content         # 寫入二進(jìn)制數(shù)據(jù) image這個(gè)變量是存儲(chǔ)requests返回的二進(jìn)制數(shù)據(jù)的         f.write(image)         print('保存成功:', img_title)except:     pass

以上就是python爬蟲獲取表情包的方法，希望對(duì)大家有所幫助。

搜索下方加老師微信

老師微信號(hào)：XTUOL1988【切記備注：學(xué)習(xí)Python】

領(lǐng)取Python web開發(fā)，Python爬蟲，Python數(shù)據(jù)分析，人工智能等精品學(xué)習(xí)課程。帶你從零基礎(chǔ)系統(tǒng)性的學(xué)好Python！

*聲明：本文于網(wǎng)絡(luò)整理，版權(quán)歸原作者所有，如來(lái)源信息有誤或侵犯權(quán)益，請(qǐng)聯(lián)系我們刪除或授權(quán)

python爬蟲學(xué)習(xí)教程：爬取表情包【附源碼】