俺也去www00271,1000部无码,影音先锋成人网址,一级毛片久久久久久久女人18,草草影院在线观看视频,大黑吊狂插美女嫩逼,操屄操屄操屄操屄,国产成人+综合亚洲+天堂

點擊上方“Python爬蟲與數(shù)據(jù)挖掘”，進行關(guān)注

回復(fù)“書籍”即可獲贈Python從入門到進階共10本電子書

今

日

雞

湯

世亂同南去，時清獨北還。

大家好，我是Python進階者。

一、前言

前幾天有個粉絲找我獲取基金信息，這里拿出來分享一下，感興趣的小伙伴們，也可以積極嘗試。

二、數(shù)據(jù)獲取

這里我們的目標(biāo)網(wǎng)站是某基金官網(wǎng)，需要抓取的數(shù)據(jù)如下圖所示。

可以看到上圖中基金代碼那一列，有不同的數(shù)字，隨機點擊一個，可以進入到基金詳情頁，鏈接也非常有規(guī)律，以基金代碼作為標(biāo)志的。

其實這個網(wǎng)站倒是不難，數(shù)據(jù)什么的，都沒有加密，網(wǎng)頁上的信息，在源碼中都可以直接看到。

這樣就降低了抓取難度了。通過瀏覽器抓包的方法，可以看到具體的請求參數(shù)，而且可以看到請求參數(shù)中只有pi在變化，而這個值恰好對應(yīng)的是頁面，直接構(gòu)造請求參數(shù)就可以了。

代碼實現(xiàn)過程

找到數(shù)據(jù)源之后，接下來就是代碼實現(xiàn)了，一起來看看吧，這里給出部分關(guān)鍵代碼。

獲取股票id數(shù)據(jù)

response?=?requests.get(url,?headers=headers,?params=params,?verify=False)
????pattern?=?re.compile(r'.*?"(?P.*?)".*?',?re.S)
????result?=?re.finditer(pattern,?response.text)
????ids?=?[]
????for?item?in?result:
????????#?print(item.group('items'))
????????gp_id?=?item.group('items').split(',')[0]

結(jié)果如下圖所示：

之后構(gòu)造詳情頁鏈接，獲取詳情頁的基金信息，關(guān)鍵代碼如下：

response?=?requests.get(url,?headers=headers)
response.encoding?=?response.apparent_encoding
selectors?=?etree.HTML(response.text)
danweijingzhi1?=?selectors.xpath('//dl[@class="dataItem02"]/dd[1]/span[1]/text()')[0]
danweijingzhi2?=?selectors.xpath('//dl[@class="dataItem02"]/dd[1]/span[2]/text()')[0]
leijijingzhi?=?selectors.xpath('//dl[@class="dataItem03"]/dd[1]/span/text()')[0]
lst?=?selectors.xpath('//div[@class="infoOfFund"]/table//text()')

結(jié)果如下圖所示：

將具體的信息做相應(yīng)的字符串處理，然后保存到csv文件中，結(jié)果如下圖所示：