用Python采集了幾千條相親文案,終于發(fā)現(xiàn)了告別單身的秘密

代碼的編寫過程
Python當(dāng)中的requests庫來發(fā)送和接受請(qǐng)求,通過正則表達(dá)式re這個(gè)庫來解析數(shù)據(jù)import requests
from tenacity import *
import re
import time
retry裝飾器來多次嘗試@retry(stop=stop_after_attempt(5))
def do_requests(url):
response = requests.get(url, headers=headers, proxies=proxies, timeout=10)
return response.text
re庫來實(shí)現(xiàn)的,date_of_birth = re.compile("<br/>①出生年月/星座(.*?)<br/>", re.M | re.S)
sex = re.compile("<br/>【基本資料】(.*?)<br/>")
height = re.compile("<br/>②身高/體重(.*?)<br/>")
education = re.compile("<br/>⑤學(xué)歷(.*?)<br/>")
jobs_1 = re.compile("<br/>⑥職業(yè)(.*?)<br/>")
income = re.compile("<br/>⑦月均收入(.*?)<br/>")
married = re.compile("<br/>⑨有無婚史(.*?)<br/>")
house_cars = re.compile("<br/>⑧車房情況(.*?)<br/>")
self_intro = re.compile("<br/>? 自我介紹(.*?)<br/>")
requirements = re.compile("<br/>【擇偶標(biāo)準(zhǔn)】<br/>(.*?)</a>")
family_member = re.compile("<br/>⑩家庭成員(.*?)<br/>")
pyecharts庫來繪制一下分析的結(jié)果,對(duì)了,要是讀者朋友不知道怎么使用pyecharts這個(gè)庫,可以閱讀一下小編寫的上幾篇文章,都是非常干貨的20個(gè)精美圖表,教你玩轉(zhuǎn)Pyecharts可視化 干貨分享 | 用Pyecharts制作炫酷的可視化大屏 分享一個(gè)Pyecharts中非常重要的組件,可以大大提高繪制圖表的效率 Pyecharts繪制22種超實(shí)用精美圖表
結(jié)果的可視化展示




review_list = []
reviews = get_cut_words("".join(df_girls["requirements"].astype(str).tolist()))
reviews_counter = Counter(reviews).most_common(200)
print(reviews_counter)
for review in reviews_counter:
review_list.append((" " + review[0] + " ") * review[1])
stylecloud.gen_stylecloud(text=" ".join(review_list), max_words=500, collocations=False,
font_path="KAITI.ttf", icon_name="fab fa-apple", size=653,
output_name="4.png")

寫在最后

推薦閱讀:
入門: 最全的零基礎(chǔ)學(xué)Python的問題 | 零基礎(chǔ)學(xué)了8個(gè)月的Python | 實(shí)戰(zhàn)項(xiàng)目 |學(xué)Python就是這條捷徑
干貨:爬取豆瓣短評(píng),電影《后來的我們》 | 38年NBA最佳球員分析 | 從萬眾期待到口碑撲街!唐探3令人失望 | 笑看新倚天屠龍記 | 燈謎答題王 |用Python做個(gè)海量小姐姐素描圖 |碟中諜這么火,我用機(jī)器學(xué)習(xí)做個(gè)迷你推薦系統(tǒng)電影
趣味:彈球游戲 | 九宮格 | 漂亮的花 | 兩百行Python《天天酷跑》游戲!
AI: 會(huì)做詩的機(jī)器人 | 給圖片上色 | 預(yù)測(cè)收入 | 碟中諜這么火,我用機(jī)器學(xué)習(xí)做個(gè)迷你推薦系統(tǒng)電影
小工具: Pdf轉(zhuǎn)Word,輕松搞定表格和水印! | 一鍵把html網(wǎng)頁保存為pdf!| 再見PDF提取收費(fèi)! | 用90行代碼打造最強(qiáng)PDF轉(zhuǎn)換器,word、PPT、excel、markdown、html一鍵轉(zhuǎn)換 | 制作一款釘釘?shù)蛢r(jià)機(jī)票提示器! |60行代碼做了一個(gè)語音壁紙切換器天天看小姐姐!|
年度爆款文案
2).學(xué)Python真香!我用100行代碼做了個(gè)網(wǎng)站,幫人PS旅行圖片,賺個(gè)雞腿吃
9).發(fā)現(xiàn)一個(gè)舔狗福利!這個(gè)Python爬蟲神器太爽了,自動(dòng)下載妹子圖片
點(diǎn)擊閱讀原文,加入我們的星球!

