2020年,那些已經(jīng)死亡的公司


大家都知道 2020 年因?yàn)樾鹿谝咔榈脑?,有些公司為了生存下去做了降薪、裁員、加班等一系列動(dòng)作,還有一部分公司直接死亡了,大家一起來看看吧。
登錄
數(shù)據(jù)來源于 IT 桔子網(wǎng)站的死亡公司公墓(https://www.itjuzi.com/deathCompany),IT桔子網(wǎng)站訪客只能看到 1 頁數(shù)據(jù),需要注冊(cè)登錄才能看到更多的數(shù)據(jù),首先注冊(cè)一個(gè)賬號(hào)登錄,在登錄頁(https://www.itjuzi.com/login)用 F12 找到登錄表單,selenium 模塊模擬用戶登錄。

def?login():
????driver?=?webdriver.Chrome()
????
????driver.get('https://www.itjuzi.com/login')
????driver.implicitly_wait(10)?
????
????driver.find_element_by_xpath('//form/div[1]/div/div[1]/input').clear()
????driver.find_element_by_xpath('//form/div[1]/div/div[1]/input').send_keys('用戶名')?
????driver.find_element_by_xpath('//form/div[2]/div/div[1]/input').clear()
????driver.find_element_by_xpath('//form/div[2]/div/div[1]/input').send_keys('密碼')
????driver.find_element_by_class_name('el-button').click()
????
????driver.switch_to.default_content()
????time.sleep(5)
????return?driver
抓取數(shù)據(jù)
模擬鼠標(biāo)從首頁導(dǎo)航欄的公司庫(kù)到死亡公司連接的跳轉(zhuǎn),只抓取 2020 年的數(shù)據(jù),大概有 100 頁左右。把抓取的數(shù)據(jù)存放在 csv 文件中。

def?link(driver):
????ActionChains(driver).move_to_element(driver.find_elements_by_class_name('more')[0]).perform()?#?把鼠標(biāo)移到公司庫(kù)導(dǎo)航上面
????driver.find_element_by_link_text('死亡公司').click()?#?點(diǎn)擊死亡公司超鏈接
????driver.switch_to.window(driver.window_handles[1])?#?切換到新開的標(biāo)簽頁
????driver.implicitly_wait(10)
????time.sleep(5)
def?crawler(driver):
????next_page=driver.find_element_by_class_name('btn-next')?#下一頁
????#?只抓?2020?年的數(shù)據(jù)
????for?page?in?range(1,?101):
????????result?=?[]
????????deadCompany?=?driver.find_element_by_tag_name("tbody").find_elements_by_tag_name("tr")
????????num?=?len(deadCompany)
????????
????????for?i?in?range(1,num?+?1):
????????????gsjc?=?deadCompany[i?-?1].find_element_by_xpath('td[3]/div/h5/a').text?#?公司簡(jiǎn)稱
????????????chsj?=?deadCompany[i?-?1].find_element_by_xpath('td[3]/div/p').text?#?存活時(shí)間
????????????gbsj?=?deadCompany[i?-?1].find_element_by_xpath('td[4]').text?#?關(guān)閉時(shí)間
????????????hy?=?deadCompany[i?-?1].find_element_by_xpath('td[5]').text?#?所屬行業(yè)
????????????dd?=?deadCompany[i?-?1].find_element_by_xpath('td[6]').text?#?公司地點(diǎn)
????????????clsj?=?deadCompany[i?-?1].find_element_by_xpath('td[7]').text?#?關(guān)閉時(shí)間
????????????htzt?=?deadCompany[i?-?1].find_element_by_xpath('td[8]').text?#?融資狀態(tài)
????
????????????result.append(','.join([gsjc,?chsj,?gbsj,?hy,?dd,?clsj,?htzt]))
????
????????with?open('itjuzi/deadCompany.csv',?'a')?as?f:
????????????f.write('\n'.join('%s'?%?id?for?id?in?result)+'\n')
????????????print(result)
????
????????print("第?%s?頁爬取完成"?%?page)
????????next_page.click()?#?點(diǎn)擊下一頁
????????time.sleep(random.uniform(2,?10))
示例截圖:

圖表
我們已經(jīng)把死亡公司數(shù)據(jù)放在了 csv 文件中,先解析到內(nèi)存并使用 pyecharts 模塊制成圖表。
def?parse_csv():
????deadCompany_list?=?[]
????with?open('itjuzi/deadCompany.csv',?'r')?as?f:
????????for?line?in?f.readlines():
????????????a?=?line.strip()
????????????deadCompany_list.append(a)
????return?deadCompany_list
從存活時(shí)長(zhǎng)年限來看有 64% 的公司都沒有超過 4 年,有 4% 存在了超過 10 年的老牌公司也在今年關(guān)停了。
def?lifetime_pie(deadCompany_list):
????lifetime_dict?=?{}
????for?i?in?deadCompany_list:
????????info?=?i.split(',')
????????lifetime?=?info[1].replace('存活',?'').split('年')[0]
????????if?int(lifetime)?>=?10:
????????????lifetime?=?'>=10'
????????lifetime_dict[lifetime]?=?lifetime_dict.get(lifetime,?0)?+?1
????(
????????Pie()
????????????.add("",?[list(z)?for?z?in?zip(lifetime_dict.keys(),?lifetime_dict.values())],
?????????????????radius=["40%",?"75%"],?)
????????????.set_global_opts(
????????????title_opts=opts.TitleOpts(
????????????title="公司存活年限",
????????????pos_left="center",
????????????pos_top="20"),legend_opts=opts.LegendOpts(type_="scroll",?pos_left="80%",?orient="vertical"),?)
????????????.set_series_opts(label_opts=opts.LabelOpts(formatter=":?go7utgvlrp%"),?)
????????????.render("存活時(shí)間.html")
????)
示例截圖:

在融資方面沒有融資的公司死亡率在 75%,融資的公司死亡率是 23%,前者是后者的 3.2 倍
def?rongzi_pie(deadCompany_list):
????rongzi_dict?=?{}
????norongzi_list?=?['尚未獲投',?'不明確',?'尚未獲']
????rongzi_list?=?['天使輪',?'A輪',?'B輪',?'C輪',?'D輪',?'E輪',?'D+輪',?'種子輪',?'A+輪',?'新三板',?'戰(zhàn)略投資',?'B+輪',?'Pre-A輪']
????for?i?in?deadCompany_list:
????????info?=?i.split(',')
????????rongzi?=?info[6].strip()
????????if?rongzi?in?norongzi_list:
????????????rongzi?=?'沒有融資'
????????elif?rongzi?in?rongzi_list:
????????????rongzi?=?'已融資'
????????rongzi_dict[rongzi]?=?rongzi_dict.get(rongzi,?0)?+?1
????(
????????Pie()
????????????.add("",?[list(z)?for?z?in?zip(rongzi_dict.keys(),?rongzi_dict.values())],
?????????????????radius=["40%",?"75%"],?)
????????????.set_global_opts(
????????????title_opts=opts.TitleOpts(
????????????????title="融資情況",
????????????????pos_left="center",
????????????????pos_top="20"),?legend_opts=opts.LegendOpts(type_="scroll",?pos_left="80%",?orient="vertical"),?)
????????????.set_series_opts(label_opts=opts.LabelOpts(formatter=":?go7utgvlrp%"),?)
????????????.render("融資情況.html")
????)
示例截圖:

從公司地區(qū)分布情況看,北上廣的死亡公司數(shù)就占到了一半以上死亡了 621 家公司。
def?place_bar(deadCompany_list):
????place_dict?=?{}
????for?i?in?deadCompany_list:
????????info?=?i.split(',')
????????place?=?info[4].strip()
????????place_dict[place]?=?place_dict.get(place,?0)?+?1
????(?Bar(init_opts=opts.InitOpts(width='2000px'))
????????.add_xaxis(list(place_dict.keys()))
????????.add_yaxis("地區(qū)",?list(place_dict.values()),?)
????????.set_global_opts(
????????????title_opts=opts.TitleOpts(title="地區(qū)分布")
????????)
????????.render("地區(qū).html")
??????)
示例截圖:

總結(jié)
從死亡公司數(shù)據(jù)中得出創(chuàng)業(yè)并不是一件容易的事情,創(chuàng)業(yè)公司在前 4 年是最容易死亡的,在地區(qū)方面北上廣超一線城市的公司競(jìng)爭(zhēng)率是最高的。在融資方面獲得融資的公司存活率遠(yuǎn)遠(yuǎn)大于沒有融資的公司。大家在找工作的時(shí)候可以找存活年限長(zhǎng)并且得到融資的公司。
