我常用的15個(gè)數(shù)據(jù)源網(wǎng)站
前面介紹過實(shí)用的效率小工具,真的幫了我很多忙,這次給小伙伴們?cè)俜N草一些數(shù)據(jù)源網(wǎng)站。
現(xiàn)在有很多免費(fèi)的數(shù)據(jù)可以供使用分析,不過很少有人能找的到,或者沒能力找,這就是所謂的信息差吧。其實(shí)數(shù)據(jù)獲取分為兩方面,一是“拿來的”數(shù)據(jù),也就是現(xiàn)成的;二是“爬來的”數(shù)據(jù),這種一般通過爬蟲等手段去采集數(shù)據(jù)。
“拿來的”數(shù)據(jù)可以在各大官方平臺(tái)或者社區(qū)去找,一般各行各業(yè)都會(huì)有自己的數(shù)據(jù)庫。我常用的數(shù)據(jù)網(wǎng)站有以下這些:
搜索指數(shù)類
百度指數(shù):百度搜索匯總的數(shù)據(jù),能看到各種關(guān)鍵詞的搜索熱度趨勢(shì),優(yōu)點(diǎn)數(shù)據(jù)量大,能反映真實(shí)的話題熱度變化,適合做需求洞察、用戶畫像、輿情監(jiān)測、市場分析。
百度指數(shù)規(guī)則,是以網(wǎng)民在百度的搜索量為數(shù)據(jù)基礎(chǔ),以關(guān)鍵詞為統(tǒng)計(jì)對(duì)象,科學(xué)分析并計(jì)算出各個(gè)關(guān)鍵詞在百度網(wǎng)頁搜索中搜索頻次的加權(quán)和。

微信指數(shù):微信生態(tài)的大數(shù)據(jù),反映關(guān)鍵詞熱度,和百度指數(shù)類似。但微信指數(shù)數(shù)據(jù)來源微信各種內(nèi)容渠道,包括搜一搜、視頻號(hào)、公眾號(hào)等,適合做微信生態(tài)人群畫像、內(nèi)容推廣、輿情監(jiān)控的研究。
在計(jì)算關(guān)鍵詞指數(shù)的過程中,微信指數(shù)主要關(guān)注:
關(guān)鍵詞相關(guān)內(nèi)容的受歡迎程度。
關(guān)鍵詞在相關(guān)內(nèi)容中的重要程度。

Google Trends:和百度指數(shù)類似的產(chǎn)品,基于google生態(tài)匯總的大數(shù)據(jù)。比百度數(shù)據(jù)來源更豐富也更廣泛,包含了google、youtube等,畢竟是全球應(yīng)用。缺點(diǎn)是對(duì)國內(nèi)搜索分析的指導(dǎo)意義不大,還是百度指數(shù)更具指導(dǎo)意義。

微博指數(shù):微博內(nèi)容提及量、閱讀量、互動(dòng)量加權(quán)得出的綜合指數(shù),優(yōu)點(diǎn)比較有時(shí)效性,而且數(shù)據(jù)基數(shù)大,可以實(shí)時(shí)反映熱度變化情況,適合實(shí)時(shí)捕捉當(dāng)前社會(huì)熱點(diǎn)事件、熱點(diǎn)話題等,快速響應(yīng)輿論走向等。

媒體數(shù)據(jù)
這種數(shù)據(jù)包含了網(wǎng)站、APP、自媒體賬號(hào)等監(jiān)測數(shù)據(jù),大多是商業(yè)付費(fèi)類
Alexa:用于查詢?nèi)蚓W(wǎng)站排名和流量的平臺(tái),可以看到PV、UV、排名、區(qū)域分布等信息。

新榜:新媒體專屬的數(shù)據(jù)平臺(tái),用于查看抖音、快手、公眾號(hào)、小紅書等平臺(tái)KOL賬號(hào)的數(shù)據(jù)。數(shù)據(jù)包括了粉絲、瀏覽、互動(dòng)、聲量等,一般用于廣告投放監(jiān)測、自媒體數(shù)據(jù)運(yùn)營等。

貓眼數(shù)據(jù):影視相關(guān)數(shù)據(jù)。匯總了電影票房、網(wǎng)播熱度、電視收視等數(shù)據(jù),適合做票房預(yù)測、節(jié)目熱度監(jiān)測。

艾瑞指數(shù):APP、Web、手機(jī)等排行榜數(shù)據(jù),包括各大移動(dòng)設(shè)備裝機(jī)指數(shù)、APP熱度指數(shù)、PC Web熱度指數(shù)、網(wǎng)絡(luò)廣告指數(shù)等等,適合做廣告營銷投放等。

金融數(shù)據(jù)
新浪財(cái)經(jīng)數(shù)據(jù)中心:新浪財(cái)經(jīng)大數(shù)據(jù),匯總了股票、基金、期貨、黃金、貨幣等各種財(cái)經(jīng)數(shù)據(jù),種類很齊全,應(yīng)該有數(shù)據(jù)接口。

Wind:國內(nèi)比較早的金融數(shù)據(jù)服務(wù)商,數(shù)據(jù)種類最齊全,而且有各種金融分析工具,也支持Python、R等量化分析。但Wind很貴,個(gè)人很難承擔(dān)的起。

Tushare:免費(fèi)的金融數(shù)據(jù)庫,支持Python接口,數(shù)據(jù)也非常齊全,包含了股票、基金、期權(quán)、債券、外匯、公司報(bào)表等各種財(cái)經(jīng)數(shù)據(jù)。只要你會(huì)用Python,就可以調(diào)用里面的各種數(shù)據(jù),非常便捷。

社會(huì)數(shù)據(jù)
這種一般包含政府開放數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù),以及各種民生數(shù)據(jù)。
國家統(tǒng)計(jì)局:最權(quán)威的國內(nèi)宏觀數(shù)據(jù)網(wǎng)站,包括人口、經(jīng)濟(jì)、農(nóng)業(yè)等等。

上海公共數(shù)據(jù)開放平臺(tái):上海市各行各業(yè)的免費(fèi)數(shù)據(jù),對(duì)公眾開放下載,非常適合做城市規(guī)劃分析。

其他城市官方數(shù)據(jù):


數(shù)據(jù)科學(xué)研究數(shù)據(jù)
這一類數(shù)據(jù)適合做機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析、算法研究等,是學(xué)術(shù)界、工業(yè)界用于數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)典型數(shù)據(jù)。
kaggle:全球最大的數(shù)據(jù)科學(xué)比賽平臺(tái),也是google旗下的產(chǎn)品。kaggle擁有豐富的數(shù)據(jù)集和各種解決方案,適合對(duì)數(shù)據(jù)感興趣的小伙伴去研究學(xué)習(xí)。

天池:阿里云里面的數(shù)據(jù)比賽平臺(tái),也擁有很多比賽數(shù)據(jù),質(zhì)量相對(duì)較高。


對(duì)比Excel系列圖書累積銷量達(dá)15w冊(cè),讓你輕松掌握數(shù)據(jù)分析技能,可以在全網(wǎng)搜索書名進(jìn)行了解選購:

