什么是數(shù)據(jù)科學(xué)?UC Berkeley 告訴你答案!

本文整理自UC Berkerly信息學(xué)院對于Data Science 數(shù)據(jù)科學(xué)項(xiàng)目的介紹,目的是細(xì)致地介紹數(shù)據(jù)科學(xué),包括需要學(xué)習(xí)哪些技能以及相關(guān)的職位和前景。
數(shù)據(jù)科學(xué)的持續(xù)蓬勃發(fā)展,成為技術(shù)專業(yè)人員最有前途和需求的職業(yè)道路之一。今天,成功的數(shù)據(jù)專業(yè)人員明白,他們必須超越分析大量數(shù)據(jù)、數(shù)據(jù)挖掘和編程技能的傳統(tǒng)技能。為了為其組織發(fā)現(xiàn)有用的情報(bào),數(shù)據(jù)科學(xué)家必須掌握數(shù)據(jù)科學(xué)生命周期的全部內(nèi)容,并擁有一定的靈活性和理解力,以便在流程的每個(gè)階段實(shí)現(xiàn)收益最大化。
數(shù)據(jù)科學(xué)生命周期

圖片代表了數(shù)據(jù)科學(xué)生命周期的五個(gè)階段。采集(數(shù)據(jù)采集、數(shù)據(jù)輸入、信號接收、數(shù)據(jù)提取);維護(hù)(數(shù)據(jù)倉儲、數(shù)據(jù)清洗、數(shù)據(jù)暫存、數(shù)據(jù)處理、數(shù)據(jù)架構(gòu));處理(數(shù)據(jù)挖掘、聚類/分類、數(shù)據(jù)建模、數(shù)據(jù)匯總);分析(探索/確認(rèn)、預(yù)測分析、回歸、文本挖掘、定性分析);交流(數(shù)據(jù)報(bào)告、數(shù)據(jù)可視化、商業(yè)智能、決策)。
"數(shù)據(jù)科學(xué)家 "一詞是在2008年被創(chuàng)造出來的,當(dāng)時(shí)許多公司意識到需要數(shù)據(jù)專業(yè)人員,他們擅長組織和分析海量數(shù)據(jù)。在2009年麥肯錫公司的一篇文章中,谷歌首席經(jīng)濟(jì)學(xué)家、加州大學(xué)伯克利分校信息科學(xué)、商業(yè)和經(jīng)濟(jì)學(xué)教授哈爾-瓦里安(Hal Varian)預(yù)測了適應(yīng)技術(shù)對不同行業(yè)的影響和重新配置的重要性。
成功的數(shù)據(jù)科學(xué)家能夠識別相關(guān)問題,從多種不同的數(shù)據(jù)源收集數(shù)據(jù),組織信息,將結(jié)果轉(zhuǎn)化為解決方案,并以積極影響商業(yè)決策的方式傳達(dá)他們的發(fā)現(xiàn)。幾乎所有行業(yè)都需要這些技能,使得熟練的數(shù)據(jù)科學(xué)家對公司的價(jià)值越來越大。
在過去十年中,數(shù)據(jù)科學(xué)家已成為必要的資產(chǎn),幾乎在所有組織中都存在。這些專業(yè)人員是全面的、以數(shù)據(jù)為導(dǎo)向的個(gè)人,具有高級技術(shù)技能,能夠建立復(fù)雜的定量算法,以組織和綜合用于回答問題和推動(dòng)組織戰(zhàn)略的大量信息。再加上溝通和領(lǐng)導(dǎo)力方面的經(jīng)驗(yàn),才能為整個(gè)組織或企業(yè)的各個(gè)利益相關(guān)者提供切實(shí)的成果。
數(shù)據(jù)科學(xué)家需要具有好奇心和結(jié)果導(dǎo)向,具有卓越的行業(yè)特定知識和溝通技巧,使他們能夠向非技術(shù)同行解釋高度技術(shù)性的結(jié)果。他們在統(tǒng)計(jì)學(xué)和線性代數(shù)方面具有很強(qiáng)的定量背景,并具有編程知識,重點(diǎn)是數(shù)據(jù)倉庫、挖掘和建模,以建立和分析算法。
他們還必須能夠利用關(guān)鍵技術(shù)工具和技能,包括:

Glassdoor(Glassdoor是美國的一家做企業(yè)點(diǎn)評與職位搜索的職場社區(qū),在Glassdoor上可匿名點(diǎn)評公司,包括其工資待遇,職場環(huán)境,面試問題等信息。)連續(xù)三年將數(shù)據(jù)科學(xué)家列為2018年美國最佳工作的第一名。隨著越來越多的數(shù)據(jù)變得越來越容易獲取,大型科技公司不再是唯一需要數(shù)據(jù)科學(xué)家的公司。各行各業(yè),無論大小,對數(shù)據(jù)科學(xué)專業(yè)人員的需求不斷增長,但由于缺乏合格的候選人來填補(bǔ)這些空缺職位,他們正在面臨挑戰(zhàn)。
對數(shù)據(jù)科學(xué)家的需求在未來幾年沒有放緩的跡象。LinkedIn將數(shù)據(jù)科學(xué)家列為2017年和2018年最有前途的工作之一,同時(shí)將多種數(shù)據(jù)科學(xué)相關(guān)技能列為企業(yè)最需要的工作。
下面列出的統(tǒng)計(jì)數(shù)字代表了對數(shù)據(jù)科學(xué)家的重大和不斷增長的需求。

數(shù)據(jù)無處不在,廣闊無垠。與數(shù)據(jù)的挖掘、清理、分析和解釋有關(guān)的各種術(shù)語經(jīng)常被交替使用,但實(shí)際上它們可能涉及不同的技能組合和數(shù)據(jù)的復(fù)雜性。
數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家研究哪些問題需要回答,在哪里找到相關(guān)數(shù)據(jù)。他們具有商業(yè)頭腦和分析技能,以及挖掘、清理和展示數(shù)據(jù)的能力。企業(yè)使用數(shù)據(jù)科學(xué)家來尋找、管理和分析大量的非結(jié)構(gòu)化數(shù)據(jù)。然后將結(jié)果進(jìn)行綜合,并傳達(dá)給關(guān)鍵利益相關(guān)者,以推動(dòng)組織的戰(zhàn)略決策。
需要的技能:編程技能(SAS、R、Python)、統(tǒng)計(jì)和數(shù)學(xué)技能、講故事和數(shù)據(jù)可視化、Hadoop、SQL、機(jī)器學(xué)習(xí)。
數(shù)據(jù)分析師
數(shù)據(jù)分析師彌補(bǔ)了數(shù)據(jù)科學(xué)家和業(yè)務(wù)分析師之間的差距。他們從組織中獲得需要回答的問題,然后組織和分析數(shù)據(jù),以找到符合高層業(yè)務(wù)戰(zhàn)略的結(jié)果。數(shù)據(jù)分析師負(fù)責(zé)將技術(shù)分析轉(zhuǎn)化為定性的行動(dòng)項(xiàng)目,并將他們的發(fā)現(xiàn)有效地傳達(dá)給不同的利益相關(guān)者。
需要的技能:編程技能(SAS、R、Python)、統(tǒng)計(jì)和數(shù)學(xué)技能、數(shù)據(jù)整理、數(shù)據(jù)可視化。
數(shù)據(jù)工程師
數(shù)據(jù)工程師負(fù)責(zé)管理指數(shù)級數(shù)量并且快速變化的數(shù)據(jù)。他們專注于數(shù)據(jù)管道和基礎(chǔ)設(shè)施的開發(fā)、部署、管理和優(yōu)化,以便將數(shù)據(jù)轉(zhuǎn)換和傳輸給數(shù)據(jù)科學(xué)家進(jìn)行查詢。
需要的技能:編程語言(Java、Scala)、NoSQL數(shù)據(jù)庫(MongoDB、Cassandra DB)、框架(Apache Hadoop)。
數(shù)據(jù)科學(xué)的職業(yè)前景和薪資機(jī)會(huì)
數(shù)據(jù)科學(xué)專業(yè)人員因其高超的技術(shù)技能而得到回報(bào),他們在大多數(shù)行業(yè)的大公司和小公司都有具有競爭力的薪水和巨大的工作機(jī)會(huì)。Glassdoor上列出了超過4500個(gè)空缺職位,擁有相應(yīng)經(jīng)驗(yàn)和教育的數(shù)據(jù)科學(xué)專業(yè)人員有機(jī)會(huì)在世界上最具前瞻性的公司中大展拳腳。
以下是以下職位的平均年基本工資:
獲得數(shù)據(jù)科學(xué)領(lǐng)域內(nèi)的專業(yè)技能可以使數(shù)據(jù)科學(xué)家更加與眾不同。例如,機(jī)器學(xué)習(xí)專家利用高級編程技能創(chuàng)建算法,不斷收集數(shù)據(jù)并自動(dòng)調(diào)整其功能,以提高工作效率。
- End -
DataScience團(tuán)隊(duì)將于9.1號推出21天的Python入門計(jì)劃,敬請關(guān)注!??!
好文章,我?在看?
