二本大二,走大數(shù)據(jù)還是數(shù)據(jù)挖掘
帥友提問
二本大二大數(shù)據(jù)專業(yè),不想考研,目前就學了c,python,java的基礎(chǔ)語法,數(shù)據(jù)結(jié)構(gòu)和算法在學,希望找個數(shù)據(jù)挖掘的工作,我現(xiàn)在是搞八股文跟基礎(chǔ),刷力扣,還是現(xiàn)在就直接偏重于大數(shù)據(jù)技術(shù)棧呢?
另外大數(shù)據(jù)的技術(shù)很是龐大,眼花繚亂,我看學校的課程貌似沒提到具體的技術(shù),小白該從哪里入門呢?需要按照什么樣的學習路線才能做個小項目在畢業(yè)時有競爭力呢?地哥和各位朋友有建議嗎?orz
帥地回答
數(shù)據(jù)挖掘?我印象中數(shù)據(jù)挖掘貌似會涉及到機器學習,模型訓練之類的,而且從事數(shù)據(jù)挖掘的,靠近算法崗,大部分都是學歷挺好的碩士,你應(yīng)該是要找大數(shù)據(jù)開發(fā)的工作吧?
按照你的情況,你就先學大數(shù)據(jù)相關(guān)的技術(shù)棧吧,首先大數(shù)據(jù)這個崗位,我覺得項目這塊還是挺重要的,特別是中小公司,會更加看重項目,然后基礎(chǔ)和算法,在大公司也是不可或缺。
我覺得你算法這塊就保持著刷,然后對于數(shù)據(jù)挖掘的技術(shù)棧,我說一說,到時候?qū)憘€詳細的學習路線吧。
大數(shù)據(jù),顯然我們需要去處理海量的數(shù)據(jù),這意味著是需要多臺機器來處理的,那么為了處理高效,一般會用到分布式,消息隊列等中間件的東西 + 一些大數(shù)據(jù)處理的框架。
所以我覺得你可以這樣學:
第一階段打基礎(chǔ):學 Javase 相關(guān)技術(shù)棧,主要就是集合,多線程,JVM 這些。第二階段學大數(shù)據(jù)組件:先學 Hadoop,之后在根據(jù)你要做的項目去學對應(yīng)的組件,例如有數(shù)倉離線計算,實時計算這些,那么對應(yīng)需要學的也是不一樣的。第三階段學中間件:主要就是 Kafka,Zookeeper,HDFS 這些東西
但是呢,這個過程也要學習計算機基礎(chǔ),例如操作系統(tǒng),計網(wǎng),不過呢,我覺得你可以先學完第一階段再來學這些,之后在第二、三階段,也可以先第二三階段,在計網(wǎng)。
還有就是,項目并不會帶來多大的競爭力的,項目你掌握的好的話才能增加你的面試成功率,另外一般實習可以帶來競爭力。
總的來說,就是先學起來,加油!
