阿里九面,數(shù)據(jù)研發(fā)面經(jīng)!

說了九次面試感覺我是大神,拿了SP之類,其實(shí)并不是,內(nèi)情就是內(nèi)推轉(zhuǎn)為了校招,內(nèi)推五次面試,校招四次面試,在加校招的筆試。本帖子適用于跨專業(yè)的人士。sp勿噴,有錯(cuò)別字,勿噴,只是想寫個(gè)面試經(jīng)驗(yàn)給以后的人士。
我投遞是數(shù)據(jù)崗位,對于之前我主要搞機(jī)器人的我來講,基本處于什么的都不會的狀態(tài),做數(shù)據(jù)的一般都知道,需要用什么 比如odps,hadoop,flink等等工具,然后做業(yè)務(wù)需要范式建模,緯度建模等等。我可以真實(shí)的告訴大家,之前這些我并不是很熟悉的。以前摸到的數(shù)據(jù)也只是阿里巴巴數(shù)據(jù)天池比賽。下面一一敘述開來。
7月中旬內(nèi)推,七月中旬我還在調(diào)試機(jī)器人。
第一次面試-電話面試
第一次面試是在內(nèi)推沒過幾天就開始了,是個(gè)女主管,說話比較親和,所以我不算緊張,在羅列之前自己做的機(jī)器人事情后,他就是隨便問了問,主要他也不懂。就問我什么三范式,我懵逼,什么是緯度建模,我繼續(xù)懵逼。一共提了很多問題(在文章最后有總結(jié))總之,我回答上來的就寥寥無幾。電話持續(xù)了1個(gè)小時(shí),對方的態(tài)度很溫和,所以氣氛不是很尷尬 。
第二次面試-電話面試
本來以為一面就跪掉了,但是內(nèi)心還是抱有幻想的。所以啥也沒想,就總結(jié)上個(gè)面試官的問題,我就各種查資料,自己買書,幾乎是一天一本的看。當(dāng)時(shí)蠻辛苦的,主要在于新知識,當(dāng)天必須理解。比如先從數(shù)據(jù)庫這本書開始看起,學(xué)到1NF,2NF,3NF就比較晦澀。還有其他等等。當(dāng)然在一面基礎(chǔ)上我學(xué)了,數(shù)據(jù)庫原理,mysql,數(shù)據(jù)倉庫,學(xué)習(xí)大概一個(gè)周的時(shí)間,一個(gè)周也是阿里面試的周期,數(shù)據(jù)倉庫這本書,我說實(shí)話沒看懂。只是有個(gè)印象是事實(shí)表的設(shè)計(jì),如果從業(yè)務(wù)出發(fā)做這個(gè)表格。
好言歸正傳,面試的時(shí)候,依據(jù)先自我介紹,在上項(xiàng)目介紹,然后提問。這一面應(yīng)該是壓力面試,問我C++相關(guān),我的比較自信,回答的很好,但是問道數(shù)據(jù)的,我開始磕磕巴巴,但是總體是能說出來的。壓力面試真的不爽,主要我對這一塊也不熟悉,害怕又上次一樣,什么都問,我啥也回答不上來。幸好,他多數(shù)問的都是算法和編程問題,比如C++多態(tài)性,動態(tài)規(guī)劃怎么做的等等問題。
第三次面試-電話面試
經(jīng)過第二次面試,我覺得自己還是有救的,依舊是每天堅(jiān)持的學(xué)下去,時(shí)間也是一周的時(shí)間,雖然是一周,但是我還有其他項(xiàng)目纏身,基本每天晚上和夜里學(xué)習(xí)。上次學(xué)了很多基礎(chǔ)的課程,但是數(shù)據(jù)倉庫并不算是,我開始學(xué)習(xí)odps工具箱,我知道這個(gè)很重要,但是沒學(xué)習(xí)過。
尤其對里面的UDF,MapReduce進(jìn)行了學(xué)習(xí),沒有項(xiàng)目可談,只是學(xué)習(xí)了關(guān)于一些實(shí)例,并自己做了實(shí)驗(yàn),因?yàn)樽约簂inux基礎(chǔ)功底比較好,所以搭建環(huán)境和調(diào)試還是很快的。這里雖然看了ODPS但是依據(jù)是半徑八兩。轉(zhuǎn)入主題,這次面試正常面試,還是依舊套路,自我介紹,項(xiàng)目介紹,提問題。
前兩個(gè)忽略,下面的面試也忽略。主要提問題,他問了一部分關(guān)于我之前的項(xiàng)目,然后就很巧!真的很巧就問了ODPS的問題,我基本都答上來了,但是他說了一句 ,懂是懂,就是沒有項(xiàng)目經(jīng)驗(yàn)。我一臉尷尬。還有問了關(guān)于維度表設(shè)計(jì),我不會。但是我記住了。
第四次面試 視頻面試
這次我在出差,是在深圳面試的,自己在一個(gè)很小的房間里。先說說怎么學(xué)啥,根據(jù)上次經(jīng)驗(yàn),我應(yīng)該欠缺關(guān)于業(yè)務(wù)的知識,還有hadoop的知識。這次時(shí)間比較久,后來聽說是想把我回絕的,但是又覺得在試試,(所以,機(jī)會一定要認(rèn)真面對)。
我這次兩周內(nèi),學(xué)了一本書叫阿里巴巴數(shù)據(jù)大實(shí)踐,還有Hadoop一本厚厚的書,先說業(yè)務(wù)方面的,我之前看的那本數(shù)據(jù)倉庫并不是很懂,但是阿里寫的這本書,真的挺好的,到面試完畢,我?guī)缀踝x了不下于30多遍,每一次都有新的認(rèn)識,(我很愛看書,不愛看視頻,看電腦學(xué)習(xí))。里面講解的很清晰如何做維度,做事實(shí)。然后各種分類。看完這本書,我又復(fù)習(xí)了關(guān)于數(shù)據(jù)倉庫書本,本來很難進(jìn)行的一本書,我堅(jiān)持看了一半。這一半也是看了很多遍,后半部分是因?yàn)楹芏鄬?shí)例所以我并沒有看。
業(yè)務(wù)上面我沒有項(xiàng)目經(jīng)驗(yàn),所以我就總結(jié)關(guān)于淘寶購買物品過程涉及的數(shù)據(jù),并繪制了一系列的圖紙以及文字描述,算是基本把這本書的核心全部摘出來了。Hadoop是apache旗下開源數(shù)據(jù)框架,分布式系統(tǒng),我不會。我真的不會,然后花了一夜的時(shí)間看了一本關(guān)于分布式系統(tǒng)的書。然后開始攻克Hadoop。雖然開源但是用的是java寫的,我java功底很差。但是我愛看源碼,所以先把hadoop書籍前面的部分看完,我就開始閱讀源碼,閱讀并不是一個(gè)個(gè)看,而是主要看框架,看實(shí)現(xiàn)方式,看信息傳輸?shù)鹊取F鋵?shí)這里蠻浪費(fèi)時(shí)間的,但是自己覺得既然學(xué)了,就要認(rèn)真的學(xué)下去,就要搞懂。基本源碼看了一天基本都懂了,當(dāng)然不是非常了解。
Hadoop周圍還有很多其他工具,比如 pig hbase hive 等等。這些源碼沒有看,既然是工具,所以沒有主要針對。但是對于每個(gè)工具,我?guī)缀趺總€(gè)工具買一本書,比如HIVE 我買了一本hive的書籍。學(xué)習(xí)會用,學(xué)習(xí)內(nèi)部原理,學(xué)習(xí)一些優(yōu)缺點(diǎn)就ok,其他的工具都一樣。
其實(shí)一下子看了那么多,就是為了這次面試,這次視頻面試很重要,不僅看你說啥,還要看你的談吐能力,以及你的應(yīng)變能力,和電話面試很不同。這次的面試官很和藹,讓我自我介紹,和介紹項(xiàng)目,他先說了你介紹你做過的項(xiàng)目把 ,我們倆大概聊了半小時(shí)關(guān)于之前的項(xiàng)目,里面夾雜問題。
后他就問我,“你說你學(xué)了數(shù)據(jù)研發(fā)的東西,你說說你學(xué)了啥”。然后我就侃侃而談,并沒有很害怕的感覺,就下單這個(gè)業(yè)務(wù)說了一遍,從購買 下單 發(fā)貨 確認(rèn),這一系列的業(yè)務(wù),從事務(wù)事實(shí)表,周期快照表,到累計(jì)快照表等等說了很久,他似乎也感覺到我會了。這次面試主要的問題就是業(yè)務(wù)如何做,我算是勉強(qiáng)能回答上來了,當(dāng)然其他比如范式建模和維度建模都有啥區(qū)別,我也早已理解記于心。并且這次面試,面試官還主動加了我的微信,這時(shí)候我第一次感覺自己還有希望。
第五次面試-電話面試
第五次面試是8月20左右,距離內(nèi)推開始1個(gè)月了,但是過了很久都沒有通話,但是我并沒放棄,我覺得自己還有救,就開始攻克關(guān)于hadoop數(shù)據(jù)體系,大約3-4天時(shí)間,我慢慢清晰了數(shù)據(jù)體系的更替,比如hadoop spark flink都屬于第幾代,并購買了相關(guān)的書籍(我愛看書,只是學(xué)習(xí)習(xí)慣而已),但是flink太前了,還沒有書可以看。
這段時(shí)間主要強(qiáng)化去學(xué)習(xí)數(shù)據(jù)架構(gòu)體系,并且不斷復(fù)習(xí)之前學(xué)的,學(xué)的方法是啥,因人而異,用什么工具去學(xué)也是因人而異,但是遺忘曲線大家都是一樣的,所以還不停的照顧之前看過的,比如什么叫做傳遞依賴,我后來還需要不停的去翻看,記住 ,千萬不要硬背,沒啥意思,一定要理解,沒有業(yè)務(wù)場景,就自己從網(wǎng)上找例子。數(shù)據(jù)業(yè)務(wù)相關(guān)很多都是實(shí)例總結(jié)出來的。Spark使用的是scala語言,我并不會,所以對于spark我只是看了看架構(gòu),一些特征之類。
面試的時(shí)候,氣氛比較沉悶,這次并不是很好,感覺他并不想要我了,所以回答雖然都答上來了,但是氣氛總是一般般,大約持續(xù)不到30分鐘,就掛了,這時(shí)候我感覺到自己很危機(jī)了。果不其然,我收到了筆試通知。
筆試
筆試通知意味我轉(zhuǎn)為了校招了,大家都明白筆試多么折磨人,尤其這樣大公司的筆試題目,很難,考的東西很全。但是我想了,算了還是堅(jiān)持一下把 ,不要抱怨了,本身自己不是這個(gè)專業(yè)的。認(rèn)真做一做。一般大家做題都是一起做,這樣會好一些,這一次是我自己做的,很神奇我的兩個(gè)編程都做出來了,但是選擇題爛的都不行,我根本沒時(shí)間算一些數(shù)據(jù),或者說自己腦子太笨了,只會靠笨方法學(xué),然后就開始忐忑的等待成績了。
第六次面試 – 電話面試
第七次面試 – 視頻面試
這兩次一起寫了,主要每次面試都一樣了,但是每次我都是認(rèn)真的回答面試官的每一個(gè)問題,不會的我會主動承認(rèn)自己不會。我不想說謊,雖然很多人說去阿里面試,一定要吹出來自己多牛逼,但是我想,如果是這樣的進(jìn)去的公司,對于我來講我是不愿意去的,不愿意承認(rèn)自己短板,即使自己去了那有啥用呢?所以我建議不要附和面試官,做自己最好,當(dāng)然如果你了解面試官是做什么的,是有好的。這樣的你回答方向有個(gè)方向,但是,你上哪知道??
第八次面試-HR視頻面試
最后一次視頻面試是HR面試,這次HR面試基本和大家一樣的,問一些關(guān)于自己價(jià)值觀的問題,我建議大家還是好好回答這個(gè)問題,假如你的價(jià)值觀和公司的價(jià)值觀不一致的話,你還是不要去為好,隨口更改自己價(jià)值觀的人去了公司也是會被辭退的。HR不是不重要,而是很重要。除了價(jià)值觀問題,還問了我一些其他的問題 比如家里情況,學(xué)習(xí)情況之類。
第九面試 –HR電話面試
這是最后一次了,這次的電話問了我一些她有疑問的地方。沒啥了。到現(xiàn)在是九月10號了,持續(xù)了兩個(gè)月了。
自我總結(jié)
不要放棄,任何時(shí)候都要靜心想自己還不會什么,自己還欠缺什么,不管是技術(shù)還是人脈等等,不要老想過不過的問題,想這個(gè)問題一點(diǎn)用沒有,因?yàn)槟忝孢^的事情無法改變,你能做的就是如果下次打仗來了,你要做好準(zhǔn)備,不要被打死。 在每一次的面試都要總結(jié),看看自己哪些不會,要及時(shí)更正,尤其是內(nèi)推,內(nèi)推是部門招聘,所以面試官會不自然的透露關(guān)于工作是啥,你一定要好好聽。這樣記住他們用的工具,以及業(yè)務(wù)都是什么,這樣的話,你接下看啥你就知道了。 有個(gè)自己的學(xué)習(xí)的方式,我的方式是看書,在不斷學(xué)習(xí)的過程,還要總結(jié)。我這個(gè)算是跨專業(yè),只是用業(yè)余時(shí)間,不到兩個(gè)月時(shí)間我看了近20本專業(yè)書,前期看很晦澀,后來就好了很多。 找工作確實(shí)參雜了很多偶然和幸運(yùn)在里面,但是你一點(diǎn)不努力,不用勁。老鐵,再大的幸運(yùn)也不會要了你。 價(jià)值觀一定要審核,即自己審核自己,不要盲目去找,有些人喜歡廣撒網(wǎng),其實(shí)這樣并不是很好,你先搞清楚自己以后要干啥,去了工作為了啥。然后找。如果這個(gè)都搞不清楚,你去了也是一身累,大家都知道互聯(lián)網(wǎng)工作都是很累的。如果沒有自我內(nèi)心追求,很難有人說自己很開心的。
問題總結(jié)(主要說明關(guān)于數(shù)據(jù)研發(fā)職位的問題)
維度建模和范式建模區(qū)別,并舉業(yè)務(wù)例子 OLAP OLTP解釋 三范式是什么,舉例子 數(shù)據(jù)中的事務(wù)是什么,mysql中怎么實(shí)現(xiàn)的 C++多態(tài)性是如何理解,和java怎么區(qū)分 說排序的種類,并且告訴我他們?yōu)槭裁催@么區(qū)分。以及時(shí)間復(fù)雜度的計(jì)算,怎么計(jì)算出來的 說一下動態(tài)規(guī)劃的過程 操作系統(tǒng)中的進(jìn)程調(diào)度算法說幾個(gè) Hbase原理 Mapreduce原理 UDF分類以及原理 數(shù)據(jù)傾斜原因以及如何預(yù)防 hive和mysql不同 Hadoop架構(gòu)簡單介紹 Spark和hadoop之間的區(qū)別。 Pig是什么,說一說 維度設(shè)計(jì)過程,事實(shí)設(shè)計(jì)過程 什么叫極限存儲設(shè)計(jì) 維度設(shè)計(jì)中有整合和拆分,有哪些方法,并詳細(xì)說明 事實(shí)設(shè)計(jì)分幾種,每一種都是如何在業(yè)務(wù)中使用。 SQL內(nèi)部原理解釋 B2B業(yè)務(wù)架構(gòu)中 公共層有什么作用。 如何理解粒度這個(gè)單詞
阿里面試總結(jié)
阿里內(nèi)推是屬于最早的,但是也是要人很少的。 如果你牛逼,基本幾天就可以告訴你,你通過了,如果你是個(gè)大佬,那么前面還有更高級的面試你,當(dāng)然和你迎來的也是sp。 內(nèi)推過程基本是一周一次,一共五次,3次技術(shù)面試,1次交叉面試,1次HR面試。基本你能接收到HR面試說明你有戲。 阿里巴巴官網(wǎng)的更新基本只能在9月下旬確定定論。當(dāng)然可能因?yàn)閼?yīng)聘人數(shù)太多了,對于大家來說,都不知道自己啥情況,有些好一些,先提前告訴你,你通過了,(俗稱口頭offer),基本是不會變化的。 由內(nèi)推轉(zhuǎn)為校招,不要害怕自己機(jī)會沒了,說明人家還想要你,只不過讓你進(jìn)入校招,在校招中,你的優(yōu)勢是很大的,有些內(nèi)推是直接回絕的。 阿里的筆試比較難,這也是很正常的,沒有扎實(shí)的基本功,誰也不想要你。
增加部分:我看過的數(shù)據(jù)書籍
數(shù)據(jù)庫 以前的教科書 Oracle 從入門到精通 高性能MySQL MySQL數(shù)據(jù)庫應(yīng)用從入門到精通 Spark快速大數(shù)據(jù)分析 Hadoop權(quán)威指南 Hive編程指南 Spark機(jī)器學(xué)習(xí) 大數(shù)據(jù)應(yīng)用與技術(shù)叢書·數(shù)據(jù)倉庫工具箱 機(jī)器學(xué)習(xí)實(shí)戰(zhàn) 大數(shù)據(jù)之路:阿里巴巴大數(shù)據(jù)實(shí)踐 智能時(shí)代 吳軍的 極力推薦 SQL入門經(jīng)典 數(shù)據(jù)挖掘 機(jī)器學(xué)習(xí)實(shí)戰(zhàn)
看書一回事,但是比如像一些工具如hadoop 還是上手操作為主,看源碼看架構(gòu)比較重要,單純的看書記憶很差的 。
業(yè)務(wù)的就自己好好分析下,比如 9 和 11 。要多看他們的對于特定業(yè)務(wù)的分析,并總結(jié)自己的觀點(diǎn) 。
- EOF -
