字節(jié)跳動(dòng),5面,終于拿下!
前
言
導(dǎo)讀:沒(méi)有幾個(gè)工程師天賦異稟,技術(shù)的差距,是認(rèn)知的差距。文筆差多包涵,希望對(duì)你有用。謝邀!
大家好,我是寶器。
看到一篇分析師友軍數(shù)倉(cāng)同學(xué)的面試經(jīng)驗(yàn),分享給大家。
主要和大家分享字節(jié)跳動(dòng)-抖音的大數(shù)據(jù)數(shù)倉(cāng)職位面試經(jīng)驗(yàn),希望對(duì)大家有用。以下是作者自述。
因前司[不知名小公司]發(fā)生人員動(dòng)蕩,人心惶惶,鄙人也下定決心看看外面的機(jī)會(huì),騎驢找馬,開啟了一波面試。先后面了一些中小型公司,找到感覺(jué)后又面試了滴滴、美團(tuán)、快手、京東、字節(jié)等“大廠”。
面試陸續(xù)用了差不多一個(gè)月,整體感覺(jué)下來(lái)面多了發(fā)現(xiàn)面試差不多也就那些問(wèn)題。更多時(shí)候更是時(shí)運(yùn)的一個(gè)碰撞,公司項(xiàng)目恰很缺人或和面試官對(duì)上眼緣基本能成。
單說(shuō)面試字節(jié),前前后后,歷經(jīng)5面(4輪技術(shù)+HR面),歷時(shí)20天,終于拿下offer。感覺(jué)整個(gè)人都自信了,職級(jí)和薪酬都很滿意,奧利給!
一面:
00. 自我介紹
01. 數(shù)倉(cāng)痛點(diǎn)?為什么要做3.0?數(shù)倉(cāng)3.0流程是怎樣的?
02. 數(shù)據(jù)傾斜,大表join大表,如何解決有哪幾種方式?
03. 數(shù)倉(cāng)分工?如何迭代3.0進(jìn)度,對(duì)接需求?
04. 數(shù)據(jù)質(zhì)量如何保證?指標(biāo)一致性如何保證?
05. 用到哪些計(jì)算組件,分別有什么異同?
06. ods全量,增量如何確定?有哪些衡量點(diǎn)?
07. 兩道sql題,粉絲互相關(guān)注,波峰波谷
08. 一道算法題,鏈表反轉(zhuǎn)o(1)
09. 數(shù)倉(cāng)模型優(yōu)化手段及方式、規(guī)范與規(guī)劃
10. 數(shù)據(jù)中臺(tái)的理解,極致的數(shù)倉(cāng)分層?

二面:
01. MR如何自定義partition,原理講一下
02. 數(shù)倉(cāng)模型,如何是最優(yōu)的?怎么衡量的?
03. 遇到的業(yè)務(wù)夸N天,如何解決的?你們公司的場(chǎng)景,模型怎么設(shè)計(jì)?
04. RDD特性
05. spark的運(yùn)行機(jī)制,job,stage,task劃分
06. spark shuffle 與 mr shuffle 不同
07. 一道sql題,行轉(zhuǎn)列,
08. 一道算法題,2分查找o(0)
09. 結(jié)合項(xiàng)目+業(yè)務(wù)場(chǎng)景各種靈魂拷問(wèn),深層次追問(wèn)
10. 數(shù)據(jù)治理方案、實(shí)施、權(quán)責(zé)、收益與風(fēng)險(xiǎn)點(diǎn)

時(shí)間:此面試為一面后第二天上午11點(diǎn)。
感受:二面就會(huì)從3個(gè)方向問(wèn),數(shù)倉(cāng)專業(yè)知識(shí)(理論+實(shí)際場(chǎng)景),大數(shù)據(jù)組件,以及各種語(yǔ)言的摸底。
把內(nèi)褲都扒出來(lái)了,最后還會(huì)問(wèn)有哪些你擅長(zhǎng)我沒(méi)有問(wèn)到的,就是要知道你的擅長(zhǎng)點(diǎn),好給你安排工作。
三面:
01. 主要負(fù)責(zé)哪些?會(huì)一步一步追詢問(wèn)
02. order by sort by 區(qū)別 ,底層原理是什么?
03. 有哪些計(jì)算引擎,你們工作中如何選取與運(yùn)用?
04. presto 與 spark 區(qū)別,多方面講解
05. 項(xiàng)目中有遇到復(fù)雜的場(chǎng)景是什么?怎么處理的?你覺(jué)得好嗎?還有一次機(jī)會(huì)你會(huì)怎么處理?
06. 覺(jué)得主要擅長(zhǎng)哪些?舉例兩點(diǎn)?
07. 主題是如何劃分的?具體case
08. 抖音中如何確定學(xué)生群里用戶?
09. 如何確定分區(qū)數(shù)?
10. 一道sql,千億級(jí)uv計(jì)算
11.一道算法歸并排序o(1)

時(shí)間:此面試為二面后第三天上午11點(diǎn)。
感受:三面就技術(shù)+架構(gòu)+職責(zé)都會(huì)問(wèn)一下,面上的東西也會(huì)結(jié)合實(shí)際的工作場(chǎng)景。
四面:
01. hdfs了解嗎?整體講一下,block的大小是多少?哪個(gè)版本?之前的是多少?用哪個(gè)參數(shù)控制?
02. 為什么block設(shè)置為128mb,之前為什么是它size一半,為什么不調(diào)大
03. 數(shù)倉(cāng)主要做哪些事情,你的主要推進(jìn)了什么?
04. dwd、dws 的英文是啥?各層都做了哪些事情?
05. MR階段的kvbuffer緩沖區(qū)了解嗎?它的價(jià)值體現(xiàn)在哪里?
06. sql如何轉(zhuǎn)化為MR,整體流程講一下
07. sql提交yarn的流程
08. 如何控制map個(gè)數(shù)
09. 寫一道sql,性能最優(yōu),為什么最優(yōu),有幾個(gè)job,幾個(gè)mr,如果我想降低job,mr數(shù)量,怎么寫
10. 講一個(gè)你比較擅長(zhǎng)的,把我講通

時(shí)間:此面試為三面后第三天上午11點(diǎn)。
感受:這個(gè)等于前面的人面過(guò)的再問(wèn)問(wèn),這面是交叉面試,所以會(huì)都問(wèn)問(wèn),如果能達(dá)個(gè)大概都沒(méi)有問(wèn)題。要態(tài)度好點(diǎn)。
五面:
HR面,聊下三觀、談下理想與職業(yè)規(guī)劃等;然后就是最重頭戲了:談薪酬。以前沒(méi)待過(guò)大廠,所以對(duì)職級(jí)和薪資沒(méi)有很好地了解,,以防要低了后面后悔。到了這一面了,屬于自己的該爭(zhēng)取的還是要奮力爭(zhēng)取的。


整體總結(jié)
首先面試這么多家、這么多場(chǎng),字節(jié)的數(shù)倉(cāng)面的是最全最細(xì)致的,態(tài)度是最好的,引導(dǎo)式問(wèn)體感很nice。
其次,就是專業(yè)度,字節(jié)的人有一說(shuō)一確實(shí)都很專業(yè),至少面試官,沒(méi)有那種水平一般都很強(qiáng)。
然后就是個(gè)人了,沒(méi)說(shuō)的,干數(shù)倉(cāng)要精通,知其所以然很重要,其次要技術(shù)棧豐富一些,不能僅僅停留在數(shù)倉(cāng)。
最后本人是面試抖音,面試也要看專業(yè)是否對(duì)口,然后眼緣運(yùn)氣也會(huì)占一定程度,最后祝大家面面過(guò),家家斬offer。希望以后有機(jī)會(huì)大家做同事。

推薦閱讀
歡迎長(zhǎng)按掃碼關(guān)注「數(shù)據(jù)管道」
