點(diǎn)擊上方 "大數(shù)據(jù)肌肉猿"關(guān)注,?星標(biāo)一起成長
后臺回復(fù)【加群】,進(jìn)入高質(zhì)量學(xué)習(xí)交流群
2021年大數(shù)據(jù)肌肉猿公眾號獎勵制度


識別下方二維碼,回復(fù)【0128】,獲得下載鏈接。
之后會持續(xù)整理一些可下載的學(xué)習(xí)資料分享給大家,大家記得將公眾號設(shè)置星標(biāo)哦!更多資料獲取、學(xué)習(xí)交流后臺回復(fù)【加群】
樓主5月初入職滴滴實(shí)習(xí),7月底得知今年滴滴不好轉(zhuǎn)正,遂離職復(fù)習(xí)鞏固 基礎(chǔ)+項(xiàng)目 備戰(zhàn)秋招。因?yàn)闇?zhǔn)備的時間比較早,有幸趕上了各大廠的提前批面試,面試崗位是大數(shù)據(jù)開發(fā)工程師,目前已入職騰訊。我本科是水利水電專業(yè),研究生轉(zhuǎn)入軟件工程,編程語言用Java,做過一個大數(shù)據(jù)開發(fā)的項(xiàng)目,以Kafka作為數(shù)據(jù)總線,所以Kafka的問題會涉及的比較多,實(shí)習(xí)期間主要是寫hive sql,所以會有比較難的sql題,大家可以結(jié)合自己的項(xiàng)目和實(shí)習(xí)經(jīng)歷進(jìn)行針對性復(fù)習(xí)。下面的面經(jīng)只涉及技術(shù),hr面就不寫了,因?yàn)椴煌緯兄貜?fù)的問題,重復(fù)的問題也不寫了。個人覺得不錯的大數(shù)據(jù)學(xué)習(xí)網(wǎng)站:http://dblab.xmu.edu.cn/blog/2、String、StringBuffer、StringBuilder的區(qū)別,怎么理解String不變性3、==和equals的區(qū)別,如果重寫了equals()不重寫hashCode()會發(fā)生什么4、volatile怎么保證可見性,synchronized和lock的區(qū)別,synchronized的底層實(shí)現(xiàn)5、sleep和wait的區(qū)別,sleep會不會釋放鎖,notify和notifyAll的區(qū)別6、了不了解線程的局部變量,講講線程池參數(shù)8、Cookie和Session的區(qū)別,怎么防止Cookie欺騙9、從用戶在瀏覽器輸入域名,到瀏覽器顯示出頁面的過程1、看你寫過UDF,談?wù)剬DF的理解,寫UDF的目的,代碼怎么寫的2、改造hive表后怎么進(jìn)行數(shù)據(jù)一致性校驗(yàn)的,有沒有自動化流程3、看你讀過kafka源碼,講講kafka broker的源碼里面你最熟悉的類,以及這個類的主要方法,用的什么設(shè)計(jì)模式4、項(xiàng)目里面從數(shù)據(jù)采集到最終的數(shù)據(jù)可視化,每個環(huán)節(jié)都有可能丟數(shù)據(jù),怎么判斷數(shù)據(jù)有沒有丟,如果丟了如何定位到在哪一個環(huán)節(jié)丟的5、項(xiàng)目里面為什么要用kafka stream做實(shí)時計(jì)算,而不是用spark或者flink,kafka sql和spark sql了解過嗎6、項(xiàng)目里面用到了時序數(shù)據(jù)庫opentsdb,為什么要用這個,有沒有跟其它的時序數(shù)據(jù)庫對比過7、平時逛不逛社區(qū),有沒有參與過開源項(xiàng)目1、看你寫了實(shí)時計(jì)算的程序,你怎么保證計(jì)算的結(jié)果肯定是對的2、數(shù)據(jù)接入的時候,怎么往kafka topic里面發(fā)的,用的什么方式,起了幾個線程,producer是線程安全的嗎3、kafka集群有幾臺機(jī)器,怎么確定你們項(xiàng)目需要用幾臺機(jī)器,有評估過嗎,吞吐量測過嗎4、
spark streaming是怎么跟kafka交互的,具體代碼怎么寫的,程序執(zhí)行流程是怎樣的,這個過程中怎么確保數(shù)據(jù)不丟5、kafka監(jiān)控是怎么做的,kafka中能徹底刪除數(shù)據(jù)嗎,怎么做的平時是怎么學(xué)習(xí)的,愛看哪些博客,怎么看待加班,有沒有成為leader的潛力1、sql題:學(xué)生成績表,把每科最高分前三名統(tǒng)計(jì)出來3、kafka如何保證高吞吐的,了不了解kafka零拷貝,具體怎么做的4、sql有幾種join,map join了解過沒5、hbase中row key該怎么設(shè)計(jì)6、hdfs文件上傳流程,hdfs的容錯機(jī)制7、怎么解決hive數(shù)據(jù)傾斜問題3、寫一下mysql binlog的數(shù)據(jù)格式,怎么進(jìn)行數(shù)據(jù)清洗的4、寫一個正則表達(dá)式進(jìn)行手機(jī)號匹配5、講一下數(shù)據(jù)倉庫層級的劃分,每層的作用去了北京美團(tuán)公司里面試,一上午面完,第二天通知高分通過1、介紹項(xiàng)目,以及滴滴的實(shí)習(xí)經(jīng)歷4、數(shù)據(jù)建模,星型模型和雪花模型5、數(shù)倉層級的劃分,怎么對接到mysql拿數(shù)據(jù)1、sql題:寫一條sql刪除訂單表中重復(fù)的記錄2、sql題:一張網(wǎng)頁瀏覽信息表,有兩列,一列是網(wǎng)頁ip,一列是瀏覽網(wǎng)頁的用戶(比如a或者b、c、d直到z),求這些網(wǎng)頁被a和b或者a和c或者b和c兩兩組合訪問的次數(shù)3、hive數(shù)據(jù)傾斜產(chǎn)生的原因,怎么解決4、設(shè)計(jì)學(xué)生成績管理系統(tǒng),符合第三范式要求,并繪出UML圖7、spark streaming從kafka中讀數(shù)據(jù)的兩種方式8、講講數(shù)據(jù)庫索引,B樹和B+樹9、Elasticsearch的索引,單field索引和多field的聯(lián)合索引
10、linux查看某文件的大小,vim中怎么替換內(nèi)容11、海量數(shù)據(jù)的Count問題(單機(jī)),如果把大文件hash成不同的小文件,此時小文件裝不下某個key對應(yīng)的數(shù)據(jù),該怎么辦12、智力題:8升水,有一個5L的杯子和3L的杯子,怎么得到4升水1、osi七層模型,三次握手和四次揮手,為什么兩次握手不行2、kafka怎么保證高吞吐量, 項(xiàng)目中有測過吞吐量嗎,相比于其它MQ,為什么會選擇kafka,kafka怎么保證exactly once語義4、hive sql怎么轉(zhuǎn)換成底層的MapReduce程序,以及shuffle的過程5、算法題:被圍繞的區(qū)域,leetcode第130題原題6、智力題:一頭母牛每年生一頭小母牛,每頭小母牛從第四年開始,每年也會生一頭小母牛,寫個公式求第n年會有多少頭牛1、java和python的區(qū)別,對面向?qū)ο蟮睦斫猓兔嫦蜻^程相比有什么區(qū)別5、volatile和synchronized的區(qū)別8、設(shè)計(jì)題:一個停車場有一些大車位和小車位,大車只能停大車位,小車既能停大車位又能停小車位,實(shí)現(xiàn)這種場景下的調(diào)度系統(tǒng)1、算法題:輸入一個字符串,輸出該字符串中字符的所有排列1、synchronized的底層實(shí)現(xiàn)5、快排的時間復(fù)雜度和空間復(fù)雜度,最優(yōu)情況和最差情況分別是多少,是穩(wěn)定排序嗎,快排為什么快1、介紹項(xiàng)目,項(xiàng)目中涉及到了一些算法,介紹一下2、兩道算法題:路徑問題,leetcode上63題和64題原題4、智力題:一張圓桌子,我和面試官輪流往桌子上放硬幣(隨便放),直到桌子放不下為止,最后一個放硬幣的人贏,如果我先放,怎么保證我肯定贏面試官是做安卓的,瞧不起大數(shù)據(jù),覺得大數(shù)據(jù)很虛,我跟他bb了一堆。然后問我有沒有女朋友,我說以前有,現(xiàn)在分了;問我什么時候談的,什么時候分的,我說本科談的,畢業(yè)分了;問我為什么要分,此處省略一萬字......問我現(xiàn)在想沒想過再談,我說畢竟轉(zhuǎn)專業(yè)過來的,想趁在校期間利用好短暫的時光提升自己的技術(shù)水平(其實(shí)因?yàn)檎也坏剑蝗缓竺嬖嚬僬f以后工作了就不好找咯,我說您說的有道理............1、jvm類加載機(jī)制,類加載器,雙親委派模型2、java實(shí)現(xiàn)多線程的方式3、spark怎么劃分stage,寬窄依賴,各包括哪些***作4、zookeeper怎么保證原子性,怎么實(shí)現(xiàn)分布式鎖5、寫個快排,為什么要用三數(shù)取中法,好處是什么1、sql題:找出單科成績高于該科平均成績的同學(xué)名單(無論該學(xué)生有多少科,只要有一科滿足即可)2、sql題:找出單科成績高于該科平均成績的同學(xué)名單(該學(xué)生所有科都必須滿足)3、算法題:求數(shù)組中連續(xù)子數(shù)組的最大和4、算法題:使用最小花費(fèi)爬樓梯,leetcode746題原題2、算法題:輸入n個整數(shù),找出其中最大的k個數(shù)3、算法題:給一個整數(shù)數(shù)組和一個目標(biāo)值,找出數(shù)組中和為目標(biāo)值的兩個數(shù)阿里的面試還是比較重視基礎(chǔ)的,應(yīng)該是bat里面問基礎(chǔ)問的最多的1、HashMap和HashTable的區(qū)別,HashMap怎么解決hash沖突,jdk1.8后對HashMap的改進(jìn)2、講講ConcurrentHashMap,
ConcurrentHashMap怎么保證線程安全,HashTable怎么保證線程安全3、HashSet的底層實(shí)現(xiàn),是不是線程安全的4、ArrayList和LinkedList的區(qū)別,是不是線程安全的5、講講設(shè)計(jì)模式,最常用哪種設(shè)計(jì)模式,單例模式的實(shí)現(xiàn)方式6、進(jìn)程和線程,Java實(shí)現(xiàn)多線程的方式,什么是線程安全,怎么保證多線程線程安全9、JVM垃圾處理方法,對象什么時候進(jìn)入老年代,什么時候進(jìn)行FullGC10、Java堆溢出問題怎么處理,內(nèi)存泄漏和內(nèi)存溢出的區(qū)別11、智力題:50個紅球和50個黑球往兩個桶里放,然后自己去抽,怎么樣才能使抽到紅球的概率最高2、介紹一下索引,索引設(shè)置的規(guī)則,聚簇索引和非聚簇索引的區(qū)別,索引的最左前綴原則3、用過redis嗎,redis支持哪些數(shù)據(jù)類型,redis與mysql的區(qū)別5、jvm調(diào)優(yōu)做過沒,-Xms和-Xmx分別指什么6、算法題:輸入兩個字符串,輸出它們合并排序后的結(jié)果4、什么是內(nèi)部類,什么是匿名內(nèi)部類5、設(shè)計(jì)題:一個市有9個消防站,現(xiàn)在要新增3個消防站,這3個消防站應(yīng)該放在哪里·················END·················
你好,我是峰哥,一個騷氣的肌肉男。獨(dú)自窮游過15個國家,60座城市,也是國家級健身教練。
二本車輛工程轉(zhuǎn)型大數(shù)據(jù)開發(fā),拿過66個大數(shù)據(jù)offer,現(xiàn)任某知名外企高級數(shù)據(jù)工程師。
畢業(yè)一年,靠自己在上海買房,點(diǎn)此看我2020年總結(jié)。為人親和,歡迎添加我的微信?Fawn0504?進(jìn)行交流或圍觀朋友圈。