大數(shù)據(jù)面試天花板,來自面試官奪命連環(huán)100問~
前言
大數(shù)據(jù)時(shí)代才剛剛開始。隨著越來越多的公司傾向于大數(shù)據(jù)來運(yùn)營他們的業(yè)務(wù),對(duì)人才的需求空前高漲。這對(duì)您意味著什么?如果您想在任何大數(shù)據(jù)崗位上工作,它只會(huì)轉(zhuǎn)化為更好的機(jī)會(huì)。您可以選擇成為數(shù)據(jù)分析師,數(shù)據(jù)科學(xué)家,數(shù)據(jù)庫管理員,大數(shù)據(jù)工程師,Hadoop大數(shù)據(jù)工程師等。
一、面試題
1、 Hadoop 的核心配置是什么?
2、那當(dāng)下又該如何配置?
3、“jps”命令的用處?
4、mapreduce 的原理?
5、 HDFS 存儲(chǔ)的機(jī)制?
6、舉一個(gè)簡單的例子說明 mapreduce 是怎么來運(yùn)行的 ?
7、用 mapreduce 來實(shí)現(xiàn)下面需求?
8、hadoop 中 Combiner 的作用?
9、簡述 hadoop 安裝
10、 請列出 hadoop 進(jìn)程名
11、 解決下面的錯(cuò)誤
12、 寫出下面的命令
13、 簡述 hadoop 的調(diào)度器
14、 列出你開發(fā) mapreduce 的語言
15、 書寫程序
16、 不同語言的優(yōu)缺點(diǎn)
17、 hive 有哪些保存元數(shù)據(jù)的方式,個(gè)有什么特點(diǎn)。
18、 combiner 和 partition 的作用
19、 hive 內(nèi)部表和外部表的區(qū)別
20、 hbase 的 rowkey 怎么創(chuàng)建好?列族怎么創(chuàng)建比較 好?
21、 用 mapreduce 怎么處理數(shù)據(jù)傾斜問題?
22、 hadoop 框架中怎么來優(yōu)化
23、 我們開發(fā) job 時(shí),是否可以去掉 reduce 階段。
24、 datanode 在什么情況下不會(huì)備份
25、 combiner 出現(xiàn)在那個(gè)過程
26、 hdfs 的體系結(jié)構(gòu)
27、 3 個(gè) datanode 中有一個(gè) datanode 出現(xiàn)錯(cuò)誤會(huì)怎樣?
28、 描述一下 hadoop 中,有哪些地方使用了緩存機(jī)制, 作用分別是什么?
29、 如何確定 hadoop 集群的健康狀態(tài)
30、 生產(chǎn)環(huán)境中為什么建議使用外部表?
31、你們數(shù)據(jù)庫怎么導(dǎo)入 hive 的,有沒有出現(xiàn)問題
32、公司技術(shù)選型可能利用 storm 進(jìn)行實(shí)時(shí)計(jì)算,講解一下 ?storm
33、一個(gè) datanode 宕機(jī),怎么一個(gè)流程恢復(fù)
34、.Hbase 的特性,以及你怎么去設(shè)計(jì) rowkey 和 ?columnFamily ,怎么去建一個(gè) table
35、Redis,傳統(tǒng)數(shù)據(jù)庫,hbase,hive 每個(gè)之間的區(qū)別
36、shuffle 階段,你怎么理解的
37、Mapreduce 的 map 數(shù)量 和 reduce 數(shù)量 怎么確 ?定 ,怎么配置
38、唯一難住我的是他說實(shí)時(shí)計(jì)算,storm 如果碰上了復(fù)雜 ?邏輯,需要算很長的時(shí)間,你怎么去優(yōu)化,怎么保證實(shí)時(shí)性
39、Hive 你們用的是外部表還是內(nèi)部表,有沒有寫過 ?UDF,hive 的版本
40、實(shí)時(shí)流式計(jì)算 的結(jié)果內(nèi)容有哪些,你們需要統(tǒng)計(jì)出來么


大數(shù)據(jù)面試筆記(附答案解析)
獲取方式↓↓↓
添加VX備注【242】即可免費(fèi)獲取
【JAVA面試題專欄】
1、2022年Java后端面試手冊,助力金三銀四,吃透25個(gè)技術(shù)棧!
2、2022年金三銀四,Java后端開發(fā)最全面試攻略,程序員求職必看!
