BigData-Notes大數(shù)據(jù)入門指南 ?
BigData-Notes
大數(shù)據(jù)入門指南
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
|---|---|---|---|---|---|---|---|---|---|---|---|
| Hadoop | Hive | Spark | Storm | Flink | HBase | Kafka | Zookeeper | Flume | Sqoop | Azkaban | Scala |
如果需要離線閱讀,可以在公眾號(hào)上發(fā)送 “bigdata” 獲取《大數(shù)據(jù)入門指南》離線閱讀版!
??
前 言
一、Hadoop
- 分布式文件存儲(chǔ)系統(tǒng) —— HDFS
- 分布式計(jì)算框架 —— MapReduce
- 集群資源管理器 —— YARN
- Hadoop 單機(jī)偽集群環(huán)境搭建
- Hadoop 集群環(huán)境搭建
- HDFS 常用 Shell 命令
- HDFS Java API 的使用
- 基于 Zookeeper 搭建 Hadoop 高可用集群
二、Hive
- Hive 簡(jiǎn)介及核心概念
- Linux 環(huán)境下 Hive 的安裝部署
- Hive CLI 和 Beeline 命令行的基本使用
- Hive 常用 DDL 操作
- Hive 分區(qū)表和分桶表
- Hive 視圖和索引
- Hive 常用 DML 操作
- Hive 數(shù)據(jù)查詢?cè)斀?/a>
三、Spark
Spark Core :
- Spark 簡(jiǎn)介
- Spark 開(kāi)發(fā)環(huán)境搭建
- 彈性式數(shù)據(jù)集 RDD
- RDD 常用算子詳解
- Spark 運(yùn)行模式與作業(yè)提交
- Spark 累加器與廣播變量
- 基于 Zookeeper 搭建 Spark 高可用集群
Spark SQL :
- DateFrame 和 DataSet
- Structured API 的基本使用
- Spark SQL 外部數(shù)據(jù)源
- Spark SQL 常用聚合函數(shù)
- Spark SQL JOIN 操作
Spark Streaming :
四、Storm
- Storm 和流處理簡(jiǎn)介
- Storm 核心概念詳解
- Storm 單機(jī)環(huán)境搭建
- Storm 集群環(huán)境搭建
- Storm 編程模型詳解
- Storm 項(xiàng)目三種打包方式對(duì)比分析
- Storm 集成 Redis 詳解
- Storm 集成 HDFS/HBase
- Storm 集成 Kafka
五、Flink
- Flink 核心概念綜述
- Flink 開(kāi)發(fā)環(huán)境搭建
- Flink Data Source
- Flink Data Transformation
- Flink Data Sink
- Flink 窗口模型
- Flink 狀態(tài)管理與檢查點(diǎn)機(jī)制
- Flink Standalone 集群部署
六、HBase
- Hbase 簡(jiǎn)介
- HBase 系統(tǒng)架構(gòu)及數(shù)據(jù)結(jié)構(gòu)
- HBase 基本環(huán)境搭建 (Standalone /pseudo-distributed mode)
- HBase 集群環(huán)境搭建
- HBase 常用 Shell 命令
- HBase Java API
- HBase 過(guò)濾器詳解
- HBase 協(xié)處理器詳解
- HBase 容災(zāi)與備份
- HBase的 SQL 中間層 —— Phoenix
- Spring/Spring Boot 整合 Mybatis + Phoenix
七、Kafka
八、Zookeeper
- Zookeeper 簡(jiǎn)介及核心概念
- Zookeeper 單機(jī)環(huán)境和集群環(huán)境搭建
- Zookeeper 常用 Shell 命令
- Zookeeper Java 客戶端 —— Apache Curator
- Zookeeper ACL 權(quán)限控制
九、Flume
十、Sqoop
十一、Azkaban
十二、Scala
- Scala 簡(jiǎn)介及開(kāi)發(fā)環(huán)境配置
- 基本數(shù)據(jù)類型和運(yùn)算符
- 流程控制語(yǔ)句
- 數(shù)組 —— Array
- 集合類型綜述
- 常用集合類型之 —— List & Set
- 常用集合類型之 —— Map & Tuple
- 類和對(duì)象
- 繼承和特質(zhì)
- 函數(shù) & 閉包 & 柯里化
- 模式匹配
- 類型參數(shù)
- 隱式轉(zhuǎn)換和隱式參數(shù)
十三、公共內(nèi)容
??
后 記
評(píng)論
圖片
表情












