深入理解Hadoop(原書第2版)
本書作者基于對Hadoop系統(tǒng)的實踐,深入淺出地對Hadoop進行了詳細(xì)的講解,包含大量的實例和技巧,可幫助有一定基礎(chǔ)的開發(fā)者快速掌握分布式系統(tǒng)。主要內(nèi)容包括:第1章~第4章講解大數(shù)據(jù)系統(tǒng)的基本概念、Hadoop系統(tǒng)的關(guān)鍵概念,以及進行Hadoop平臺管理的關(guān)鍵概念要素。第5章~第7章是本書的重點,深入分析了MapReduce框架,不僅包括MapReduce框架的API,還介紹MapReduce框架的更復(fù)雜概念及其設(shè)計理念。第8章~第14章介紹Hadoop生態(tài)系統(tǒng),包括支持MapReduce程序的單元測試和集成測試框架、Hadoop系統(tǒng)的監(jiān)控和日志系統(tǒng)、Hive框架、Pig和Crunch框架、HCatalog框架、Hadoop日志流處理、HBase等。第15章~第17章介紹了數(shù)據(jù)科學(xué)基本概念及應(yīng)用、云計算實例、分布式下載服務(wù)實例等。
評論
圖片
表情
