Hadoop權(quán)威指南(中文版)
本書是您縱情享用數(shù)據(jù)之美的得力助手。作為處理海量數(shù)據(jù)集的理想工具,Apache Hadoop架構(gòu)是MapReduce算法的一種開源應(yīng)用,是Google(谷歌)開創(chuàng)其帝國的重要基石。本書內(nèi)容豐富,展示了如何使用Hadoop構(gòu)建可靠、可伸縮的分布式系統(tǒng),程序員可從中探索如何分析海量數(shù)據(jù)集,管理員可以了解如何建立與運行Hadoop集群。.
本書完全通過案例學(xué)習(xí)來展示如何用Hadoop解決特殊問題,它將幫助您:
使用Hadoop分布式文件系統(tǒng)(HDFS)來存儲海量數(shù)據(jù)集,通過MapReduce對這些數(shù)據(jù)集運行分布式計算..
熟悉Hadoop的數(shù)據(jù)和I/O構(gòu)件,用于壓縮、數(shù)據(jù)集成、序列化和持久處理
洞悉編寫MapReduce實際應(yīng)用程序時常見陷阱和高級特性
設(shè)計、構(gòu)建和管理專用的Hadoop集群或在云上運行Hadoop
使用Pig這種高級的查詢語言來處理大規(guī)模...
本書是您縱情享用數(shù)據(jù)之美的得力助手。作為處理海量數(shù)據(jù)集的理想工具,Apache Hadoop架構(gòu)是MapReduce算法的一種開源應(yīng)用,是Google(谷歌)開創(chuàng)其帝國的重要基石。本書內(nèi)容豐富,展示了如何使用Hadoop構(gòu)建可靠、可伸縮的分布式系統(tǒng),程序員可從中探索如何分析海量數(shù)據(jù)集,管理員可以了解如何建立與運行Hadoop集群。.
本書完全通過案例學(xué)習(xí)來展示如何用Hadoop解決特殊問題,它將幫助您:
使用Hadoop分布式文件系統(tǒng)(HDFS)來存儲海量數(shù)據(jù)集,通過MapReduce對這些數(shù)據(jù)集運行分布式計算..
熟悉Hadoop的數(shù)據(jù)和I/O構(gòu)件,用于壓縮、數(shù)據(jù)集成、序列化和持久處理
洞悉編寫MapReduce實際應(yīng)用程序時常見陷阱和高級特性
設(shè)計、構(gòu)建和管理專用的Hadoop集群或在云上運行Hadoop
使用Pig這種高級的查詢語言來處理大規(guī)模數(shù)據(jù)
利用HBase這個Hadoop數(shù)據(jù)庫來處理結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)
學(xué)習(xí)Zookeeper,這是一個用于構(gòu)建分布式系統(tǒng)的協(xié)作原語工具箱
如果您擁有海量數(shù)據(jù),無論是GB級還是PB級,Hadoop都是完美的選擇。本書是這方面最全面的參考。
