資源簡介
本書是您縱情享用數據之美的得力助手 作為處理海量數據集的理想工具 Apache Hadoop架構是MapReduce算法的一種開源應用 是Google 谷歌 開創其帝國的重要基石 本書內容豐富 展示了如何使用Hadoop構建可靠 可伸縮的分布式系統 程序員可從中探索如何分析海量數據集 管理員可以了解如何建立與運行Hadoop集群
本書完全通過案例學習來展示如何用Hadoop解決特殊問題 它將幫助您:
使用Hadoop分布式文件系統(HDFS)來存儲海量數據集 通過MapReduce對這些數據集運行分布式計算
熟悉Hadoop的數據和I O構件 用于壓縮 數據集成 序列化和持久處理
代碼片段和文件信息
評論
共有 條評論