內容簡介
本書將大數據技術生態圈主流技術框架的應用與發展、搭建Hadoop大數據分布式系統集群平臺、大數據分布式文件系統HDFS(Hadoop Distributed File System)、大數據分布式并行計算框架MapReduce、企業大數據分析平臺總共分為10章內容進行闡述;A篇包括第1~6章,具體包括Hadoop概述、Hadoop基礎環境配置、分布式存儲HDFS、并發計算框架MapReduce、新型計算模型Yarn,提高篇包括第7~10章,具體包括協調系統Zookeeper、Hadoop數據庫Hbase、Hadoop數據倉庫Hive、Hadoop數據采集Flume、企業大數據分析平臺。全書內容結構合理,知識點全面,講解詳細,重點難點突出。本書適合作為院校計算機及相關專業大數據課程的教材,也可供學習者自學參考。