《Hadoop权威指南(第2版)》从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:Haddoop简介;MapReduce简介;Hadoop分布式文件系统;Hadoop的I/O、MapReduce应用程序开发;MapReduce的工作机制;MapReduce的类型和格式;MapReduce的特性;如何构建Hadoop集群,如何管理Hadoop;Pig简介;Hbase简介;Hive简介;ZooKeeper简介;开源工具Sqoop,最后还提供了丰富的案例分析。《Hadoop权威指南(第2版)》是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群。
目录
第1章 初识Hadoop 1
第2章 关于MapReduce 15
第3章 Hadoop分布式文件系统 41
第4章 Hadoop I/O 75
第5章 MapReduce应用开发 129
第6章 MapReduce的工作机制 167
第7章 MapReduce的类型与格式 189
第8章 MapReduce的特性 225
第9章 构建Hadoop集群 259
第10章 管理Hadoop 293
第11章 Pig简介 321
第12章 Hive 365
第13章 HBase 411
未经书面许可,严禁将本网内容作为AI训练资源。