失效链接处理 |
Hadoop海量数据处理 PDF 下载
转载自:http://download.csdn.net/detail/anhuoren/9678565
本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/24010133.html
相关截图:
资料简介: 本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。基础篇详细介绍了Hadoop、YARN、MapReduce、HDFS、Hive、Sqoop和HBase,并深入探讨了Hadoop的运维和调优;应用篇则包含了一个具有代表性的完整的基于Hadoop的商业智能系统的设计和实现;结束篇对全书进行总结,并对技术发展做了展望 资料目录: 基础篇:Hadoop基础 第1章 绪论 2 1.1 Hadoop和云计算 2 1.1.1 Hadoop的电梯演讲 2 1.1.2 Hadoop生态圈 3 1.1.3 云计算的定义 6 1.1.4 云计算的类型 7 1.1.5 Hadoop和云计算 8 1.2 Hadoop和大数据 9 1.2.1 大数据的定义 9 1.2.2 大数据的结构类型 10 1.2.3 大数据行业应用实例 12 1.2.4 Hadoop和大数据 13 1.2.5 其他大数据处理平台 14 1.3 数据挖掘和商业智能 15 1.3.1 数据挖掘的定义 15 1.3.2 数据仓库 17 1.3.3 操作数据库系统和数据仓库系统的区别 18 1.3.4 为什么需要分离的数据仓库 19 1.3.5 商业智能 19 1.3.6 大数据时代的商业智能 20 1.4 小结 21 第2章 环境准备 22 2.1 Hadoop的发行版本选择 22 2.1.1 Apache Hadoop 22 2.1.2 CDH 22 2.1.3 Hadoop的版本 23 2.1.4 如何选择Hadoop的版本 25 2.2 Hadoop架构 26 2.2.1 Hadoop HDFS架构 27 2.2.2 YARN架构 28 2.2.3 Hadoop架构 28 2.3 安装Hadoop 29 2.3.1 安装运行环境 30 2.3.2 修改主机名和用户名 36 2.3.3 配置静态IP地址 36 2.3.4 配置SSH无密码连接 37 2.3.5 安装JDK 38 2.3.6 配置Hadoop 39 2.3.7 格式化HDFS 42 2.3.8 启动Hadoop并验证安装 42 2.4 安装Hive 43 2.4.1 安装元数据库 44 2.4.2 修改Hive配置文件 44 2.4.3 验证安装 45 2.5 安装HBase 46 2.5.1 解压文件并修改Zookeeper相关配置 46 2.5.2 配置节点 46 2.5.3 配置环境变量 47 2.5.4 启动并验证 47 2.6 安装Sqoop 47 2.7 Cloudera Manager 48 2.8 小结 51 第3章 Hadoop的基石:H |