图书介绍

写给大忙人的Hadoop 2PDF|Epub|txt|kindle电子书版本网盘下载

（美）DouglasEadline著；卢涛，李颖译著
出版社：北京：电子工业出版社
ISBN：9787121288050
出版时间：2016
标注页数：271页
文件大小：33MB
文件页数：289页
主题词：数据处理软件

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：a9787f0da24c38a3f41c159c00404e79

下载说明

写给大忙人的Hadoop 2PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

1 背景和概念1

定义Apache Hadoop1

Apache Hadoop的发展简史3

大数据的定义4

Hadoop作为数据湖5

使用Hadoop：管理员、用户或两种身份兼具7

原始的MapReduce7

Apache Hadoop的设计原则8

Apache Hadoop MapReduce示例8

MapReduce的优势10

Apache Hadoop V 1 MapReduce操作11

使用Hadoop V2超越MapReduce13

Hadoop V2 YARN操作设计14

Apache Hadoop项目生态系统16

总结和补充资料18

2 安装攻略21

核心Hadoop服务21

Hadoop配置文件22

规划你的资源23

硬件的选择23

软件的选择24

在台式机或笔记本电脑上安装25

安装Hortonworks HDP 2.2沙箱25

用Apache源代码安装Hadoop32

配置单节点YARN服务器的步骤33

运行简单的MapReduce示例42

安装Apache Pig（可选）42

安装Apache Hive（可选）43

使用Ambari安装Hadoop44

执行Ambari安装45

撤消Ambari安装59

使用Apache Whirr在云中安装Hadoop59

总结和补充资料65

3 HDFS基础知识67

HDFS设计的特点67

HDFS组件68

HDFS块复制71

HDFS安全模式72

机架的识别73

NameNode高可用性73

HDFS NameNode联邦75

HDFS检查点和备份76

HDFS快照76

HDFS NFS网关76

HDFS用户命令77

简要HDFS命令参考77

一般HDFS命令78

列出HDFS中的文件79

在HDFS中创建一个目录80

将文件复制到HDFS80

从HDFS复制文件81

在HDFS中复制文件81

删除在HDFS中的文件81

删除在HDFS中的目录81

获取HDFS状态报告81

HDFS的Web图形用户界面82

在程序中使用HDFS82

HDFS Java应用程序示例82

HDFS C应用程序示例86

总结和补充资料88

4 运行示例程序和基准测试程序91

运行MapReduce示例91

列出可用的示例92

运行Pi示例93

使用Web界面监控示例95

运行基本Hadoop基准测试程序101

运行Terasort测试101

运行TestDFSIO基准102

管理Hadoop MapReduce作业104

总结和补充资料105

5 Hadoop MapReduce框架107

MapReduce模型107

MapReduce并行数据流110

容错和推测执行114

推测执行114

Hadoop MapReduce硬件115

总结和补充资料115

6 MapReduce编程117

编译和运行Hadoop WordCount的示例117

使用流式接口122

使用管道接口125

编译和运行Hadoop Grep链示例127

调试MapReduce131

作业的列举、清除和状态查询131

Hadoop日志管理131

启用YARN日志聚合132

Web界面日志查看133

命令行日志查看133

总结和补充资料135

7 基本的Hadoop工具137

使用Apache Pig137

Pig示例演练138

使用Apache Hive140

Hive示例演练140

更高级的Hive示例142

使用Apache Sqoop获取关系型数据145

Apache Sqoop导入和导出方法145

Apache Sqoop版本更改147

Sqoop示例演练148

使用Apache Flume获取数据流155

Flume的示例演练157

使用Apache Oozie管理Hadoop工作流160

Oozie示例演练162

使用Apache HBase170

HBase数据模型概述170

HBase示例演练171

总结和补充资料176

8 Hadoop YARN应用程序179

YARN分布式shell179

使用YARN分布式shell180

一个简单的示例181

使用更多的容器182

带有shell参数的分布式shell示例183

YARN应用程序的结构185

YARN应用程序框架187

Hadoop MapReduce188

Apache Tez188

Apache Giraph189

Hoya： HBase on YARN189

Dryad on YARN189

Apache Spark189

Apache Storm190

Apache REEF：可持续计算执行框架190

Hamster： Hadoop和MPI在同一集群190

Apache Flink：可扩展的批处理和流式数据处理191

Apache Slider：动态应用程序管理191

总结和补充资料192

9 用Apache Ambari管理Hadoop193

快速浏览Apache Ambari194

仪表板视图194

服务视图197

主机视图199

管理视图201

查看视图201

Admin下拉菜单202

更改Hadoop属性206

总结和补充资料212

10 基本的Hadoop管理程序213

基本的Hadoop YARN管理214

停用YARN节点214

YARN WebProxy214

使用JobHistoryServer215

管理YARN作业215

设置容器内存215

设置容器核心216

设置MapReduce属性216

基本的HDFS管理217

NameNode用户界面217

将用户添加到HDFS219

在HDFS上执行FSCK220

平衡HDFS221

HDFS安全模式222

停用HDFS节点222

SecondaryNameNode223

HDFS快照223

配置到HDFS的NFSv3网关225

容量调度程序背景知识229

Hadoop 2的MapReduce兼容性231

启用应用主控程序的重新启动功能231

计算一个节点的承载容量232

运行Hadoop 1的应用程序233

总结和补充资料235

附录A 本书的网页和代码下载237

附录B 入门流程图和故障排除指南239

入门流程图239

常见的Hadoop故障排除指南239

规则1：不要惊慌239

规则2：安装并使用Ambari244

规则3：检查日志244

规则4：简化情况245

规则5：在互联网上提问245

其他有用的提示246

附录C 按主题列出的Apache Hadoop资源汇总253

常规的Hadoop信息253

Hadoop安装攻略253

HDFS254

示例255

MapReduce255

MapReduce编程255

基本工具256

YARN应用程序框架257

Ambari管理257

基本的Hadoop管理257

附录D 安装HueHadoop GUI259

Hue安装259

安装和配置Hue262

启动Hue263

Hue用户界面263

附录E 安装Apache Spark267

在集群上安装Spark267

在整个集群中启动Spark268

在伪分布式的单节点安装版本中安装和启动Spark270

运行Spark示例271