图书介绍
Oracle大数据解决方案PDF|Epub|txt|kindle电子书版本网盘下载
![Oracle大数据解决方案](https://www.shukui.net/cover/72/34480987.jpg)
- (美)普伦凯特,(美)麦克唐纳,(美)纳尔逊著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302385516
- 出版时间:2015
- 标注页数:302页
- 文件大小:67MB
- 文件页数:326页
- 主题词:关系数据库系统
PDF下载
下载说明
Oracle大数据解决方案PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第Ⅰ部分 引言3
第1章 大数据简介3
1.1 大数据3
1.2 谷歌的MapReduce算法和Apache Hadoop4
1.3 Oracle的大数据平台5
1.4 总结8
第2章 大数据的价值9
2.1 我是大数据吗?还是大数据是我?10
2.2 大数据,小数据——仍然是数据12
2.2.1 什么已经发生了?12
2.2.2 现在发生了什么?13
2.3 请看看现实!14
2.4 你想把它做成什么?16
2.5 大数据,大数字,大企业?17
2.5.1 Twitter18
2.5.2 Facebook19
2.5.3 内部源19
2.5.4 ICR:连接20
2.5.5 ICR:变更20
2.6 需要:大数据的价值22
2.6.1 大数据案例1:医疗行业的临床试验研究23
2.6.2 大数据案例2:在汽车行业的汽车设计中改进驾驶员安全23
2.7 总结24
第Ⅱ部分 大数据平台27
第3章 Apache Hadoop平台27
3.1 软件与硬件28
3.2 Hadoop的软件平台28
3.2.1 Hadoop的发布与版本29
3.2.2 Hadoop Distributed File System(HDFS)29
3.2.3 调度、计算和处理31
3.3 操作系统的选择33
3.4 Hadoop硬件平台34
3.4.1 CPU和内存34
3.4.2 网络34
3.4.3 磁盘35
3.5 整合在一起35
第4章 选择Appliance的理由37
4.1 Oracle创建大数据机的理由38
4.2 Appliance的概念39
4.3 Oracle BigData Appliance的发展目标39
4.4 Appliance优化39
4.5 Oracle Big DataAppliance第2版软件40
4.6 Oracle大数据机X3-2硬件42
4.7 Oracle获取Hadoop知识的地方44
4.8 配置Hadoop集群45
4.8.1 选择核心集群组件45
4.8.2 组装集群47
4.9 自己组建的集群48
4.10 集群总成本49
4.11 时间价值52
4.12 如何打造更大的集群53
4.13 Oracle大数据机可否支持其他软件53
4.14 一体机的缺陷54
第5章 BDA配置、部署架构和监控55
5.1 介绍56
5.1.1 大数据机X3-2满配机架(18个节点)57
5.1.2 大数据机X3-2入门机架(6个节点)60
5.1.3 大数据机X3-2扩展机架(6个节点)63
5.1.4 BDA的硬件修改63
5.1.5 大数据机X3-2的软件支持63
5.2 BDA安装和配置过程64
5.3 关键和非关键节点65
5.4 NameNode故障自动切换66
5.5 BDA磁盘存储布局67
5.6 为Hadoop集群增加存储69
5.7 仅有Hadoop配置和Hadoop+NoSQL数据库70
5.7.1 仅有Hadoop的一体机70
5.7.2 Hadoop和NoSQL数据库71
5.8 内存选项72
5.9 部署架构72
5.9.1 云中的多租户和Hadoop72
5.9.2 可扩展性74
5.9.3 BDA多机架的注意事项74
5.10 在BDA上安装其他软件75
5.11 数据中心的BDA75
5.11.1 管理网络75
5.11.2 客户端访问网络76
5.11.3 Infiniband私有网络76
5.11.4 网络需求76
5.11.5 连接到数据中心的局域网78
5.11.6 连接架构的例子78
5.12 Oracle大数据机的使用限制78
5.13 BDA的管理和监控79
5.13.1 企业管理器80
5.13.2 Cloudera管理器82
5.13.3 Hadoop的监控工具:Web图形用户界面83
5.13.4 Oracle ILOM84
5.13.5 Hue86
5.13.6 DCLI工具86
第6章 为大数据集成数据仓库和分析基础架构87
6.1 数据仓库作为存储历史记录的数据库88
6.1.1 Oracle数据库作为数据仓库88
6.1.2 为什么要把数据仓库和Hadoop部署在一起89
6.2 完成路径:业务分析师工具90
6.3 扩建基础设施91
第7章 BDA连接器93
7.1 Oracle Big Data Connectors94
7.2 Oracle Loader for Hadoop95
7.2.1 在线模式96
7.2.2 Oracle OCI Direct Path Output97
7.2.3 JDBC Output97
7.2.4 离线模式98
7.2.5 Oracle Data Pump Output98
7.2.6 带分隔符的文本输出99
7.3 安装Oracle Loader for Hadoop99
7.4 调用Oracle Loader for Hadoop100
7.5 输入格式100
7.5.1 DelimitedTextInputFormat101
7.5.2 RegexInputFormat102
7.5.3 AvroInputFormat102
7.5.4 HiveToAvroInputFormat102
7.5.5 KVAvroInputFormat102
7.5.6 自定义输入格式103
7.6 Oracle Loader for Hadoop配置文件103
7.6.1 Loader Maps105
7.6.2 额外的优化106
7.6.3 利用Infiniband107
7.6.4 对比Apache Sqoop107
7.7 Oracle SQL Connector for HDFS108
7.8 安装Oracle SQL Connector forHDFS110
7.9 Hive安装112
7.10 使用Oracle SQL Connector for HDFS创建外部表113
7.10.1 ExternalTable配置工具113
7.10.2 数据源类型113
7.10.3 配置工具语法114
7.10.4 必需的属性114
7.10.5 可选属性115
7.10.6 针对带分隔符的ExternalTable工具115
7.10.7 在使用--noexecute选项的情况下测试DDL117
7.10.8 在位置文件里增加一个新的HDFS文件118
7.10.9 外部表的手动配置118
7.11 Hive源119
7.12 Oracle Data Pump源121
7.13 配置文件122
7.14 使用Oracle SQL Connector for HDFS查询124
7.15 Oracle R Connector for Hadoop125
7.16 Oracle Data Integrator Application Adapter for Hadoop125
第8章 Oracle NoSQL数据库129
8.1 NoSQL数据库系统的定义130
8.2 Oracle NoSQL数据库131
8.3 架构133
8.3.1 客户端驱动程序134
8.3.2 键-值对134
8.3.3 存储节点136
8.3.4 复制136
8.3.5 智能拓扑137
8.3.6 在线的灵活性137
8.3.7 没有单点故障138
8.4 数据管理138
8.4.1 API138
8.4.2 CRUD操作138
8.4.3 多种更新操作139
8.4.4 查找操作139
8.4.5 事务139
8.4.6 可预测的性能140
8.5 集成141
8.6 安装和管理142
8.6.1 简单安装142
8.6.2 管理142
8.7 Oracle NoSQL数据库的特性142
8.8 有用的链接143
第Ⅲ部分 分析信息和制定决策147
第9章 数据库库内分析:快速交付彰显时间价值147
9.1 介绍148
9.1.1 Oracle数据库内分析149
9.1.2 为什么在数据库内运行如此重要151
9.2 Oracle数据挖掘和统计分析介绍151
9.2.1 Oracle库内高级分析152
9.2.2 Oracle数据挖掘153
9.2.3 R语言介绍159
9.2.4 文本挖掘165
9.3 库内统计函数168
9.4 空间分析169
9.4.1 理解空间数据模型170
9.4.2 查询空间数据模型170
9.4.3 使用空间分析171
9.4.4 让BI工具更聪明171
9.5 基于图形分析172
9.5.1 图形数据模型172
9.5.2 查询图形数据172
9.6 多维分析174
9.7 库内分析:综合范例176
9.7.1 在ETL过程中集成分析176
9.7.2 提供指导浏览176
9.7.3 提供混搭式分析176
9.8 总结177
第10章 使用R分析数据179
10.1 Open Source R介绍180
10.1.1 CRAN、Packages和Task View180
10.1.2 GUI和IDE182
10.2 传统的R与数据库交互对比Oracle R Enterprise183
10.3 Oracle针对R的战略185
10.3.1 Oracle R Enterprise185
10.3.2 Oracle R Distribution186
10.3.3 ROracle186
10.3.4 Oracle R Connector for Hadoop187
10.4 Oracle R Enterprise:下一级视图187
10.5 Oracle REnterprise安装和配置188
10.6 使用Oracle R Enterprise189
10.6.1 透明层189
10.6.2 嵌入式R执行199
10.6.3 预测分析213
10.7 OracleRConnectorforHadoop225
10.7.1 调用MapReduce Job227
10.7.2 在非Hadoop集群下测试ORCH R脚本227
10.7.3 用R与HDFS交互228
10.7.4 HDFS MetadataDiscovery229
10.7.5 基于ORCH框架来使用Hadoop231
10.7.6 在Hadoop上的预测分析232
10.7.7 ORCHhive233
10.7.8 Oracle R Connector forHadoop与Oracle R Enterprise之间的交互235
10.8 总结236
第11章 Endeca信息发现237
11.1 为什么Oracle选择Endeca237
11.2 Endeca信息发现平台239
11.2.1 主要功能域239
11.2.2 主要特性239
11.3 Endeca信息发现与商业智能241
11.3.1 作用和功能不同241
11.3.2 BI开发过程与信息发现方法对比242
11.3.3 互补而非互斥243
11.4 架构244
11.4.1 Oracle Endeca服务器244
11.4.2 Oracle Endeca工作室246
11.4.3 Oracle Endeca集成套件248
11.4.4 Exalytics上的Endeca249
11.4.5 可伸缩性和负载均衡250
11.5 统一多种内容集253
11.5.1 Endeca不同之外253
11.5.2 行业用例253
11.6 Endeca实际操作255
11.6.1 安装与配置255
11.6.2 开发Endeca应用256
第12章 大数据治理259
12.1 企业数据治理的要素260
12.1.1 业务输出260
12.1.2 信息生命周期管理260
12.1.3 合规性和风险管理261
12.1.4 元数据管理261
12.1.5 数据质量管理261
12.1.6 主数据和引用数据管理262
12.1.7 数据安全和隐私管理262
12.1.8 业务流程调整263
12.2 大数据怎样影响企业数据治理263
12.2.1 模型化的数据和原始数据263
12.2.2 大数据的类型265
12.2.3 在大数据上应用数据治理267
12.2.4 利用大数据治理269
12.3 特定行业的案例272
12.3.1 公共事业272
12.3.2 卫生医疗273
12.3.3 金融服务274
12.3.4 零售行业275
12.3.5 大众消费品276
12.3.6 通信行业277
12.3.7 石油和天然气278
12.4 大数据如何对数据治理的角色产生影响279
12.5 实施大数据治理的一种方法280
第13章 大数据开发架构和路线图283
13.1 大数据功能架构283
13.1.1 大数据的新特点284
13.1.2 大数据概念功能架构285
13.1.3 产品功能和工具285
13.1.4 制定大数据架构决策287
13.2 架构开发流程实现增值288
13.2.1 Oracle信息架构框架概述288
13.2.2 采用OADP的信息架构概述291
13.2.3 大数据架构开发流程293
13.3 对数据管理和BI过程的影响298
13.3.1 传统BI开发过程298
13.3.2 大数据和分析开发过程298
13.4 大数据治理299
13.4.1 传统数据治理的关注点299
13.4.2 大数据治理新的关注点299
13.5 开发技能和人才300
13.5.1 数据科学家300
13.5.2 大数据开发人员301
13.5.3 大数据管理员301
13.6 大数据最佳实践301
13.6.1 让大数据活动结合特定业务目标301
13.6.2 确保集中化IT战略的标准和治理301
13.6.3 使用卓越中心来最小化培训和风险301
13.6.4 大数据与结构化数据关联301
13.6.5 提供高性能和可伸缩的分析沙箱302
13.6.6 重塑IT运营模式302