图书介绍
大数据分析师权威教程 机器学习、大数据分析和可视化PDF|Epub|txt|kindle电子书版本网盘下载
![大数据分析师权威教程 机器学习、大数据分析和可视化](https://www.shukui.net/cover/41/30482356.jpg)
- Wrox国际IT认证项目组编 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115456892
- 出版时间:2017
- 标注页数:320页
- 文件大小:54MB
- 文件页数:337页
- 主题词:数据处理-教材
PDF下载
下载说明
大数据分析师权威教程 机器学习、大数据分析和可视化PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
模块1 机器学习的概念3
第1讲 理解机器学习技术3
1.1 什么是机器学习4
1.1.1 数据挖掘与机器学习之间的差异5
1.1.2 SpamAssassin特性6
1.2 机器学习的应用8
1.2.1 图像识别8
1.2.2 语音识别10
1.2.3 医疗诊断10
1.2.4 统计套利11
1.2.5 关联学习11
1.2.6 分类11
1.2.7 预测12
1.2.8 提取13
1.2.9 回归13
1.2.10 概率13
1.3 机器学习的类型14
1.3.1 有监督学习14
1.3.2 无监督学习15
1.3.3 强化学习15
1.4 机器学习方法16
1.4.1 决策树学习16
1.4.2 关联规则学习16
1.4.3 人工神经网络17
1.4.4 归纳逻辑编程17
1.4.5 支持向量机17
1.4.6 聚类18
1.4.7 贝叶斯网络18
1.4.8 强化学习18
1.4.9 表示学习18
1.4.10 相似性和度量学习18
1.4.11 稀疏字典学习19
1.5 机器学习算法列表19
练习22
备忘单24
第2讲 R上的图模型和贝叶斯网络25
2.1 图模型简介26
2.1.1 图模型的类型30
2.1.2 图中的条件独立性32
2.1.3 图中的条件独立性与分割33
2.1.4 图的分解或者因子化35
2.1.5 图模型的应用36
2.2 案例研究——图模型在大众公司的应用37
2.2.1 背景37
2.2.2 问题37
2.2.3 解决方案38
2.3 贝叶斯统计简介38
2.3.1 贝叶斯定理39
2.3.2 贝叶斯网络39
2.4 贝叶斯网络特性43
2.5 贝叶斯网络中的概率推理49
2.5.1 推断未观测变量49
2.5.2 参数学习49
2.5.3 结构学习49
2.6 贝叶斯方法51
2.6.1 变量消除51
2.6.2 动态编程52
2.6.3 逼近算法52
2.7 贝叶斯网络的应用54
练习57
备忘单59
第3讲 人工神经网络60
3.1 神经网络简介62
3.2 神经网络的应用65
3.3 神经网络的结构66
3.4 人工神经网络模型68
3.4.1 多层感知器68
3.4.2 径向基函数网络69
3.4.3 Kohonen网络70
3.5 学习规则72
3.5.1 Hebbian学习规则73
3.5.2 感知器学习规则73
3.5.3 Delta学习规则(Windrow-Hoff学习规则)74
3.5.4 相关学习规则74
3.5.5 外向星学习规则74
3.6 神经网络训练算法75
3.6.1 梯度下降76
3.6.2 演化算法77
3.6.3 遗传算法78
3.7 在R中实现神经网络80
练习84
备忘单87
第4讲 在R中使用PCA和因子分析降维88
4.1 降维简介90
4.2 降维的应用91
4.2.1 文档分类91
4.2.2 基因表达微阵列分析92
4.2.3 面部识别93
4.3 因子分析94
4.4 因子分析的应用96
4.4.1 心理测验学中的因子分析96
4.4.2 营销中的因子分析97
4.5 因子分析方法98
4.5.1 EFA和CFA的相似之处98
4.5.2 EFA和CFA之间的差异98
4.6 作为数据归约方法的因子分析99
4.6.1 确定因子数量的标准101
4.6.2 公因子方差102
4.6.3 因子载荷103
4.6.4 因子结构的旋转104
4.6.5 旋转策略104
4.6.6 因子结构的解读105
4.6.7 层次化因子分析106
4.6.8 因子得分107
4.7 主成分分析107
4.7.1 主成分分析的显著性108
4.7.2 主成分的提取108
4.7.3 主成分的特性108
4.7.4 主成分分析的特性109
4.8 主成分分析中的数据归约和解读109
4.8.1 投影于一个轴上的惯性110
4.8.2 距离110
4.8.3 逆方差110
4.8.4 协方差111
4.8.5 变量的范数112
4.8.6 因子轴112
4.8.7 因子平面112
4.8.8 主成分分析的目标113
4.8.9 相关矩阵的特征值113
4.8.10 变量的表示113
4.8.11 个体的表示114
4.8.12 主成分分析过程114
4.8.13 选择主成分数量116
4.8.14 主成分分析的变种118
4.9 在R上实现主成分分析120
4.9.1 示例1:欧洲人的蛋白质消耗120
4.9.2 示例2:美国月度失业率122
练习123
备忘单125
第5讲 支持向量机127
5.1 支持向量机简介128
5.2 支持向量机的应用领域129
5.3 SVM算法131
5.3.1 可分情况132
5.3.2 不可分情况133
5.4 线性支持向量机135
5.4.1 原型135
5.4.2 对偶形式136
5.4.3 有偏和无偏超平面137
5.5 核函数137
5.5.1 核规则137
5.5.2 支持向量机核示例139
5.6 在R中训练和测试SVM模型139
5.7 用SVM模型预测的实例143
5.7.1 数据集143
5.7.2 准备数据集144
5.7.3 选择参数144
5.7.4 训练模型145
5.7.5 测试模型146
练习147
备忘单149
模块2 社交媒体、移动分析和可视化153
第1讲 大数据解决方案工程153
1.1 大数据展望过程154
1.1.1 步骤1:研究和面谈以理解业务活动155
1.1.2 步骤2:获取和分析数据157
1.1.3 步骤3:对新思路展开头脑风暴158
1.1.4 步骤4:排定大数据集用例的优先级159
1.1.5 步骤5:文档160
1.2 大数据用例的优先级排定160
1.2.1 优先顺序矩阵过程161
1.2.2 优先顺序矩阵的陷阱162
1.3 解决方案工程过程164
1.3.1 第1步:理解组织是如何赚钱的164
1.3.2 第2步:识别组织的关键业务活动167
1.3.3 第3步:进行头脑风暴,确定大数据在业务上的作用167
1.3.4 第4步:将业务活动分解为用例168
1.3.5 第5步:证明用例168
1.3.6 第6步:设计和实施大数据解决方案169
1.4 解决方案工程示例170
1.4.1 客户行为分析171
1.4.2 减少欺诈行为172
1.5 大数据解决方案的挑战172
练习174
备忘单176
第2讲 社交媒体分析和文本分析177
2.1 什么是社交媒体178
2.2 社交分析、指标和计量181
2.2.1 社交媒体分析工具181
2.2.2 社交媒体分析与业务决策182
2.2.3 社交媒体分析与其他分析类型的对比184
2.3 社交媒体分析的关键要素184
2.3.1 目标受众184
2.3.2 预期行动185
2.3.3 内容185
2.3.4 内容机制185
2.3.5 社交媒体分析中使用的技本186
2.3.6 在线社交媒体分析工具187
2.3.7 社交媒体分析所用的桌面应用程序187
2.4 文本挖掘简介188
2.4.1 文本挖掘工作方式189
2.4.2 文本挖掘的应用190
2.5 文本分析过程190
2.6 情绪分析192
2.6.1 情绪分析使用的方法193
2.6.2 在线情绪分析193
2.7 在R上实施Twitter情绪分析194
练习203
备忘单205
第3讲 执行移动分析207
3.1 移动分析简介208
3.1.1 什么是移动分析209
3.1.2 移动分析和Web分析209
3.1.3 移动分析和商业价值210
3.1.4 移动分析结果类型210
3.1.5 移动分析应用类型211
3.1.6 使用移动分析的领域212
3.2 移动分析工具212
3.2.1 基于位置的跟踪工具213
3.2.2 实时分析工具213
3.2.3 用户行为跟踪工具214
3.3 执行移动分析216
3.3.1 通过移动应用收集数据216
3.3.2 将数据收集到服务器217
3.4 应用分析报告218
3.5 移动分析的挑战219
3.5.1 网络问题219
3.5.2 安全性问题和政府协议220
练习221
备忘单223
第4讲 大数据可视化225
4.1 什么是可视化226
4.1.1 为什么对数据进行可视化226
4.1.2 可视化技术227
4.1.3 可视化类型227
4.1.4 可视化的应用228
4.2 大数据可视化的重要性229
4.2.1 传统信息可视化的不足229
4.2.2 大数据可视化的商业价值229
4.2.3 用可视化将数据变成信息230
4.2.4 使用不同工具的可视化示例231
4.2.5 大数据可视化中的障碍233
4.3 大数据可视化工具233
4.3.1 大数据可视化专属服务234
4.3.2 开源可视化程序库234
4.3.3 用于大数据可视化的技术235
4.4 Tableau产品235
4.4.1 用TableauDesktop创建可视化236
4.4.2 Tableau Desktop工作区简介239
4.4.3 多个工作表页面240
4.4.4 Tableau工作区240
4.5 使用数据源246
4.5.1 用Tableau联合数据库表246
4.5.2 连接到SQL247
4.6 数据运算(排序、聚合、联接)248
4.6.1 地图和地理单元249
4.6.2 创建交互式可视化251
练习254
备忘单256
第5讲 招聘准备258
5.1 大数据分析师所需要的关键技能260
5.2 大数据分析岗位职责262
5.2.1 初级分析师262
5.2.2 中级分析师263
5.2.3 高级分析师263
5.3 大数据工作机会领域264
模块3 大数据分析的行业应用273
第1讲 大数据业务问题和解决方案——保险欺诈分析273
1.1 背景274
1.1.1 保险合同275
1.1.2 保单类型275
1.2 保险欺诈及其影响276
1.3 场景277
1.4 数据的解释277
1.5 方法论278
1.6 具体做法279
1.7 结论280
第2讲 大数据业务问题和解决方案——信用风险281
2.1 背景282
2.2 场景283
2.3 数据的解释284
2.4 方法论和具体做法285
2.5 结论287
第3讲 大数据业务问题和解决方案——典型行业288
3.1 背景289
3.1.1 客户流失289
3.1.2 缺乏最优营销策略289
3.1.3 呼叫数据记录(CDR)分析的需求290
3.2 为增加利润而进行数据分析290
3.2.1 避免客户流失290
3.2.2 采用最优的营销策略290
3.2.3 分析呼叫详细记录291
3.3 场景291
3.4 数据的解释291
3.5 方法论294
3.6 具体做法295
3.6.1 高管视图295
3.6.2 中层管理视图296
3.6.3 代理人视图296
3.7 结论298
第4讲 大数据业务问题和解决方案——在线客户细分299
4.1 背景300
4.2 为客户细分进行数据分析301
4.3 场景302
4.4 数据的解释302
4.5 方法论302
4.6 具体做法303
4.7 结论305
第5讲 大数据业务问题和解决方案——在电子商务中使用可视化工具306
5.1 背景307
5.2 场景310
5.3 数据的解释310
5.4 方法论311
5.5 具体做法311
5.6 结论317