图书介绍

数据挖掘 R语言实战PDF|Epub|txt|kindle电子书版本网盘下载

数据挖掘 R语言实战
  • 黄文,王正林编著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121231223
  • 出版时间:2014
  • 标注页数:292页
  • 文件大小:44MB
  • 文件页数:305页
  • 主题词:数据采集-统计分析-应用软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘 R语言实战PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第0章 致敬,R!1

致敬,肩膀!1

致敬,时代!3

致敬,人才!4

致敬,R瑟!5

上篇数据预处理10

第1章 数据挖掘导引10

1.1 数据挖掘概述10

1.1.1 数据挖掘的过程10

1.1.2 数据挖掘的对象12

1.1.3 数据挖掘的方法12

1.1.4 数据挖掘的应用13

1.2 数据挖掘的算法14

1.3 数据挖掘的工具17

1.3.1 工具的分类17

1.3.2 工具的选择18

1.3.3 商用的工具19

1.3.4 开源的工具21

1.4 R在数据挖掘中的优势23

第2章 数据概览25

2.1 n×m数据集25

2.2 数据的分类28

2.2.1 一般的数据分类28

2.2.2 R的数据分类29

2.2.3 用R简单处理数据31

2.3 数据抽样及R实现34

2.3.1 简单随机抽样34

2.3.2 分层抽样36

2.3.3 整群抽样38

2.4 训练集与测试集40

2.5 本章汇总40

第3章 用R获取数据42

3.1 获取内置数据集42

3.1.1 datasets数据集42

3.1.2 包的数据集43

3.2 获取其他格式的数据45

3.2.1 CSV与TXT格式45

3.2.2 从Excel直接获取数据47

3.2.3 从其他统计软件中获取数据48

3.3 获取数据库数据50

3.4 获取网页数据52

3.5 本章汇总55

第4章 探索性数据分析56

4.1 数据集56

4.2 数字化探索57

4.2.1 变量概况57

4.2.2 变量详情58

4.2.3 分布指标61

4.2.4 稀疏性62

4.2.5 缺失值63

4.2.6 相关性65

4.3 可视化探索68

4.3.1 直方图68

4.3.2 累积分布图71

4.3.3 箱形图73

4.3.4 条形图78

4.3.5 点阵图81

4.3.6 饼图82

4.5 本章汇总84

第5章 数据预处理86

5.1 数据集加载86

5.2 数据清理88

5.2.1 缺失值处理90

5.2.2 噪声数据处理95

5.2.3 数据不一致的处理97

5.3 数据集成99

5.4 数据变换101

5.5 数据归约102

5.6 本章汇总104

中篇基本算法及应用106

第6章 关联分析106

6.1 概述106

6.2 R 中的实现109

6.2.1 相关软件包109

6.2.2 核心函数109

6.2.3 数据集110

6.3 应用案例111

6.3.1 数据初探111

6.3.2 对生成规则进行强度控制112

6.3.3 一个实际应用114

6.3.4 改变输出结果形式115

6.3.5 关联规则的可视化116

6.4 本章汇总120

第7章 聚类分析121

7.1 概述121

7.1.1 K-均值聚类122

7.1.2 K-中心点聚类122

7.1.3 系谱聚类122

7.1.4 密度聚类124

7.1.5 期望最大化聚类125

7.2 R 中的实现126

7.2.1 相关软件包126

7.2.2 核心函数127

7.2.3 数据集129

7.3 应用案例131

7.3.1 K-均值聚类131

7.3.2 K-中心点聚类135

7.3.3 系谱聚类137

7.3.4 密度聚类140

7.3.5 期望最大化聚类145

7.4 本章汇总150

第8章 判别分析151

8.1 概述151

8.1.1 费希尔判别152

8.1.2 贝叶斯判别153

8.1.3 距离判别153

8.2 R 中的实现154

8.2.1 相关软件包154

8.2.2 核心函数155

8.2.3 数据集157

8.3 应用案例161

8.3.1 线性判别分析161

8.3.2 朴素贝叶斯分类167

8.3.3 K最近邻172

8.3.4 有权重的K最近邻算法174

8.4 推荐系统综合实例175

8.4.1 kNN与推荐176

8.4.2 MovieLens数据集说明176

8.4.3 综合运用177

8.5 本章汇总182

第9章 决策树183

9.1 概述183

9.1.1 树形结构183

9.1.2 树的构建184

9.1.3 常用算法185

9.2 R中的实现185

9.2.1 相关软件包185

9.2.2 核心函数186

9.2.3 数据集187

9.3 应用案例190

9.3.1 CART应用191

9.3.2 C4.5 应用202

9.4 本章汇总205

下篇高级算法及应用208

第10章 集成学习208

10.1 概述208

10.1.1 一个概率论小计算208

10.1.2 Bagging算法209

10.1.3 AdaBoost算法209

10.2 R 中的实现209

10.2.1 相关软件包209

10.2.2 核心函数210

10.2.3 数据集210

10.3 应用案例213

10.3.1 Bagging算法213

10.3.2 Adaboost算法218

10.4 本章汇总219

第11章 随机森林220

11.1 概述220

11.1.1 基本原理220

11.1.2 重要参数222

11.2 R 中的实现223

11.2.1 相关软件包223

11.2.2 核心函数223

11.2.3 可视化分析231

11.3 应用案例232

11.3.1 数据处理233

11.3.2 建立模型234

11.3.3 结果分析235

11.3.4 自变量的重要程度236

11.3.5 优化建模237

11.4 本章汇总241

第12章 支持向量机242

12.1 概述242

12.1.1 结构风险最小原理243

12.1.2 函数间隔与几何间隔244

12.1.3 核函数245

12.2 R中的实现245

12.2.1 相关软件包245

12.2.2 核心函数246

12.2.3 数据集248

12.3 应用案例248

12.3.1 数据初探249

12.3.2 建立模型249

12.3.3 结果分析249

12.3.4 预测判别250

12.3.5 综合建模251

12.3.6 可视化分析252

12.3.7 优化建模254

12.4 本章汇总256

第13章 神经网络257

13.1 概述257

13.2 R中的实现258

13.2.1 相关软件包258

13.2.2 核心函数258

13.3 应用案例261

13.3.1 数据初探261

13.3.2 数据处理262

13.3.3 建立模型263

13.3.4 结果分析264

13.3.5 预测判别264

13.3.6 模型差异分析266

13.3.7 优化建模268

13.4 本章汇总272

第14章 模型评估与选择273

14.1 评估过程概述273

14.2 安装Rattle包274

14.3 Rattle功能简介275

14.3.1 Data——选取数据275

14.3.2 Explore——数据探究276

14.3.3 Test——数据相关检验276

14.3.4 Transform——数据预处理277

14.3.5 Cluster——数据聚类277

14.3.6 Model——模型评估277

14.3.7 Evaluate——模型评估280

14.3.8 Log——模型评估记录281

14.4 模型评估相关概念281

14.4.1 误判率281

14.4.2 正确/错误的肯定判断、正确/错误的否定判断281

14.4.3 精确度、敏感度及特异性282

14.5 Rattle在模型评估中的应用282

14.5.1 混淆矩阵282

14.5.2 风险图283

14.5.3 ROC图及相关图表286

14.5.4 模型得分数据集287

14.6 综合实例288

14.6.1 数据介绍288

14.6.2 模型建立288

14.6.3 模型结果分析289

热门推荐