图书介绍
数据挖掘理论与技术PDF|Epub|txt|kindle电子书版本网盘下载
- 罗森林,马俊,潘丽敏编著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121189890
- 出版时间:2013
- 标注页数:242页
- 文件大小:29MB
- 文件页数:254页
- 主题词:数据采集
PDF下载
下载说明
数据挖掘理论与技术PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
1.1数据挖掘产生的背景1
1.1.1技术背景1
1.1.2理论基础2
1.1.3数据挖掘相关概念3
1.2数据挖掘知识基础4
1.2.1基本概念及特点4
1.2.2数据集5
1.2.3功能与分类7
1.2.4任务与过程9
1.2.5方法与步骤14
1.3数据挖掘简史与现状16
1.3.1简史16
1.3.2现状19
1.4数据挖掘的技术工具19
1.4.1技术工具20
1.4.2工具选择24
1.5数据挖掘的应用25
1.5.1典型应用25
1.5.2高级应用27
1.6技术难点与发展趋势32
1.6.1常见误解32
1.6.2技术难点33
1.6.3发展趋势34
1.7本章小结35
思考题35
第2章 概率统计理论基础36
2.1引言36
2.2概率统计知识基础36
2.3随机变量的分布函数37
2.3.1多维随机变量37
2.3.2条件分布39
2.4统计推理40
2.5参数估计41
2.5.1估计理论41
2.5.2最大似然估计43
2.5.3贝叶斯估计44
2.6假设检验45
2.7数据采样方法45
2.8本章小结47
思考题47
第3章 数据挖掘效果评价48
3.1引言48
3.2模型的评分函数48
3.2.1基本概念48
3.2.2预测模型的评分函数49
3.2.3描述模型的评分函数52
3.3模型的比较与验证54
3.3.1模型比较54
3.3.2模型验证55
3.4模型的性能提升55
3.4.1增量学习56
3.4.2半监督学习57
3.4.3迁移学习59
3.4.4反模型60
3.4.5 Boosting61
3.5模型的建立与使用62
3.5.1模型的建立62
3.5.2模型的理解62
3.5.3模型的使用62
3.6本章小结63
思考题63
第4章 数据预处理64
4.1引言64
4.2数据预处理知识基础64
4.3数据清理65
4.3.1遗漏值65
4.3.2噪声数据65
4.3.3不一致数据67
4.4数据集成67
4.5数据转换68
4.6数据规约69
4.6.1数据方聚集69
4.6.2维归约70
4.6.3数据压缩71
4.6.4数值归约73
4.7数据离散78
4.8应用实例分析80
4.8.1腹围空缺数值归一化弥补方法80
4.8.2 Ⅱ型糖尿病数据预处理87
4.9本章小结91
思考题91
第5章 数据仓库93
5.1引言93
5.2数据仓库知识基础93
5.2.1基本概念93
5.2.2基本作用94
5.2.3与数据挖据的关系94
5.3数据仓库中的模型95
5.3.1概念模型95
5.3.2物理模型96
5.3.3元数据模型98
5.3.4多维数据模型99
5.4数据仓库系统结构100
5.4.1组成100
5.4.2数据仓库概念结构101
5.4.3数据仓库结构类型102
5.5 OLAP分析103
5.5.1知识基础103
5.5.2多维分析105
5.5.3 OLAP结构107
5.5.4多维数据库108
5.5.5关系数据库108
5.6本章小结109
思考题109
第6章 数据分类分析110
6.1引言110
6.2分类分析知识基础110
6.2.1基本概念110
6.2.2基本作用110
6.2.3评价方法110
6.3主要技术方法及分析112
6.4贝叶斯分类114
6.4.1朴素贝叶斯分类法115
6.4.2贝叶斯网络117
6.4.3动态贝叶斯网络118
6.5基于决策树的算法119
6.5.1基本思想119
6.5.2 ID3算法119
6.5.3 C4.5算法120
6.5.4 SLIQ算法123
6.5.5 SPRINT算法123
6.6神经网络与遗传算法124
6.6.1神经网络124
6.6.2遗传算法127
6.7支持向量机129
6.8粗糙集与模糊集133
6.8.1粗糙集133
6.8.2模糊集136
6.9最大熵模型137
6.10应用实例分析141
6.10.1汉语句义类型识别141
6.10.2特定音频事件识别145
6.11本章小结155
思考题155
第7章 数据聚类分析156
7.1引言156
7.2聚类分析知识基础156
7.2.1基本概念156
7.2.2基本作用156
7.2.3近邻测度157
7.2.4评价方法159
7.3主要技术方法及分析160
7.4基于划分的算法162
7.4.1基本思想162
7.4.2 K-means算法162
7.4.3 K-medoids算法163
7.4.4 CLARANS算法163
7.5基于层次的算法164
7.5.1基本思想164
7.5.2 BIRCH算法165
7.5.3 CURE算法166
7.5.4 ROCK算法166
7.5.5 Chameleon算法167
7.6基于密度的算法168
7.6.1基本思想168
7.6.2 DBSCAN算法169
7.6.3 OPTICS算法169
7.6.4 DENCLUE算法170
7.7基于网格的算法171
7.7.1基本思想171
7.7.2 STING算法171
7.7.3 Wave Cluster算法172
7.7.4 CLIQUE算法173
7.8基于模型的算法174
7.8.1基本思想174
7.8.2 EM算法174
7.8.3 COBWEB算法174
7.8.4自组织神经网络175
7.9应用实例分析176
7.9.1镜头聚类176
7.9.2文本聚类180
7.10本章小结188
思考题188
第8章 关联规则发现189
8.1引言189
8.2关联规则发现知识基础189
8.2.1基本概念189
8.2.2评价方法189
8.2.3注意事项191
8.3主要技术方法及分析192
8.4关联规则的基本算法193
8.4.1 Apriori算法193
8.4.2 FP-树频集算法194
8.4.3 CIoSpan195
8.5并行和分布式关联规则算法200
8.5.1并行关联规则200
8.5.2分布式关联规则202
8.6多层次关联规则算法203
8.7数量关联规则算法204
8.8应用实例分析——蠕虫检测205
8.9本章小结212
思考题212
第9章 统计预测方法213
9.1引言213
9.2统计预测方法知识基础213
9.3主要技术方法及分析214
9.4回归预测方法215
9.4.1线性和多元回归215
9.4.2非线性回归215
9.5 Box-Jenkins回归216
9.6隐马模型217
9.6.1隐马尔可夫模型218
9.6.2隐半马尔可夫模型224
9.7应用实例分析226
9.7.1 Ⅱ型糖尿病发病危险状态预测226
9.7.2关键人物判定231
9.8本章小结239
思考题239
参考文献240