图书介绍
数据挖掘教程PDF|Epub|txt|kindle电子书版本网盘下载
- 邓纳姆(MargaretH.Dunham)著;郭崇慧,田凤占,靳晓明等译;陆玉昌审校 著
- 出版社: 北京:清华大学出版社
- ISBN:7302105332
- 出版时间:2005
- 标注页数:280页
- 文件大小:15MB
- 文件页数:298页
- 主题词:数据采集-教材
PDF下载
下载说明
数据挖掘教程PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1部分 导论3
第1章 概述3
目录3
1.1 基本数据挖掘任务5
1.1.1 分类5
1.1.2 回归5
1.1.3 时间序列分析6
1.1.4 预测6
1.1.5 聚类7
1.1.6 汇总7
1.1.7 关联规则7
1.2 数据挖掘与数据库中的知识发现8
1.1.8 序列发现8
1.2.1 数据挖掘的发展10
1.3 数据挖掘问题12
1.4 数据挖掘度量13
1.5 数据挖掘的社会影响14
1.6 从数据库观点看数据挖掘14
1.7 数据挖掘的未来发展15
1.8 练习16
1.9 参考文献注释17
第2章 相关概念19
2.1 数据库/OLTP系统19
2.2 模糊集和模糊逻辑21
2.3 信息检索23
2.4 决策支持系统25
2.5 维数据建模25
2.5.1 多维模式27
2.5.2 索引30
2.6 数据仓储31
2.7 OLAP34
2.8 Web搜索引擎35
2.9 统计学36
2.10 机器学习37
2.11 模式匹配38
2.14 参考文献注释39
2.13 练习39
2.12 小结39
第3章 数据挖掘技术41
3.1 引言41
3.2 数据挖掘的统计方法42
3.2.1 点估计42
3.2.2 基于汇总的模型45
3.2.3 贝叶斯定理46
3.2.4 假设检验48
3.2.5 回归和相关49
3.3 相似性度量50
3.4 决策树51
3.5 神经网络53
3.5.1 激励函数56
3.6 遗传算法57
3.7 练习60
3.8 参考文献注释61
第2部分 核心课题65
第4章 分类65
4.1 引言65
4.1.1 分类中的问题67
4.2 基于统计的算法69
4.2.1 回归69
4.2.2 贝叶斯分类74
4.3.1 简单方法76
4.3 基于距离的算法76
4.3.2 K最近邻77
4.4 基于决策树的算法79
4.4.1 ID383
4.4.2 C4.5和C5.085
4.4.3 CART87
4.4.4 可伸缩的决策树技术88
4.5 基于神经网络的算法88
4.5.1 传播90
4.5.2 神经网络有指导学习91
4.5.3 径向基函数网络95
4.5.4 感知器96
4.6 基于规则的算法96
4.6.1 从决策树生成规则97
4.6.2 从神经网络生成规则98
4.6.3 不用决策树或神经网络生成规则98
4.7 组合技术101
4.8 小结103
4.9 练习103
4.10 参考文献注释104
第5章 聚类107
5.1 引言107
5.2 相似性和距离度量110
5.3 异常点111
5.4 层次算法112
5.4.1 凝聚算法113
5.4.2 分裂聚类117
5.5 划分算法118
5.5.1 最小生成树118
5.5.2 平方误差聚类算法119
5.5.3 K均值聚类120
5.5.4 最近邻算法121
5.5.5 PAM算法122
5.5.6 结合能量算法125
5.5.7 基于遗传算法的聚类125
5.5.8 基于神经网络的聚类126
5.6 大型数据库聚类128
5.6.1 BIRCH129
5.6.2 DBSCAN130
5.6.3 CURE算法132
5.7 对类别属性进行聚类135
5.8 比较137
5.9 练习138
5.10 参考文献注释138
第6章 关联规则141
6.1 引言141
6.2 大项目集144
6.3 基本算法145
6.3.1 Apriori算法145
6.3.2 抽样算法149
6.3.3 划分152
6.4.1 数据并行154
6.4 并行和分布式算法154
6.4.2 任务并行155
6.5 方法比较157
6.6 增量规则158
6.7 高级关联规则技术159
6.7.1 泛化关联规则159
6.7.2 多层关联规则160
6.7.3 数量关联规则160
6.7.4 使用多个最小支持度161
6.7.5 相关规则162
6.8 度量规则的质量162
6.10 参考文献注释164
6.9 练习164
第3部分 高级课题169
第7章 Web挖掘169
7.1 引言169
7.2 Web内容挖掘170
7.2.1 爬虫171
7.2.2 Harvest系统174
7.2.3 虚拟Web视图174
7.2.4 个性化175
7.3 Web结构挖掘176
7.3.1 PageRank177
7.3.2 Clever177
7.4 Web使用挖掘178
7.4.1 预处理179
7.4.2 数据结构181
7.4.3 模式发现182
7.4.4 模式分析187
7.5 练习188
7.6 参考文献注释188
第8章 空间数据挖掘190
8.1 引言190
8.2 空间数据概述191
8.2.1 空间查询191
8.2.2 空间数据结构191
8.3 空间数据挖掘原语195
8.2.3 主题地图195
8.2.4 图像数据库195
8.4 般化和特殊化196
8.4.1 渐进求精196
8.4.2 一般化197
8.4.3 最近邻199
8.4.4 STING199
8.5 空间规则201
8.5.1 空间关联规则201
8.6 空间分类算法203
8.6.1 对ID3的扩展203
8.6.2 空间决策树203
8.7 空间聚类算法204
8.7.1 对CLARANS的扩展205
8.7.2 SD(CLARANS)206
8.7.3 DBCLASD206
8.7.4 BANG207
8.7.5 WaveCluster208
8.7.6 近似208
8.8 练习209
8.9 参考文献注释209
第9章 时序数据挖掘211
9.1 引言211
9.2 时序事件建模213
9.3.1 时间序列分析217
9.3 时间序列217
9.3.2 趋势分析218
9.3.3 变换219
9.3.4 相似性219
9.3.5 预测220
9.4 模式检测221
9.4.1 串匹配222
9.5 时序序列224
9.5.1 AprioriAll225
9.5.2 SPADE226
9.5.3 一般化227
9.6 时序关联规则229
9.5.4 特征抽取229
9.6.1 事务间关联规则230
9.6.2 情节规则230
9.6.3 趋势依赖231
9.6.4 序列关联规则233
9.6.5 日历关联规则233
9.7 练习234
9.8 参考文献注释234
附录A 数据挖掘产品236
A.1 参考文献注释252
附录B 参考文献253
词汇表268