图书介绍

数据挖掘技术PDF|Epub|txt|kindle电子书版本网盘下载

数据挖掘技术
  • 朱玉全,杨鹤标,孙蕾编著 著
  • 出版社: 南京:东南大学出版社
  • ISBN:7564105941
  • 出版时间:2006
  • 标注页数:193页
  • 文件大小:12MB
  • 文件页数:204页
  • 主题词:数据采集-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘技术PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

1 绪论1

1.1 数据管理1

1.1.1 人工管理阶段1

1.1.2 文件系统阶段1

1.1.3 数据库系统阶段2

1.2 数据仓库和联机分析处理2

1.3 数据挖掘和知识发现4

1.3.1 数据挖掘的发展4

1.3.4 数据挖掘过程5

1.3.3 数据挖掘的目的5

1.3.2 数据挖掘的对象5

1.3.5 数据挖掘的分类6

1.3.6 数据挖掘方法和技术7

1.3.7 数据挖掘技术的难点9

1.4 数据挖掘工具10

1.4.1 数据挖掘工具的选择11

1.4.2 数据挖掘原型系统11

1.4.3 主要商业产品介绍11

1.5 本章小结12

2.1 数据仓库概念14

2.1.1 数据仓库的产生14

2 数据仓库和联机分析处理14

2.1.2 数据仓库的定义15

2.2 数据仓库中的数据组织18

2.2.1 数据仓库的数据组织结构18

2.2.2 数据仓库的系统结构18

2.3 数据仓库的基本数据模型19

2.3.1 星型模型20

2.3.2 雪花模型20

2.4 数据仓库的实现策略21

2.6 联机分析处理22

2.6.1 基本概念22

2.5 数据仓库与联机分析处理22

2.6.2 多维分析的基本分析动作23

2.6.3 OLAP结构25

2.6.4 OLTP和OLAP的比较25

2.7 数据仓库与数据挖掘26

2.8 本章小结26

3 关联规则挖掘27

3.1 基本概念27

3.2 关联规则的Apriori算法27

3.2.1 Apriori算法28

3.2.2 AprioriTid算法31

3.3 Apriori的改进算法32

3.2.3 AprioriHybrid算法32

3.3.2 基于数据分割(Partition)的方法33

3.3.1 基于散列(Hash)的方法33

3.3.3 基于采样(Sampling)的方法34

3.4 基于FP-tree的关联规则挖掘算法FP-growth34

3.4.1 算法描述34

3.4.2 示例说明35

3.5 多层关联规则挖掘40

3.6 多维关联规则挖掘41

3.7 基于约束的关联规则挖掘41

3.8.1 基本概念42

3.8 数量关联规则挖掘42

3.8.2 数量关联规则的分类43

3.8.3 数量关联规则挖掘的一般步骤44

3.8.4 数值属性离散化问题46

3.9 最大频繁项目集挖掘48

3.9.1 最大频繁项目集49

3.9.2 基于Apriori的最大频繁项目集挖掘算法49

3.9.3 基于FP-tree的最大频繁项目集挖掘算法50

3.10 关联规则更新挖掘算法53

3.10.1 数据集的增量性更新挖掘算法53

3.10.2 算法参数的相似性更新挖掘算法57

3.10.3 基于FP-tree的关联规则更新挖掘算法58

3.10.4 基于FP-tree的最大频繁项目集更新算法60

3.11 一种新的支持度计算方法63

3.11.1 基本概念63

3.11.2 候选频繁项目集的生成65

3.11.3 项目集支持数计算方法65

3.12 负关联规则挖掘算法66

3.12.1 基本概念67

3.12.2 基于Apriori的负关联规则挖掘算法68

3.12.3 基于频繁模式树的负关联规则挖掘算法70

3.13 加权关联规则挖掘算法71

3.13.1 加权关联规则模型72

3.13.2 加权关联规则的发现73

3.14 本章小结77

4 序列模式挖掘78

4.1 问题描述78

4.2 类Apriori(Apriori-based)方法79

4.3 GSP算法82

4.4 基于投影的序列模式挖掘算法PrefixSpan85

4.4.1 基本概念85

4.4.2 算法描述86

4.4.3 示例说明87

4.5 SPADE方法89

4.5.1 基本理论89

4.5.2 支持数(度)计算90

4.5.3 基于前缀分类的格分解92

4.5.4 频繁序列模式搜索93

4.5.5 SPADE算法的设计和实现94

4.6 序列模式增量式更新算法96

4.6.1 基本概念96

4.6.2 算法描述98

4.6.3 示例说明99

4.7 本章小结101

5 分类102

5.1 分类概述102

5.2 决策树(Decision Tree)方法103

5.2.1 决策树方法概述103

5.2.2 决策树方法的理论基础103

5.2.3 决策树的表示106

5.2.4 决策树的生成107

5.3 ID3决策树方法108

5.3.1 ID3算法的决策属性选择方法108

5.3.2 ID3算法示例108

5.4.1 C4.5方法中决策树的构造111

5.3.3 ID3的特点111

5.4 C4.5方法111

5.4.2 处理未知属性值的训练样本112

5.4.3 连续属性的处理112

5.4.4 决策树修剪113

5.4.5 交叉验证114

5.4.6 规则的抽取115

5.5 IBLE决策规则树方法116

5.6 SLIQ:一种快速可扩展的分类算法117

5.6.1 算法的扩展性117

5.6.2 SLIQ分类器118

5.6.3 算法流程120

5.7 SPRINT:一种可扩展的并行分类器123

5.8 贝叶斯方法126

5.8.1 贝叶斯理论126

5.8.2 朴素贝叶斯分类128

5.9 本章小结129

6 聚类分析130

6.1 什么是聚类分析130

6.2 距离和相似系数131

6.2.1 距离132

6.2.2 相似系数133

6.3.1 数据准备135

6.3 聚类分析的过程135

6.3.2 特征生成137

6.3.3 聚类分析137

6.4 聚类分析算法的分类137

6.4.1 划分法137

6.4.4 基于网格的方法138

6.4.5 基于模型的方法138

6.4.6 基于变换的聚类算法138

6.4.3 基于密度的方法138

6.4.2 层次方法138

6.5 常用的聚类算法139

6.5.1 划分法139

6.5.2 层次方法142

6.5.3 基于密度的方法150

6.5.4 基于网格的聚类方法158

6.5.5 基于模型的聚类方法161

6.5.6 模糊聚类算法FCM162

6.5.7 聚类算法性能评价163

6.6 孤立点分析164

6.7 高维空间聚类问题167

6.8 本章小结168

7.1 Web挖掘概述169

7 Web挖掘169

7.2 Web挖掘基本流程170

7.3 Web挖掘分类171

7.3.1 Web内容挖掘171

7.3.2 Web结构挖掘175

7.3.3 Web用法挖掘178

7.4 Web挖掘的应用前景182

7.5 本章小结183

8 基于数据挖掘的医学图像分类184

8.2 医学图像的特征描述185

8.1 分类模型的基本框架185

8.3 医学图像分割及局部组织特征的提取186

8.3.1 医学图像分割186

8.3.2 局部组织特征的提取186

8.4 关联分类规则188

8.4.1 关联分类规则188

8.4.2 频繁关联分类规则挖掘算法189

8.4.3 精确关联分类规则挖掘算法190

8.5 规则比较与分析190

8.6 本章小结191

参考文献192

热门推荐