图书介绍

数据仓库与数据挖掘PDF|Epub|txt|kindle电子书版本网盘下载

数据仓库与数据挖掘
  • 龙军,章成源编著 著
  • 出版社: 长沙:中南大学出版社
  • ISBN:9787548731719
  • 出版时间:2018
  • 标注页数:258页
  • 文件大小:33MB
  • 文件页数:274页
  • 主题词:数据库系统;数据采集

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据仓库与数据挖掘PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 数据仓库的概念与体系结构1

1.1 数据仓库的兴起1

1.1.1 数据管理技术的发展1

1.1.2 数据仓库的萌芽3

1.2 数据仓库的基本概念4

1.2.1 元数据4

1.2.2 数据粒度5

1.2.3 数据模型5

1.2.4 ETL6

1.2.5 数据集市7

1.3 数据仓库的特点与组成8

1.3.1 数据仓库的特点8

1.3.2 数据仓库的组成11

1.4 数据仓库的体系结构15

1.4.1 传统的数据仓库体系结构15

1.4.2 传统数据仓库系统在大数据时代所面临的挑战16

1.4.3 大数据时代的数据仓库20

习题23

第2章 数据24

2.1 数据的概念与内容24

2.2 数据属性与数据集28

2.3 数据预处理29

2.3.1 数据预处理概述30

2.3.2 数据清洗31

2.3.3 数据集成35

2.3.4 数据变换38

2.3.5 数据归约39

习题47

第3章 数据存储49

3.1 数据仓库的数据模型49

3.1.1 数据仓库的概念模型50

3.1.2 数据仓库的逻辑模型52

3.1.3 数据仓库的物理模型54

3.2 元数据存储55

3.2.1 元数据的概念55

3.2.2 元数据的分类方法55

3.2.3 元数据的管理57

3.2.4 元数据的作用58

3.3 数据集市59

3.3.1 数据集市的概念59

3.3.2 数据集市的类型60

3.3.3 数据集市的建立60

3.4 大数据存储技术61

3.4.1 大数据的概念61

3.4.2 传统数据库的局限62

3.4.3 NoSQL数据库63

3.4.4 几种主流的NoSQL数据库64

习题64

第4章 OLAP与数据立方体65

4.1 OLAP的概念65

4.1.1 OLAP的定义65

4.1.2 OLAP的准则66

4.1.3 OLAP的特征69

4.2 多维分析的基本分析动作70

4.2.1 切片70

4.2.2 切块71

4.2.3 钻取72

4.2.4 旋转72

4.3 OLAP的数据模型73

4.3.1 ROLAP数据模型73

4.3.2 MOLAP数据模型75

4.3.3 MOLAP和ROLAP的数据组织与应用比较76

4.3.4 HOLAP数据模型77

4.4 数据立方体的基本概念78

4.4.1 数据立方体中的一些概念78

4.4.2 数据立方体计算的一般策略79

4.5 数据立方体的计算方法80

4.5.1 多路数组策略计算完全立方体80

4.5.2 从顶点方体向下计算冰山立方体80

4.5.3 使用动态星树结构计算冰山立方体81

4.5.4 快速高维OLAP预计算壳片段82

习题83

第5章 数据挖掘基础84

5.1 数据挖掘的兴起84

5.1.1 数据挖掘的发展历程84

5.1.2 数据挖掘的概述85

5.1.3 大规模数据挖掘86

5.2 数据挖掘的任务87

5.2.1 关联规则87

5.2.2 聚类分析88

5.2.3 分类分析89

5.2.4 回归分析90

5.2.5 相关分析91

5.2.6 异常检测92

5.3 数据挖掘的流程92

5.3.1 数据挖掘对象92

5.3.2 数据挖掘分类93

5.3.3 知识发现的过程94

习题96

第6章 关联挖掘97

6.1 关联规则的概念和分类97

6.1.1 关联规则的概念97

6.1.2 关联规则的分类99

6.2 Apriori算法100

6.2.1 Apriori算法概述100

6.2.2 Apriori算法的性质与步骤100

6.2.3 Apriori算法的实例101

6.2.4 从频繁项集产生关联规则103

6.3 FP-Growth算法104

6.3.1 FP-tree的建立105

6.3.2 FP-tree上挖掘关联规则106

6.4 挖掘算法的进阶算法107

习题110

第7章 聚类分析112

7.1 聚类分析概述112

7.1.1 聚类分析的定义112

7.1.2 聚类分析的分类113

7.2 差异度的计算方法114

7.2.1 聚类算法中的数据结构114

7.2.2 区间标度变量的差异度计算115

7.2.3 二元变量的差异度计算116

7.2.4 标称型变量的差异度计算117

7.2.5 序数型变量的差异度计算118

7.2.6 比例标度型变量的差异度计算119

7.2.7 混合类型变量的差异度计算119

7.3 基于分割的聚类方法120

7.3.1 分割聚类方法的描述120

7.3.2 K-means均值算法121

7.3.3 PAM算法122

7.3.4 CLARA算法和CLARANS算法125

7.4 基于密度的聚类方法126

7.4.1 基于密度的聚类方法描述126

7.4.2 DBSCAN算法127

7.4.3 OPTICS算法129

7.5 谱聚类方法130

7.5.1 谱聚类描述130

7.5.2 谱聚类算法描述131

7.5.3 谱聚类实例132

7.6 ICA聚类分析133

7.6.1 ICA的起源和目的133

7.6.2 ICA模型和应用要求133

7.6.3 ICA应用场合135

习题135

第8章 分类137

8.1 分类的基本知识137

8.1.1 分类的概念137

8.1.2 分类的评价标准138

8.1.3 分类的主要方法138

8.2 决策树分类139

8.2.1 决策树算法概述139

8.2.2 决策树的生成141

8.2.3 决策树中规则的提取142

8.2.4 ID3算法143

8.2.5 C4.5算法145

8.2.6 蒙特卡洛树搜索(MCTS)算法146

8.3 SVM预测147

8.3.1 线性可分的SVM147

8.3.2 线性不可分的SVM150

8.3.3 SVM的实现——手写数字图片的识别153

8.4 KNN算法154

8.4.1 KNN算法的描述155

8.4.2 KNN算法的实现156

习题157

第9章 神经网络159

9.1 神经网络概述与定义159

9.1.1 神经网络概述159

9.1.2 神经网络的学习过程160

9.2 限制玻尔兹曼机(RBM)161

9.2.1 RBM的定义161

9.2.2 RBM的能量模型与学习方法162

9.3 深度信念网络165

9.3.1 DBN反向传播算法介绍与改进165

9.3.2 DNN分类与代价函数选择170

9.4 卷积神经网络(CNN)173

9.4.1 卷积神经网络定义与结构173

9.4.2 CNN两个特点与图形实例176

9.5 循环神经网络(RNN)179

9.5.1 RNN概述180

9.5.2 RNN训练181

9.5.3 LSTMs网络与函数展示图例182

习题186

第10章 统计分析188

10.1 回归分析188

10.1.1 一元线性回归188

10.1.2 多元线性回归191

10.1.3 非线性回归193

10.2 EM算法194

10.2.1 EM算法的引入194

10.2.2 EM算法的推导196

10.2.3 EM算法的收敛性197

10.3 Bayes分类199

10.3.1 Bayes定理199

10.3.2 简单Bayes分类200

10.3.3 Bayes信念网络201

10.3.4 Bayes网络的应用203

习题203

第11章 非结构化数据挖掘204

11.1 文本数据挖掘204

11.1.1 文本数据挖掘的概念204

11.1.2 文本数据挖掘技术208

11.2 Web数据挖掘214

11.2.1 Web数据挖掘的概念215

11.2.2 Web数据挖掘的分类216

11.2.3 Web数据挖掘的应用220

11.3 多媒体数据挖掘221

11.3.1 多媒体数据挖掘的概念222

11.3.2 多媒体数据挖掘的分类223

习题225

第12章 知识图谱227

12.1 知识图谱构建227

12.1.1 知识图谱的概述227

12.1.2 知识图谱的数据来源229

12.1.3 多源异构数据的融合231

12.1.4 知识图谱的表示232

12.2 知识图谱技术233

12.2.1 实体抽取234

12.2.2 关系抽取235

12.2.3 知识推理236

12.3 知识图谱的典型应用238

12.3.1 查询理解238

12.3.2 自动问答240

12.3.3 前景和挑战240

习题241

第13章 大数据挖掘算法242

13.1 Hadoop介绍242

13.1.1 Hadoop的基本概念242

13.1.2 Hadoop的基本组件244

13.2 基于MapReduce数据挖掘算法247

13.2.1 基于MapReduce的K-means并行算法248

13.2.2 基于MapReduce的分类算法251

13.2.3 基于MapReduce的序列模式挖掘算法253

习题255

参考文献256

热门推荐