图书介绍
Python数据科学 技术详解与商业实践PDF|Epub|txt|kindle电子书版本网盘下载
![Python数据科学 技术详解与商业实践](https://www.shukui.net/cover/3/34507552.jpg)
- 常国珍,赵仁乾,张秋剑著 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111603092
- 出版时间:2018
- 标注页数:424页
- 文件大小:44MB
- 文件页数:435页
- 主题词:软件工具-程序设计
PDF下载
下载说明
Python数据科学 技术详解与商业实践PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据科学家的武器库1
1.1 数据科学的基本概念1
1.2 数理统计技术5
1.2.1 描述性统计分析5
1.2.2 统计推断与统计建模7
1.3 数据挖掘的技术与方法7
1.4 描述性数据挖掘算法示例9
1.4.1 聚类分析——客户细分9
1.4.2 关联规则分析10
1.5 预测性数据挖掘算法示例11
1.5.1 决策树11
1.5.2 KNN算法11
1.5.3 Logistic回归12
1.5.4 神经网络12
1.5.5 支持向量机13
1.5.6 集成学习14
1.5.7 预测类模型讲解15
1.5.8 预测类模型评估概述17
第2章 Python概述18
2.1 Python概述18
2.1.1 Python简介18
2.1.2 Python与数据科学18
2.1.3 Pyhon2与Python319
2.2 Anaconda Python的安装、使用20
2.2.1 下载与安装20
2.2.2 使用Jupyter Notebook21
2.2.3 使用Spyder22
2.2.4 使用conda或pip管理第三方库24
第3章 数据科学的Python编程基础26
3.1 Python的基本数据类型26
3.1.1 字符串(str)26
3.1.2 浮点数和整数(float、int)27
3.1.3 布尔值(Bool:True/False)28
3.1.4 其他29
3.2 Python的基本数据结构29
3.2.1 列表(list)30
3.2.2 元组(tuple)31
3.2.3 集合(set)31
3.2.4 字典(dict)32
3.3 Python的程序控制33
3.3.1 三种基本的编程结构简介33
3.3.2 顺承结构33
3.3.3 分支结构34
3.3.4 循环结构35
3.4 Pyhon的函数与模块38
3.4.1 Python的函数38
3.4.2 Python的模块40
3.5 Pandas读取结构化数据41
3.5.1 读取数据42
3.5.2 写出数据44
第4章 描述性统计分析与绘图46
4.1 描述性统计进行数据探索46
4.1.1 变量度量类型与分布类型46
4.1.2 分类变量的统计量48
4.1.3 连续变量的分布与集中趋势49
4.1.4 连续变量的离散程度51
4.1.5 数据分布的对称与高矮52
4.2 制作报表与统计制图53
4.3 制图的步骤58
第5章 数据整合和数据清洗64
5.1 数据整合65
5.1.1 行列操作65
5.1.2 条件查询67
5.1.3 横向连接70
5.1.4 纵向合并72
5.1.5 排序74
5.1.6 分组汇总75
5.1.7 拆分、堆叠列77
5.1.8 赋值与条件赋值79
5.2 数据清洗82
5.2.1 重复值处理82
5.2.2 缺失值处理83
5.2.3 噪声值处理84
5.3 RFM方法在客户行为分析上的运用90
5.3.1 行为特征提取的RFM方法论90
5.3.2 使用RFM方法计算变量91
5.3.3 数据整理与汇报92
第6章 数据科学的统计推断基础94
6.1 基本的统计学概念94
6.1.1 总体与样本94
6.1.2 统计量95
6.1.3 点估计、区间估计和中心极限定理95
6.2 假设检验与单样本t检验100
6.2.1 假设检验100
6.2.2 单样本t检验102
6.3 双样本t检验103
6.4 方差分析(分类变量和连续变量关系检验)105
6.4.1 单因素方差分析106
6.4.2 多因素方差分析110
6.5 相关分析(两连续变量关系检验)112
6.5.1 相关系数112
6.5.2 散点矩阵图116
6.6 卡方检验(二分类变量关系检验)118
6.6.1 列联表118
6.6.2 卡方检验120
第7章 客户价值预测:线性回归模型与诊断122
7.1 线性回归123
7.1.1 简单线性回归124
7.1.2 多元线性回归130
7.1.3 多元线性回归的变量筛选133
7.2 线性回归诊断136
7.2.1 残差分析137
7.2.2 强影响点分析142
7.2.3 多重共线性分析144
7.2.4 小结线性回归诊断147
7.3 正则化方法148
7.3.1 岭回归149
7.3.2 LASSO回归155
第8章 Logistic回归构建初始信用评级159
8.1 Logistic回归的相关关系分析160
8.2 Logistic回归模型及实现162
8.2.1 Logistic回归与发生比162
8.2.2 Logistic回归的基本原理164
8.2.3 在Python中实现Logistic回归165
8.3 Logistic回归的极大似然估计170
8.3.1 极大似然估计的概念170
8.3.2 Logistics回归的极大似然估计171
8.4 模型评估172
8.4.1 模型评估方法172
8.4.2 ROC曲线的概念172
8.4.3 在Python中实现ROC曲线176
第9章 使用决策树进行初始信用评级179
9.1 决策树概述179
9.2 决策树算法180
9.2.1 ID3建树算法原理181
9.2.2 C4.5建树算法原理184
9.2.3 CART建树算法原理187
9.2.4 决策树的剪枝189
9.3 在Python中实现决策树192
9.3.1 建模193
9.3.2 模型评估195
9.3.3 决策树的可视化196
9.3.4 参数搜索调优198
第10章 神经网络201
10.1 神经元模型202
10.2 单层感知器203
10.3 BP神经网络206
10.4 多层感知器的scikit-learn代码实现210
第11章 分类器入门:最近邻域与朴素贝叶斯215
11.1 KNN算法215
11.1.1 KNN算法原理215
11.1.2 在Python中实现KNN算法217
11.2 朴素贝叶斯分类220
11.2.1 贝叶斯公式221
11.2.2 朴素贝叶斯分类原理221
11.2.3 朴素贝叶斯的参数估计222
11.2.4 在Python中实现朴素贝叶斯223
第12章 高级分类器:支持向量机224
12.1 线性可分与线性不可分225
12.2 线性可分支持向量机226
12.2.1 函数间隔和几何间隔227
12.2.2 学习策略227
12.2.3 对偶方法求解229
12.2.4 线性可分支持向量机例题230
12.3 线性支持向量机与软间隔最大化233
12.4 非线性支持向量机与核函数235
12.4.1 核函数236
12.4.2 非线性支持向量机的学习238
12.4.3 示例与Python实现238
12.5 使用支持向量机的案例239
第13章 连续变量的特征选择与转换244
13.1 方法概述245
13.2 主成分分析246
13.2.1 主成分分析简介246
13.2.2 主成分分析原理247
13.2.3 主成分分析的运用250
13.2.4 在Python中实现主成分分析250
13.3 基于主成分的冗余变量筛选253
13.4 因子分析254
13.4.1 因子分析模型255
13.4.2 因子分析算法256
13.4.3 在Python中实现因子分析258
第14章 客户分群与聚类262
14.1 聚类算法概述264
14.2 聚类算法基本概念265
14.2.1 变量标准化与分布形态转换266
14.2.2 变量的维度分析267
14.3 聚类模型的评估268
14.4 层次聚类269
14.4.1 层次聚类原理269
14.4.2 层次聚类在Python中的实现272
14.5 基于划分的聚类276
14.5.1 k-means聚类原理276
14.5.2 k-means聚类的应用场景278
14.5.3 在Python中实现k-means聚类278
14.6 基于密度的聚类283
14.6.1 详谈基于密度聚类283
14.6.2 在Python中实现密度聚类285
14.7 案例:通信客户业务使用偏好聚类286
14.7.1 保持原始变量分布形态进行聚类287
14.7.2 对变量进行分布形态转换后聚类290
第15章 关联规则294
15.1 关联规则294
15.1.1 关联规则的一些概念294
15.1.2 Apriori算法原理295
15.1.3 在Python中实现关联规则298
15.2 序列模式304
15.2.1 序列模式简介与概念304
15.2.2 序列模式算法305
15.2.3 在Python中实现序列模式308
第16章 排序模型的不平衡分类处理318
16.1 不平衡分类概述318
16.2 欠采样法320
16.2.1 随机欠采样法320
16.2.2 Tomek Link法321
16.3 过采样法321
16.3.1 随机过采样法322
16.3.2 SMOTE法322
16.4 综合采样法323
16.5 在Python中实现不平衡分类处理323
第17章 集成学习328
17.1 集成学习概述328
17.2 Bagging330
17.2.1 Bagging算法实现330
17.2.2 随机森林331
17.3 Boosting332
17.4 偏差(Bias)、方差(Variance)与集成方法334
17.4.1 偏差与方差334
17.4.2 Bagging与Boosting的直观理解335
第18章 时间序列建模337
18.1 认识时间序列337
18.2 效应分解法时间序列分析338
18.3 平稳时间序列分析ARMA模型343
18.3.1 平稳时间序列343
18.3.2 ARMA模型344
18.3.3 在Python中进行AR建模348
18.4 非平稳时间序列分析ARIMA模型351
18.4.1 差分与ARIMA模型352
18.4.2 在Python中进行ARIMA建模354
18.5 ARIMA方法建模总结363
第19章 商业数据挖掘案例365
19.1 个人贷款违约预测模型365
19.1.1 数据介绍366
19.1.2 业务分析369
19.1.3 数据理解369
19.1.4 数据整理371
19.1.5 建立分析模型375
19.1.6 模型运用376
19.1.7 流程回顾377
19.2 慈善机构精准营销案例377
19.2.1 构造营销响应模型379
19.2.2 构造客户价值预测模型389
19.2.3 制订营销策略393
19.2.4 案例过程回顾与不足394
19.3 旅游企业客户洞察案例395
19.3.1 案例说明395
19.3.2 数据预处理397
19.3.3 使用k-means聚类建模403
19.3.4 对各个簇的特征进行描述405
19.4 个人3C产品精准营销案例409
19.4.1 案例说明409
19.4.2 数据预处理411
19.4.3 建模413
19.4.4 模型评估414
19.4.5 下一步建议417
附录A 数据说明418
参考文献423