图书介绍
Python数据科学导论概念技术与应用PDF|Epub|txt|kindle电子书版本网盘下载
![Python数据科学导论概念技术与应用](https://www.shukui.net/cover/8/31342258.jpg)
- (西)劳拉·伊瓜尔,(西)桑蒂·塞吉等著;章宗长,王艺深等译 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111604648
- 出版时间:2018
- 标注页数:190页
- 文件大小:25MB
- 文件页数:202页
- 主题词:软件工具-程序设计
PDF下载
下载说明
Python数据科学导论概念技术与应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据科学概述1
1.1 什么是数据科学1
1.2 关于本书2
第2章 数据专家的工具箱4
2.1 引言4
2.2 为什么选择Python4
2.3 数据专家的基本Python库5
2.3.1 数值和科学计算:NumPy和SciPy5
2.3.2 Scikit-learn : Python中的机器学习库5
2.3.3 Pandas:Python数据分析库5
2.4 数据科学生态系统的安装6
2.5 集成开发环境6
2.5.1 网络集成开发环境:Jupyter7
2.6 数据专家从Python开始7
2.6.1 读取11
2.6.2 选择数据13
2.6.3 筛选数据14
2.6.4 筛选缺失的数据15
2.6.5 处理数据15
2.6.6 排序19
2.6.7 分组数据20
2.6.8 重排数据21
2.6.9 对数据进行排名22
2.6.10 绘图23
2.7 小结24
第3章 描述统计学25
3.1 引言25
3.2 数据准备25
3.2.1 Adult数据集示例26
3.3 探索性数据分析28
3.3.1 汇总数据28
3.3.2 数据分布31
3.3.3 离群点的处理33
3.3.4 测量不对称性:偏度和皮尔逊中值偏度系数36
3.3.5 连续分布38
3.3.6 核密度39
3.4 估计41
3.4.1 样本和估计均值、方差和标准记分41
3.4.2 协方差、皮尔逊相关和斯皮尔曼秩相关42
3.5 小结44
参考文献45
第4章 统计推断46
4.1 引言46
4.2 统计推断:频率论方法46
4.3 测量估计的差异性47
4.3.1 点估计47
4.3.2 置信区间50
4.4 假设检验53
4.4.1 用置信区间检验假设53
4.4.2 使用p值检验假设55
4.5 效应E是真实的吗57
4.6 小结57
参考文献58
第5章 监督学习59
5.1 引言59
5.2 问题60
5.3 第一步60
5.4 什么是学习?69
5.5 学习曲线70
5.6 训练、验证和测试73
5.7 两种学习模型76
5.7.1 学习三要素76
5.7.2 支持向量机77
5.7.3 随机森林79
5.8 结束学习过程80
5.9 商业案例81
5.10 小结83
参考文献83
第6章 回归分析84
6.1 引言84
6.2 线性回归84
6.2.1 简单线性回归85
6.2.2 多元线性回归和多项式回归90
6.2.3 稀疏模型90
6.3 逻辑斯蒂回归97
6.4 小结99
参考文献99
第7章 无监督学习100
7.1 引言100
7.2 聚类100
7.2.1 相似度和距离101
7.2.2 什么是一个好的聚类?定义衡量聚类质量的度量101
7.2.3 聚类技术的分类标准104
7.3 案例学习113
7.4 小结118
参考文献119
第8章 网络分析120
8.1 引言120
8.2 图的基本定义121
8.3 社交网络分析122
8.3.1 NetworkX基础122
8.3.2 实际案例:Facebook数据集123
8.4 中心性125
8.4.1 在图中绘制中心性130
8.4.2 PageRank132
8.5 自我网络134
8.6 社区发现138
8.7 小结139
参考文献139
第9章 推荐系统140
9.1 引言140
9.2 推荐系统如何工作?140
9.2.1 基于内容的过滤141
9.2.2 协作过滤141
9.2.3 混合推荐系统141
9.3 建模用户偏好142
9.4 评估推荐系统142
9.5 实际案例143
9.5.1 MovieLens数据集143
9.5.2 基于用户的协作过滤145
9.6 小结153
参考文献153
第10章 用于情感分析的统计自然语言处理154
10.1 引言154
10.2 数据清洗155
10.3 文本表示158
10.3.1 二元组和n元组163
10.4 实际案例163
10.5 小结168
参考文献168
第11章 并行计算169
11.1 引言169
11.2 架构170
11.2.1 入门指南171
11.2.2 连接到集群(引擎)171
11.3 多核编程172
11.3.1 引擎的直接视图172
11.3.2 引擎的负载均衡视图175
11.4 分布式计算176
11.5 实际应用:纽约出租车旅行177
11.5.1 直接视图非阻塞方案178
11.5.2 实验结果180
11.6 小结182
参考文献182