图书介绍

R语言数据高效处理指南PDF|Epub|txt|kindle电子书版本网盘下载

R语言数据高效处理指南
  • 出版社:
  • ISBN:
  • 出版时间:2019
  • 标注页数:0页
  • 文件大小:172MB
  • 文件页数:216页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

R语言数据高效处理指南PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1部分 基础知识1

第1章 数据处理总论2

1.1 数据处理的定义2

1.2 数据处理的意义3

1.3 数据处理基本工具3

第2章 R语言编程基础6

2.1 下载安装6

2.2 包的使用7

2.3 数据类型8

2.4 数据结构10

2.5 程序控制15

2.6 函数式编程17

第3章 数据处理基本范式19

第2部分 快速入门24

第4章 base-r:基本数据处理25

4.1 数据集及其基本探索25

4.2 基本范式实现27

4.2.1 创建(read.csv/data.frame)27

4.2.2 删除(rm)28

4.2.3 检索(DF[i,j])28

4.2.4 插入(rbind/cbind)31

4.2.5 排序(order)33

4.2.6 过滤(DF[condition,])35

4.2.7 汇总(apply)36

4.2.8 分组(aggregate)36

4.2.9 连接(merge)37

第5章 tidyverse生态系统:简洁高效数据处理40

5.1 tidyverse生态系统简介40

5.2 基本范式实现41

5.2.1 包的加载(p_load)41

5.2.2 创建(read_csv/tibble)42

5.2.3 删除(rm)45

5.2.4 检索(select/slice)46

5.2.5 插入(add/bind)50

5.2.6 排序(arrange)54

5.2.7 过滤(filter)56

5.2.8 汇总(summarise)59

5.2.9 分组(group_by)61

5.2.10 连接(join)63

5.3 高级处理工具67

5.3.1 长宽数据变换(gather/spread)68

5.3.2 集合运算(intersect/union/setdiff)70

5.3.3 窗口函数(rank/lead/lag/cum)74

5.3.4 连接数据库:对SQL的支持(dbplyr)81

5.3.5 巧妙写函数:变量的引用85

第3部分 高级进阶93

第6章 data.table:高速数据处理94

6.1 data.table简介94

6.2 基本范式实现96

6.2.1 创建(fread/data.table/setDT)96

6.2.2 删除(rm/file.remove)100

6.2.3 检索(DT[ij,by])101

6.2.4 插入(DT[,new.column:=anything,])105

6.2.5 排序(DT[order[x],,])107

6.2.6 过滤(DT[conditionj,by])108

6.2.7 汇总(DT[i,summary_function,by])109

6.2.8 分组(DT[i,j,by])110

6.2.9 连接(merge)111

6.3 高级特性探索116

6.3.1 原位更新(set*/:=)116

6.3.2 高速过滤(DT[filter_condition,j,by,on=.(x)])119

6.3.3 长宽数据转换(melt/dcast)121

第7章 sparklyr:分布式数据处理128

7.1 连接R与Spark:sparklyr包简介128

7.2 基本操作指南130

7.3 存储机制简介135

7.4 分布式计算136

第4部分 实战应用139

第8章 航班飞行数据演练140

8.1 nycflights13数据集探索140

8.2 flights14数据集探索148

第9章 测试155

第10章 实用数据处理技巧157

10.1 数据存取157

10.1.1 令人头疼的编码格式(encoding)157

10.1.2 读写性能竞速赛(fst/feather & data.table/readr)158

10.1.3 数据存取转换的瑞士军刀(rio)162

10.2 并行计算(doParallel)164

10.3 混合编程168

第11章 实战案例:网络爬虫与文本挖掘173

11.1 网络爬取(rvest)174

11.2 文本挖掘(tidytext)177

第12章 实战案例:数据塑型与可视化(ggplot2)180

12.1 数据准备181

12.2 柱状图(geom_bar)182

12.3 折线图(geom_line)183

12.4 饼图(ggpie)184

12.5 一行代码实现一页多图(gridExtra)186

第13章 实战案例:机器学习193

13.1 机器学习概述193

13.2 为什么要做机器学习193

13.3 如何入门机器学习194

13.4 数据处理与机器学习195

13.5 案例分析:信贷风险预测模型构建195

致谢204

热门推荐