图书介绍

R高性能编程 用整套解决方案与高超技巧突破性能瓶颈PDF|Epub|txt|kindle电子书版本网盘下载

R高性能编程 用整套解决方案与高超技巧突破性能瓶颈
  • 利姆,Tjhi著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121273964
  • 出版时间:2015
  • 标注页数:144页
  • 文件大小:42MB
  • 文件页数:160页
  • 主题词:程序语言-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

R高性能编程 用整套解决方案与高超技巧突破性能瓶颈PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

1 理解R的性能:为什么R程序有时候很慢?1

计算性能的三个限制因素:CPU、RAM和磁盘I/O2

R是运行时解释的4

R是单线程的5

R需要将全部数据加载到内存5

算法设计影响时间和空间复杂度6

小结9

2 性能分析:衡量代码的性能11

衡量总运行时间11

使用system.time()衡量运行时间12

使用rbenchmark重复衡量运行时间13

使用microbenchmark衡量运行时间的分布15

分析运行时间16

使用Rprof()分析函数的性能16

性能分析的结果18

分析内存使用情况20

使用OS工具监控内存、CPU使用情况和磁盘I/O22

瓶颈的发现及解决23

小结26

3 加快R运行的简单方法27

向量化27

使用内置函数29

预分配内存30

使用更简单的数据结构33

使用哈希表进行大型数据上的频繁查找34

去CRAN寻找更快的包35

小结36

4 使用编译代码加快运行速度37

在运行之前编译R代码37

编译函数38

即时编译(JIT)R代码41

在R中使用编译语言41

前提条件42

以内联形式包含编译代码42

调用外部编译代码46

使用编译代码的注意事项49

小结52

5 使用GPU让R运行得更快53

GPU上的通用计算53

R和GPU54

安装gputools55

使用gputools实现快速统计建模55

小结59

6 减少内存使用的简单方法61

重用对象而不多占用内存61

删除不再需要的中间数据66

运行时计算值而不是永久性存储值69

交换活跃数据和非活跃数据71

小结71

7 使用有限的内存处理大型数据集73

使用节约内存的数据结构73

更小的数据类型76

稀疏矩阵77

对称矩阵78

比特向量79

使用内存映射文件并以块的形式处理数据80

bigmemory包81

ff包85

小结89

8 使用并行计算加倍提升性能91

数据并行性v.s.任务并行性91

实现数据并行的算法95

实现任务并行的算法98

集群节点运行同一个任务时98

集群节点运行多个不同任务时100

计算机集群并行执行多个任务102

共享内存并行性v.s.分布式内存并行性104

优化并行的性能108

小结109

9 将数据处理交给数据库系统111

将数据抽取到R v.s.在数据库中处理数据111

在关系型数据库中使用SQL进行数据预处理112

将R表达式转化为SQL116

使用dplyr117

使用PivotalR119

在数据库中运行统计和机器学习算法122

使用列式数据库提升性能125

使用数据库阵列最大化科学计算的性能128

小结129

10 R和大数据131

理解Hadoop131

在Amazon Web Services上配置Hadoop133

使用Hadoop批量处理大型数据集136

将数据上传到HDFS136

使用RHadoop分析HDFS数据138

R中的其他Hadoop包142

小结143

热门推荐