图书介绍
并行计算导论PDF|Epub|txt|kindle电子书版本网盘下载
![并行计算导论](https://www.shukui.net/cover/17/31368793.jpg)
- 雷向东,雷振阳,龙军编著 著
- 出版社: 长沙:中南大学出版社
- ISBN:9787548733737
- 出版时间:2018
- 标注页数:288页
- 文件大小:39MB
- 文件页数:301页
- 主题词:并行算法;并行程序-程序设计
PDF下载
下载说明
并行计算导论PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 并行计算机体系结构1
1.1 并行计算1
1.2 计算机的四个发展阶段2
1.3 高性能计算机的发展3
1.4 计算机体系结构的弗林分类方法4
1.5 SIMD体系结构5
1.6 MIMD体系结构6
1.6.1 共享存储器的组成6
1.6.2 消息传递系统的组成7
1.7 并行计算机类型8
1.8 本章小结9
第2章 多处理器互连网络11
2.1 系统互连11
2.2 互连网络的分类13
2.2.1 按操作方式分类13
2.2.2 按控制策略分类13
2.2.3 按交换技术分类13
2.2.4 按拓扑结构分类13
2.3 动态互连网络15
2.3.1 基于总线的动态互连网络15
2.3.2 基于交换的互连网络16
2.4 静态互连网络18
2.4.1 全连接网络18
2.4.2 有限连接网络19
2.5 标准互联网络23
2.6 并行计算机访存模型26
2.6.1 UMA模型26
2.6.2 NUMA模型26
2.6.3 COMA模型28
2.6.4 CC-NUMA模型28
2.6.5 NORMA模型29
2.6.6 并行机系统存储结构分类30
2.7 并行机系统结构30
2.8 本章小结36
第3章 多处理器体系结构性能分析38
3.1 并行计算机系统性能指标38
3.2 Amdahl定律40
3.3 Gustafson定律42
3.4 Sun-Ni定律42
3.5 并行体系结构的可扩展性43
3.6 基准测试程序44
3.7 本章小结46
第4章 共享存储器系统47
4.1 共享存储器分类48
4.2 减少存储器访问冲突方法49
4.2.1 造成热冲突的原因50
4.2.2 减少热点冲突的策略51
4.3 基于总线的对称多处理机系统54
4.4 共享存储器系统高速缓存一致性55
4.4.1 高速缓存-存储器一致性55
4.4.2 高速缓存-高速缓存一致性55
4.4.3 造成高速缓存与主存不一致的原因56
4.4.4 高速缓存与高速缓存之间不一致的原因56
4.4.5 共享存储器系统高速缓存一致性方法58
4.5 基于监听总线协议59
4.5.1 写-无效通写协议59
4.5.2 写-无效和回写协议61
4.5.3 写一次协议63
4.5.4 写更新和部分通写协议66
4.5.5 写-更新和回写协议68
4.6 基于目录的协议71
4.6.1 全映射目录71
4.6.2 有限目录73
4.6.3 链式目录74
4.6.4 使无效协议75
4.7 共享存储器的编程模型78
4.8 本章小结78
第5章 消息传递系统82
5.1 消息传递系统结构82
5.2 消息传递系统中的路由83
5.2.1 广播和多播的路由83
5.2.2 路由的潜在问题84
5.3 消息传递中的交换机制86
5.4 消息传递系统编程模型87
5.5 本章小结87
第6章 多核构架88
6.1 多核技术88
6.2 多核芯片89
6.3 多核中的并行性93
6.4 多核处理器关键技术95
6.4.1 多级Cache设计与一致性问题95
6.4.2 多核处理器核间通信技术95
6.4.3 多核处理器总线设计96
6.4.4 多核处理器操作系统设计97
6.4.5 多核处理器低功耗设计98
6.4.6 多核处理器存储器墙99
6.5 本章小结100
第7章 并行计算模型101
7.1 并行计算模型102
7.2 Brent定理102
7.3 PRAM模型103
7.4 APRAM模型105
7.5 BSP模型106
7.6 LogP模型110
7.7 本章小结111
第8章 并行算法112
8.1 并行算法设计112
8.2 数组求和114
8.2.1 数组求总和114
8.2.2 数组求所有部分和115
8.3 排序116
8.3.1 枚举排序116
8.3.2 奇偶排序117
8.3.3 希尔排序119
8.3.4 快速排序119
8.3.5 正则采样排序121
8.4 矩阵运算122
8.4.1 Cannon乘法122
8.4.2 Fox乘法124
8.5 线性方程组求解126
8.5.1 高斯消元法126
8.5.2 雅可比迭代法128
8.5.3 高斯-塞德尔迭代法131
8.5.4 超松弛迭代法133
8.6 本章小结136
第9章 并行程序设计方法137
9.1 并行程序设计基本概念137
9.2 并行度138
9.3 交互/通信140
9.3.1 通信140
9.3.2 同步141
9.3.3 聚集142
9.3.4 交互方式143
9.3.5 交互模式144
9.4 并行编程风范146
9.5 并行编程模型与并行语言147
9.6 共享存储器编程152
9.6.1 ANSI X3H5共享存储器模型152
9.6.2 Posix线程模型153
9.6.3 OpenMP标准153
9.7 消息传递编程154
9.7.1 PVP并行编程154
9.7.2 MPI并行编程155
9.8 数据并行编程155
9.9 本章小结156
第10章 MPI并行程序设计158
10.1 MPI基本编程158
10.2 点对点通信161
10.2.1 阻塞通信161
10.2.2 非阻塞通信164
10.3 MPI预定义数据类型165
10.4 通信模式166
10.4.1 标准通信模式167
10.4.2 缓存通信模式167
10.4.3 同步通信模式169
10.4.4 就绪通信模式169
10.5 集合通信170
10.5.1 组通信的消息通信功能170
10.5.2 广播171
10.5.3 收集172
10.5.4 散发174
10.5.5 组收集174
10.5.6 全互换175
10.5.7 同步177
10.5.8 归约177
10.5.9 组归约181
10.5.10 扫描182
10.5.11 用户自定义归约操作183
10.6 对等模式和主从模式183
10.7 非阻塞通信185
10.7.1 非阻塞发送和接收185
10.7.2 非阻塞通信的完成188
10.7.3 非阻塞通信对象191
10.7.4 消息到达的检查192
10.8 重复非阻塞通信193
10.9 进程组的管理196
10.10 通信组的管理200
10.11 虚拟进程拓扑202
10.11.1 笛卡尔拓扑203
10.11.2 图拓扑206
10.12 本章小结207
第11章 OpenMP并行程序设计211
11.1 OpenMP编程基础211
11.2 并行域219
11.2.1 parallel结构219
11.2.2 for指令224
11.2.3 循环依赖229
11.2.4 sections结构232
11.2.5 simd结构237
11.2.6 single结构237
11.3 数据处理环境238
11.3.1 private子句239
11.3.2 firstprivate子句240
11.3.3 lastprivate子句241
11.3.4 threadprivate指令243
11.3.5 shared子句243
11.3.6 reduction子句244
11.3.7 if子句245
11.3.8 copyin子句247
11.3.9 copyprivate子句248
11.3.10 default子句249
11.4 线程同步250
11.4.1 critical指令250
11.4.2 atomic指令252
11.4.3 barrier指令255
11.4.4 nowait子句255
11.4.5 master指令256
11.4.6 ordered指令258
11.4.7 flush指令259
11.4.8 互斥锁函数260
11.5 任务调度262
11.5.1 static调度264
11.5.2 dynamic分配266
11.5.3 guided调度268
11.5.4 auto调度270
11.5.5 runtime调度270
11.6 本章小结270
附录1 MPI函数调用274
附录2 OpenMP指令和库函数283
参考文献288