v

您的位置:VeryCD图书计算机与网络

图书资源事务区


《GPU高性能运算之CUDA》扫描版[PDF]

  • 状态: 精华资源
  • 摘要:
    图书分类软件
    出版社中国水利水电出版社
    发行时间2009年10月
    语言简体中文
  • 时间: 2013/10/05 22:53:13 发布 | 2013/10/06 01:06:19 更新
  • 分类: 图书  计算机与网络 

古代青年

精华资源: 1822

全部资源: 1823

相关: 分享到新浪微博   转播到腾讯微博   分享到开心网   分享到人人   分享到QQ空间   订阅本资源RSS更新   美味书签  subtitle
该内容尚未提供权利证明,无法提供下载。
中文名GPU高性能运算之CUDA
作者张舒
图书分类软件
资源格式PDF
版本扫描版
出版社中国水利水电出版社
书号9787508465432
发行时间2009年10月
地区大陆
语言简体中文
简介

IPB Image

内容介绍

《GPU高性能运算之CUDA》是全国第一本全面介绍CUDA软硬件体系架构的书籍。全面介绍使用CUDA进行通用计算所需要的语法、硬件架构、程序优化技巧等知识,是进行GPU通用计算程序开发的入门教材和参考书。

《GPU高性能运算之CUDA》共分5章。第1章介绍GPU通用计算的发展历程,介绍并行计算的历史、现状以及面临的问题;第2章介绍CUDA的使用方法,帮助读者理解CUDA的编程模型、存储器模型和执行模型,掌握CUDA程序的编写方法;第3章探讨CUDA硬件架构,深入分析Tesla GPU架构与CUDA通用计算的相互作用:第4章总结CUDA的高级优化方法,对任务划分、存储器访问、指令流效率等课题进行探讨;第5章以丰富的实例展示如何使用CUDA的强大性能解决实际问题。
  
《GPU高性能运算之CUDA》可作为CUDA的学习入门和编程参考书,主要面向从事高性能计算的程序员与工程师,使用GPU加速专业领域计算的科研人员,以及对GPU通用计算感兴趣的程序员。

网盘地址在评论1楼。

内容截图

IPB Image
(点击图片查看原图)



目录

前言
第1章 GPU通用计算
1.1 多核计算的发展
1.1.1 CPU多核并行
1.1.2 超级计算机、集群与分布式计算
1.1.3 CPU+GPU异构并行
1.2 GPU发展简介
1.2.1 GPU渲染流水线
1.2.2 着色器模型
1.2.3 NVIDIA GPU发展简介
1.3 从GPGPU到CUDA
1.3.1 传统GPGPU开发
1.3.2 CUDA开发

第2章 CUDA基础
2.1 CUDA编程模型
2.1.1 主机与设备
2.1.2 Kernel函数的定义与调用
2.1.3 线程结构
2.1.4 硬件映射
2.1.5 deviceQuery示例
2.1.6 matrixAssign示例
2.2 CUDA软件体系
2.2.1 CUDA C语言
2.2.2 nvcc编译器
2.2.3 运行时API与驱动API
2.2.4 CUDA函数库
2.3 CUDA存储器模型
2.3.1 寄存器
2.3.2 局部存储器
2.3.3 共享存储器
2.3.4 全局存储器
2.3 5 主机端内存
2.3.6 主机端页锁定内存
2.3.7 常数存储器
2.3.8 纹理存储器
2.4 CUDA通信机制
2.4.1 同步函数
2.4.2 Volatile关键字
2.4.3 ATOM操作
2.4.4 VOTE操作
2.5 异步并行执行
2.5.1 流
2.5.2 事件
2.6 CUDA与图形学API互操作
2.6.1 CUDA与OpenGL的互操作
2.6.2 CUDA与Direct3D互操作
2.7 多设备与设备集群
2.7.1 CUDA设备控制
2.7.2 CUDA与openMP
2.7.3 CUDA与集群

第3章 CUDA硬件架构
3.1 NVIDIA显卡构造简介
3.1.1 图形显卡概览
3.1.2 PCI-E总线
3.1.3 显存
3.1.4 GPU芯片
3.2 Tesla图形与计算架构
3.2.1 SPA-TPC-SM
3.2.2 主流GPU架构
3.3 Tesla通用计算模型
3.3.1 数据与指令的加载
3.3.2 warp指令的发射与执行
3.3.3 纹理、渲染和存储器流水线

第4章 CUDA程序的优化
4.1 CUDA程序优化概述
4.2 测量程序运行时间
4.2.1 设备端测时
4.2.2 主机端测时
4.3 任务划分
4.3.1 任务划分原则
4.3.2 grid和block维度设计
4.4 存储器访问优化
4.4.1 主机-设备通信优化
4.4 2全局存储器访问优化
4.4.3 共享存储器访问优化
4.4.4 使用纹理存储器和常数存储器加速
4.5 指令流优化
4.5.1 算术指令
4.5.2 控制流指令
4.5.3 访存指令
4.5.4 同步指令
4.6 CURDAprofiler的使用
4.6.1 图形分析
4.6.2 图表分析
4.7 优化应用举例
4.7.1 矩阵乘法的优化
4.7.2 并行归约的优化
4.7.3 矩阵转置的优化

第5章 综合应用
5.1 基本应用
5.1.1 双调排序网络
5.1.2 Scan
5.1.3 CUBLAS简单应用
5.1.4 CUFFT简单应用
5.2 高级应用
5.2.1 共轭梯度法的CUBLAS实现
5.2.2 AC多模式匹配算法的CUDA实现

附录A 安装、配置、编译及调试
附录B 常见问题与解答
附录C 技术规范
附录D C扩展
附录E 数学函数
附录F 纹理拾取
附录G 着色器模型

正在读取……

这里是其它用户补充的资源(我也要补充):

暂无补充资源
正在加载,请稍等...

点击查看所有23网友评论

 

(?) [公告]留口水、评论相关规则 | [活动]每日签到 轻松领取电驴经验

    小贴士:
  1. 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
  2. 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
  3. 勿催片。请相信驴友们对分享是富有激情的,如果确有更新版本,您一定能搜索到。
  4. 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
  5. 如果您发现自己的评论不见了,请参考以上4条。