v

您的位置:VeryCD图书计算机与网络

图书资源事务区


《GPU精粹2.高性能图形芯片和通用计算机编程技巧》(GPU Gems 2:Programming Techniques for High-Performance Graphics and General-Purpose Computation)扫描版[PDF]

  • 状态: 精华资源
  • 摘要:
    图书分类软件
    出版社Tsinghua University Press
    发行时间2007年5月
    语言简体中文
  • 时间: 2011/11/15 00:26:46 发布 | 2011/11/15 01:56:07 更新
  • 分类: 图书  计算机与网络 

reallh

精华资源: 41

全部资源: 41

相关: 分享到新浪微博   转播到腾讯微博   分享到开心网   分享到人人   分享到QQ空间   订阅本资源RSS更新   美味书签  subtitle
该内容尚未提供权利证明,无法提供下载。
中文名GPU精粹2.高性能图形芯片和通用计算机编程技巧
原名GPU Gems 2:Programming Techniques for High-Performance Graphics and General-Purpose Computation
别名GPU Gems, GPU精粹
译者龚敏敏
图书分类软件
资源格式PDF
版本扫描版
出版社Tsinghua University Press
书号9787XXX139430
发行时间2007年5月
地区大陆
语言简体中文
简介

IPB Image

内容介绍:

本书延续了畅销书《GPU精粹》的第1卷,细述了在今天的图形处理器(GPU)上最新的可编程技术。随着GPU进入手机、手持游戏设备和游戏机领域,GPU专业知识在今天的竞争环境中显得更为重要。实时图形程序员会发现用于建立高级的视觉特效、管理复杂场景的策略和高级图像处理技术的最新算法。读者还会学到一些新方法,把GPU的强大处理能力运用到其他计算密集型程序中,比如科学计算和金融。书中有20章专门讲述GPGPU编程,从基本的概念到高级技术。本书提供了一些专家撰写的最前沿的GPU编程技术,为读者介绍了利用GPU巨大功能的实用方法。

作者介绍:

《GPU精粹2》的主编是NVIDIA公司的软件工程师Matt Pharr。Matt也是Physically Based Rendering:From Theory to Implementation(Morgan Kaufmann,2004)一书的合著者之一。“GPU精粹”系列编辑是Randima Fernando。Randy 主编了“GPU精粹”的第1卷(Addison-Wesley,2004),而且是The Cg Tutorial(Addiosn-Wesley,2003)的合著者,其论文“Adaptive Shadow Maps”曾发表于SIGGRAPH2001。

内容截图:

IPB Image



目录

第ⅰ部分 几何复杂性
第1章 实现照片级真实感的虚拟植物
1.1 场景管理
1.1.1 种植栅格
1.1.1 种植策略
1.1.3 实时优化
1.2 草层
1.2.1 通过溶解模拟Alpha透明
1.2.2 变化
1.2.3 光照
1.2.4 风
1.3 地面杂物层
1.4 树和灌木层
1.5 阴影
1.6 后处理
1.6.1 天空圆顶辉散
1.6.2 全场景辉光
1.7 本章小结
参考文献
第2章 使用基于GPU几何体剪切图的地形渲染
2.1 几何体剪切图简介
2.2 GPU实现概览
2.2.1 数据结构
2.2.2 剪切图大小
2.3 渲染
2.3.1 活动层
2.3.2 顶点和索引缓冲区
2.3.3 视锥剪切
2.3.4 DrawPrimitive调用
2.3.5 顶点着色器
2.3.6 像素着色器
2.4 更新
2.4.1 升采样
2.4.2 残差
2.4.3 法线图
2.5 结果和讨论
2.6 本章小结和改进
2.6.1 顶点纹理
2.6.2 去掉法线图
2.6.3 不需要存储空间的地形合成
参考文献
第3章 几何体实例化的内幕
3.1 为什么要对几何体实例化?
3.2 定义
3.2.1 几何体包
3.2.2 实例属性
3.2.3 几何体实例
3.2.4 渲染和纹理场景
3.2.5 几何体批次
3.3 实现
3.3.1 静态批次
3.3.2 动态批次
3.3.3 顶点常量实例化
3.3.4 几何体实例API批次
3.4 本章小结
参考文献
第4章 分段缓冲
4.1 问题空间
4.2 解决方案
4.3 方法
4.3.1 分段缓冲的第一步
4.3.2 分段缓冲的第二步
4.3.3 分段缓冲的第三步
4.4 改进分段缓冲技术
4.5 本章小结
参考文献
第5章 用多流来优化资源管理
5.1 概览
5.2 实现
5.2.1 DirectX 9.0中的多流
5.2.2 资源管理
5.2.3 处理顶点
5.3 本章小结
参考文献
第6章 让硬件遮挡查询发挥作用
6.1 引言
6.2 受益于遮挡查询的场景
6.3 遮挡裁减
6.4 层的停等方法
6.4.1 为什么使用层
6.4.2 层结构
6.4.3 层的算法
6.4.4 问题1:停滞
6.4.5 问题2:查询的额外开销
6.5 一致性层裁减
6.5.1 想法1:猜测
6.5.2 想法2:提升,提升
6.5.3 算法
6.5.4 实现细节
6.5.5 停滞比较少的原因
6.5.6 查询较少的原因
6.5.7 如何遍历层
6.6 优化
6.6.1 用真正的几何体查询
6.6.2 只有Z的渲染遍
6.6.3 近似的可见性
6.6.4 保守的可见性测试
6.7 本章小结
参考文献
第7章 带有位移映射的细分表面自适应镶嵌
7.1 细分表面
7.1.1 一些定义
7.1.2 Catmull-Clark细分
7.1.3 用细分来镶嵌
7.1.4 面片化表面
7.1.5 GPU镶嵌算法
7.1.6 致密镶嵌
7.2 位移映射
7.2.1 改变平滑度测试
7.2.2 用法线映射着色
7.3 本章小结
参考文献
第8章 使用距离函数的逐像素位移
8.1 简介
8.2 准备工作
8.3 距离映射算法
8.4 计算距离图
8.5 着色器
8.5.1 顶点着色器
8.5.2 片段着色器
8.5.3 关于过滤的注意事项
8.6 结果
8.7 本章小结
参考文献
第ⅱ部分 着色、光照和阴影
第9章 S.T.A.L.K.E.R.中的延期着色
9.1 引言
9.2 几种观点
9.3 优化
9.3.1 优化的对象
9.3.2 光照优化
9.3.3 G缓冲区建立的优化
9.3.4 阴影优化
9.4 改善质量
9.4.1 “虚拟位置”的威力
9.4.2 环境遮挡
9.4.3 材质和表面光照的交互
9.5 反走样
9.5.1 高效的调和映射
9.5.2 处理透明
9.6 尝试过但没有包含入最终代码的内容
9.6.1 高程图
9.6.2 实时的全局照明
9.7 本章小结
参考文献
第10章 动态辐照度环境映射实时计算
10.1 辐照度(irradiance)环境映射
10.2 球面调合卷积
10.3 映射到GPU上
10.3.1 空域到频域
10.3.2 卷积和恢复
10.4 以后的工作
10.5 本章小结
参考文献
第11章 近似的双向纹理函数
11.1 引言
11.2 采集
11.2.1 建立和采集
11.2.2 汇集着色图
11.3 渲染
11.3.1 细节算法
11.3.2 实时渲染
11.4 结果
11.5 本章小结
参考文献
第12章 基于贴面的纹理映射
12.1 方法简介
12.2 纹理贴面的构造
12.3 纹理贴面的打包
12.4 纹理贴面映射
12.5 mipmap问题
12.6 本章小结
参考文献
第13章 在GPU上实现mental images的phenomena渲染器
13.1 引言
13.2 着色器和Phenomena
13.3 用Cg实现Phenomena
13.3.1 Cg顶点程序和可变参数
13.3.2 片段程序着色器的main()入口点
13.3.3 通用着色器接口
13.3.4 一个简单的着色器例子
13.3.5 全局的状态变量
13.3.6 光着色器
13.3.7 纹理着色器
13.3.8 凹凸映射
13.3.9 环境着色器和体着色器
13.3.10 返回结构体的着色器
13.3.11 渲染毛发
13.3.12 组合所有东西
13.4 本章小结
参考文献
第14章 动态环境遮挡和间接光照
14.1 表面元素
14.2 环境遮挡
14.2.1 多遍阴影算法
14.2.2 改善性能
14.3 间接光照和面光源
14.4 本章小结
参考文献
第15章 蓝图渲染和草图绘制
15.1 基本原理
15.1.1 中间渲染结果
15.1.2 边增强
15.1.3 深度子图形渲染
15.2 蓝图渲染
15.2.1 深度剥离
15.2.2 析取可见边和不可见边
15.2.3 合成蓝图
15.2.4 深度屏蔽
15.2.5 使用蓝图渲染显示建筑
15.3 草图渲染
15.3.1 边和颜色面片
15.3.2 应用不确定性
15.3.3 调整深度
15.3.4 草图渲染的变体
15.3.5 控制不确定性
15.3.6 减少雨景效果
15.4 本章小结
参考文献
第16章 精确的大气散射
16.1 引言
16.2 解散射方程
16.2.1 Rayleigh散射与Mie散射
16.2.2 相位函数
16.2.3 外向散射方程
16.2.4 内向散射方程
16.2.5 表面散射方程
16.3 实时渲染
16.4 挤入着色器中
16.4.1 去除一个维度
16.4.2 去除其他维度
16.5 实现散射的着色器
16.5.1 顶点着色器
16.5.2 片段着色器
16.6 增加高动态范围渲染
16.7 本章小结
参考文献
第17章 利用像素着色器分支的高效模糊边缘阴影
17.1 现有的阴影生成技术
17.2 用单张阴影图产生模糊阴影
17.2.1 模糊尖锐边缘阴影
17.2.2 提高效率
17.2.3 实现细节
17.3 本章小结
参考文献
第18章 将顶点纹理位移用于水的真实感渲染
18.1 水的模型
18.2 实现
18.2.1 水的表面模型
18.2.2 实现细节
18.2.3 对高度图采样
18.2.4 质量的提高与优化
18.2.5 渲染局部的扰动
18.3 本章小结
参考文献
第19章 通用的折射模拟
19.1 基本方法
19.2 折射掩码
19.3 示例
19.3.1 水的模拟
19.3.2 玻璃的模拟
19.4 本章小结
参考文献
第ⅲ部分 高质量渲染
第20章 快速三阶纹理过滤
20.1 高阶过滤
20.2 快速递归三次卷积
20.3 mipmapping
20.4 导数重建
20.5 本章小结
参考文献
第21章 高质量反走样的光栅化
21.1 概述
21.2 降采样
21.2.1 与现有软硬件的对比
21.2.2 用GPU进行降采样
21.3 延伸
21.4 过滤器的细节
21.5 两遍分离式的过滤器
21.6 分块和累加
21.7 代码
21.7.1 渲染循环
21.7.2 降采样类
21.7.3 实现细节
21.8 本章小结
参考文献
第22章 快速的预过滤线条
22.1 为什么尖锐的直线看起来很糟糕
22.2 限制信号的带宽
22.3 预处理
22.4 运行时
22.4.1 线段的建立(CPU)
22.4.2 表查找(GPU)
22.5 实现的问题
22.5.1 绘制宽线
22.5.2 组合多条线段
22.6 示例
22.7 本章小结
参考文献
第23章 Nalu Demo的头发动画和渲染
23.1 头发的几何体
23.1.1 布局和增长
23.1.2 控制头发
23.1.3 数据流
23.1.4 镶嵌
23.1.5 插值
23.2 动力学和碰撞
23.2.1 约束条件
23.2.2 碰撞
23.2.3 鳍
23.3 头发的着色
23.3.1 用于头发的实时反射模型
23.3.2 头发中实时的体化阴影
23.4 本章小结和未来的工作
参考文献
第24章 使用查找表加速颜色变换
24.1 查找表的基础知识
24.1.1 一维查找表
24.1.2 三维查找表
24.1.3 插值
24.2 实现
24.2.1 把查找表映射到GPU的策略
24.2.2 Cg着色器
24.2.3 系统集成
24.2.4 把三维查找表扩展到用于高动态范围图像
24.3 本章小结
参考文献
第25章 Apple Motion中的GPU图像处理
25.1 设计
25.1.1 喜爱的和厌恶的
25.1.2 选择语言
25.1.3 CPU向后支持
25.2 实现
25.2.1 GPU资源的限制
25.2.2 被零除
25.2.3 丢失的顶点分量
25.2.4 双线过滤
25.2.5 高精度存储
25.3 调试
25.4 本章小结
参考文献
第26章 实现改进的Perlin噪声
26.1 随机但平滑
26.2 存储与计算
26.3 实现细节
26.4 本章小结
参考文献
第27章 高级的高质量过滤
27.1 在GPU上实现过滤
27.1.1 访问图像样本
27.1.2 卷积过滤
27.2 数字图像的重采样
27.2.1 背景知识
27.2.2 反走样问题
27.2.3 图像重建
27.3 冲击过滤:锐化图像的方法
27.4 过滤器的实现技巧
27.5 高级应用
27.5.1 时间变形
27.5.2 运动模糊的消除
27.5.3 自适应的纹理过滤
27.6 本章小结
参考文献
第28章 Mipmap级的测量
28.1 哪个mipmap层是可见的?
28.2 GPU抢险队
28.2.1 像素点计数
28.2.2 引擎中的实际考虑
28.2.3 扩展
28.3 实验结果
28.4 本章小结
参考文献
第ⅳ部分 GPU的通用计算:初级读本
第29章 流式体系结构和技术趋势
29.1 技术趋势
29.1.1 核心技术趋势
29.1.2 后果
29.2 高性能计算的关键
29.2.1 高效计算的方法
29.2.2 高效通讯的方法
29.2.3 与CPU对比
29.3 流式计算
29.3.1 流式变成模型
29.3.2 构建一个流式处理器
29.4 未来和挑战
29.4.1 技术趋势
29.4.2 功耗管理
29.4.3 支持更高的可编程性和功能性
29.4.4 来自CPU的GPU功能性(或反之亦然)
参考文献
第30章 Geforce 6系列GPU的体系结构
30.1 GPU如何适合于整体计算系统
30.2 整体系统体系结构
30.2.1 图形操作的功能结构图
30.2.2 非图形操作的功能结构图
30.3 GPU特性
30.3.1 固定函数特性
30.3.2 着色器Model 3.0编程
30.3.3 支持的数据存储格式
30.4 性能
30.5 达到最佳性能
30.5.1 积极地使用z裁减
30.5.2 加载数据时利用纹理数学
30.5.3 使用片段程序的分支
30.5.4 尽可能使用fp16作中间值
30.6 本章小结
第31章 把计算概念映射到GPU
31.1 数据并行的重要性
31.1.1 哪种类型的计算可以很好地映射到GPU
31.1.2 示例:在栅格上模拟
31.1.3 流通信:聚集与散布
31.2 GPU计算资源清单
31.3 CPU-GPU类比
31.3.1 流:GPU纹理=CPU数组
31.3.2 核:GPU片段程序=CPU“内循环”
31.3.3 渲染到纹理=反馈
31.3.4 几何体光栅化=计算的调用
31.3.5 纹理坐标=计算的域
31.3.6 顶点坐标=计算的范围
31.3.7 缩减
31.4 从类比到实现
31.5 一个简单的例子
31.6 本章小结
参考文献
第32章 尝试GPU计算
32.1 选择快速算法
32.1.1 局部性
32.1.2 允许计算的准则
32.1.3 考虑下载和读回
32.2 了解浮点
32.3 实现散列
32.3.1 转换成聚集
32.3.2 地址排序
32.3.3 渲染点
32.4 本章小结
参考文献
第33章 在GPU上实现高效的并行数据结构
33.1 流式编程
33.2 GPU存储器模型
33.2.1 存储器体系结构
33.2.2 GPU流类型
33.2.3 GPU核的存储器访问
33.3 基于GPU的数据结构
33.3.1 多维数组
33.3.2 结构体
33.3.3 稀疏数据结构
33.4 性能考虑
33.4.1 依赖的纹理读取
33.4.2 计算频度和程序特化
33.4.3 Pbuffer Survival Guide
33.5 本章小结
参考文献
第34章 GPU流程控制习惯用法
34.1 流程控制的挑战
34.2 基本的流程控制策略
34.2.1 判定
34.2.2 把分支向着流水线上端移动
34.2.3 z裁减
34.2.4 分支指令
34.2.5 选择一种分支机制
34.3 使用遮挡查询的数据依赖循环
34.4 本章小结
第35章 GPU程序优化
35.1 数据并行计算
35.1.1 指令级并行性
35.1.2 数据级并行性
35.2 计算频率
35.2.1 循环内不变量的预计算
35.2.2 用查找表进行预计算
35.2.3 避免内循环分支
35.2.4 swizzle操作
35.3 评价和负载平衡
35.4 本章小结
参考文献
第36章 用于GPGPU应用程序的流式缩减操作
36.1 通过紧缩来过滤
36.1.1 累加和扫描
36.1.2 通过搜索/聚集来散布
36.1.3 过滤性能
36.2 动机:碰撞检测
36.3 用于细分表面的过滤
36.4 本章小结
参考文献
第ⅴ部分 面向图像的计算
第37章 GPU上的八叉树纹理
37.1 一个GPU加速的层次结构:N3 树
37.1.1 定义
37.1.2 实现
37.2 应用1:在网格表面上色
37.2.1 建立八叉树
37.2.2 上色
37.2.3 渲染
37.2.4 把八叉树纹理转换成标准2D纹理
37.3 应用2:表面模拟
37.4 本章小结
参考文献
第38章 使用光栅化的高质量全局照明渲染
38.1 通过光栅化的全局照明
38.2 最终聚集简介
38.2.1 两遍的方法
38.2.2 最终聚集
38.2.3 两遍方法的问题
38.3 通过光栅化的最终聚集
38.3.1 最终聚集光线的聚类
38.3.2 光线投射作为多次平行投影
38.4 实现细节
38.4.1 初始化
38.4.2 深度剥离
38.4.3 采样
38.4.4 性能
38.5 GPU上的全局照明渲染器
38.5.1 第一遍
38.5.2 生成可见点数据
38.5.3 第二遍
38.5.4 其它解决方案
38.6 本章小结
参考文献
第39章 使用逐步求精辐射度方法的全局照明
39.1 辐射度的基础
39.2 GPU实现
39.2.1 使用半球投影的可见性
39.2.2 构成因子的计算
39.2.3 选择下一个发射者
39.3 渐进细分
39.3.1 纹理四叉树
39.3.2 四叉数细分
39.4 性能
39.5 本章小结
参考文献
第40章 GPU上的计算机视觉
40.1 引言
40.2 实现框架
40.3 应用示例
40.3.1 把一系列片段程序用于计算机视觉
40.3.2 求和操作
40.3.3 创建全景照片的方程组
40.3.4 特征向量的计算
40.4 并行计算机视觉处理
40.5 本章小结
参考文献
第41章 延迟过滤:困难数据格式的渲染
41.1 引言
41.2 为什么要延迟
41.3 延迟过滤算法
41.4 为什么它可以工作
41.5 本章小结:何时延迟
参考文献
第42章 保守光栅化
42.1 问题定义
42.2 两种保守算法
42.2.1 剪切空间
42.2.2 第一种算法
42.2.3 第二种算法
42.3 鲁棒性问题
42.4 保守深度
42.5 结果和本章小结
参考文献
第ⅵ部分 模拟与数值算法
第43章 蛋白质结构预测的GPU计算
43.1 介绍
43.2 Floyd-Warshall算法以及绑定距离的平滑
43.3 GPU实现
43.3.1 动态更新
43.3.2 数据纹理的索引
43.3.3 三角形划分
43.3.4 向量化
43.4 试验结果
43.5 本章小结和工作展望
参考文献
第44章 用于解线性方程组的GPU框架
44.1 概述
44.2 表示
44.2.1 “单浮点”的表示
44.2.2 向量
44.2.3 矩阵
44.3 运算
44.3.1 向量运算
44.3.2 向量缩减
44.3.3 矩阵与向量的积
44.3.4 把所有的组合起来
44.3.5 共轭梯度求解器
44.4 一个偏微分方程的例子
44.5 本章小结
参考文献
第45章 GPU上的期权定价
45.1 期权概述
45.2 Black-Scholes模型
45.3 Lattice模型
45.3.1 二项模型
45.3.2 欧式期权定价
45.4 本章小结
参考文献
第46章 改进的GPU排序
46.1 排序算法
46.2 一种简单的方法
46.3 快速排序
46.3.1 实现奇偶合并排序
46.4 使用所有的GPU资源
46.5 本章小结
参考文献
第47章 复杂边界的流体模拟
47.1 简介
47.2 Lattice Boltzmann方法
47.3 基于GPU的LBM
47.3.1 算法介绍
47.3.2 数据封装
47.3.3 迁移
47.4 基于GPU的边界处理
47.4.1 基于GPU的体素化方法
47.4.2 周期性边界
47.4.3 流出边界
47.4.4 障碍物边界
47.5 可视化
47.6 实验结果
47.7 本章小结
参考文献
第48章 基于FFT的医学图像重建
48.1 背景
48.2 傅里叶变换
48.3 FFT算法
48.4 在GPU上的实现
48.4.1 方法1:主要使用片段处理器
48.4.2 方法2:使用顶点处理器、光栅器和片段处理器
48.4.3 负载平衡
48.4.4 基准测试结果
48.5 医学成像中的FFT
48.5.1 磁共振成像
48.5.2 MRI结果
48.5.3 超声波成像
48.6 本章小结
参考文献

正在读取……

这里是其它用户补充的资源(我也要补充):

暂无补充资源
正在加载,请稍等...

点击查看所有103网友评论

 

(?) [公告]留口水、评论相关规则 | [活动]每日签到 轻松领取电驴经验

    小贴士:
  1. 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
  2. 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
  3. 勿催片。请相信驴友们对分享是富有激情的,如果确有更新版本,您一定能搜索到。
  4. 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
  5. 如果您发现自己的评论不见了,请参考以上4条。