楼主: marcus10
3114 6

[程序化交易] 【论坛首发】深度学习底层技术:GPU高性能编程CUDA实战(中文+英文) [推广有奖]

  • 8关注
  • 13粉丝

教授

0%

还不是VIP/贵宾

-

威望
0
论坛币
1463 个
通用积分
24.6283
学术水平
61 点
热心指数
73 点
信用等级
44 点
经验
30689 点
帖子
1473
精华
0
在线时间
597 小时
注册时间
2010-6-12
最后登录
2023-12-29

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
4d086e061d950a7b5d03bbbb08d162d9f2d3c99f.jpg

CUDA是一种专门为提高并行程序开发效率而设计的计算架构。是目前深度学习算法的底层开发技术。
除该书外,压缩包内,本人附录了全英
《CUDA C Best Practices Guide》
简介
CUDA是一种专门为提高并行程序开发效率而设计的计算架构。是目前深度学习算法的底层开发技术。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。本书首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA c的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA c的基本语法和使用模式。通过学习本书,读者可以清楚了解CUDA c中每个功能的适用场合,并编写出高性能的CUDA软件。   本书适合具备c或者c++知识的应用程序开发人员、数值计算库开发人员等,也可以作为学习并行计算的学生和教师的教辅。

Desktop.zip (23.72 MB, 需要: 10 个论坛币) 本附件包括:
  • GPU高性能编程CUDA实战中文.pdf
  • CUDA_C_Best_Practices_Guide.pdf


译者序

前言
致谢
作者简介
第1章 为什么需要cuda 1
1.1 本章目标 2
1.2 并行处理的历史 2
1.3 gpu计算的崛起 3
1.4 cuda 5
1.5 cuda的应用 6
1.6 本章小结 8
第2章 入门 9
2.1 本章目标 10
2.2 开发环境 10
2.3 本章小结 14
第3章 cuda c简介 15
3.1 本章目标 16
3.2 第一个程序 16
3.3 查询设备 20
.3.4 设备属性的使用 23
3.5 本章小结 24
第4章 cuda c并行编程 26
4.1 本章目标 27
4.2 cuda并行编程 27
4.3 本章小结 41
第5章 线程协作 42
5.1 本章目标 43
5.2 并行线程块的分解 43
5.3 共享内存和同步 54
5.4 本章小结 68
第6章 常量内存与事件 69
6.1 本章目标 70
6.2 常量内存 70
6.3 使用事件来测量性能 78
6.4 本章小结 83
第7章 纹理内存 84
7.1 本章目标 85
7.2 纹理内存简介 85
7.3 热传导模拟 86
7.4 本章小结 101
第8章 图形互操作性 102
8.1 本章目标 103
8.2 图形互操作 103
8.3 基于图形互操作性的gpu波纹示例 108
8.4 基于图形互操作性的热传导 113
8.5 directx互操作性 118
8.6 本章小结 118
第9章 原子性 119
9.1 本章目标 120
9.2 计算功能集 120
9.3 原子操作简介 122
9.4 计算直方图 124
9.5 本章小结 133
第10章 流 134
10.1 本章目标 135
10.2 页锁定主机内存 135
10.3 cuda流 139
10.4 使用单个cuda流 140
10.5 使用多个cuda流 144
10.6 gpu的工作调度机制 149
10.7 高效地使用多个cuda流 151
10.8 本章小结 152
第11章 多gpu系统上的cuda c 154
11.1 本章目标 155
11.2 零拷贝主机内存 155
11.3 使用多个gpu 162
11.4 可移动的固定内存 166
11.5 本章小结 170
第12章 后记 171
12.1 本章目标 172
12.2 cuda工具 172
12.3 参考资料 176
12.4 代码资源 178
12.5 本章小结 179
附录 高级原子操作 180
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:CUDA 深度学习 GPU 高性能 Practices

已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
Nicolle + 100 + 1 + 1 + 1 精彩帖子
fantuanxiaot + 77 + 77 精彩帖子

总评分: 经验 + 177  论坛币 + 77  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

北大中文系毕业现在研究考古学
沙发
钱学森64 发表于 2017-7-24 15:47:12 |只看作者 |坛友微信交流群
谢谢分享

使用道具

藤椅
albertwishedu 发表于 2017-7-24 16:54:36 |只看作者 |坛友微信交流群

使用道具

板凳
marcus10 发表于 2017-7-24 21:25:39 |只看作者 |坛友微信交流群
albertwishedu 发表于 2017-7-24 16:54
您这是啥表情!

使用道具

报纸
marcus10 发表于 2017-7-25 12:28:55 来自手机 |只看作者 |坛友微信交流群
marcus10 发表于 2017-7-24 14:33
CUDA是一种专门为提高并行程序开发效率而设计的计算架构。是目前深度学习算法的底层开发技术。
除该书 ...
自己顶一下

使用道具

地板
marcus10 发表于 2017-7-28 17:00:20 |只看作者 |坛友微信交流群
也还是有趣

使用道具

7
albertwishedu 发表于 2017-9-3 09:31:10 |只看作者 |坛友微信交流群
marcus10 发表于 2017-7-24 21:25
您这是啥表情!
只是汗颜了一下哈

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-4 13:11