| 所在主题: | |
| 文件名: PDF-20121105141646-JiSuanJiXiTongJieGouLiangHuaYanJiuFangFa.pdf | |
| 资料下载链接地址: https://bbs.pinggu.org/a-1734462.html | |
| 附件大小: | |
|
《计算机体系结构-量化研究方法》是计算机体系结构领域,最经典也是最前沿的教材。 经典,是因为没有其他的书能超越此书在体系结构领域的地位。前沿,是因为这本书基本是每5年左右再版一次。紧紧围绕最新的体系结构方向的变化。 作者: John L.Hennessy 斯坦福大学校长 IEEE和ACM会士 美国国家工程研究院院士及美国科学艺术研究院院士。Hennessy教授因为在RISC技术方面做出了突出贡献而荣获2001年的Eckert-Mauchly奖章 他也是2001年Seymour Cray计算机工程奖得主 并且和本书另外一位作者David A.Patterson分享了2000年John von Neumann奖。 Table of Contents ================= 1 章节变化 1.1 强调了功耗 1.2 更加强调存储体系结构 1.3 合并了ILP(Instruction-Level Parallelism)章节 1.4 增加了对向量、SIMD和GPU等强大数据流并行支持一章 1.5 对称多处理器和多线程并行章节变化不大 1.6 增加了Warehouse-Scale一章介绍面向请求和数据的并行 1.7 弱化外部存储章节 2 《编译点滴》评论 3 其他变化 4 相关资源 1 章节变化 ~~~~~~~~~~~ 1.1 强调了功耗 =============== 第一章在Put it all together中,侧重了对功耗的考察。 1.2 更加强调存储体系结构 ========================= 在第4版中,存储体系结构虽然也是很重要的一章,但被放置在第5章。而第5版中,直接将其放置在了第2章。 本章中除了讨论Cache、SRAM和DRAM,还增加了对Flash的讨论。 Put it all together中所举的例子,也从AMD Opteron,改成了ARM Cortex-A8和Core I7。 1.3 合并了ILP(Instruction-Level Parallelism)章节 =================================================== ILP一章主要介绍了指令级并行的相关概念,在第4版中分为两个章节分别在第2和第3章中论述。第5版中,将两个章节做了合并,在第3章中介绍。 这一章中的Put It All Together也主要讨论ARM Cortex A8和Core I7. 《量化》第3版曾使用大量的篇幅介绍安腾和VLIW中的指令级并行,第4版虽然增加了对Power处理器和X86处理器的介绍,但安腾的VLIW也被一并介绍。 第5版则干脆直接ARM和Core。关于安腾和VLIW的介绍,放到了附录里。作者给出的理由是“This architecture did not live up to the earlier claims". 即作者觉得这种体系结构实际效果并没有开始时声称的那么好. 1.4 增加了对向量、SIMD和GPU等强大数据流并行支持一章 ==================================================== 不管是高性能计算领域,还是嵌入式手机上,现在貌似不用上GPU就不够时尚。 《量化》在第4版只在附录中介绍了一下向量机,在第5版中则在正文中第4章完整的介绍该体系结构。 而且作者用了“contain the most detailed and clearset explanation of GPU yet"来形容这一章的内容,而且用了”particularly proud about“形容自己对这一章的态度。 可见,这一章将是本书让作者最为骄傲的亮点之一(之二是第6章对Google Warehouse-scale计算机的论述,没有之三)。 这一章主要介绍了GPU的体系结构,并选择Core I7、Nvidia GTX系列GPU和 Tegra 2 GPU进行比较。 1.5 对称多处理器和多线程并行章节变化不大 ========================================= 这一章主要介绍线程级并行,但标题从第四版的”Multiprocessors and Thread-Level Application",缩减成了“Thread-Level Application”,作者并没有提为什么少了一个词。 Put It All Together 部分的介绍也从Sun T1变成了 Core I7. 1.6 增加了Warehouse-Scale一章介绍面向请求和数据的并行 ====================================================== warehouse规模计算机(Warehouse-Scale Computer, WSC),即将整个数据中心看作一台计算机。这种规模的计算机面向的主要是互联网服务。 作者在撰写这一章时,得到了许多Amazon和Google一线工程师的协作,论述WSC计算机的设计、成本和性能。 本章从MapReduce的编程模型谈起,接着描述WSC计算机的物理实现,以及能耗、成本、性能的情况。 Put It All Together部分详细介绍了Google WSC的情况,许多内容都是在本书中首次公开。 (《编译点滴》也将持续跟进这部分内容,敬请关注。) 1.7 弱化外部存储章节 ===================== “Storag System”一章,是《量化》第4版本正文中的一章,在第5版中,被放入了附录里。 2 《编译点滴》评论 ~~~~~~~~~~~~~~~~~~~ 从第4版到第5版,书中的亮点“Put It All Together”部分,从介绍Intel Pentium 4, Sun T1,AMD Opteron等好几款CPU的结构,缩减为介绍ARM Cortex 和Core I7。 看来作者也看好Intel和ARM的未来发展。 第5版的《量化》更加关注个人移动设备上的体系结构发展,以及数据中心端的体系结构发展,所以选择了面向个人设备的ARM Cortex系列CPU和面向数据中心的Intel Core I7 CPU。 除了第一章基础介绍和第二章存储结构外,第3-6章每一章的标题中都有“Parallelism”。总共涉及了如下几个方面: - 指令级并行(ILP) - 数据级并行(DLP) - 线程级并行(TLP) - 请求级并行(RLP) 其中数据级并行占用的章节最多,而且都是第5版《量化》中新增加的章节--第4章GPU和第6章数据中心。数据正变得越来越重要。 ` |
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明