分支与不规则访存在GPU上的优化方法研究
近几年,GPU在通用计算领域得到了广泛的应用,成为当前高性能计算系统的重要组成部分。然而,GPU采用SIMT的工作方式,使其执行效率受到程序中不一致分支行为(Branch Divergence)的严重影响;为了节约内存带宽并减小访存延迟,GPU引入了访存合并机制。
虽然这一机制可以提高内存访问效率,但不规则访存仍然会严重影响程序性能。针对这两个问题,本文分析了它们产生的原因,提出了相应的优化方法,利用GPGPU-Sim模拟器进行测试,并分析提出的优化方法对性能(程序运行时间)、功耗和能耗(功耗时间积)的影响。
本文的主要工作可以分为以下几个方面:1)分析了分支问题产生的原因,研究了现有线程交换算法对功耗的影响,并对Reduction和Bitonic Sort程序进一步优化。对于Reduction程序,现有线程交换算法增加了功耗,针对这一问题,通过改变线程交换算法,减少了共享存储器体冲突,从而减小了程序功耗,结果表明在性能平均损失5%的情况下,功耗平均降低了5%;对于Bitonic Sort程序,通过分析线程交换算法,在此基础上减少了一些不必要的 ...


雷达卡


京公网安备 11010802022788号







