并行向量访存单元的设计与优化
现代通信技术的迅速发展和媒体处理信息的爆炸性增长,对数字信号处理器(DSP)的性能提出了更高的要求。速度和实时性信息处理需求的不断提高,促使高性能DSP向超宽度SIMD发展。
如何为基于SIMD结构的DSP集成的多路运算单元提供高效、高带宽的访存数据成为其存储系统设计面临的重要问题。本文基于一款16路超宽SIMD结构高性能DSP内核Matrix2,设计实现了高带宽的并行向量访存单元(AM),研究了如何在特定应用中提高SIMD处理器的访存性能的方法。
本文的主要工作和创新点体现在以下几个方面:1、基于Matrix2指令集体系结构,设计了一套支持半字(4B)、字(8B)、双字(16B)等多粒度数据访问的向量访存指令,其中提出了特殊的用于FFT算法向量加速的专用向量访存指令。2、支持两条并行的向量访存指令操作,每一条指令的数据带宽均高达256B/拍。
双访问给SIMD并行运算部件提供了充足的数据带宽。3、支持SIMD非对齐访问。
在字访存粒度和双字访存粒度上实现了SIMD非对齐访问,提高了向量访存的效率和灵活性。4、支持DMA并行访问,实现了低冲突率的两条向量访 ...


雷达卡


京公网安备 11010802022788号







