| 所在主题: | |
| 文件名: 计算机:英伟达Vera Rubin重构AI存储层级,NAND有望成为通胀品.pdf | |
| 资料下载链接地址: https://bbs.pinggu.org/a-8735651.html | |
| 附件大小: | |
|
英伟达Vera Rubin全面投产,重构存储架构改善“内存墙”困境
CES2026展会现场,黄仁勋正式宣布其新一代AI超级计算平台Vera Rubin已进入全面投产阶段。根据英伟达公布的数据,Rubin GPU搭载第三代Transformer引擎,NVFP4推理/训练算力达到50/35PFLOPS,达到前代Blackwell的5/3.5倍;HBM4带宽22TB/s,为前代的2.8倍;晶体管数量3360亿个,为Blackwell的1.6倍。 决上下文存储瓶颈,Rubin平台重构HBM-DRAM-NAND三层存储 金字塔存储架构。在Agentic AI时代,智能体需要记住漫长的对话历史和复杂的上下文,这会产生巨大的KV Cache。传统的解决方案是将这些数据塞进昂贵的HBM显存中,但HBM容量有限且价格高昂。英伟达为此设计全新的存储架构,推出了由BlueField-4驱动的第三层推理上下文内存存储平台,让每秒处理的token数提升高达5倍。 HBM:Rubin GPU升级为HBM4,成为与GPU紧紧绑定的“计算核心” Rubin GPU集成了新一代高带宽内存HBM4,其接口宽度较HBM3e增加一倍。通过新内存控制器、与内存生态系统的深度协同设计及更紧密的计算-内存集成,Rubin GPU的内存带宽几乎达到了Blackwell的三倍。数量上,每颗Rubin GPU HBM4,容量288GB,带宽22TB/s,不再只是GPU附近的“高速缓存”,而是整个系统吞吐的硬约束。单价上,HBM4较3e显著提升,有望明显带动原厂的毛利率提升。 DRAM:Vera CPU升级为LPDDR5X,负责存放温热数据(KV缓存) Vera将SCF与高达1.5TB的LPDDR5X内存子系统(Grace内存为480GB LPDDR5X)相结合,能在低功耗下提供高达1.2TB/s的带宽(Grace带宽为512GB/s)。应用上,可将LPDDR5X和HBM4视为单一的一致性内存池,减少数据移动开销,并支持KV缓存卸载和高效多模型执行等技术。单价上,服务器端高端DRAM价格/盈利显著提升,消费端DRAM在被动挤压中承受成本压力和价格传导,形成“AI优先”的新一轮结构性涨价周期。 NAND:推出BlueField-4驱动的推理上下文内存存储平台,有望成为与GPU数量线性相关的通胀品 Vera Rubin在机架内部署BlueField-4处理器,专门管理KVCache。BlueField-4集成了64核Grace CPU和高带宽LPDDR5X内存,以及ConnectX-9网络,可提供高达800Gb/s的超低延迟以太网或InfiniBand连接。容量方面,在每个GPU原有1TB内存的基础上,BlueField-4DPU内存存储平台额外增加了16TB内存/每GPU,对于NVL72机架则增加1152TB内存。单价上,受到云服务商和AI应用需求的增长,行业预计2026年全年的NAND价格两位数百分比上涨。 投资建议 我们看好存储产业链叙事升级逻辑,建议关注: 1)海外龙头:海力士、三星、美光、闪迪、铠侠等; 2)国内标的:香农芯创、德明利、兆易创新、普冉股份、同有科技等。 风险提示: 供需节奏不及预期、行业竞争加剧、技术迭代不及预期等。 |
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明