​Nvidia 发布全新 Rubin CPX GPU,助力 “海量上下文” 人工智能应用

AI资讯1周前发布 阿力
4 0

Nvidia近日宣布,其全新的VeraRubin微架构正处于研发阶段,计划于2026年正式推出。该架构下的RubinCPX变体将专注于满足那些需要处理海量上下文窗口的人工智能工作负载。Nvidia首席执行官黄仁勋在新闻发布会上表示:“VeraRubin平台将标志着人工智能计算的新飞跃,推出下一代RubinGPU和名为CPX的新类别处理器。”

RubinCPX特别适用于需要处理超过一百万个token的应用场景,例如复杂的软件开发和高清晰度视频生成。根据Nvidia的计划,VeraRubinNDL144CPX类GPU将于2026年底上市。CPX模型是针对需要长上下文窗口的应用而特别设计的,能够提供8exaflops的人工智能性能、30PFNVFP4的上下文计算能力,以及相较于NvidiaGB300NVL72系统提升了三倍的指数运算能力。此外,CPX模型还配备了128GBGDDR7内存、4个编码器和4个解码器,专为生成视频而设计,并提供100TB的快速内存。

Nvidia的高管表示,VeraRubinNDL144CPX可被视为大型人工智能工厂的一部分。为了支持大规模数据中心的构建,Nvidia还计划推出千兆规模的参考设计。这意味着,Nvidia将与基础设施公司密切合作,从计算的角度重新设计数据中心,以提供覆盖建筑、设计、模拟、运营等各个方面的参考设计。

在此次发布前,Nvidia还公布了最新的MLPerf推理测试结果,黑威尔GPU在该基准测试中创下了新记录,超越了Llama3.1405B交互模型的基线。此项创新技术被称为“解耦服务”,能够使相同硬件在性能上得到提升,这为已经部署解决方案的企业带来了额外的收入机会。

划重点:

🔍**Nvidia发布RubinCPXGPU,旨在支持海量上下文AI应用。**

🚀**该GPU将于2026年底上市,具备强大的AI性能和内存配置。**

🏢**Nvidia计划推出数据中心的千兆规模参考设计,助力AI工厂建设。**

© 版权声明

相关文章

暂无评论

暂无评论...