Nvidia 发布全新 Rubin CPX GPU，助力 “海量上下文” 人工智能应用

4 0 0

Nvidia近日宣布，其全新的VeraRubin微架构正处于研发阶段，计划于2026年正式推出。该架构下的RubinCPX变体将专注于满足那些需要处理海量上下文窗口的人工智能工作负载。Nvidia首席执行官黄仁勋在新闻发布会上表示:“VeraRubin平台将标志着人工智能计算的新飞跃，推出下一代RubinGPU和名为CPX的新类别处理器。”

RubinCPX特别适用于需要处理超过一百万个token的应用场景，例如复杂的软件开发和高清晰度视频生成。根据Nvidia的计划，VeraRubinNDL144CPX类GPU将于2026年底上市。CPX模型是针对需要长上下文窗口的应用而特别设计的，能够提供8exaflops的人工智能性能、30PFNVFP4的上下文计算能力，以及相较于NvidiaGB300NVL72系统提升了三倍的指数运算能力。此外，CPX模型还配备了128GBGDDR7内存、4个编码器和4个解码器，专为生成视频而设计，并提供100TB的快速内存。

Nvidia的高管表示，VeraRubinNDL144CPX可被视为大型人工智能工厂的一部分。为了支持大规模数据中心的构建，Nvidia还计划推出千兆规模的参考设计。这意味着，Nvidia将与基础设施公司密切合作，从计算的角度重新设计数据中心，以提供覆盖建筑、设计、模拟、运营等各个方面的参考设计。

在此次发布前，Nvidia还公布了最新的MLPerf推理测试结果，黑威尔GPU在该基准测试中创下了新记录，超越了Llama3.1405B交互模型的基线。此项创新技术被称为“解耦服务”，能够使相同硬件在性能上得到提升，这为已经部署解决方案的企业带来了额外的收入机会。

划重点:

🔍**Nvidia发布RubinCPXGPU，旨在支持海量上下文AI应用。**

🚀**该GPU将于2026年底上市，具备强大的AI性能和内存配置。**

🏢**Nvidia计划推出数据中心的千兆规模参考设计，助力AI工厂建设。**

打赏赞

# AI资讯 # AI性能 # NVIDIA # RubinCPX # VeraRubin

文章版权归作者所有，未经允许请勿转载。

Nvidia 推出小型开放模型 Nemotron-Nano-9B-v2：可切换的推理功能

阿力

8 0

AMD 收购 Brium，向 Nvidia 发起 AI 硬件挑战

阿力

6 0

英国金融监管局携手 Nvidia，开启 AI 创新 “超级沙盒” 计划！

阿力

34 0

NVIDIA放大招！Llama-Nemotron-Nano-VL-8B-V1发布，图像视频文本全能，微调王座谁与争锋？

阿力

10 0

NVIDIA 推出 Jet-Nemotron：53 倍提速的混合架构语言模型实现 98% 的推理成本节约

阿力

7 0

Infineon与 NVIDIA 携手推动人形机器人精确运动技术

阿力

16 0

暂无评论

暂无评论...

Nvidia 发布全新 Rubin CPX GPU，助力 “海量上下文” 人工智能应用

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

Freepik重磅接入Seedream 4.0！Premium+会员无限生图

相关文章

暂无评论

热门文章

热门标签

​Nvidia 发布全新 Rubin CPX GPU，助力 “海量上下文” 人工智能应用

相关文章：

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

Freepik重磅接入Seedream 4.0！Premium+会员无限生图

相关文章

暂无评论

热门文章

热门标签

Nvidia 发布全新 Rubin CPX GPU，助力 “海量上下文” 人工智能应用