英伟达下一代Rubin芯片已流片-电子发烧友网

继8月底英伟达透露Rubin架构芯片计划明年量产后，当地时间9月8日的高盛技术会议上，英伟达又谈到Rubin的进展。英伟达CFO科莱特?克雷斯（Colette Kress）表示，Rubin芯片已经在为进入市场做准备，Rubin架构将会有6个芯片，这些芯片都已经流片。这一消息在半导体和人工智能领域引起了广泛关注，预示着英伟达在芯片技术上的又一次重大飞跃。

Rubin芯片采用先进的台积电3nmEUV工艺制造，并且搭载HBM4高带宽内存，初期为8堆栈配置。这样的工艺和内存配置，使得芯片在性能参数上表现十分惊艳。其浮点运算能力达到每秒100万亿次，相较于前代产品有了约30%的显著提升。每个GPU的显存将达到288GB，带宽更是从原来的8TB/s跃升至13TB/s。如此强大的显存和带宽能力，能够更好地满足当下复杂的人工智能运算以及大规模数据处理的需求。

在数据中心领域，Rubin芯片的出现有望重塑格局。英伟达计划推出基于Rubin架构的下一代旗舰AI服务器NVIDIA Vera Rubin NVL144 CPX，该服务器将集成36个Vera CPU、144块Rubin GPU 和 144 块 Rubin CPX GPU。测试数据显示，搭载Rubin CPX 的Rubin机架在处理大上下文窗口时的性能，能比当前旗舰机架GB300 NVL72 高出最多6.5倍。而下一代旗舰机架将提供8exaFLOPs 的NVFP4算力，比GB300 NVL72高出7.5倍，同时单个机架就能提供100TB的高速内存和1.7PB/s的内存带宽。这意味着数据中心在使用Rubin芯片相关架构后，能够以更高的效率处理海量数据，无论是对于云计算服务提供商，还是进行大规模数据分析的企业来说，都极具吸引力。

从人工智能应用层面来看，Rubin芯片的强大性能也为诸多应用场景带来了新的可能。例如在自然语言处理领域，当前的模型在处理较长文本时往往面临算力不足的问题，而Rubin芯片凭借其强大的浮点运算能力和高带宽内存，有望使语言模型能够处理更长、更复杂的文本，实现更加精准的语义理解和文本生成。在计算机视觉方面，对于高清视频处理以及大规模图像数据集的分析，Rubin芯片也能够大幅缩短处理时间，提高处理精度。

另外，英伟达还计划在2027年下半年推出Rubin Ultra，进一步增强GPU性能，并引入HBM4E显存技术。到那时，FP4推理计算能力将高达15ExaFLOPS，FP8训练性能也达到5ExaFLOPS。新布局NVL576能够容纳多达576个GPU，支持企业构建超大规模的算力集群，这将为人工智能的前沿研究，如通用人工智能的探索等提供坚实的硬件基础。

英伟达下一代Rubin芯片的流片成功，是其在芯片研发道路上的重要里程碑。随着明年Rubin芯片的量产，以及后续Rubin Ultra等产品的推出，预计将在全球范围内推动人工智能、数据中心等多个领域迈向新的发展阶段，进一步巩固英伟达在半导体和人工智能计算领域的领先地位。

来源：半导体芯科技

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片

芯片

+关注

关注
460

文章
52944

浏览量
448067
英伟达

英伟达

+关注

关注
22

文章
3994

浏览量
95227

搜索历史

英伟达下一代Rubin芯片已流片

评论