继8月底英伟达透露Rubin架构芯片计划明年量产后,当地时间9月8日的高盛技术会议上,英伟达又谈到Rubin的进展。英伟达CFO科莱特?克雷斯(Colette Kress)表示,Rubin芯片已经在为进入市场做准备,Rubin架构将会有6个芯片,这些芯片都已经流片。这一消息在半导体和人工智能领域引起了广泛关注,预示着英伟达在芯片技术上的又一次重大飞跃。
?
Rubin芯片采用先进的台积电3nmEUV工艺制造,并且搭载HBM4高带宽内存,初期为8堆栈配置。这样的工艺和内存配置,使得芯片在性能参数上表现十分惊艳。其浮点运算能力达到每秒100万亿次,相较于前代产品有了约30%的显著提升。每个GPU的显存将达到288GB,带宽更是从原来的8TB/s跃升至13TB/s。如此强大的显存和带宽能力,能够更好地满足当下复杂的人工智能运算以及大规模数据处理的需求。
?
在数据中心领域,Rubin芯片的出现有望重塑格局。英伟达计划推出基于Rubin架构的下一代旗舰AI服务器NVIDIA Vera Rubin NVL144 CPX,该服务器将集成36个Vera CPU、144块Rubin GPU 和 144 块 Rubin CPX GPU。测试数据显示,搭载Rubin CPX 的Rubin机架在处理大上下文窗口时的性能,能比当前旗舰机架GB300 NVL72 高出最多6.5倍。而下一代旗舰机架将提供8exaFLOPs 的NVFP4算力,比GB300 NVL72高出7.5倍,同时单个机架就能提供100TB的高速内存和1.7PB/s的内存带宽。这意味着数据中心在使用Rubin芯片相关架构后,能够以更高的效率处理海量数据,无论是对于云计算服务提供商,还是进行大规模数据分析的企业来说,都极具吸引力。
从人工智能应用层面来看,Rubin芯片的强大性能也为诸多应用场景带来了新的可能。例如在自然语言处理领域,当前的模型在处理较长文本时往往面临算力不足的问题,而Rubin芯片凭借其强大的浮点运算能力和高带宽内存,有望使语言模型能够处理更长、更复杂的文本,实现更加精准的语义理解和文本生成。在计算机视觉方面,对于高清视频处理以及大规模图像数据集的分析,Rubin芯片也能够大幅缩短处理时间,提高处理精度。
另外,英伟达还计划在2027年下半年推出Rubin Ultra,进一步增强GPU性能,并引入HBM4E显存技术。到那时,FP4推理计算能力将高达15ExaFLOPS,FP8训练性能也达到5ExaFLOPS。新布局NVL576能够容纳多达576个GPU,支持企业构建超大规模的算力集群,这将为人工智能的前沿研究,如通用人工智能的探索等提供坚实的硬件基础。
英伟达下一代Rubin芯片的流片成功,是其在芯片研发道路上的重要里程碑。随着明年Rubin芯片的量产,以及后续Rubin Ultra等产品的推出,预计将在全球范围内推动人工智能、数据中心等多个领域迈向新的发展阶段,进一步巩固英伟达在半导体和人工智能计算领域的领先地位。
来源:半导体芯科技
审核编辑 黄宇
-
芯片
+关注
关注
460文章
52944浏览量
448067 -
英伟达
+关注
关注
22文章
3994浏览量
95227
发布评论请先 登录
堪称史上最强推理芯片!英伟达发布 Rubin CPX,实现50倍ROI

今日看点丨媒体“爆料”美国在芯片货物中安了追踪器;英伟达下一代GPU芯片Rubin可能延后上市
安森美携手英伟达推动下一代AI数据中心发展
下一代高速芯片晶体管解制造问题解决了!
NVIDIA 采用纳微半导体开发新一代数据中心电源架构 800V HVDC 方案,赋能下一代AI兆瓦级算力需求

新思科技携手英伟达加速芯片设计,提升芯片电子设计自动化效率
新思科技亮相英伟达GTC 2025大会
黄仁勋宣布:丰田与英伟达携手打造下一代自动驾驶汽车
微软大手笔采购英伟达AI芯片
今日看点丨龙芯中科:下一代桌面芯片3B6600预计明年上半年交付流片;消息称英伟达 Thor 芯片量产大幅推迟

评论