0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA在Hot Chips 2025大会展示创新技术

NVIDIA英伟达 ? 来源:NVIDIA英伟达 ? 2025-08-27 12:52 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本周在加利福尼亚州帕洛阿尔托(Palo Alto)举行的 Hot Chips 大会上,NVIDIA 专家详细介绍了 NVIDIA NVLink 和Spectrum-X 以太网技术、Blackwell 以及 CUDA 如何为全球数百万的 AI 工作流加速推理。

AI 逻辑推理和网络成为 Hot Chips 大会的首要焦点。

Hot Chips是一个面向行业和学术界的关于处理器及系统架构的重要论坛,在太平洋时间 8 月 24 - 26 日于斯坦福大学举办,旨在展示创新成果,推动 AI 工厂发展,助力万亿美元的数据中心计算市场。

大会期间,NVIDIA 与谷歌(Google)和微软(Microsoft)等行业领导者在 8 月 24 日(星期日)一起举办了一场“授课式”会议——探讨如何为数据中心设计以机柜为单位的新架构。

此外,NVIDIA 专家还在四场会议和一场课程中详细介绍了:

NVIDIA 网络(包括NVIDIA ConnectX-8 SuperNIC)支持机整柜和数据中心规模的 AI 逻辑推理。(由NVIDIA 负责网卡和 SoC 的首席架构师 Idan Burstein 主讲)

由NVIDIA Blackwell 架构所支持的神经渲染的进步及推理能力的巨大飞跃——从而提供更高级别的图形和仿真功能。(由 NVIDIA 系统架构高级总监 Marc Blackstein 主讲)

基于硅光技术的NVIDIA CPO 交换机——采用光速光纤取代铜缆,可更快地传送信息,并且功耗更低,助力打造高效、高性能的十亿瓦级 AI 工厂。本次演讲还将重点介绍 NVIDIA Spectrum-XGS 以太网,这是一种新的跨地域扩展技术,可将多个分布式数据中心组合为 AI 超级工厂。(由 NVIDIA 网络高级副总裁 Gilad Shainer 主讲)

NVIDIA GB10 超级芯片成为NVIDIA DGX Spark台式超级计算机的引擎。(由 NVIDIA 高级杰出工程师 Andi Skende 主讲)

这些都是 NVIDIA 的最新技术如何通过加速推理来推动各个领域和各种规模的 AI 创新的一部分。

NVIDIA 网络促进了大规模的 AI 创新

AI 逻辑推理指的是 AI 系统可以通过多个 AI 推理步骤来分析和解决复杂问题——这需要机柜级规模的性能,以便高效地提供最佳的用户体验。

如今,为 AI 工作负载提供动力的数据中心里,网络如同中枢神经系统一样——将所有组件(服务器、存储设备和其他硬件)统一连接成一个强大的计算单元。

Burstein 在 Hot Chips 大会上的报告将会深入探讨 NVIDIA 网络技术(特别是 NVIDIA ConnectX-8 SuperNIC)如何实现高速、低延迟的多 GPU 通信,并在大规模场景下提供领先的 AI 逻辑推理性能。

NVIDIA ConnectX-8 SuperNIC

作为 NVIDIA 网络平台的一部分,NVIDIA NVLink、NVLink Switch 和 NVLink Fusion 提供了纵向扩展(scale-up)连接——能够在服务器内部及跨服务器连接 GPU 和计算元件,实现超低延迟、高带宽的数据交换。

NVIDIA Spectrum-X 以太网提供了横向扩展(scale-out) 来连接整个集群,能够快速将海量数据集导入到 AI 模型中,并编排数据中心内的 GPU 到 GPU 的通信。Spectrum-XGS跨区域扩展(scale-across)技术将 Spectrum-X 以太网的卓越性能和扩展能力扩展到多个分布式数据中心,组成十亿瓦级的智能 AI 超级工厂。

NVIDIA Spectrum-XGS 以太网连接多个分布式 AI 数据中心

作为 Spectrum-X Ethernet 的核心,CPO 交换机推升了大规模 AI 基础设施的性能和效率极限。Gilad Shainer 将在其演讲中详细介绍这一内容。

NVIDIA Blackwell NVL72——单机柜百亿亿级(Exascale)计算机——配备了 36 个 NVIDIA 超级芯片,其中每组芯片包含 2 个 NVIDIA GPU 和 1 个 NVIDIA CPU,通过目前最大的 NVLink 域实现互连。NVLink 交换机为 AI 和高性能计算工作负载提供每秒 130 TB/s的低延迟 GPU 通信。

NVIDIA 单机柜系统

NVIDIA Blackwell 架构,在推理性能方面实现了巨大的跃进。

NVIDIA GeForce RTX 5090 D v2 GPU(同样由 Blackwell 提供支持)——通过 NVIDIA DLSS 4 技术将当今游戏中的 AI 性能翻倍。

它还能够为游戏添加神经网络渲染功能,提供至高可达 10 倍的性能提升、10 倍的存储空间扩展,并将设计周期缩短 10 倍,有助于增强计算机图形和仿真中的逼真度。这不但在低功耗的情况下提供了流畅、灵敏的视觉体验,而且大大提升了游戏角色和特效的拟真度。

NVIDIA CUDA 是全球应用最广泛的计算基础设施,让用户能在任何地方利用 NVIDIA Blackwell 部署与运行AI模型。

全球已有数亿台的 GPU 运行 CUDA,从NVIDIA Blackwell 架构规模的系统到搭载 GeForce RTX 和 NVIDIA RTX PRO 的 PC 和工作站,包括由 NVIDIA GB10 提供支持的 NVIDIA DGX Spark(在 Skende 的会议中讨论过的)也即将发布。

算法到 AI 超级计算机

对大语言模型(LLM)的全面优化

NVIDIA DGX Spark

DGX Spark 用小巧的机身提供了强大的性能和功能,使开发者、研究人员、数据科学家和学生能够在桌面上突破生成式 AI 的界限,加速各行业的工作负载。

作为 NVIDIA Blackwell 平台的一部分,DGX Spark 支持 NVFP4,这是一种低精度数值格式,用于实现高效的代理式 AI 推理,特别是针对大语言模型(LLM)。

通过开源协作推动推理创新

NVIDIA 通过加速各种开放源代码库和框架,来加速和优化 LLM 和分布式推理的 AI 工作负载。这些平台包括NVIDIA TensorRT-LLM、NVIDIA Dynamo、TileIR、Cutlass、NVIDIA 集合通信库和 NIXL——它们都已被集成到数百万个工作流中。

为了支持开发者们能够使用自己的框架,NVIDIA 已与顶级开放框架供应商合作,为 FlashInfer、PyTorch、SGLang、vLLM 等提供模型优化。

此外,NVIDIA NIM 微服务也可用于 OpenAI 的 gpt-oss 和 Llama 4 等热门开放模型,使开发者能够轻松地在其喜欢的基础设施上,像运行自托管模型一样灵活安全地操作托管应用程序界面。

参与 NVIDIA 在 Hot Chips 大会上的活动,以了解推理和加速计算的最新进展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    41

    文章

    5782

    浏览量

    177055
  • NVIDIA
    +关注

    关注

    14

    文章

    5372

    浏览量

    106960
  • AI
    AI
    +关注

    关注

    88

    文章

    36024

    浏览量

    283494

原文标题:Hot Chips 大会热门主题:各种规模的推理、网络和 AI 创新都源于 NVIDIA

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智芯公司亮相2025电力信息通信新技术大会

    8月20至22日,由中国能源研究会主办的2025年电力信息通信新技术大会在武汉举办。大会以“数智赋能新型电力系统建设?助力电力行业高质量发展”为主题,旨在推进新型电力系统建设,探讨
    的头像 发表于 08-26 17:19 ?446次阅读

    2025 NVIDIA创业企业展示广州站成功举办

    近日,2025 NVIDIA 创业企业展示广州站在广州环球贸易中心举办。
    的头像 发表于 08-18 11:37 ?472次阅读

    村田中国亮相2025开放计算创新技术大会:以创新技术驱动智能化发展

    2025年8月7日,中国北京——今日,全球居先的综合电子元器件制造商村田中国(以下简称“村田”) 亮相2025开放计算创新技术大会(OCP China Day),围绕
    的头像 发表于 08-07 16:09 ?297次阅读
    村田中国亮相<b class='flag-5'>2025</b>开放计算<b class='flag-5'>创新技术</b><b class='flag-5'>大会</b>:以<b class='flag-5'>创新技术</b>驱动智能化发展

    是德科技邀您相约2025开放计算创新技术大会

    2025开放计算创新技术大会将于8月7日北京国际饭店举办,围绕“开放变革”主题,分享开放计算技术创新
    的头像 发表于 08-01 16:41 ?907次阅读

    康尼新能源亮相2025走进小鹏新技术展示交流会

    近日,"2025走进小鹏新技术展示交流会"广州小鹏汽车总部盛大启幕。本次交流会汇聚了产业链上下游众多领军企业,通过前沿技术
    的头像 发表于 06-28 16:20 ?748次阅读

    NVIDIAICRA 2025展示多项最新研究成果

    亚特兰大举行的国际机器人与自动化大会 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控领域的多项研究成果。
    的头像 发表于 06-06 14:56 ?835次阅读

    回顾2025蓝牙亚洲大会 蓝牙创新技术引领连接新纪元

    创新技术连接智能未来?? 2025蓝牙亚洲大会在深圳会展中心(福田)5号馆于2025年5月23日圆满闭幕。本次
    的头像 发表于 05-30 19:59 ?1142次阅读
    回顾<b class='flag-5'>2025</b>蓝牙亚洲<b class='flag-5'>大会</b>  蓝牙<b class='flag-5'>创新技术</b>引领连接新纪元

    2025 NVIDIA创业企业展示澳门站圆满收官

    澳门站首次作为 NVIDIA 创业企业展示分站城市,聚焦 AI 智能体、物理 AI 和机器人等前沿技术,更有 NVIDIA Omniverse、NV
    的头像 发表于 05-29 14:12 ?581次阅读

    2025 NVIDIA创业企业展示上海站圆满收官

    近日,2025 NVIDIA 创业企业展示——上海站在上海创新创意设计研究院圆满举办。
    的头像 发表于 05-20 16:31 ?522次阅读

    2025年联想创新科技大会即将开幕

    正式定档!2025年联想创新科技大会(Tech World),将于5月7日在上海世博中心精彩开幕。大会以“Smarter AI for all 让AI成为创新生产力”为主题,将聚焦混合
    的头像 发表于 04-15 15:58 ?539次阅读

    天马微电子亮相2025国际显示技术大会

    3月22-25日,2025 国际显示技术大会(ICDT 2025厦门佰翔会展中心盛大举行。作
    的头像 发表于 03-25 10:11 ?853次阅读

    MediaTek将于MWC 2025展示创新技术

    MediaTek 将于 2025 年世界移动通信大会(MWC 2025)第三展厅 3D10 展台展示多项无线通信迈向下一代 6G 的重要技术
    的头像 发表于 02-27 18:04 ?1574次阅读

    爱立信2024进博会展示5G及6G创新技术

    第七届中国国际进口博览会(进博会)上,全球领先的通信技术企业爱立信再次亮相,展示了其新一代5G网络硬件、5G-A赋能可编程网络、智慧工厂与智慧港口5G用例等领域的最
    的头像 发表于 11-11 15:16 ?1112次阅读

    海格通信亮相2024年能源北斗与时空智能创新技术应用大会

    近日,2024能源北斗与时空智能创新技术应用大会在广州召开,海格通信作为大会重要支持单位,充分展示了北斗与时空智能新技术、新应用、新产品,共
    的头像 发表于 11-09 14:51 ?1041次阅读

    NVIDIA Hot Chips 大会展示提升数据中心性能和能效的创新技术

    处理器及系统架构师领域的深度技术盛会,Hot Chips 已经成为价值万亿美元的数据中心计算市场的一个重要论坛。 本周举行的
    的头像 发表于 08-28 16:38 ?763次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>在</b> <b class='flag-5'>Hot</b> <b class='flag-5'>Chips</b> <b class='flag-5'>大会展示</b>提升数据中心性能和能效的<b class='flag-5'>创新技术</b>