0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔定律赶不上模型进化?业界首款超以太网和UALink IP带来“算力扩容”新解法

Felix分析 ? 来源:电子发烧友网 ? 作者:吴子鹏 ? 2025-07-16 14:06 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文 / 吴子鹏)时至 2025 年,在专项政策扶持、旺盛算力需求以及跨行业多元应用的共同推动下,AI人工智能)技术展现出前所未有的增长潜力。根据市场调研机构 IDC 的统计数据,2024 年全球 AI IT 总投资已达 3158 亿美元,预计到 2028 年将进一步增长至 8159 亿美元,期间年复合增长率高达 32.9%。

AI 算力集群作为 AI IT 投资中的关键组成部分,正通过 Scale Up(纵向扩展)和 Scale Out(水平 / 横向扩展)两种方式不断扩大规模。为满足万亿甚至十万亿参数规模的 AI 大模型训练需求,万卡级、十万卡级别的 AI 算力集群已成为行业主流配置。然而,在构建大规模 AI 算力集群的过程中,行业面临着诸多典型挑战。比如,英伟达公司NVLink 和 InfiniBand 技术虽然在 Scale Up和 Scale Out方面具有一定的性能优势,但其作为专有协议也构建起了生态壁垒,将算力卡与扩展技术深度绑定,显著提高了算力布局的准入门槛。

为进一步释放大规模 AI 算力集群的发展潜能,打破专有技术的封闭生态已迫在眉睫,同时还需兼顾高性能、低功耗与可扩展性等关键指标。超以太网联盟(UEC)和 UALink 联盟(UAC)通过制定开放规范,将碎片化的互连技术整合为统一框架。这种标准化举措不仅减少了重复研发投入,更有效提升了行业整体运营效率。在此背景下,新思科技(Synopsys)推出的业界首款超以太网和 UALink IP 解决方案,凭借开放标准、高性能设计以及生态协同优势,为大规模 AI 集群提供了可扩展、高可靠的互连基础,有望成为下一代 AI 基础设施的核心技术。

开放标准:提升 AI 算力集群效率的关键

对于 AI 算力集群而言,算力芯片是最基本的计算单元。然而,算力芯片需求的发展与先进制程之间出现了严重的演进速度不匹配问题。算力芯片主要服务于 AI 模型领域,该领域参数量大约每 4 至 6 个月便会翻一番;而先进制程遵循摩尔定律,晶体管数量约每 18 - 24 个月增加一倍,性能同步提升。此外,随着单颗芯片内集成的计算单元和内存单元日益增多,算力芯片设计不断突破掩膜尺寸限制。因此,AI 行业迫切需要一种可扩展的解决方案,以应对急剧增长的算力需求。

现代 AI 算力集群普遍采用 “Scale Up + Scale Out” 混合架构。其中,Scale Up 主要用于在算力集群中通过纵向扩展,提升单节点内的计算密度与通信效率。在传统算力网络中,每台服务器即为一个算力节点,但受空间、功耗和散热条件限制,单台服务器所能容纳的计算芯片数量有限。为此,行业引入超节点(SuperPod)概念,通过 Switch 或交换机组网技术,使单节点不再局限于一台服务器,而是可由多台服务器与网络设备共同组成。

Scale Up 旨在尽可能地增加单节点内的计算资源,而 Scale Out 则致力于突破单节点的算力上限,进行更大规模的横向扩展,以满足大模型训练对计算资源呈指数级增长的需求。对于大模型训练任务,往往需要数万至数十万计算卡协同工作,Scale Out 的优势在于其理论上具备无限扩展能力,但连接效率对其至关重要。

长期以来,英伟达公司在 “Scale Up + Scale Out” 混合架构领域引领技术发展。在 Scale Up 方向,英伟达拥有 NVLink 和 NVSwitch 两大核心技术;在 Scale Out 方向,Infiniband(IB)也是主流通信网络协议之一。但正如前文所述,NVLink、NVSwitch 和 Infiniband 均为专有协议,形成了一定的行业技术壁垒。为打破这一局面,超以太网和 UALink 等开放标准应运而生,重塑 AI 基础设施的生态格局。

UALink 是一项对标英伟达 NVLink 和 NVSwitch 的关键技术,可广泛适配各类加速器。与 NVLink 相同,UALink 采用 GPU 内部总线传输的原生语义 —— 内存语义,支持内存共享功能,能够优化加速器之间的内存通信。无论是直接连接还是通过交换机连接,UALink 均可实现高效数据传输,每通道速度高达 200 Gbps,使每个加速器能够直接访问其他加速器的内存。UALink 还是一个低延迟的轻量级协议,并具备同步功能,有助于保障多个加速器之间的一致性,促进系统高效运行。

UALink 技术框图,图源:MICRO - 2024 HiPChips 研讨会


另外,UALink 还具有两项显著优势特性:支持 Switch 组网,并与 UEC 相辅相成。前者使 AI 行业能够打造支持 UALink 的交换机,进而构建更高计算性能的超级节点;后者则构建起基于开放标准的生态体系,加速行业从 “少数公司主导” 向 “开放竞争” 模式转变。凭借这些领先特性,UALink 可使超级节点如同单个加速器般运作,提供高性能、低延时、低功耗的计算性能。

2025 年 4 月,UALink 联盟正式发布 UALink 1.0 规范,支持每通道 200 GT/s 的双向数据速率,信号速率达 212.5 GT/s,单个 UALink 1.0 系统支持连接多达 1024 个 AI 加速器,并通过 UALink 交换机连接,为每个 AI 加速器分配一个端口和 10 - bit 唯一标识符,以实现精准路由。

在 Scale Out 方向,超以太网联盟致力于创建 “基于以太网的完整通信堆栈架构”,用超以太网传输协议替代基于以太网的 RoCE 协议,从而提高网络吞吐量、降低延迟,增强网络的可靠性与稳定性,这对于提升 Scale Out 的可扩展性至关重要。

超以太网集群图,图源:新思科技


以太网是当前全球应用最广泛的局域网技术,其技术标准由 IEEE 的 802.3 标准制定。UEC 采用专为 AI 和 HPC 应用设计的下一代传输协议,对以太网进行重新定义。超以太网从物理层、链路层、传输层、软件层等多个层面改进以太网技术,具备 FEC(前向纠错)统计、链路层重传(LLR)、多路径报文喷发、新一代拥塞控制、灵活排序、端到端遥测、交换机卸载等关键功能。例如,在传输层,超以太网支持选择性重传、无序传送、数据包喷射和高级拥塞控制机制,提供可靠有序交付(ROD)、可靠无序交付(RUD)和不可靠无序交付(UUD)等多种传输模式。

超以太网技术框图,图源:UEC


虽然超以太网与 InfiniBand 均是专为 AI 和 HPC 领域研发的网络通信技术,但超以太网凭借开放标准,促进了广泛的技术融合以及不同制造商和设备间的联合创新。同时,以太网庞大的供应商生态体系有助于 AI 行业降低算力门槛,使中小型企业也能以较低成本参与 AI 硬件市场竞争。

业界首款 UALink 和超以太网 IP 解决方案

超以太网和 UALink 技术的诞生,实现了不同厂商加速器的高效互连,避免了生态绑定问题。已发布的 UALink 1.0 标准和 UEC 就绪(UEC - ready)规范,共同构建起下一代 AI 基础设施的互连框架。

作为超以太网联盟(UEC)和 UALink 联盟(UAC)的活跃成员,新思科技推出业界首款超以太网 IP 和 UALink IP 解决方案,旨在满足下一代大规模 AI 算力集群在高带宽、低延迟互连方面的迫切需求。

业界首款 UALink 和超以太网 IP 解决方案,图源:新思科技


新思科技 UALink IP 解决方案集成了控制器、物理层(PHY)和验证 IP,专为数据密集型 AI 工作负载设计,具备低延迟、高带宽和先进的内存共享能力。该方案是一套面向 AI 加速器和交换机的全集成解决方案,满足 UALink 规范的完整硬件安全要求,可实现每通道 200 Gbps 的最大吞吐量,为扩展至 1024 个 AI 加速器的超级节点提供强大的带宽支持。

新思科技超以太网 IP 解决方案由 MAC(媒体访问控制)、PCS(物理编码子层)控制器、物理层(PHY)以及验证 IP 组成,并采用经硅验证的新思科技 112G/224G PHY IP,以提升可靠性,为连接百万节点构建大规模 AI 扩展网络提供超低延迟和高带宽连接。这一完整的超以太网接口栈通过 112Gbps 和 224Gbps SerDes(串行器 / 解串器)进行信息传输,支持 4×400G、2×800G 和 1.6T 以太网速率。

同时,新思科技超以太网 IP 解决方案支持不断演进的 IEEE 802.3 和 OIF - 224G 电气标准,满足 chip - to - chip、chip - to - module 以及长距离铜缆 / 背板互连的性能要求。该方案中包含以太网 PCS 的 RS - FEC(里德 - 所罗门前向纠错)功能、前馈均衡器 (FFE) 以及低抖动锁相环(PLL),有效提升了信号传输的稳定性。

更为关键的是,新思科技 UALink IP 解决方案和超以太网 IP 解决方案基于经硅验证的成熟技术,结合该公司在接口技术领域数十年的丰富经验,并严格遵循不断发展的行业开放标准,能够帮助开发人员有效降低研发风险。截至目前,新思科技已经能够为 AI 和 HPC 等前沿应用提供丰富的高速接口 IP 组合,涵盖 PCIe 7.0、1.6T 以太网、CXL、HBM、UCIe 以及最新的超以太网和 UALink 方案,充分释放下一代 AI 基础设施的发展潜能。

结语

大规模 AI 算力集群的发展已步入技术跃迁的关键阶段。面对专有技术形成的生态壁垒以及指数级增长的算力需求,开放标准正以革新者的姿态重塑行业格局。超以太网与 UALink 通过标准化互连框架,在打破技术垄断的同时,凭借高性能、低功耗和可扩展特性,为万卡、十万卡级集群的算力协同提供了坚实的底层支撑。新思科技推出的业界首款超以太网与 UALink IP 解决方案,依托经硅验证的技术积累与对开放标准的深度契合,不仅为 AI 加速器与交换机的高效互联奠定了硬件基础,更通过生态协同效应降低了创新门槛,助力中小企业参与算力基建竞争,推动行业从 “少数巨头主导” 向 “多元开放创新” 模式加速演进。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摩尔定律
    +关注

    关注

    4

    文章

    640

    浏览量

    79922
  • Synopsys
    +关注

    关注

    2

    文章

    160

    浏览量

    90771
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    车载网络测试技术的进化之路#CAN #车载以太网 #TSN #时间敏感网络

    车载以太网
    北汇信息POLELINK
    发布于 :2025年06月26日 18:12:48

    奇异摩尔邀您相约2025中国AI大会

    在2025中国AI大会上,奇异摩尔首席网络架构专家叶栋将带来“AI原生时代 —共筑节点的网络基础架构”的主题演讲,分享国内外
    的头像 发表于 06-17 17:49 ?738次阅读

    双通道CAN转以太网#CAN转以太网#三格电子

    以太网
    三格电子科技
    发布于 :2025年05月12日 13:17:05

    电力电子中的“摩尔定律”(1)

    本文是第二届电力电子科普征文大赛的获奖作品,来自上海科技大学刘赜源的投稿。著名的摩尔定律中指出,集成电路每过一定时间就会性能翻倍,成本减半。那么电力电子当中是否也存在着摩尔定律呢?1965年,英特尔
    的头像 发表于 05-10 08:32 ?280次阅读
    电力电子中的“<b class='flag-5'>摩尔定律</b>”(1)

    深入解读新思科技UALink以太网IP解决方案

    AI工作负载正显著推动接口IP市场的创新。AI模型参数量呈指数级增长,大约每4至6个月翻一番,这与摩尔定律所描绘的硬件发展速度(周期长达18个月)形成了鲜明对比。此差距要求硬件创新来支持人工智能(AI)工作负载,并且需要更强的计
    的头像 发表于 03-26 10:08 ?929次阅读
    深入解读新思科技<b class='flag-5'>UALink</b>和<b class='flag-5'>超</b><b class='flag-5'>以太网</b><b class='flag-5'>IP</b>解决方案

    石墨烯互连技术:延续摩尔定律的新希望

    半导体行业长期秉持的摩尔定律(该定律规定芯片上的晶体管密度大约每两年应翻一番)越来越难以维持。缩小晶体管及其间互连的能力正遭遇一些基本的物理限制。特别是,当铜互连按比例缩小时,其电阻率急剧上升,这会
    的头像 发表于 01-09 11:34 ?610次阅读

    摩尔定律是什么 影响了我们哪些方面

    摩尔定律是由英特尔公司创始人戈登·摩尔提出的,它揭示了集成电路上可容纳的晶体管数量大约每18-24个月增加一倍的趋势。该定律不仅推动了计算机硬件的快速发展,也对多个领域产生了深远影响。
    的头像 发表于 01-07 18:31 ?1452次阅读

    新思科技推出超以太网UALink IP解决方案

    近日,全球领先的电子设计自动化(EDA)和半导体IP供应商新思科技(Synopsys, Inc.)宣布了一项重大技术创新——推出业界首以太网
    的头像 发表于 12-25 11:12 ?750次阅读

    新思科技推出业界首连接大规模AI加速器集群的以太网UALink IP 解决方案

    加州桑尼维尔,2024 年 12 月 11 日 ——新思科技 (Synopsys, Inc.,纳斯达克股票代码:SNPS)近日宣布,推出业界首以太网
    发表于 12-20 11:47 ?577次阅读

    摩尔定律时代,提升集成芯片系统化能力的有效途径有哪些?

    电子发烧友报道(文/吴子鹏)当前,终端市场需求呈现多元化、智能化的发展趋势,芯片制造则已经进入后摩尔定律时代,这就导致先进的工艺制程虽仍然是芯片性能提升的重要手段,但效果已经不如从前,先进封装
    的头像 发表于 12-03 00:13 ?3193次阅读

    以太网物理模型和仿真用户指南

    电子发烧友网站提供《以太网物理模型和仿真用户指南.pdf》资料免费下载
    发表于 11-20 11:38 ?1次下载
    <b class='flag-5'>以太网</b>物理<b class='flag-5'>模型</b>和仿真用户指南

    以太网和TCP/IP的关系解析

    在现代计算机网络中,以太网和TCP/IP协议栈是构建网络通信的基础。以太网定义了局域(LAN)中的数据链路层和物理层的技术标准,而TCP/IP
    的头像 发表于 11-08 09:21 ?2422次阅读

    中国大会召开,业界首高质量评估体系发布

    首次完整地构建了人工智能时代高质量的理论体系,并探索性提出业界首个 "五位一体"的高质量评估体系。 发布现场 在当前由大
    的头像 发表于 09-28 16:50 ?510次阅读
    中国<b class='flag-5'>算</b><b class='flag-5'>力</b>大会召开,<b class='flag-5'>业界首</b>个<b class='flag-5'>算</b><b class='flag-5'>力</b>高质量评估体系发布

    AI芯片主张“超越摩尔”,Chiplet与先进封装技术迎百家争鸣时代

    越来越差。在这种情况下,超越摩尔逐渐成为打造高芯片的主流技术。 ? 超越摩尔是后摩尔定律时代三大技术路线之一,强调利用层堆叠和高速接口技
    的头像 发表于 09-04 01:16 ?4264次阅读
    高<b class='flag-5'>算</b><b class='flag-5'>力</b>AI芯片主张“超越<b class='flag-5'>摩尔</b>”,Chiplet与先进封装技术迎百家争鸣时代

    模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问
    发表于 08-20 09:04