0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深入解读新思科技UALink和超以太网IP解决方案

新思科技 ? 来源:新思科技 ? 2025-03-26 10:08 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI工作负载正显著推动接口IP市场的创新。AI模型参数量呈指数级增长,大约每4至6个月翻一番,这与摩尔定律所描绘的硬件发展速度(周期长达18个月)形成了鲜明对比。此差距要求硬件创新来支持人工智能(AI)工作负载,并且需要更强的计算能力、更丰富的资源和更高带宽的互连技术。

更重要的是,硬件性能已经超越了标准掩膜尺寸的限制。由于计算单元和相关内存越来越多,CPUGPU设计正在不断突破掩膜尺寸。AI加速器和GPU现在需要一种全新的超高效网络基础设施,突破单个芯片的性能限制,同时实现低延迟、高密度连接的芯片间通信,优化能效。

本文从技术角度深入探讨了横向、纵向扩展为何成为HPC和AI芯片开发商的关键需求,以及超以太网和UALink等新标准如何应对高带宽、低延迟连接和高效资源管理的挑战。

新标准的崛起

在AI工作负载需求的推动下,芯片到芯片架构的横向、纵向扩展至关重要。从单芯片过渡到Multi-Die系统,并融合HBM和UCIe等并行接口已成为必然趋势。这些解决方案支持同构和异构计算架构,借助PCIe和CXL的传统连接进一步扩展内存,并利用以太网实现更广泛的网络架构。

6ab15be4-089a-11f0-9310-92fbcf53809c.png

▲点击查看详细信息

为了满足AI扩展需求,两项新标准应运而生:

适用于横向扩展的超以太网

适用于纵向扩展的UALink

超以太网是一种开放、可互操作的高性能架构,专为AI而设计,得到了交换机、网络、半导体和系统供应等领域的知名企业以及超大规模用户的支持。另一方面,UALink则通过特定的内存共享功能,使加速器能够直接运行,得到了半导体行业重要参与者的广泛认可。

超以太网:横向扩展AI工作负载

随着AI和HPC流量的增长,使用RoCE或专有解决方案的传统网络逐渐显露出其局限性。这包括严格的按序数据包传送、基于流的低效负载平衡,以及数据包丢失时在RDMA操作中繁琐的重新传输。而这些对于AI操作来说成本非常高昂。超以太网联盟(UEC)技术通过提供更高效、可扩展且强大的网络解决方案来解决这些问题,能够针对性地满足AI和HPC工作负载的高性能需求。

超以太网的工作原理

6ac97b3e-089a-11f0-9310-92fbcf53809c.png

▲点击查看详细信息

图1:超以太网集群图

超以太网系统由多个集群组成,每个集群都包含节点和基础设施。节点通过结构接口(网卡)连接到网络,该接口可以承载多个逻辑结构端点(FEP)。网络分为多个平面,每个平面包含多个通过交换机互连的FEP。

集群主要采用两种模式来处理不同的任务。

并行作业模式:系统运行任务直至完成,并允许多个节点同时进行通信。对于需要大量并行处理的高性能计算任务来说,这是理想的作业模式。

客户端/服务器模式:系统专为存储任务而设置。在这种情况下,服务器持续处理来自多个客户端的请求,并在特定的节点对之间进行通信,非常适合用于可靠且一致的数据访问和管理工作。

超以太网的关键技术特点

6ade93e8-089a-11f0-9310-92fbcf53809c.png

▲点击查看详细信息

图2:超以太网使用专为AI和HPC应用而设计的下一代传输协议重新定义了以太网。(图片来源:超以太网联盟)

1. 物理层:与IEEE 802.3标准以太网兼容,具有基于FEC(前向纠错)码字的可选性能监控功能。UCR(不可纠正码字率)和MTBPE(平均数据包错误间隔时间)等指标有助于深入分析传输性能以及可靠性表现。

2. 链路层:引入LLR(链路层重传)协议,可实现无损传输,而无需依赖优先级流量控制(PFC)机制。这可确保更快的错误恢复,避免不必要的端到端重传,并减少尾部延迟。

3. 数据包速率改进(PRI):通过压缩以太网和IP报头提高数据包速率,解决由传统功能和冗余协议字段导致的效率低下问题。

4.链路协商协议:通过协商功能扩展LLDP,以检测并启用LLR和PRI等受支持功能。

5.传输层:旨在解决传统RDMA网络的局限性,支持选择性重传、无序传送、数据包喷射和高级拥塞控制机制。提供多种传输模式,包括可靠有序交付(ROD)、可靠无序交付(RUD)和不可靠无序交付(UUD)。

6.拥塞控制:实现了incast管理、加速速率调整、基于遥测的控制和通过数据包喷射进行自适应路由等功能,以尽可能地减少尾部延迟并增强网络性能。

7.安全:在传输层整合基于作业的安全性,利用IPSec和PSP功能进一步减少加密开销并支持硬件卸载。

UALink:纵向扩展AI工作负载

AI模型的规模越来越大,相关市场对算力和内存资源的需求显著增加。传统的互连技术并非专为AI工作负载网络设计,难以满足其需求。UALink作为一种可扩展结构,可在数十到数百个专用AI加速器之间建立基于标准的超高带宽连接网络。这一技术的出现标志着市场的重大进步,纵向扩展网络从临时配置转向更标准化的网络,支持更高基数的系统,并配备专用的UALink交换机。

UALink的工作原理

6b12eb0c-089a-11f0-9310-92fbcf53809c.png

▲点击查看详细信息

图3:UALink为纵向扩展网络和AI加速器交换机营造了开放的生态系统。摘自:MICRO-2024 HiPChips研讨会

UALink创建了一个高速、低延迟的网络,可以连接一个Pod内的多个加速器(例如GPU)。这让每个加速器能够直接访问其他加速器的内存,整个Pod可以像单个巨大的GPU一样运行。这使得每个GPU可以直接访问和修改同一扩展网络内其他任何GPU的内存。从软件角度来看,这组相互连接的GPU看起来就像一整个大型GPU。

UALink的工作原理超加速器链路(UALink)的关键技术特点

1.高带宽:UALink每通道的速度高达200 Gbps,有助于在加速器之间高效传输数据。

2.轻量级协议:该协议设计轻量,可减少开销并确保高效通信。

3.效率:亚微秒级延迟提高了推理性能,并支持在不划分工作负载的情况下扩展到八个GPU以上。

4. 开放标准:UALink是一个开放的行业标准,可改善互操作性,减少供应商锁定。

5. 内存共享:特定的内存共享功能让加速器可以有效地访问共享内存资源,支持数百个GPU之间的加载、存储和原子操作,减少端到端延迟并降低功耗。

6.同步功能:UALink包含同步功能,有助于确保多个加速器之间的一致性,促进高效运行。

7. 与UEC相辅相成:可以与超以太网联盟成员的前沿技术良好协作,实现更广泛的可扩展性。

利用业界首发的超以太网和UALink IP解决方案实现大规模AI集群

新思科技抢先推出业内首款UALink和超以太网IP解决方案,致力于连接海量AI加速器集群。

6b25c628-089a-11f0-9310-92fbcf53809c.png

▲点击查看详细信息

新思科技超以太网IP解决方案的速度高达1.6Tb/s,可支持多达一百万个端点。此外,新思科技UALink IP每通道的速度高达200Gb/s,可连接一千多个加速器。这些解决方案针对AI的横向、纵向扩展进行了优化,提供了AI通信所必需的高带宽和轻量级协议。

结语

随着AI领域的不断扩大,采用标准化接口对于推动创新、降低复杂性和提高整体系统性能至关重要。AI基础结构的未来在于这些能够促进行业增长、提高效率的协作性开放标准解决方案。新思科技正处于AI和HPC设计创新的前沿,提供广泛的高速接口IP组合。新思科技为PCIe 7.0、1.6T以太网、CXL、HBM、UCIe以及最新的超以太网和UALink提供完整且安全的IP解决方案,从而推动AI和HPC在性能、可扩展性、效率和互操作性等方面达到新的高度,帮助客户实现一次性流片成功。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    41

    文章

    5710

    浏览量

    176495
  • 交换机
    +关注

    关注

    22

    文章

    2760

    浏览量

    102082
  • AI
    AI
    +关注

    关注

    88

    文章

    35501

    浏览量

    281354
  • 新思科技
    +关注

    关注

    5

    文章

    874

    浏览量

    51663
  • HPC
    HPC
    +关注

    关注

    0

    文章

    333

    浏览量

    24391

原文标题:业内首款UALink和超以太网IP解决方案,重塑高性能AI网络

文章出处:【微信号:Synopsys_CN,微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    思科技推出业界首款连接大规模AI加速器集群的以太网UALink IP 解决方案

    加州桑尼维尔,2024 年 12 月 11 日 ——新思科技 (Synopsys, Inc.,纳斯达克股票代码:SNPS)近日宣布,推出业界首款以太网IP
    发表于 12-20 11:47 ?584次阅读

    设计坊第三期:灵活的工业以太网解决方案

    、EtherNet/IP 和 EtherCAT以太网标准各自有哪些优缺点呢?大家来比较下 3. 随着市场上标准数量的增多,以及标准的不断发展,采用多块电路板的解决方案怎样才能最有效,同时迅速支持新功能和其他协议
    发表于 12-25 11:17

    自动化行业中的全厂自动化中的以太网/IP

    在本系列第一部分中,我们探讨了以太网在自动化行业中的重要性,谈到了其相对于传统现场总线的优势。对于初创企业来说,以太网解决方案具有卓越的优势、能效比和设备选择自由性,这些优势全部来自其底层技术
    发表于 10-22 16:45

    基于以太网接口的TCP/IP 实验

    基于以太网接口的TCP/IP 实验 一. 实验目的进行一次TCP/IP 的通讯实验,使用户初步了解以太网IP、ARP、ICMP 等协议。
    发表于 09-26 16:51 ?2198次阅读
    基于<b class='flag-5'>以太网</b>接口的TCP/<b class='flag-5'>IP</b> 实验

    工业以太网方案选择指南

    针对工业以太网方案选择,ARC咨询集团的专家给大家的建议是,终端用户需要从2个方面考虑工业以太网:平台导向的解决方案和应用导向的解决方案
    发表于 07-09 17:41 ?943次阅读

    Linux以太网解决方案的介绍

    本课程将回顾高性能以太网解决方案所需的系统功能。 将审查Xilinx以太网IP内核和相关设备驱动程序,包括设备树绑定。 还讨论了与Petalinux的联网。
    的头像 发表于 11-27 06:38 ?3564次阅读

    万兆以太网IP SAN的融合

    IP SAN存储融合到万兆以太网络中,将大大增加了IP SAN网络的通信带宽,提高主机访问存储的速度,同时由于以太网灵活易实施的特点,万兆
    的头像 发表于 01-24 15:16 ?3618次阅读

    思科技收购MorethanIP,进一步扩展DesignWare以太网IP产品组合

    借助此项收购,新思科技将能提供 完整的以太网IP解决方案,包括应用于200G/400G和800G高性能计算SoC的MAC、PCS和112G PHY。
    发表于 04-20 09:52 ?2113次阅读

    以太网供电解决方案

    以太网供电解决方案
    发表于 05-18 13:45 ?15次下载
    <b class='flag-5'>以太网</b>供电<b class='flag-5'>解决方案</b>

    思科技推出业界首个1.6T高速以太网解决方案

    思科技(Synopsys)近日在数据中心领域取得了重大突破,推出了业界首个1.6T高速以太网解决方案,为日益增长的人工智能(AI)计算需求提供了强有力的网络支持。这一创新解决方案相较
    的头像 发表于 03-08 11:06 ?938次阅读

    数据中心市场的关键以太网解决方案

    了解数据中心市场动态的关键在于以太网解决方案。Synopsys负责产品管理和高性能计算IP的副总裁Michael Posner说:“以太网在数据中心中根深蒂固……虽然它并不广为人知,但
    发表于 03-12 09:53 ?729次阅读
    数据中心市场的关键<b class='flag-5'>以太网</b><b class='flag-5'>解决方案</b>

    思科技正式推出业界首个1.6T以太网IP整体解决方案

    思科技1.6T以太网IP整体解决方案现已上市并被多家客户用,与现有实现方案相比,其互连功耗最多可降低50%
    的头像 发表于 03-19 10:23 ?853次阅读

    思科技推出业界首个1.6T以太网IP整体解决方案

    思科技(Synopsys)日前重磅推出了业界首个1.6T以太网IP整体解决方案,这一创新性的方案在数据密集型人工智能(AI)工作负载的处理
    的头像 发表于 03-19 10:24 ?685次阅读

    解读工业以太网标准:Profinet与EtherNet/IP

    随着工业自动化技术的飞速发展,工业以太网标准作为连接各种自动化设备、控制系统和信息系统的重要桥梁,其重要性日益凸显。在众多工业以太网标准中,Profinet和EtherNet/IP凭借其各自的特点
    的头像 发表于 06-28 16:34 ?4214次阅读

    思科技推出超以太网UALink IP解决方案

    近日,全球领先的电子设计自动化(EDA)和半导体IP供应商新思科技(Synopsys, Inc.)宣布了一项重大技术创新——推出业界首款以太网IP
    的头像 发表于 12-25 11:12 ?772次阅读