0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何用AI负载为SONiC交换机调整ECN水线

是德科技KEYSIGHT ? 来源:是德科技KEYSIGHT ? 2025-07-11 14:12 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

什么是ECN?

显式拥塞通知(ECN)是计算机网络中的一种机制,它允许发送设备明确地通知接收设备网络拥塞,而不是依赖于传统的“丢包”方法。在传统的TCP/IP网络中,当路由器或交换机出现拥塞时,它会丢弃数据包以防止进一步的数据包丢失,这是有损的。

ECN通过引入一种新的数据包标记类型来解决这些问题,这种标记称为 “CE” (经历拥塞),它在不丢弃数据包的情况下通知发送方网络拥塞。ECN允许设备做出智能化的决策,以减少它们的流量速率来缓解拥塞。在这种情况下,端侧拥塞控制协议,比如DCQCN将被用来减少流量速率以进行拥塞控制。

ECN如何工作?

ECN标记机制的工作原理是基于出口队列利用率来使用标记概率线。当队列使用率低于最小阈值(Kmin)时,不标记任何数据包。对于Kmin和Kmax之间的队列使用率,应用概率P来标记数据包。

7ebf0f1a-5c54-11f0-baa5-92fbcf53809c.png

sonic-mgmt/docs/ECN-test-plan.md at master · sonic-net/sonic-mgmt

SONiC无损队列?

交换机队列(如图1)是存储等待被交换机转发数据包的缓冲区。它就像一个临时存储区域,数据包在这里暂时存储,然后被传输到它们的最终目的地。

7ec90682-5c54-11f0-baa5-92fbcf53809c.png

图1、端口队列

“SONiC默认有两个无损优先级:3和4。需要注意的是,只有无损优先级才能对PFC帧做出反应或生成PFC帧。换句话说,PFC帧不应该对有损优先级的流量有任何影响。DSCP 3和4的数据包分别映射到优先级3和4。”

sonic-mgmt/docs/testplan/PFC-test-plan.md at master · sonic-net/sonic-mgmt

本例中,我们不采用优先级流控制(PFC)来管理拥塞,只是遵循SONiC无损队列的指导原则。

AI负载的DSCP映射到队列中,需要如下的步骤:

映射DSCP-TC → 绑定接口DSCP-TC配置 → 映射TC-queue → 绑定接口TC-queue配置。

?把DSCP映射Traffic Class(TC)(图2)。

7ed48124-5c54-11f0-baa5-92fbcf53809c.png

图2、DSCP映射到Traffic Class

?你可以通过config命令(需要sudo)创建多个dscp-tc的配置(图3)。

7ede1630-5c54-11f0-baa5-92fbcf53809c.png

图3、创建dscp-tc配置

?接口绑定dscp-tc配置,如下命令,其中AZURE是创建的profile的名称,Ethernet144是绑定的端口

config interface qos dscp-tc bind Ethernet144 AZURE

?映射Traffic Class到队列

7f0849c8-5c54-11f0-baa5-92fbcf53809c.png

图4、TC与队列映射配置

?为接口绑定tc-queue配置,如下命令

config interface qos tc-queue bind Ethernet144 AZURE

队列的缓存配置

交换机上的入口和出口缓冲区在转发过程中都扮演着关键角色。具体来说,入口缓冲区有助于触发PFC的决策过程,而出口缓冲区则在决定何时用ECN-CE标记数据包方面起着至关重要的作用。

7f11e140-5c54-11f0-baa5-92fbcf53809c.png

图5、入口及出口缓冲区

同时,你还需要为接口配置缓冲区大小。如下命令,其中egress_lossless_profile 为缓冲区配置的名称。

config interface buffer bind queue Ethernet144 3 egress_lossless_profile

ECN水线调优

通过SONiC ECN设置,您可以配置多达三个不同的[min, max, P]集,这些配置集通过一个包含绿色、黄色和红色后缀来设置。在本例中,我们也将利用这个特性来探索其潜在益处。

我们将添加一个新的WRED配置文件‘test’,并首先配置红色集。

config wred add test --mode ecn

config wred update --ecn-gmin 20000000 --ecn-gmax 26000000 --ecn-gmark 80 --no-ecn-yellow --no-ecn-red --mode ecn test

7f1d1eb6-5c54-11f0-baa5-92fbcf53809c.png

图6、第一次尝试水线

将ECN配置与接口绑定

config interface wred bind queue Ethernet144 3 test

结合Keysight AI工作负载模拟和DCQCN特性,我们可以估计总线带宽利用率大约为20.77 GB/s,这相当于理想带宽利用率的约42%。被标记为ECN-CE的数据包数量较多,这表明流量速率控制介入较晚,导致缓冲区使用率升高,相应地,标记概率也较高。

7f26be58-5c54-11f0-baa5-92fbcf53809c.png

图7、第一次尝试集合通信基准测试

为了主动管理拥塞,我们可以尝试设置较低的ECN最小和最大阈值,以便更早地触发拥塞控制机制。

config wred update --ecn-gmin 10000000 --ecn-gmax 20000000 --ecn-gmark 80 --no-ecn-yellow --no-ecn-red --mode ecn test

7f3074f2-5c54-11f0-baa5-92fbcf53809c.png

图8、第二次尝试水线

在进行了这些调整之后,我们成功地实现了大约53%的优化总线带宽利用率,同时在模拟过程中显著减少了接收到的ECN-CE数据包。

7f39994c-5c54-11f0-baa5-92fbcf53809c.png

图9、第二次尝试集合通信基准测试

在尝试调整Kmin和Kmax设置后,我们发现逐步调整并不能始终如一地实现最佳总线带宽利用率。因此,我们引入了额外的黄色集配置来进一步优化性能。

config wred update --ecn-gmin 20000000 --ecn-gmax 30000000 --ecn-gmark 80 --ecn-ymin 2000000 --ecn-ymax 20000000 --ecn-ymark 20 --no-ecn-red --mode ecn test

7f424ede-5c54-11f0-baa5-92fbcf53809c.png

图10、第三次尝试水线

最终我们通过引入黄色配置集达到了96%的优化总线带宽利用率,使用少量的ECN-CE数据包来控制拥塞,成功的达到了调优目标。

7f4d1cec-5c54-11f0-baa5-92fbcf53809c.png

图11、第三次尝试集合通信基准测试

总结

优化AI工作负载的ECN阈值需要精巧的平衡:在确保工作负载期间没有数据包丢失的同时,最小化ECN-CE标记。随着缓冲区消耗的增加,它可能导致接口上的转发延迟变长,最终影响作业完成时间。为了克服这一挑战,早期介入和降低标记概率至关重要。此外,将优先级流控制(PFC)作为补充解决方案可以进一步增强拥塞管理并优化整体系统性能。

关于是德科技

是德科技(NYSE:KEYS)启迪并赋能创新者,助力他们将改变世界的技术带入生活。作为一家标准普尔 500 指数公司,我们提供先进的设计、仿真和测试解决方案,旨在帮助工程师在整个产品生命周期中更快地完成开发和部署,同时控制好风险。我们的客户遍及全球通信、工业自动化、航空航天与国防、汽车、半导体和通用电子等市场。我们与客户携手,加速创新,创造一个安全互联的世界。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 负载
    +关注

    关注

    2

    文章

    618

    浏览量

    35282
  • 计算机
    +关注

    关注

    19

    文章

    7673

    浏览量

    90918
  • 交换机
    +关注

    关注

    22

    文章

    2754

    浏览量

    102009
  • AI
    AI
    +关注

    关注

    88

    文章

    35318

    浏览量

    280710

原文标题:案例分享:如何用AI 负载为SONiC 交换机调整ECN水线

文章出处:【微信号:是德科技KEYSIGHT,微信公众号:是德科技KEYSIGHT】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ATM交换机详解

    ;带环回机制的排队方式;共享输出排队方式;在一条输出线上设置多个输出子队列,这些输出子队列在逻辑上作为一个单一的输出队列来操作。 [hide]2、ATM交换机实现大容量的交换,也
    发表于 05-25 16:35

    接入层交换机、汇聚层交换机和核心层交换机的区别

    `1.功能区别核心层交换机的主要功能是用于路由选择及高速转发的,提供优化、可靠的骨干传输结构,因此核心层交换机应用有更高的可靠性和吞吐量。汇聚层交换机是多台接入层交换机的汇聚点,作用是
    发表于 06-04 11:57

    工业控制交换机和工业交换机的区别

    以太网交换机一般分为:商用(以太网)交换机、工业(以太网)交换机、家用(以太网)交换机,在这里着重介绍下工业交换机
    发表于 01-21 09:54 ?2336次阅读

    核心交换机、汇聚交换机与普通交换机的区别介绍

    核心交换机并不是交换机的一种类型,放在核心层(网络主干部分)的交换机叫核心交换机。汇聚层交换机,是多台接入层
    发表于 03-19 14:50 ?1.3w次阅读

    家庭交换机怎么安装_交换机网速是平分的吗

    已经广泛应用于各个领域,作为网络的主要连接设备,被众多用户广泛应用,在这里我同大家分享的详细安装图解,在这里你会了解,。交换机华为交换机华为S5700交换机交换机安装图解怎么安装
    发表于 03-25 10:29 ?1.1w次阅读

    网络交换机的作用_网络交换机怎么用

    本文首先阐述了网络交换机的概念,其次阐述了网络交换机的作用,最后介绍了网络交换机的使用。
    发表于 04-02 08:49 ?6838次阅读

    交换机重要吗 如何使用NVIDIA交换机展现云计算、AI的性能

    交换机重要吗? 网络矩阵是现代化数据中心性能的关键。这对数据中心的交换机提出了很多要求,而其中最基本的要求,是所有客户提供等量的带宽,以便均匀地共享资源。如果没有公平的网络,所有应用都会因吞吐量
    的头像 发表于 10-20 09:54 ?2471次阅读

    什么是网络交换机?网络交换机的分类标准

    从广义上来看,网络交换机分为广域网交换机和局域网交换机。广域网交换机主要用于电信领域,提供基本的通信平台。局域网网络交换机应用于局域网,用于
    发表于 08-10 11:17 ?3786次阅读

    核心交换机、汇聚交换机、接入交换机之间的对比分析

    Cisco定义的分层互联模型包括核心层、汇聚层和接入层,因此,工作在这些层的网络交换机有相应的名称,如核心交换机、汇聚交换机和接入交换机
    的头像 发表于 11-02 16:25 ?2.5w次阅读

    千兆交换机和百兆交换机应该如何选择?

    千兆交换机(Gigabit Ethernet Switch)和百兆交换机(Fast Ethernet Switch)之间存在几个主要区别,在速度、性能、成本和应用场景等方面存在明显的区别,选择哪种
    的头像 发表于 06-18 10:26 ?5187次阅读
    千兆<b class='flag-5'>交换机</b>和百兆<b class='flag-5'>交换机</b>应该如何选择?

    PoE交换机可以当普通交换机使用吗

    随着PoE交换机的广泛应用,人们对PoE交换机有了一定的了解。然而,很多人认为PoE交换机可以自行发电,这种说法并不正确,通常所讲的PoE交换机供电指的是PoE
    的头像 发表于 06-27 10:20 ?7958次阅读

    一文解析交换机行业5大技术趋势

    AI催化下,短期看英伟达AI方案带动IB交换机需求提升,长期看IB和以太网交换机方案共存。英伟达作为AI领域主流厂商,其推广的IB
    发表于 07-03 09:44 ?1858次阅读
    一文解析<b class='flag-5'>交换机</b>行业5大技术趋势

    核心交换机和普通交换机的区别?

    核心交换机和普通交换机的区别? 核心交换机(Core Switch)是网络中的重要组成部分,与普通交换机(Regular Switch)有许多区别。在这篇文章中,我将详细介绍核心
    的头像 发表于 12-07 14:39 ?2720次阅读

    汇聚交换机和核心交换机区别

    汇聚交换机和核心交换机是网络中常见的两种交换机设备,在网络中扮演着不同的角色和功能。虽然它们的主要目标是提供高速、高效的数据交换和数据传输,但在设计和使用上有一些区别。本文将介绍汇聚
    的头像 发表于 01-22 14:32 ?6276次阅读

    工业交换机究竟有何用

    的工业环境中发挥着至关重要的作用。本文将从工业交换机的技术特性、核心功能、应用场景及选型要点等方面,深入解析其价值,并结合济南有人物联网技术有限公司的白金系列工业交换机(如USR-ISG1005)例,探讨其在实际工业
    的头像 发表于 04-16 16:51 ?490次阅读