0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

是德科技推出AI数据中心构建器以验证和优化网络架构和主机设计

电子行业新闻 ? 来源:电子行业新闻 ? 作者:电子行业新闻 ? 2025-04-10 08:50 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

·通过模拟真实工作负载验证AI基础设施的性能

·通过评估新算法、组件或协议提高AI训练的性能

·在不投资昂贵的大规模部署的情况下,调整和优化AI工作负载和系统基础设施的参数

是德科技(NYSE: KEYS )推出Keysight AI (KAI)数据中心构建器,这是一款先进的软件套件,通过模拟真实工作负载来评估新算法、组件和协议对AI训练性能的影响。KAI数据中心构建器的工作负载模拟功能将大型语言模型(LLM)和其他人工智能(AI)模型训练工作负载集成到AI基础设施组件的设计和验证中——包括网络、主机和加速器。该解决方案实现了硬件设计、协议、架构和AI训练算法之间的更紧密协同,提升系统性能。

Keysight AI (KAI)数据中心构建器是一款先进的软件套件,通过模拟真实工作负载来评估新算法、组件和协议对AI训练性能的影响

AI服务提供商使用各种并行处理策略(也称为数据或模型并行)来加速AI模型训练。将模型并行与AI集群拓扑和配置对齐可以提高训练性能。在AI集群设计阶段,关键问题最好通过实验来回答。许多问题集中在图形处理单元(GPU)之间的数据传输效率上。关键考虑因素包括:

·AI主机或机架内GPU互连的scale up设计

·Scale out网络设计,包括每个GPU的带宽和拓扑

·网络负载均衡和拥塞控制的配置

·训练框架参数的调整

KAI数据中心构建器的工作负载模拟解决方案再现了真实AI训练任务的网络通信模式,加速实验,降低达到熟练程度所需的学习曲线,并更深入洞察性能下降的原因,这些是通过真实AI训练任务实验难以获得的。是德科技客户可以访问包括GPT和Llama在内的LLM工作负载库,以及数据并行(DP)、全分片数据并行(FSDP)和三维(3D)并行等流行的模型分区方案。

使用KAI数据中心构建器中的工作负载模拟应用程序,AI服务提供商可以:

·实验并行参数,包括并行数据大小及其在可用AI基础设施上的分布(调度)

·了解并行内和并行间通信对整体任务完成时间(JCT)的影响

·识别低性能的集合通信操作并深入识别瓶颈

·分析网络利用率、尾部延迟和拥塞,了解它们对JCT的影响

KAI数据中心构建器的新工作负载模拟功能使AI服务提供商、GPU云提供商和基础设施供应商能够将真实的AI工作负载引入其实验室环境,以验证AI集群和新组件的不断演变的设计。他们还可以通过实验微调模型并行方案、参数和算法,以优化基础设施并提高AI工作负载性能。

是德科技网络测试与安全解决方案副总裁兼总经理Ram Periakaruppan表示:“随着AI基础设施规模和复杂性的增长,对全栈验证和优化的需求变得至关重要。为了避免昂贵的延误和返工,必须将验证转移到设计和制造周期的早期阶段。KAI数据中心构建器的工作负载模拟为AI组件和系统设计提供了非常高的真实性,优化工作负载以实现最佳性能。”

KAI数据中心构建器是是德科技人工智能(KAI)架构的基础,这是一系列端到端解决方案,旨在通过使用真实AI工作负载模拟验证AI集群组件,帮助客户在数据中心扩展人工智能(AI)处理能力。

是德科技在2025年4月1日至3日于旧金山Moscone中心举行的OFC 2025会议上展示KAI数据中心构建器及其工作负载模拟功能,展位号1301。

关于是德科技

是德科技(NYSE:KEYS)启迪并赋能创新者,助力他们将改变世界的技术带入生活。作为一家标准普尔 500 指数公司,我们提供先进的设计、仿真和测试解决方案,旨在帮助工程师在整个产品生命周期中更快地完成开发和部署,同时控制好风险。我们的客户遍及全球通信、工业自动化、航空航天与国防、汽车、半导体和通用电子等市场。我们与客户携手,加速创新,创造一个安全互联的世界。了解更多信息,请访问是德科技官网。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据中心
    +关注

    关注

    16

    文章

    5256

    浏览量

    73635
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281298
  • 是德科技
    +关注

    关注

    21

    文章

    997

    浏览量

    83777
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    PCIe协议分析仪在数据中心中有何作用?

    PCIe协议分析仪在数据中心中扮演着至关重要的角色,它通过深度解析PCIe总线的物理层、链路层、事务层及应用层协议,帮助运维人员、硬件工程师和系统架构优化性能、诊断故障、验证设计合规
    发表于 07-29 15:02

    中型数据中心中的差分晶体振荡应用与匹配方案

    核心网络、存储、通信与计算节点。 通过精准选型与合理布线,这些高性能差分晶体振荡可有效提升数据中心设备间的时钟一致性与传输效率,是构建稳定、可靠、高吞吐量
    发表于 07-01 16:33

    华为面向亚太地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025亚太站期间,“星河AI数据中心网络,赋AI时代新动能”为主题的分
    的头像 发表于 06-11 11:11 ?602次阅读

    重新思考数据中心架构,推进AI的规模化落地

    人工智能(AI)对计算资源的贪婪需求推动了基础设施的变革,业界正着力解决如何满足AI在功率、可扩展性以及效率等方面的需求。这促使大量投资涌入,旨在重新配置数据中心架构
    的头像 发表于 05-30 13:51 ?448次阅读
    重新思考<b class='flag-5'>数据中心</b><b class='flag-5'>架构</b>,推进<b class='flag-5'>AI</b>的规模化落地

    华为面向中东中亚地区发布全新星河AI数据中心网络

    联接、AI网元三层网络架构,为企业构建智联满载算力,业务永续护航的数据中心网络,助力中东中亚地区
    的头像 发表于 05-21 15:49 ?355次阅读

    科技推出用于大规模AI数据中心的系列解决方案

    ·?为AI基础设施提供商提供从物理层到应用层数据中心模拟和优化解决方案 ·?验证优化系统级性能,确保A
    的头像 发表于 04-10 08:51 ?282次阅读
    是<b class='flag-5'>德</b>科技<b class='flag-5'>推出</b>用于大规模<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>的系列解决方案

    科技推出AI数据中心构建

    科技(NYSE:KEYS)推出Keysight AI (KAI)数据中心构建,这是一款先进
    的头像 发表于 04-07 11:06 ?538次阅读

    适用于数据中心AI时代的800G网络

    和性能隔离能力,保障不同用户任务互不干扰。 分布式AI计算与网络架构设计 分布式计算已成为AI训练的主流方式,通过将工作负载分配
    发表于 03-25 17:35

    华为全新升级星河AI数据中心网络

    在华为中国合作伙伴大会2025期间, “星河AI数据中心网络,赋AI时代新动能”为主题的数据中心
    的头像 发表于 03-24 14:46 ?530次阅读

    优化800G数据中心:高速线缆、有源光缆和光纤跳线解决方案

    高速线缆支持热插拔功能,具有低功耗和小弯曲半径,便于灵活布线,可实现高稳定性、低成本、节省空间和高散热等优势,非常适合数据中心布线需求。这些高速线缆能够与交换机、路由和服务无缝集成,确保
    发表于 03-24 14:20

    华为发布新一代站点能源架构AI数据中心建设理念

    西班牙巴塞罗那2025年3月13日?/美通社/ -- 在MWC25巴塞罗那期间举办的产品与解决方案发布会上,华为数据中心能源及关键供电产品线总裁何波发布新一代站点能源架构"Single
    的头像 发表于 03-13 15:38 ?328次阅读
    华为发布新一代站点能源<b class='flag-5'>架构</b>及<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>建设理念

    亚马逊云科技发布全新数据中心组件

    设计等多个方面进行深度优化和创新,成功构建了一个更加高效节能的数据中心。这些创新不仅提升了数据中心的运行效率,更为客户在AI等领域的进一步创
    的头像 发表于 12-24 15:05 ?567次阅读

    Meta AI数据中心网络用了哪家的芯片

    构建更加灵活、可扩展和高效的新系统。 自2011年帮助创建OCP以来,我们分享了数据中心和组件设计,并开源了网络编排软件,激发自己的数据中心
    的头像 发表于 11-25 10:05 ?1432次阅读
    Meta <b class='flag-5'>AI</b><b class='flag-5'>数据中心</b><b class='flag-5'>网络</b>用了哪家的芯片

    简述数据中心网络架构的演变

    随着全球对人工智能(AI)的需求不断增长,数据中心作为AI计算的重要基础设施,其网络架构与连接技术的发展变得尤为关键。
    的头像 发表于 10-22 16:23 ?919次阅读

    Molex连接助力构建未来数据中心 充分发挥人工智能AI的力量

    AI数据中心计算庞大的数据集,并且文本、视频、音频、图片等形式做出实时响应。 为了满足性能需求,数据中心
    的头像 发表于 08-29 11:57 ?2577次阅读
    Molex连接<b class='flag-5'>器</b>助力<b class='flag-5'>构建</b>未来<b class='flag-5'>数据中心</b> 充分发挥人工智能<b class='flag-5'>AI</b>的力量