0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面向万亿级参数大模型,“超节点”涌现

Hobby观察 ? 来源:电子发烧友网 ? 作者:梁浩斌 ? 2025-08-03 02:37 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网综合报道 近年来,随着人工智能技术的迅猛发展,尤其是大模型的兴起,对算力的需求呈现出爆发式增长。在这一背景下,紫光股份旗下新华三集团以“算力×联接”为技术基石,重磅发布了全新的H3C UniPoD系列超节点产品,旨在为万亿级参数大模型的训练与推理提供更强劲、更智能且更绿色的算力支持。

H3C UniPoD系列超节点产品基于领先的Scale-up南向互联技术,可实现单机柜最高64卡GPU间的高速互联互通,有效突破了单卡计算性能瓶颈,为AI技术在百行百业的落地应用提供了坚实的算力基础。

当前,以DeepSeek为代表的MoE大模型持续火爆,推动了AI领域的“军备竞赛”,大模型已迈入“万亿级”时代。然而,传统的计算架构和“摩尔定律”已不再适用,单卡计算性能接近天花板,单机GPU互联及机间Scale-out横向扩展也难以满足高带宽、低时延与高可靠的集群网络联接需求。新华三凭借在网络联接领域的深厚积累,结合不同品牌GPU的性能与架构特点,开发出基于以太协议和PCIe协议的双技术路线超节点产品,可实现单机柜最高64卡的全互联互通,大幅提升单节点计算效能,打造了万亿级参数大模型训推的强劲算力引擎。

本次发布的H3C UniPoD超节点产品以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念,主要涵盖H3C UniPoD S80000和H3C UniPoD F80000两个子产品系列,能够为不同规模参数的模型训练、推理和精调提供有针对性的算力支撑。

H3C UniPoD S80000面向万亿级参数模型训推场景,实现了更高性能、更高密度、更高效率的三重进化。它以网强算,全面释放算力矩阵动能,柜内卡间全互联通信,互联带宽提升8倍,单机柜训练性能相较于单节点最高可提升10倍,单卡推理效率提升13倍。

在密度方面,H3C UniPoD S80000单柜支持部署64卡,采用液冷方式散热,整柜功率可支持到120KW,同时兼容下一代高性能AI加速卡。此外,三总线全盲插、全面的漏液检测等设计,简化了运维流程、提升了能效产出。

值得关注的创新点是,H3C UniPoD F80000依托全国产算力平台,采用创新的PCIe光互联技术,突破单机板内走线限制,实现了64张AI加速卡的高速互联,卡间带宽大幅提升至576GB/s,模型训练性能提升35%以上。基于灵活开放的产品理念,H3C UniPoD F80000支持基于不同形态的AI服务器及AI加速卡灵活构建超节点产品,支持按需定义产品拓扑16/32/64卡,实现灵活按需交付。

近年来随着算力需求的增长,市场上出现越来越多的超节点产品。比如,NVIDIA NVL72系统配备72个NVIDIA Blackwell GPU,单个GPU显存为192T;配置36个NVIDIA Grace CPU,每个CPU搭配480GB内存,总内存为17TB DDR5X;采用第五代NVLink技术,单GPU连接带宽达1.8TB/s,整个系统内的72个GPU通过NVLink全互联,总带宽达130TB/s;采用全液冷机架方案,相比传统风冷基础设施,同等功耗下性能提升25倍。

华为昇腾 384 超节点由 12 个计算柜和 4 个总线柜组成,支持 384 张昇腾 910C NPU 全互联,通信时延降低至 0.2μs(较传统方案下降 10 倍),带宽提升 15 倍。采用液冷设计,PUE<1.2,性能对标英伟达 NVL72 超节点。
燧原科技云燧ESL超节点系统单节点最高64卡全带宽互联,采用液冷方案,实现高性价比、高密度、高能效,可实现9216GB单节点存储容量、230TB/s单节点存储带宽、51.2TB/s单节点聚合带宽、单节点可支持PD分离优化。

展望未来,AI行业对算力的需求将持续增长。随着大模型的不断发展,算力基础设施的性能、效率和灵活性将变得至关重要。新华三将持续深化“算力×联接”能力,实现关键技术突破和工程化创新,全面构建多元开放、持续进化、AI就绪、强劲稳定的算力基础设施,加速百行百业的智慧跃迁。多元算力架构的融合、高速互联技术创新、绿色节能发展、智能化运维管理以及算力云服务的普及将成为未来行业发展的主要趋势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    算能发布节点服务器,128颗BM1690芯片组成

    电子发烧友网综合报道 在2025世界人工智能大会上,算能最新发布了一款节点服务器,可提供多达8T显存空间以及巨大的FP8算力,形成一台强大“智算服务器”单机设备。据工作人员介绍,这是基于算能
    的头像 发表于 08-03 07:33 ?1086次阅读

    重磅!华为昇腾384节点真机登场,中兴携厂商首秀GPU节点实力

    作为中国自主的算力核弹,华为昇腾384节点真机首次亮相。中兴通讯、上海仪电、曦智科技、壁仞科技联合打造的光互联芯片及节点应用创新方案荣获2025年世界人工智能大会最高奖。本文将对这
    的头像 发表于 07-29 00:45 ?6349次阅读
    重磅!华为昇腾384<b class='flag-5'>超</b><b class='flag-5'>节点</b>真机登场,中兴携厂商首秀GPU<b class='flag-5'>超</b><b class='flag-5'>节点</b>实力

    万亿参数!元脑企智一体机率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布元脑企智一体机已率先完成对Kimi K2 万亿参数模型的适配支持,并实现单用户70 tokens/s的流畅输出速度,为企业客户高效部署
    的头像 发表于 07-22 09:27 ?164次阅读
    <b class='flag-5'>万亿</b><b class='flag-5'>参数</b>!元脑企智一体机率先支持Kimi K2大<b class='flag-5'>模型</b>

    奇异摩尔亮相2025中国AI算力大会

    技术驱动下,节点已成为国内外构建大规模HBD域应用的关键趋势。随着千亿到万亿参数MoE大模型并行训练(尤其是专家并行和张量并行)对GPU间
    的头像 发表于 07-03 11:40 ?579次阅读

    立讯技术解读ETH-X节点高速互连技术的现状与未来

    当前,人工智能技术驱动全球数据中心向智算中心加速演进,传统架构在承载AI大模型训练时暴露出显著瓶颈--资源调度碎片化、异构算力协同低效、能源利用率不足等问题。在此背景下,行业亟需通过技术架构的创新突破应用壁垒。节点作为资源池化
    的头像 发表于 07-03 09:44 ?723次阅读
    立讯技术解读ETH-X<b class='flag-5'>超</b><b class='flag-5'>节点</b>高速互连技术的现状与未来

    华为云黄瑾:昇腾云CloudMatrix 384节点六大科技创新,定义下一代AI基础设施

    近日,华为云 AI 峰会在北京召开,华为云副总裁黄瑾发表主题演讲,介绍了更多 CloudMatrix 384 节点技术优势与细节。他指出,随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已
    的头像 发表于 05-17 10:31 ?1319次阅读

    华为云节点创新算力基础设施,推动千行万业AI应用开发落地

    近日,“逐光向新·智领未来”华为云 AI 峰会于北京成功举办。大会期间,华为云面向客户伙伴详细介绍了 CloudMartix 384 节点的创新技术优势,并与在场嘉宾共同探讨如何加速 AI 应用落地,为加速行业智能化发展提供了
    的头像 发表于 05-17 10:30 ?1199次阅读

    昆仑芯节点产品推出,大模型训推任务性能跨越式提升

    AI开发者大会上,昆仑芯作为底层算力核心被高频提及,三万卡集群点亮振奋人心,昆仑芯节点也在大会上正式发布。 ? ? 自ChatGPT问世,大模型参数快速增长,单卡显存无法容纳越来越大
    的头像 发表于 04-25 19:29 ?1177次阅读

    《中国电机工程学报》网络首发论文:基于数据驱动观测器的永磁同步电机显式模型预测直接速度控制

    步骤一:构造预测模型。 考虑参数变化和外部扰动,表贴式 PMSM 的数 学方程为 (1) 其中,id、iq 和 ud、uq 分别为定子电流和电压的 d、 q 轴分量;?和?e 分别为机械角速度和电
    发表于 03-07 15:07

    聆思CSK6大模型语音开发板接入DeepSeek资料汇总(包含深度求索/火山引擎/硅基流动华为昇腾满血版)

    调用DeepSeek节点,最终将大模型输出的结果进行语音合成实现端侧播报 下载工程模板导入,配置参数后绑定开发板ID即可。 关键参数说明(以火山引擎版为例): HOST
    发表于 03-06 17:02

    Kaggle知识点:7种参数搜索方法

    数据科学参数搜索确实是机器学习生命周期中不可或缺的一步,特别是在模型性能方面。正确的参数选择可以显著提高
    的头像 发表于 02-08 14:28 ?1031次阅读
    Kaggle知识点:7种<b class='flag-5'>超</b><b class='flag-5'>参数</b>搜索方法

    xgboost参数调优技巧 xgboost在图像分类中的应用

    的成绩。然而,XGBoost模型涉及众多参数,这些参数的组合和调优对于模型性能至关重要。以下是一些XGBoost
    的头像 发表于 01-31 15:16 ?1311次阅读

    ETH-X节点:开辟AI算力约束突破的新路径

    、交换机芯片制造商、服务器供应商、网络设备厂商及互联网企业等多方力量,共同发起超大带宽ETH-X(以太网)节点计划,旨在通过技术创新与行业合作,构建开放可扩展的HBD(高带宽域)节点
    的头像 发表于 11-09 10:03 ?2973次阅读
    ETH-X<b class='flag-5'>超</b><b class='flag-5'>节点</b>:开辟AI算力约束突破的新路径

    英伟达Blackwell可支持10万亿参数模型AI训练,实时大语言模型推理

    、NVLink交换机、Spectrum以太网交换机和Quantum InfiniBand交换机。 ? 英伟达称,Blackwell拥有6项革命性技术,可支持多达10万亿参数模型进行AI训练
    的头像 发表于 09-04 09:10 ?3805次阅读

    全调度以太网(GSE),中国智算网络新标准

    伴随着智算技术的发展,越来越多的研究表明在 AI 训练达到一定规模下能力才会涌现,在AI大模型的扩展定律和涌现能力的驱动下,AI大模型参数
    的头像 发表于 08-13 15:20 ?619次阅读
    全调度以太网(GSE),中国智算网络新标准