面向万亿级参数大模型，“超节点”涌现-电子发烧友网

电子发烧友网综合报道近年来，随着人工智能技术的迅猛发展，尤其是大模型的兴起，对算力的需求呈现出爆发式增长。在这一背景下，紫光股份旗下新华三集团以“算力×联接”为技术基石，重磅发布了全新的H3C UniPoD系列超节点产品，旨在为万亿级参数大模型的训练与推理提供更强劲、更智能且更绿色的算力支持。

H3C UniPoD系列超节点产品基于领先的Scale-up南向互联技术，可实现单机柜最高64卡GPU间的高速互联互通，有效突破了单卡计算性能瓶颈，为AI技术在百行百业的落地应用提供了坚实的算力基础。

当前，以DeepSeek为代表的MoE大模型持续火爆，推动了AI领域的“军备竞赛”，大模型已迈入“万亿级”时代。然而，传统的计算架构和“摩尔定律”已不再适用，单卡计算性能接近天花板，单机GPU互联及机间Scale-out横向扩展也难以满足高带宽、低时延与高可靠的集群网络联接需求。新华三凭借在网络联接领域的深厚积累，结合不同品牌GPU的性能与架构特点，开发出基于以太协议和PCIe协议的双技术路线超节点产品，可实现单机柜最高64卡的全互联互通，大幅提升单节点计算效能，打造了万亿级参数大模型训推的强劲算力引擎。

本次发布的H3C UniPoD超节点产品以算力芯片多元化、互联协议标准化、基础设施集成化为核心设计理念，主要涵盖H3C UniPoD S80000和H3C UniPoD F80000两个子产品系列，能够为不同规模参数的模型训练、推理和精调提供有针对性的算力支撑。

H3C UniPoD S80000面向万亿级参数模型训推场景，实现了更高性能、更高密度、更高效率的三重进化。它以网强算，全面释放算力矩阵动能，柜内卡间全互联通信，互联带宽提升8倍，单机柜训练性能相较于单节点最高可提升10倍，单卡推理效率提升13倍。

在密度方面，H3C UniPoD S80000单柜支持部署64卡，采用液冷方式散热，整柜功率可支持到120KW，同时兼容下一代高性能AI加速卡。此外，三总线全盲插、全面的漏液检测等设计，简化了运维流程、提升了能效产出。

值得关注的创新点是，H3C UniPoD F80000依托全国产算力平台，采用创新的PCIe光互联技术，突破单机板内走线限制，实现了64张AI加速卡的高速互联，卡间带宽大幅提升至576GB/s，模型训练性能提升35%以上。基于灵活开放的产品理念，H3C UniPoD F80000支持基于不同形态的AI服务器及AI加速卡灵活构建超节点产品，支持按需定义产品拓扑16/32/64卡，实现灵活按需交付。

近年来随着算力需求的增长，市场上出现越来越多的超节点产品。比如，NVIDIA NVL72系统配备72个NVIDIA Blackwell GPU，单个GPU显存为192T；配置36个NVIDIA Grace CPU，每个CPU搭配480GB内存，总内存为17TB DDR5X；采用第五代NVLink技术，单GPU连接带宽达1.8TB/s，整个系统内的72个GPU通过NVLink全互联，总带宽达130TB/s；采用全液冷机架方案，相比传统风冷基础设施，同等功耗下性能提升25倍。

华为昇腾 384 超节点由 12 个计算柜和 4 个总线柜组成，支持 384 张昇腾 910C NPU 全互联，通信时延降低至 0.2μs（较传统方案下降 10 倍），带宽提升 15 倍。采用液冷设计，PUE<1.2，性能对标英伟达 NVL72 超节点。
燧原科技云燧ESL超节点系统单节点最高64卡全带宽互联，采用液冷方案，实现高性价比、高密度、高能效，可实现9216GB单节点存储容量、230TB/s单节点存储带宽、51.2TB/s单节点聚合带宽、单节点可支持PD分离优化。

展望未来，AI行业对算力的需求将持续增长。随着大模型的不断发展，算力基础设施的性能、效率和灵活性将变得至关重要。新华三将持续深化“算力×联接”能力，实现关键技术突破和工程化创新，全面构建多元开放、持续进化、AI就绪、强劲稳定的算力基础设施，加速百行百业的智慧跃迁。多元算力架构的融合、高速互联技术创新、绿色节能发展、智能化运维管理以及算力云服务的普及将成为未来行业发展的主要趋势。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

搜索历史

面向万亿级参数大模型，“超节点”涌现

评论