0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

摩尔线程WAIC2025亮相:以“AI工厂”理念重塑算力生态 全栈产品开启智能新纪元

电子麦克风 ? 来源:电子发烧友网 ? 作者:张迎辉 ? 2025-07-28 16:00 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在2025年世界人工智能大会(WAIC 2025)开幕前一天,国产GPU企业摩尔线程以“算力进化,精度革命”为主题带来技术分享,随后在7月26日-29日的展会期间,又凭借“云边端”全栈AI产品和解决方案成为焦点,全方位展现了其在AI领域的技术实力与行业愿景。


一、“AI工厂”理念:重构大模型训练基础设施

张建中董事长CEO在技术分享会上提出了极具前瞻性的“AI工厂”理念,为AI基础设施建设指明了新方向。他将“AI工厂”比作芯片晶圆厂,强调这是一个系统性的变革,需要从底层芯片架构、集群整体架构,到软件算法调优和资源调度系统进行全面升级。

图:摩尔线程创始人兼CEO张建中提出AI Foudry的概念(来源:电子发烧友网)


“AI工厂”的生产效率由五大核心要素决定,即加速计算通用性、单芯片有效算力、单节点效率、集群效率和集群稳定性,它们之间呈相乘关系,共同决定着“AI工厂”的产能。这一理念致力于推动AI训练从千卡级向万卡级乃至十万卡级规模演进,实现生产力和创新效率的飞跃。

张建中强调,摩尔线程的“AI工厂”以全功能GPU为基石,通过先进架构、芯片算力、单节点效率、集群效率优化与可靠性等协同跃升的深度技术创新,将全功能GPU加速计算平台的强大潜能转化为工程级的训练效率与可靠性保障。

二、全功能GPU:功能完备与精度完整

全功能GPU是摩尔线程“AI工厂”的核心支撑,也是其技术突破的关键所在。张建中介绍,摩尔线程自主研发的全功能GPU实现了单芯片同时支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码的技术突破,目前国内GPU只有摩尔线程具备这个能力。

图:摩尔线程原生支持FP8 大模型训练推理


在计算精度方面,摩尔线程的全功能GPU支持从FP 64至INT 8的完整精度谱系,尤其在FP8混合精度技术上表现突出,在主流前沿大模型训练中实现20%-30%的性能跃升,为国产GPU的算力效率树立了行业标杆。这种全精度支持使其能够全面覆盖从AI训练、推理到科学计算的全场景需求,无论是大模型训练还是复杂的科学计算任务,都能游刃有余。

三、MUSA架构:释放芯片有效算力

自研的MUSA架构是摩尔线程提升芯片有效算力的核心武器。张建中详细阐述了MUSA架构在计算、内存、通信三方面的突破。该架构采用创新的多引擎、可伸缩GPU架构,通过硬件资源池化及动态资源调度技术,构建了全局共享的计算、内存与通信资源池,突破了传统GPU功能单一的限制。

在计算层面,摩尔线程的AI加速系统(TCE/TME)全面支持多种混合精度计算,作为国内首批实现FP 8算力量产的GPU厂商,其FP8技术通过一系列创新设计,将Transformer计算性能提升约30%。内存系统方面,实现了50%的带宽节省和60%的延迟降低;通信领域,独创的ACE异步通信引擎减少了15%的计算资源损耗,MT Link 2.0互联技术提供了高出国内行业平均水平60%的带宽。

四、MUSA全栈系统软件:提升单节点效率

单节点效率的提升离不开优秀的软件支持,摩尔线程的MUSA全栈系统软件在这方面表现出色。张建中介绍,其核心创新包括任务调度优化,核函数启动时间缩短50%;极致性能算子库,GEMM算子算力利用率达98%,Flash Attention算子算力利用率突破95%;通信效能跃升,MCCL通信库实现RDMA网络97%带宽利用率等。

这些软件层面的优化使得单节点能够充分发挥硬件的性能,减少资源浪费,提高计算效率,为“AI工厂”的高效运转提供了坚实的软件基础。

五、KUAE大规模集群:系统工程级的突破

当单节点效率达到较高水平后,大规模集群的高效协作成为新的挑战。摩尔线程自研的夸额(KUAE)计算集群通过5D大规模分布式并行计算技术,实现了上千节点的高效协作,推动AI基础设施从单点优化迈向系统工程级突破。

KUAE集群创新采用5D并行训练,整合数据、模型、张量、流水线和专家并行技术,全面支持Transformer等主流架构。同时,自主研发的Simumax工具能面向超大规模集群自动搜索最优并行策略,为模型缩短训练周期提供科学依据。此外,创新的Check Point加速方案利用RDMA技术,将百GB级备份恢复时间从数分钟压缩至1秒,大幅提升了GPU有效算力利用率。

六、零中断容错技术:保障集群稳定性

在万卡级AI集群中,硬件故障导致的训练中断会严重浪费算力。为此,摩尔线程创新推出零中断容错技术,这一技术成为保障“AI工厂”持续运转的关键。

当故障发生时,该技术仅隔离受影响节点组,其余节点继续训练,备机无缝接入,全程无中断。这使得KUAE集群有效训练时间占比超99%,大幅降低了恢复开销。同时,KUAE集群通过多维度训练洞察体系实现动态监测与智能诊断,异常处理效率提升50%;结合集群巡检与起飞检查,训练成功率提高10%,为大规模AI训练提供了稳定保障。

七、展台产品矩阵:“云边端”全栈解决方案亮相

在WAIC展会的H1-A821展位,摩尔线程展示了丰富的“云边端”全栈AI产品与解决方案,让观众直观感受到其技术的实际应用。

图:WAIC 2025摩尔线程现场大受热捧


夸娥(KUAE)作为以全功能GPU为硬件核心的软硬一体化系统级算力解决方案,支持万卡级规模扩展能力,为大模型预训练提供稳定高效的算力支撑。其中,KUAE2是2024年底推出的第二代大规模智算融合中心产品,支持万卡互联,兼顾AI与科学计算。

全功能GPU OAM模组专为大规模智算集群设计,可支持万亿级参数大模型训练与推理,且在国内率先支持FP8等全计算精度。AI大模型一体机MCCXD800X2是旗舰级GPU加速服务器,为大语言及多模态大模型、科学计算等前沿领域提供强大支持。

此外,还有训推兼顾的AI大模型智算加速卡MTTS4000,适用于云电脑、云游戏等场景的云端渲染卡MTTS3000,首款国产GPU游戏显卡MTTS80,以及可广泛应用于多个行业的边缘AI计算模组。这些产品形成了完整的计算加速产品矩阵,全面满足不同场景的需求。

八、行业应用:全功能GPU赋能千行百业

摩尔线程的全功能GPU不仅在技术上领先,更在多个行业领域展现出强大的应用价值。在智能计算领域,其大模型训练和推理解决方案性能优异,运行DeepSeekR1671B全量模型的单路解码速度约100token/s,处于行业领先水平。

在科学计算领域,与国内顶尖科研机构打造了软硬件协同的生命科学解决方案,凭借全功能GPU的全精度计算、强大兼容性和高性能优势,可高效运行分子动力学、分子对接等科学计算软件。该方案不仅突破传统研究瓶颈,更在性能上达到行业领先水平,推动生命科学研究的国产化突破。

物理仿真方面,硒钼科技研发的AI for Science大模型平台,依托全功能GPU强大算力与均衡的训推能力,在保持计算精度下实现百倍仿真效率跃升。其专有智能体系统自动化处理重复科研工作,推动科学研究向工程化、精准化新范式演进。

在空间智能领域,依托全功能GPU算力,摩尔线程联合超图共同构建了覆盖训练、推理到可视化的完整国产化链条,支持亿级参数模型开发,并实现快速解译和高清影像实时渲染,成为国内极少数的可满足遥感大模型全流程需求的国产GPU解决方案。

在具身智能、创娱教育、智能制造、智慧医疗、智能驾驶、智能座舱等领域,摩尔线程的全功能GPU也都有出色的应用展示,为各行业的智能化升级注入新动能。

从“AI工厂”理念的提出到全栈产品的展示,摩尔线程在WAIC 2025上充分展现了其在全功能GPU领域的深厚积累和领先地位。随着技术的不断迭代和应用的持续拓展,摩尔线程正以系统级创新定义新一代AI基础设施,为AGI时代的到来奠定坚实的算力基础。

相关阅读:
摩尔线程“AI工厂”:以系统级创新定义新一代AI基础设施
疑似摩尔线程S90曝光,对标RTX4060
摩尔线程吴庆详解 MUSA 软件栈:以技术创新释放 KUAE 集群潜能,引领 GPU 计算新高度

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4968

    浏览量

    131659
  • 摩尔线程
    +关注

    关注

    2

    文章

    242

    浏览量

    5455
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程副总裁王华:AI工厂技术重构基建,开启国产 GPU 黄金时代

    摩尔线程在世界人工智能大会(WAIC 2025)前夕举办
    的头像 发表于 08-02 14:21 ?595次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>副总裁王华:<b class='flag-5'>AI</b><b class='flag-5'>工厂</b><b class='flag-5'>全</b><b class='flag-5'>栈</b>技术重构<b class='flag-5'>算</b><b class='flag-5'>力</b>基建,<b class='flag-5'>开启</b>国产 GPU 黄金时代

    沐曦链路方案亮相WAIC 2025

    智能时代 同球共济”为主题的2025世界人工智能大会(WAIC)于7月26日在上海开幕,全球人工智能
    的头像 发表于 08-01 11:58 ?664次阅读

    WAIC2025:澳鹏发布新一代技术平台矩阵 助力大模型垂直应用落地

    解决方案精彩亮相,为人工智能产业发展提供坚实的数据基础设施支撑。本届大会"智能时代 同球共济"为主题,吸引了来自70多个国家和地区的1500余位顶尖专家共襄盛举。
    的头像 发表于 07-31 09:54 ?113次阅读
    <b class='flag-5'>WAIC2025</b>:澳鹏发布新一代技术平台矩阵 助力大模型垂直应用落地

    WAIC2025|芯海科技卢国建主旨演讲:大数据、“芯”生态重构AI健康诊疗新范式

    7月28日,作为2025世界人工智能大会(WAIC2025)的重要部委级论坛活动,由国家数据局指导、中国信息协会主办的“数据要素×人工智能+赋能行业高质量发展”论坛在上海世博中心举行。
    的头像 发表于 07-29 12:02 ?396次阅读
    <b class='flag-5'>WAIC2025</b>|芯海科技卢国建主旨演讲:<b class='flag-5'>以</b>大数据、“芯”<b class='flag-5'>生态</b>重构<b class='flag-5'>AI</b>健康诊疗新范式

    2025端侧AI芯片爆发:存一体、非Transformer架构谁主浮沉?边缘计算如何选型?

    各位技术大牛好!最近WAIC 2025上端侧AI芯片密集发布,彻底打破传统困局。各位大佬在实际项目中都是如何选型的呢?
    发表于 07-28 14:40

    摩尔线程吴庆详解 MUSA 软件技术创新释放 KUAE 集群潜能,引领 GPU 计算新高度?

    2025 年世界人工智能大会(WAIC?2025)期间,摩尔线程举办的技术分享日活动现场气氛
    的头像 发表于 07-28 13:47 ?3911次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>吴庆详解 MUSA 软件<b class='flag-5'>栈</b>:<b class='flag-5'>以</b>技术创新释放 KUAE 集群潜能,引领 GPU 计算新高度?

    摩尔线程亮相WAIC 2025AI工厂理念驱动进化,AI应用赋能千行百业

    7月26日-29日,2025世界人工智能大会(WAIC)在上海举办。摩尔线程全功能GPU为核
    的头像 发表于 07-28 11:34 ?528次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b><b class='flag-5'>亮相</b><b class='flag-5'>WAIC</b> <b class='flag-5'>2025</b>:<b class='flag-5'>以</b>“<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>”<b class='flag-5'>理念</b>驱动<b class='flag-5'>算</b><b class='flag-5'>力</b>进化,<b class='flag-5'>全</b><b class='flag-5'>栈</b><b class='flag-5'>AI</b>应用赋能千行百业

    摩尔线程AI工厂”:五大核心技术支撑,打造大模型训练超级工厂

    2025年7月25日,上海——在世界人工智能大会(WAIC 2025)开幕前夕,摩尔线程
    的头像 发表于 07-28 11:28 ?415次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>“<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>”:五大核心技术支撑,打造大模型训练超级<b class='flag-5'>工厂</b>

    摩尔线程AI工厂”:系统级创新定义新一代AI基础设施

    2025年7月25日,上海——在世界人工智能大会(WAIC 2025)开幕前夕,摩尔线程
    发表于 07-28 10:34 ?1178次阅读
    <b class='flag-5'>摩尔</b><b class='flag-5'>线程</b>“<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>”:<b class='flag-5'>以</b>系统级创新定义新一代<b class='flag-5'>AI</b>基础设施

    AI应用创新与技术融合分论坛即将召开

    2025开放原子开源生态大会即将启幕,其中 “AI应用创新与技术融合分论坛”将于 7月24日重磅亮相
    的头像 发表于 07-23 09:54 ?256次阅读

    芯导科技亮相2025上海世界移动通信大会

    被誉为 “全球移动通信行业发展风向标” 的 2025 世界移动通信大会(上海)(MWC 上海)于 6 月 18 日在浦东启幕。本届大会开启智能互联
    的头像 发表于 06-19 17:33 ?641次阅读

    德明利亮相COMPUTEX 2025: 存储技术赋能AI产业落地

    此前,2025年5月20日至23日,全球科技盛会COMPUTEX台北国际电脑展顺利举办,德明利"智存无界,智能"为主题,携全场景存储
    的头像 发表于 06-07 15:44 ?469次阅读

    摩尔线程AI平台AutoDL达成深度合作

    近日,摩尔线程与国内领先的AI平台AutoDL宣布达成深度合作,双方联合推出面向个人开发者的“摩尔
    的头像 发表于 05-23 16:10 ?883次阅读

    摩尔线程加入中国移动AI能力联合舰队

    近日,在第八届数字中国建设峰会期间,中国移动携手包括摩尔线程在内的21家投资生态企业正式发布“中国移动AI能力联合舰队”。依托“产业引领+资本赋能”双轮驱动战略,中国移动构建了覆盖“
    的头像 发表于 05-07 17:47 ?747次阅读

    中国信通院栗蔚:云计算与AI加速融合,如何开启时代新纪元

    中国信通院栗蔚:云计算与AI加速融合,如何开启时代新纪元
    的头像 发表于 01-17 18:48 ?1026次阅读
    中国信通院栗蔚:云计算与<b class='flag-5'>AI</b>加速融合,如何<b class='flag-5'>开启</b>智<b class='flag-5'>算</b>时代<b class='flag-5'>新纪元</b>?