0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

WAIC 2025:芯片企业竞逐AI新赛道!技术革新突破算力物理极限

Carol Li ? 来源:电子发烧友网 ? 作者:李弯弯 ? 2025-08-04 10:30 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯) 2025年世界人工智能大会(WAIC 2025)上,全球芯片企业以“算力革命”为核心,展开了一场关于技术突破与生态构建的深度交流。从云端超算到端侧智能,从光电融合到存算一体,参展企业通过硬件创新与场景落地,重新定义了AI时代的算力边界。

在这场科技盛宴中,摩尔线程、燧原科技、沐曦、寒武纪、华为昇腾、后摩智能、此芯科技、曦智科技、海光信息、龙芯中科等十几家代表性企业以差异化技术路线,勾勒出中国芯片产业从“跟跑”到“并跑”乃至“领跑”的转型轨迹。

图:2025年世界人工智能大会(WAIC 2025)现场(电子发烧友拍摄)


摩尔线程:全功能GPU重构AI算力范式

摩尔线程以“全功能GPU”为基石,构建了覆盖“云-边-端“的全栈AI解决方案。其展出的通用加速计算平台,通过硬件架构优化与软件栈协同,实现了专业图形渲染、大模型训练与推理的融合计算。夸娥智算集群方案则聚焦分布式训练场景,通过高速互联技术将多节点算力整合为统一资源池,支持千亿参数模型的并行训练。

技术层面,摩尔线程GPU采用自研“MUSA”架构,在浮点运算精度与能效比上取得平衡。其核心优势在于硬件层面的渲染与计算单元解耦设计,使同一芯片可动态分配资源以适应不同负载。例如,在医疗影像分析场景中,GPU可同时处理3D重建(图形渲染)与病灶识别(AI推理)任务,较传统方案效率提升3倍。

生态建设方面,摩尔线程的软件栈与CUDA生态保持兼容,并针对国产AI框架深度优化。目前,其解决方案已落地智慧城市、自动驾驶等领域,成为少数具备全场景覆盖能力的国产GPU厂商。

燧原科技:训推一体芯片开启大模型普惠时代


燧原科技首发的新一代AI芯片L600,以“训推一体”架构重新定义大模型计算范式。该芯片采用7nm制程,集成380亿晶体管,通过动态电压频率调整技术,在训练模式下可释放128TFLOPS(FP16)算力,推理模式下则切换至低功耗模式,支持每秒处理2000张图像的实时推理需求。

技术突破点在于其创新的“存算一体”内存架构。L600将128MB片上缓存与HBM3内存直接耦合,减少数据搬运延迟,使大模型训练的内存带宽利用率提升至92%。在展出的千亿参数语言模型训练演示中,L600集群较上一代产品训练效率提升40%,能耗降低35%。

燧原科技同步推出“云燧”智能计算平台,通过硬件虚拟化技术实现多用户资源隔离,单集群可支持超200个并发训练任务。这一特性使其在科研机构与互联网企业客户中快速渗透,目前已在30个国家级实验室部署。

沐曦:全流程自主可控的GPU生态构建者

沐曦展出的曦云C600 GPU芯片,标志着中国在高端GPU领域实现“设计-制造-封装”全链条自主化。该芯片采用12nm工艺,集成2048个流处理器,支持PCIe 5.0与CXL 2.0高速接口,在科学计算领域达到国际同类产品85%性能。

产品矩阵方面,沐曦形成三大系列:曦云C系列(训推一体)、曦思N系列(推理加速)、曦彩G系列(图形渲染)。其中,曦思N100推理卡以15W功耗实现每秒32TOPS(INT8)算力,在智慧安防场景中可同时处理64路1080P视频流分析。

生态合作层面,沐曦与中科曙光、浪潮信息等服务器厂商共建“曦光联盟”,推出预装国产AI框架的整机方案。其软件栈“MXMAC”已适配200余个开源模型,在气象预测、基因测序等超算场景中,曦云C系列集群展现出与NVIDIA A100相当的运算效率。

寒武纪:云端智能芯片的7nm制程突破

寒武纪展出的思元370芯片,采用台积电7nm工艺,集成256TOPS混合精度算力(INT8),较前代产品能效比提升3倍。其创新的“双芯互联”技术,通过片间高速总线实现两颗芯片无缝协同,可扩展至512TOPS算力,满足机器人多模态决策的实时性要求。

边缘端MLU270芯片则聚焦低功耗场景,以5W功耗支持16TOPS算力,适配无人机、智能摄像头等终端设备。在展出的电力巡检机器人演示中,MLU270可同时处理视觉导航、红外测温与缺陷识别任务,推理延迟低于5ms。

寒武纪作为“阶跃星辰模芯生态创新联盟”首批成员,其芯片已深度集成至联盟的AI开发平台。在自动驾驶领域,思元370与比亚迪合作实现BEV感知模型的车端部署,使数据处理延迟从100ms降至20ms。

华为昇腾:超节点架构重塑大模型训练格局

华为昇腾384超节点成为展会焦点,其通过384个NPU芯片的低延迟互联,构建起支持万亿参数大模型训练的分布式计算系统。该系统采用3D封装技术,将芯片间通信带宽提升至1.6Tbps,较传统PCIe互联方案性能提升10倍。

在广汽合作案例中,昇腾超节点优化了汽车排产算法,将原本需要72小时的混合整数规划问题求解时间缩短至8分钟。这一突破使柔性制造系统能够动态响应订单变化,生产线利用率提升18%。

生态建设方面,昇腾率先实现Step-3大模型的搭载运行,其“MindSpore 4.0”框架新增光追加速库,使AI训练与图形渲染任务可共享计算资源。目前,昇腾生态已聚集超过1200家合作伙伴,覆盖金融、医疗等20个行业。

后摩智能:存算一体开启端侧AI新纪元

后摩智能发布的漫界?M50芯片,以160TOPS@INT8的物理算力与10W典型功耗,重新定义了端侧大模型计算标准。其存算一体架构将内存与计算单元深度融合,使能效比达到传统架构的10倍。在70B参数大模型推理测试中,M50以手机快充级功耗实现每秒5token的生成速度。

产品矩阵方面,力擎?LQ50 M.2卡以口香糖大小的体积,为AI PC提供7B模型推理能力;BX50计算盒子则集成4颗M50芯片,支持32路视频分析与本地大模型运行。在智能工业场景中,该盒子可实时处理产线质检数据,将缺陷检测准确率提升至99.7%。

后摩智能通过“离线全流程处理”技术,确保数据在设备端闭环。在智慧医疗场景中,其解决方案使超声诊断设备无需联网即可完成病灶识别,患者隐私数据留存率100%。这一特性使其在政务、金融等敏感领域快速落地。

此芯科技:异构SoC赋能多场景智能计算

此芯科技展出的P1高能效异构SoC,集成CPU、GPU、NPU与DSP核心,通过动态任务调度实现能效比最大化。在PC计算平台演示中,P1可同时运行4K视频解码、语音交互与背景虚化算法,功耗较传统方案降低40%。

边缘计算场景下,P1通过硬件加速模块实现每秒30TOPS的推理算力。在车计算平台展示中,其与地平线联合开发的域控制器,可支持L4级自动驾驶的感知、规划与控制任务并行处理,系统延迟低于20ms。

此芯科技构建了完善的开发者生态,提供从模型量化到部署的全链路工具。目前,其解决方案已在联想、小米等厂商的20余款终端设备中预装。

曦智科技:光电融合突破算力物理极限

曦智科技以“光子计算+光子网络”双产品线,展示了光电融合计算的颠覆性潜力。其光跃LightSphere X系统采用硅光芯片与CPO(共封装光学)技术,将光模块与交换芯片集成,使数据中心内部通信能耗降低60%。该系统荣获2025 SAIL奖,标志着光电计算进入商业化落地阶段。

与燧原科技合作的xPU-CPO原型系统,则探索了光子与电子计算的混合架构。通过光互连技术,该系统将AI芯片间的通信延迟从微秒级降至纳秒级,为万亿参数模型训练提供了可行路径。

曦智科技的光子计算芯片已实现每秒100万亿次运算的实测性能,较电子芯片能效比提升3个数量级。

海光信息:x86生态的国产替代标杆

作为国产x86架构CPU/DCU龙头,海光信息展出的7285系列CPU,性能达到Intel至强铂金8380的92%,支持DDR5内存与PCIe 5.0接口。其DCU深算一号加速器,集成4096个流处理器,在HPC场景中可提供64TFLOPS(FP64)算力,已在中科曙光“硅立方”超算系统中部署。

生态兼容性是海光的核心优势。其产品通过x86指令集授权,可无缝运行Windows、Linux操作系统及各类商业软件。在金融行业,海光CPU已替代进口产品支撑核心交易系统,单节点处理能力提升30%。

目前,海光信息积极与国际技术伙伴开展合作,通过技术交流与协作,不断推动自身技术进步,确保在保持自主可控的同时,能够紧跟国际技术发展的步伐。

龙芯中科:自主生态筑牢安全基石

龙芯中科展出的3A6000处理器,采用自主LoongArch指令集,性能对标Intel第十代酷睿i3。其工控芯片3C5000L通过国密算法加速模块,为网络安全设备提供硬件级安全防护。在电力监控系统演示中,该芯片可实时检测10万级网络攻击行为,误报率低于0.01%。

生态建设方面,龙芯推出“龙芯云”解决方案,集成统信UOS、麒麟等国产操作系统,形成从芯片到应用的完整链条。目前,其产品已应用于航天、能源等关键领域,累计出货超500万片。

龙芯中科正推动LoongArch指令集开源,吸引开发者构建自主软件生态。这一战略使其在信创市场中占据先发优势,成为国产化替代的首选方案之一。

联发科:两岸融合中的技术先锋

作为台湾企业代表,联发科展出的天玑9400芯片,集成第七代APU人工智能处理器,在苏黎世AI-Benchmark测试中取得全球第一成绩。其3nm制程与全大核架构设计,使NPU算力达到60TOPS,可支持端侧130亿参数大模型运行。

在两岸融合展区,联发科与大陆企业联合展示了智能座舱解决方案。通过天玑9400与地平线征程6芯片的协同,系统可同时处理语音交互、手势识别与3D导航任务,多模态响应延迟低于100ms。

联发科正加大在大陆研发投入,其上海研发中心已扩展至2000人规模,聚焦AIoT与车用芯片领域。这一布局使其在两岸产业融合中占据枢纽地位。

写在最后

WAIC 2025的芯片展区,折射出中国半导体产业从“单点突破”到“系统超越”的蜕变。摩尔线程的全功能GPU、燧原科技的训推一体架构、后摩智能的存算一体技术,共同构建起覆盖“云-边-端”的AI算力网络。而华为昇腾、寒武纪等企业的生态建设,则推动中国AI技术从实验室走向千行百业。

在这场全球竞速中,中国芯片企业正以差异化创新打破技术垄断。光电融合、存算一体等新范式的涌现,标志着中国从“技术跟随”转向“路径创造”。随着RISC-V开源架构的普及与先进制程的突破,中国芯片产业有望在AI时代实现真正的“弯道超车”,为全球智能生态赋能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35506

    浏览量

    281395
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    摩尔线程副总裁王华:AI工厂全栈技术重构基建,开启国产 GPU 黄金时代

    摩尔线程在世界人工智能大会(WAIC 2025)前夕举办以“进化,精度革命”为主题的技术分享会,创新性提出“
    的头像 发表于 08-02 14:21 ?1147次阅读
    摩尔线程副总裁王华:<b class='flag-5'>AI</b>工厂全栈<b class='flag-5'>技术</b>重构<b class='flag-5'>算</b><b class='flag-5'>力</b>基建,开启国产 GPU 黄金时代

    沐曦全链路方案亮相WAIC 2025

    解决方案及首发新品参展,通过硬件生态全景展示、软硬协同技术解析及多行业标杆案例,系统呈现中国产业从底层
    的头像 发表于 08-01 11:58 ?1129次阅读

    墨芯人工智能WAIC 2025现场直击

    2025世界人工智能大会(WAIC 2025)于7月26-29日在上海世博展览馆盛大开幕,热度持续攀升。墨芯人工智能(展位号:H1-A738)携其突破性的
    的头像 发表于 07-31 17:55 ?322次阅读

    光电融合突破边界:曦智科技2025 WAIC发布多维度创新成果

    2025年7月27日,上海】在2025世界人工智能大会(WAIC)上,曦智科技以“光电融合突破
    发表于 07-28 21:28 ?880次阅读
    光电融合<b class='flag-5'>突破</b><b class='flag-5'>算</b><b class='flag-5'>力</b>边界:曦智科技<b class='flag-5'>2025</b> <b class='flag-5'>WAIC</b>发布多维度创新成果

    摩尔线程WAIC2025亮相:以“AI工厂”理念重塑生态 全栈产品开启智能新纪元

    2025年世界人工智能大会(WAIC 2025)开幕前一天,国产GPU企业摩尔线程以“进化
    的头像 发表于 07-28 16:00 ?6092次阅读
    摩尔线程<b class='flag-5'>WAIC2025</b>亮相:以“<b class='flag-5'>AI</b>工厂”理念重塑<b class='flag-5'>算</b><b class='flag-5'>力</b>生态 全栈产品开启智能新纪元

    2025端侧AI芯片爆发:存一体、非Transformer架构谁主浮沉?边缘计算如何选型?

    各位技术大牛好!最近WAIC 2025上端侧AI芯片密集发布,彻底打破传统
    发表于 07-28 14:40

    耐能KNEO Pi开发板的三大技术革新

    在万物互联与AI普惠化的浪潮中,边缘计算正成为技术革新的核心战场。 传统开发板受限于、功耗与生态封闭性,难以满足实时AI推理与工业级部署
    的头像 发表于 06-06 09:58 ?554次阅读

    AIGC基础设施技术架构与行业实践

    AIGC基础设施技术架构与行业实践 一、硬件层:AI
    的头像 发表于 05-29 07:44 ?202次阅读
    AIGC<b class='flag-5'>算</b><b class='flag-5'>力</b>基础设施<b class='flag-5'>技术</b>架构与行业实践

    接棒,慧荣科技以主控技术突破AI存储极限

    电子发烧友网报道(文/黄山明)在AI的高速增长下,尤其是以DeepSeek为代表的AI大模型推动存储需求激增,增长倒逼存升级。而存储是
    的头像 发表于 03-19 01:29 ?1871次阅读
    存<b class='flag-5'>力</b>接棒<b class='flag-5'>算</b><b class='flag-5'>力</b>,慧荣科技以主控<b class='flag-5'>技术</b><b class='flag-5'>突破</b><b class='flag-5'>AI</b>存储<b class='flag-5'>极限</b>

    信而泰CCL仿真:解锁AI极限,智中心网络性能跃升之道

    中心RoCE网络提供精准评估方案,助力企业突破瓶颈,释放AI澎湃动力! 什么是智中心 智
    的头像 发表于 02-24 17:34 ?507次阅读
    信而泰CCL仿真:解锁<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>极限</b>,智<b class='flag-5'>算</b>中心网络性能跃升之道

    AI赋能边缘网关:开启智能时代的新蓝海

    ,准确率达到99.9%。 这一技术革新正在创造巨大的商业价值。在智慧城市领域,AI边缘网关可以实现交通流量实时分析、违章行为智能识别;在工业互联网中,能够实现设备预测性维护、生产工艺优化;在智慧能源领域
    发表于 02-15 11:41

    企业AI租赁模式的好处

    构建和维护一个高效、可扩展的AI基础设施,不仅需要巨额的初期投资,还涉及复杂的运维管理和持续的技术升级。而AI
    的头像 发表于 12-24 10:49 ?1259次阅读

    企业AI租赁是什么

    企业AI租赁是指企业通过互联网向专业的提供商
    的头像 发表于 11-14 09:30 ?2467次阅读

    亿铸科技熊大鹏探讨AI芯片的挑战与解决策略

    在SEMiBAY2024《HBM与存储器技术与应用论坛》上,亿铸科技的创始人、董事长兼CEO熊大鹏博士发表了题为《超越极限:大芯片
    的头像 发表于 10-25 11:52 ?993次阅读

    AI网络物理层底座: 大芯片先进封装技术

    随着人工智能(AI技术的迅猛发展,我们正站在第四次工业革命的风暴中, 这场风暴也将席卷我们整个芯片行业,特别是先进封装领域。Chiplet是实现单个芯片
    发表于 09-11 09:47 ?1353次阅读
    <b class='flag-5'>AI</b>网络<b class='flag-5'>物理</b>层底座: 大<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>先进封装<b class='flag-5'>技术</b>