电子发烧友网报道(文/李弯弯) 2025年世界人工智能大会(WAIC 2025)上,全球芯片企业以“算力革命”为核心,展开了一场关于技术突破与生态构建的深度交流。从云端超算到端侧智能,从光电融合到存算一体,参展企业通过硬件创新与场景落地,重新定义了AI时代的算力边界。
在这场科技盛宴中,摩尔线程、燧原科技、沐曦、寒武纪、华为昇腾、后摩智能、此芯科技、曦智科技、海光信息、龙芯中科等十几家代表性企业以差异化技术路线,勾勒出中国芯片产业从“跟跑”到“并跑”乃至“领跑”的转型轨迹。
图:2025年世界人工智能大会(WAIC 2025)现场(电子发烧友拍摄)
摩尔线程:全功能GPU重构AI算力范式
摩尔线程以“全功能GPU”为基石,构建了覆盖“云-边-端“的全栈AI解决方案。其展出的通用加速计算平台,通过硬件架构优化与软件栈协同,实现了专业图形渲染、大模型训练与推理的融合计算。夸娥智算集群方案则聚焦分布式训练场景,通过高速互联技术将多节点算力整合为统一资源池,支持千亿参数模型的并行训练。
技术层面,摩尔线程GPU采用自研“MUSA”架构,在浮点运算精度与能效比上取得平衡。其核心优势在于硬件层面的渲染与计算单元解耦设计,使同一芯片可动态分配资源以适应不同负载。例如,在医疗影像分析场景中,GPU可同时处理3D重建(图形渲染)与病灶识别(AI推理)任务,较传统方案效率提升3倍。
生态建设方面,摩尔线程的软件栈与CUDA生态保持兼容,并针对国产AI框架深度优化。目前,其解决方案已落地智慧城市、自动驾驶等领域,成为少数具备全场景覆盖能力的国产GPU厂商。
燧原科技:训推一体芯片开启大模型普惠时代
燧原科技首发的新一代AI芯片L600,以“训推一体”架构重新定义大模型计算范式。该芯片采用7nm制程,集成380亿晶体管,通过动态电压频率调整技术,在训练模式下可释放128TFLOPS(FP16)算力,推理模式下则切换至低功耗模式,支持每秒处理2000张图像的实时推理需求。
技术突破点在于其创新的“存算一体”内存架构。L600将128MB片上缓存与HBM3内存直接耦合,减少数据搬运延迟,使大模型训练的内存带宽利用率提升至92%。在展出的千亿参数语言模型训练演示中,L600集群较上一代产品训练效率提升40%,能耗降低35%。
燧原科技同步推出“云燧”智能计算平台,通过硬件虚拟化技术实现多用户资源隔离,单集群可支持超200个并发训练任务。这一特性使其在科研机构与互联网企业客户中快速渗透,目前已在30个国家级实验室部署。
沐曦:全流程自主可控的GPU生态构建者
沐曦展出的曦云C600 GPU芯片,标志着中国在高端GPU领域实现“设计-制造-封装”全链条自主化。该芯片采用12nm工艺,集成2048个流处理器,支持PCIe 5.0与CXL 2.0高速接口,在科学计算领域达到国际同类产品85%性能。
产品矩阵方面,沐曦形成三大系列:曦云C系列(训推一体)、曦思N系列(推理加速)、曦彩G系列(图形渲染)。其中,曦思N100推理卡以15W功耗实现每秒32TOPS(INT8)算力,在智慧安防场景中可同时处理64路1080P视频流分析。
生态合作层面,沐曦与中科曙光、浪潮信息等服务器厂商共建“曦光联盟”,推出预装国产AI框架的整机方案。其软件栈“MXMAC”已适配200余个开源模型,在气象预测、基因测序等超算场景中,曦云C系列集群展现出与NVIDIA A100相当的运算效率。
寒武纪:云端智能芯片的7nm制程突破
寒武纪展出的思元370芯片,采用台积电7nm工艺,集成256TOPS混合精度算力(INT8),较前代产品能效比提升3倍。其创新的“双芯互联”技术,通过片间高速总线实现两颗芯片无缝协同,可扩展至512TOPS算力,满足机器人多模态决策的实时性要求。
边缘端MLU270芯片则聚焦低功耗场景,以5W功耗支持16TOPS算力,适配无人机、智能摄像头等终端设备。在展出的电力巡检机器人演示中,MLU270可同时处理视觉导航、红外测温与缺陷识别任务,推理延迟低于5ms。
寒武纪作为“阶跃星辰模芯生态创新联盟”首批成员,其芯片已深度集成至联盟的AI开发平台。在自动驾驶领域,思元370与比亚迪合作实现BEV感知模型的车端部署,使数据处理延迟从100ms降至20ms。
华为昇腾:超节点架构重塑大模型训练格局
华为昇腾384超节点成为展会焦点,其通过384个NPU芯片的低延迟互联,构建起支持万亿参数大模型训练的分布式计算系统。该系统采用3D封装技术,将芯片间通信带宽提升至1.6Tbps,较传统PCIe互联方案性能提升10倍。
在广汽合作案例中,昇腾超节点优化了汽车排产算法,将原本需要72小时的混合整数规划问题求解时间缩短至8分钟。这一突破使柔性制造系统能够动态响应订单变化,生产线利用率提升18%。
生态建设方面,昇腾率先实现Step-3大模型的搭载运行,其“MindSpore 4.0”框架新增光追加速库,使AI训练与图形渲染任务可共享计算资源。目前,昇腾生态已聚集超过1200家合作伙伴,覆盖金融、医疗等20个行业。
后摩智能:存算一体开启端侧AI新纪元
后摩智能发布的漫界?M50芯片,以160TOPS@INT8的物理算力与10W典型功耗,重新定义了端侧大模型计算标准。其存算一体架构将内存与计算单元深度融合,使能效比达到传统架构的10倍。在70B参数大模型推理测试中,M50以手机快充级功耗实现每秒5token的生成速度。
产品矩阵方面,力擎?LQ50 M.2卡以口香糖大小的体积,为AI PC提供7B模型推理能力;BX50计算盒子则集成4颗M50芯片,支持32路视频分析与本地大模型运行。在智能工业场景中,该盒子可实时处理产线质检数据,将缺陷检测准确率提升至99.7%。
后摩智能通过“离线全流程处理”技术,确保数据在设备端闭环。在智慧医疗场景中,其解决方案使超声诊断设备无需联网即可完成病灶识别,患者隐私数据留存率100%。这一特性使其在政务、金融等敏感领域快速落地。
此芯科技:异构SoC赋能多场景智能计算
此芯科技展出的P1高能效异构SoC,集成CPU、GPU、NPU与DSP核心,通过动态任务调度实现能效比最大化。在PC计算平台演示中,P1可同时运行4K视频解码、语音交互与背景虚化算法,功耗较传统方案降低40%。
边缘计算场景下,P1通过硬件加速模块实现每秒30TOPS的推理算力。在车计算平台展示中,其与地平线联合开发的域控制器,可支持L4级自动驾驶的感知、规划与控制任务并行处理,系统延迟低于20ms。
此芯科技构建了完善的开发者生态,提供从模型量化到部署的全链路工具。目前,其解决方案已在联想、小米等厂商的20余款终端设备中预装。
曦智科技:光电融合突破算力物理极限
曦智科技以“光子计算+光子网络”双产品线,展示了光电融合计算的颠覆性潜力。其光跃LightSphere X系统采用硅光芯片与CPO(共封装光学)技术,将光模块与交换芯片集成,使数据中心内部通信能耗降低60%。该系统荣获2025 SAIL奖,标志着光电计算进入商业化落地阶段。
与燧原科技合作的xPU-CPO原型系统,则探索了光子与电子计算的混合架构。通过光互连技术,该系统将AI芯片间的通信延迟从微秒级降至纳秒级,为万亿参数模型训练提供了可行路径。
曦智科技的光子计算芯片已实现每秒100万亿次运算的实测性能,较电子芯片能效比提升3个数量级。
海光信息:x86生态的国产替代标杆
作为国产x86架构CPU/DCU龙头,海光信息展出的7285系列CPU,性能达到Intel至强铂金8380的92%,支持DDR5内存与PCIe 5.0接口。其DCU深算一号加速器,集成4096个流处理器,在HPC场景中可提供64TFLOPS(FP64)算力,已在中科曙光“硅立方”超算系统中部署。
生态兼容性是海光的核心优势。其产品通过x86指令集授权,可无缝运行Windows、Linux操作系统及各类商业软件。在金融行业,海光CPU已替代进口产品支撑核心交易系统,单节点处理能力提升30%。
目前,海光信息积极与国际技术伙伴开展合作,通过技术交流与协作,不断推动自身技术进步,确保在保持自主可控的同时,能够紧跟国际技术发展的步伐。
龙芯中科:自主生态筑牢安全基石
龙芯中科展出的3A6000处理器,采用自主LoongArch指令集,性能对标Intel第十代酷睿i3。其工控芯片3C5000L通过国密算法加速模块,为网络安全设备提供硬件级安全防护。在电力监控系统演示中,该芯片可实时检测10万级网络攻击行为,误报率低于0.01%。
生态建设方面,龙芯推出“龙芯云”解决方案,集成统信UOS、麒麟等国产操作系统,形成从芯片到应用的完整链条。目前,其产品已应用于航天、能源等关键领域,累计出货超500万片。
龙芯中科正推动LoongArch指令集开源,吸引开发者构建自主软件生态。这一战略使其在信创市场中占据先发优势,成为国产化替代的首选方案之一。
联发科:两岸融合中的技术先锋
作为台湾企业代表,联发科展出的天玑9400芯片,集成第七代APU人工智能处理器,在苏黎世AI-Benchmark测试中取得全球第一成绩。其3nm制程与全大核架构设计,使NPU算力达到60TOPS,可支持端侧130亿参数大模型运行。
在两岸融合展区,联发科与大陆企业联合展示了智能座舱解决方案。通过天玑9400与地平线征程6芯片的协同,系统可同时处理语音交互、手势识别与3D导航任务,多模态响应延迟低于100ms。
联发科正加大在大陆研发投入,其上海研发中心已扩展至2000人规模,聚焦AIoT与车用芯片领域。这一布局使其在两岸产业融合中占据枢纽地位。
写在最后
WAIC 2025的芯片展区,折射出中国半导体产业从“单点突破”到“系统超越”的蜕变。摩尔线程的全功能GPU、燧原科技的训推一体架构、后摩智能的存算一体技术,共同构建起覆盖“云-边-端”的AI算力网络。而华为昇腾、寒武纪等企业的生态建设,则推动中国AI技术从实验室走向千行百业。
在这场全球竞速中,中国芯片企业正以差异化创新打破技术垄断。光电融合、存算一体等新范式的涌现,标志着中国从“技术跟随”转向“路径创造”。随着RISC-V开源架构的普及与先进制程的突破,中国芯片产业有望在AI时代实现真正的“弯道超车”,为全球智能生态赋能。
-
AI
+关注
关注
88文章
35506浏览量
281395
发布评论请先 登录
沐曦全链路算力方案亮相WAIC 2025
墨芯人工智能WAIC 2025现场直击
光电融合突破算力边界:曦智科技2025 WAIC发布多维度创新成果

2025端侧AI芯片爆发:存算一体、非Transformer架构谁主浮沉?边缘计算如何选型?
耐能KNEO Pi开发板的三大技术革新
AI赋能边缘网关:开启智能时代的新蓝海
亿铸科技熊大鹏探讨AI大算力芯片的挑战与解决策略
AI网络物理层底座: 大算力芯片先进封装技术

评论