近日,阿里云重磅推出Qwen3 系列开源混合推理模型。用时不到1天,后摩智能自研NPU迅速实现Qwen3 系列模型(Qwen3 0.6B-14B)在端边侧的高效部署。这一成果充分彰显了后摩智能NPU在生态适配性与快速响应能力方面的显著优势。
通义千问 Qwen3 系列作为国内领先的混合推理模型,其亮点在于创造性地将 “快思考” 与 “慢思考” 集成进同一个模型架构。对于简单需求,可迅速做出低算力响应,实现 “秒回”;面对复杂问题,能够进行多步骤深度思考,逐步推导出合理答案。此外,Qwen3 系列基于海量多语言、多模态数据预训练,并经过高质量数据微调,在人类偏好对齐方面表现出色,推理效率提升 3 倍,支持 API 商用及开源代码库,为用户提供了灵活多样的部署选择。
后摩智能通过多种产品组合,为用户提供丰富的高性能 AI 算力选择。基于自研 NPU,后摩智能推出了力谋SM30 计算模组、力谋LM30 智能加速卡及力谋BX30 计算盒子等产品,在政务、工业、消费、汽车等行业全面覆盖端侧与边缘侧的多样化应用场景。这些产品凭借其高性能、低功耗的特点,为 AI 技术的落地提供了坚实的算力基础,满足了不同用户在不同场景下的需求。
此前,后摩智能 NPU 已成功支持了 DeepSeek R1 Distilled 系列模型,展现出其在适配主流大模型方面的卓越性能和广泛兼容性。此次适配通义千问 Qwen3 系列模型,进一步验证了后摩智能 NPU 在处理复杂 AI 任务时的高效性和稳定性,为国产技术栈的完整性与竞争力提供了有力证明。
未来,后摩智能将继续深耕存算一体技术,持续优化 NPU 性能,加强与生态伙伴的合作,推动国产 NPU 在 AI 领域的广泛应用。通过技术创新与生态共建,后摩智能致力于为更多用户提供高效、普惠的 AI 算力解决方案。
-
模型
+关注
关注
1文章
3531浏览量
50569 -
阿里云
+关注
关注
3文章
1014浏览量
44289 -
NPU
+关注
关注
2文章
333浏览量
19843 -
后摩智能
+关注
关注
0文章
38浏览量
1395
原文标题:后摩智能 NPU 率先完成阿里 Qwen3 系列模型的端边侧部署
文章出处:【微信号:后摩智能,微信公众号:后摩智能】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
Intel OpenVINO? Day0 实现阿里通义 Qwen3 快速部署

MediaTek天玑9400率先完成阿里Qwen3模型部署
中科曙光DeepAI深算智能引擎全面支持Qwen3
几B都有!BM1684X一键适配全系列Qwen3

评论