后摩智能NPU适配通义千问Qwen3系列模型-电子发烧友网

后摩智能NPU适配通义千问Qwen3系列模型

近日，阿里云重磅推出Qwen3 系列开源混合推理模型。用时不到1天，后摩智能自研NPU迅速实现Qwen3 系列模型（Qwen3 0.6B-14B）在端边侧的高效部署。这一成果充分彰显了后摩智能NPU在生态适配性与快速响应能力方面的显著优势。

通义千问 Qwen3 系列作为国内领先的混合推理模型，其亮点在于创造性地将 “快思考” 与 “慢思考” 集成进同一个模型架构。对于简单需求，可迅速做出低算力响应，实现 “秒回”；面对复杂问题，能够进行多步骤深度思考，逐步推导出合理答案。此外，Qwen3 系列基于海量多语言、多模态数据预训练，并经过高质量数据微调，在人类偏好对齐方面表现出色，推理效率提升 3 倍，支持 API 商用及开源代码库，为用户提供了灵活多样的部署选择。

后摩智能通过多种产品组合，为用户提供丰富的高性能 AI 算力选择。基于自研 NPU，后摩智能推出了力谋SM30 计算模组、力谋LM30 智能加速卡及力谋BX30 计算盒子等产品，在政务、工业、消费、汽车等行业全面覆盖端侧与边缘侧的多样化应用场景。这些产品凭借其高性能、低功耗的特点，为 AI 技术的落地提供了坚实的算力基础，满足了不同用户在不同场景下的需求。

此前，后摩智能 NPU 已成功支持了 DeepSeek R1 Distilled 系列模型，展现出其在适配主流大模型方面的卓越性能和广泛兼容性。此次适配通义千问 Qwen3 系列模型，进一步验证了后摩智能 NPU 在处理复杂 AI 任务时的高效性和稳定性，为国产技术栈的完整性与竞争力提供了有力证明。

未来，后摩智能将继续深耕存算一体技术，持续优化 NPU 性能，加强与生态伙伴的合作，推动国产 NPU 在 AI 领域的广泛应用。通过技术创新与生态共建，后摩智能致力于为更多用户提供高效、普惠的 AI 算力解决方案。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3531

浏览量
50569
阿里云

阿里云

+关注

关注
3

文章
1014

浏览量
44289
NPU

NPU

+关注

关注
2

文章
333

浏览量
19843
后摩智能

后摩智能

+关注

关注
0

文章
38

浏览量
1395

原文标题：后摩智能 NPU 率先完成阿里 Qwen3 系列模型的端边侧部署

文章出处：【微信号：后摩智能，微信公众号：后摩智能】欢迎添加关注！文章转载请注明出处。

搜索历史

后摩智能NPU适配通义千问Qwen3系列模型

评论