0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

广和通加速通义千问Qwen3在端侧全面落地

广和通FIBOCOM ? 来源:广和通FIBOCOM ? 2025-06-25 15:35 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

广和通要闻

6月,广和通宣布:率先完成通义千问Qwen3系列混合推理模型在高通QCS8550平台端侧的适配部署。广和通通过定制化混合精度量化方案与创新硬件加速算法,成功突破Qwen3新型架构在边缘侧的落地创新,为AIoT设备提供业界领先的端侧大模型支持。

通义千问Qwen3自4月底正式发布并全部开源8款「混合推理模型」,其模型性能在代码、数学、通用能力等多项基准测试中刷新纪录。其中,Qwen3-4B与早期版本的Qwen2.5-72B能力相当,在提升推理性能的同时,大大降低了端侧部署成本。同时,Qwen3系列模型还是首个支持混合推理模式(Hybrid Reasoning)的开源模型。开发者可以根据需求开启、关闭思考模式或指定思考长度,将人类大脑的“直觉反应”和“深度思考”能力装进了AI。

广和通完成了参数规模为0.6B/1.7B/4B/8B的Qwen3模型在边缘端的部署,以满足不同下游应用需求。针对Qwen3引入的QK-Norm改进注意力机制和混合推理模式,广和通设计了定制化的混合精度量化方案,动态识别模型结构特征,对Norm层、注意力模块等关键组件采用差异化量化策略。再者,广和通结合NPU特点优化推理结构,利用QCS8550芯片Hexagon DSP的矩阵加速单元,显著提升了大模型在边缘设备上的落地能力。

目前,广和通AI Stack已支持通义千问Qwen3- 0.6B/1.7B/4B/8B模型的量化和推理,为用户提供不同端侧场景应用的模型选择。AI Stack拥有完整AI工具链,集成易于部署的代码,可进行数据标注、模型训练、模型微调。针对模型移植,AI Stack提供模型转换、模型量化和算子替换等能力。再者,AI Stack的高性能推理引擎将训练、转换完成的模型高效部署在端侧并执行推理任务,从而在实际业务场景中实现多样化的AI应用。

广和通AI研究院院长刘子威表示:“广和通率先在端侧部署Qwen3,不仅是技术验证,更是边缘智能落地的典型案例能力。通过广和通自研的AI Stack,我们让机器人、AI眼镜、翻译机等端侧设备真正具备本地化复杂推理与决策能力。广和通将强化端侧AI的商业落地能力,为更多AIoT设备赋智。”

广和通始创于1999年,是中国首家上市的无线通信模组企业(股票代码:300638)。作为全球领先的无线通信模组和AI解决方案提供商,广和通以无线通信与人工智能为技术底座,提供软硬件一体、赋能行业应用的全栈式解决方案,加速千行百业从“万物互联”到“万物智联”。

广和通全栈式解决方案覆盖AIoT模组、AI模型、智能体、全球资费和云服务,助力智能机器人、消费电子、低空经济、智能驾驶、智慧零售、智慧能源等行业数智化升级。

——构筑数字世界基石,丰富智慧生活!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 高通
    +关注

    关注

    78

    文章

    7630

    浏览量

    193474
  • 广和通
    +关注

    关注

    4

    文章

    799

    浏览量

    13716
  • 通义千问
    +关注

    关注

    1

    文章

    36

    浏览量

    449

原文标题:广和通加速通义千问Qwen3在端侧全面落地,破解边缘AI效能瓶颈

文章出处:【微信号:Fibocom,微信公众号:广和通FIBOCOM】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    壁仞科技完成Qwen3旗舰模型适配

    近日,高效适配Qwen3系列模型推理后,壁仞科技宣布完成旗舰版Qwen3-235B-A22B模型的训练适配和优化。由此,壁仞科技已实现Qwen3系列模型
    的头像 发表于 05-16 16:23 ?459次阅读

    Arm CPU适配通义Qwen3系列模型

    近日,阿里巴巴开源了新一代通义模型 Qwen3,Arm 率先成为首批成功适配该模型的计算平台厂商。与此同时,Arm 面向人工智能 (AI) 框架开发者的开源计算内核 Arm Kle
    的头像 发表于 05-12 16:37 ?741次阅读

    Intel OpenVINO? Day0 实现阿里通义 Qwen3 快速部署

    本文将以 Qwen3-8B 为例,介绍如何利用 OpenVINO 的 Python API 英特尔平台(GPU, NPU)Qwen3 系列模型。
    的头像 发表于 05-11 11:36 ?943次阅读
    Intel OpenVINO? Day0 实现阿里<b class='flag-5'>通义</b> <b class='flag-5'>Qwen3</b> 快速部署

    NVIDIA RTX 5880 Ada与Qwen3系列模型实测报告

    近日,阿里巴巴通义团队正式推出新一代开源大语言模型——Qwen3 系列,该系列包含 6 款 Dense 稠密模型和 2 款 MoE 混合专家模型,参数规模覆盖 0.6B 至 235
    的头像 发表于 05-09 15:05 ?1059次阅读
    NVIDIA RTX 5880 Ada与<b class='flag-5'>Qwen3</b>系列模型实测报告

    NVIDIA使用Qwen3系列模型的最佳实践

    阿里巴巴近期发布了其开源的混合推理大语言模型 (LLM) 通义 Qwen3,此次 Qwen3 开源模型系列包含两款混合专家模型 (MoE
    的头像 发表于 05-08 11:45 ?1410次阅读
    NVIDIA使用<b class='flag-5'>Qwen3</b>系列模型的最佳实践

    MediaTek天玑9400率先完成阿里Qwen3模型部署

    通义大模型团队天玑 9400 旗舰移动平台上率先完成 Qwen3 3)的
    的头像 发表于 05-08 10:11 ?552次阅读

    后摩智能NPU适配通义Qwen3系列模型

    近日,阿里云重磅推出Qwen3 系列开源混合推理模型。用时不到1天,后摩智能自研NPU迅速实现Qwen3 系列模型(Qwen3 0.6B-14B)
    的头像 发表于 05-07 16:46 ?653次阅读

    openEuler上基于vLLM Ascend部署Qwen3

    近日,阿里巴巴正式发布新一代Qwen大语言模型系列(Qwen3Qwen3-MoE),模型规模与性能上实现多方面升级。openEuler社区团队与vLLM社区通力合作,
    的头像 发表于 05-07 14:44 ?768次阅读
    <b class='flag-5'>在</b>openEuler上基于vLLM Ascend部署<b class='flag-5'>Qwen3</b>

    中科曙光DeepAI深算智能引擎全面支持Qwen3

    日前,Qwen3正式发布并全部开源8款混合推理模型。作为Qwen系列中的最新一代大型语言模型,Qwen3推理、指令遵循、工具调用、多语言能力等方面实现
    的头像 发表于 05-06 15:17 ?595次阅读

    几B都有!BM1684X一键适配全系列Qwen3

    Qwen3发布,大小尺寸通吃Qwen3一发布,登顶开源大模型排行榜!235B、32B、8B、4B、1.7B云边全尺寸模型,BF16和FP8两种精度,一次性发布,无论云端大卡还是边缘AI设备,都可
    的头像 发表于 04-30 18:37 ?649次阅读
    几B都有!BM1684X一键适配全系列<b class='flag-5'>Qwen3</b>

    上新:小米首个推理大模型开源 马斯克:下周推出Grok 3.5

    开源新一代通义模型Qwen3。据悉,Qwen3模型参数量仅为DeepSeek - R1的1/3
    的头像 发表于 04-30 16:08 ?842次阅读

    壁仞科技完成阿里巴巴通义Qwen3全系列模型支持

    4月29日,阿里巴巴通义发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qw
    的头像 发表于 04-30 15:19 ?843次阅读

    阿里通义代码模型全系列开源

    近日,阿里云通义大模型团队宣布了一项重大决策:将通义代码模型全系列正式开源。此次开源的模型系列共包含6款Qwen2.5-Coder模型,
    的头像 发表于 11-14 15:26 ?1066次阅读

    通义三款主力模型再降价

    阿里云百炼平台再次掀起降价风暴,三款通义主力模型——Qwen-Turbo、Qwen-Plus及Qwe
    的头像 发表于 09-20 16:46 ?1590次阅读

    通义发布第二代视觉语言模型Qwen2-VL

    阿里巴巴旗下的通义近日宣布,其第二代视觉语言模型Qwen2-VL正式问世,并宣布旗舰模型Qwen2-VL-72B的API已顺利接入阿里云
    的头像 发表于 09-03 16:31 ?896次阅读