搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

几B都有！BM1684X一键适配全系列Qwen3

Qwen3发布，大小尺寸通吃

Qwen3一发布，登顶开源大模型排行榜！235B、32B、8B、4B、1.7B云边端全尺寸模型，BF16和FP8两种精度，一次性发布，无论云端大卡还是边缘AI设备，都可体验最新的大模型能力。

来看下Qwen3各个模型的benchmark得分：

这些年看多了大模型的迭代，各家都在玩参数竞赛和架构魔术，但阿里这次Qwen3的设计有点意思——它搞了个"混合模式"的机制，让模型能自己决定什么时候该"慢慢想"，什么时候该"快速答"。这玩意儿本质上是在延迟和精度之间做动态权衡，技术上不算新鲜（OpenAI的o3就玩过这套），但阿里的实现方式更像个老会计——给你个"思考预算"的开关，让用户自己把控成本。

BM1684X，Qwen3部署性价比之王

这种设计背后是典型的工程思维：既然大模型的推理成本居高不下，不如把选择权交给用户。就像当年CPU的动态调频技术，与其无脑跑满频，不如让系统根据负载灵活调节，但这种模式切换要在硬件层面做好流水线调度，否则切换时的上下文保存就能吃掉那点省下来的算力。

现在的大模型就像过度教育的孩子，解得了奥数题但算不清买菜账。Qwen3给"孩子"装了个手动挡，让用户自己决定什么时候该挂高档位冲刺，什么时候该低档省油，这种策略下每瓦特的性价比自然就上去了，而边缘和端侧的设备对成本更是敏感，那作为边缘大模型部署的性价比之王，BM1684X表现如何？

4B运行demo（SOC模式950Mhz 16.4tokens/s）

1.7B运行demo(SOC模式950Mhz 30.3 tokens/s)

一行代码适配，解锁全系模型

BM1684X 单芯配置16GB内存，20B以下的都可以在一颗芯片跑，32B用2颗就可以(32B dense模型性能约5 tokens/s)。

更详细的适配流程参考：https://github.com/sophgo/LLM-TPU/tree/main/models/Qwen3，拉取最新的tpu-mlir代码后，只需要一行代码即可转出bmodel，不用再通过onnx中介。

bmodel转好之后，可以用python或者cpp来跑：

限制我们适配新模型速度的不是工具链，而是模型下载速度，欢迎关注算能产品，解锁更多大模型部署方案，手中有BM1684X的同学可以玩起来了！

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

边缘AI

边缘AI

+关注

关注
0

文章
169

浏览量
5493
大模型

大模型

+关注

关注
2

文章
3191

浏览量
4147

评论

算能开发者社区
企业号

63 内容 9w 阅读 6 粉丝

我要咨询关注

Hot 重塑翻译与识别技术：开源语音识别模型Whisper的编译优化与部署
Hot 探索ChatGLM2在算能BM1684X上INT8量化部署，加速大模型商业落地
New ROCm 6.2.4 成功移植至 SG2044: 大模型部署速率飙升，RISC-V + AI 新纪元！代码已经开源，一起来试试！
New SC11 FP300 MLA算子融合与优化

精选推荐
更多

文章

资料

帖子

无刷电机弱磁控制：技术原理与实战应用

其利天下技术
1天前

1188 阅读

3D 管道是如何流动的？

图扑-数字孪生
1天前

193 阅读

芯海科技：BMS芯片出货超亿颗，系列新品强势夯筑第二增长曲线

章鹰观察
2天前

5411 阅读

营收940亿美元！苹果第三财季业绩亮眼，开放AI并购，中国市场重回增长

章鹰观察
2天前

4832 阅读

LCD高清平板对偏压供电电路设计的挑战

安世半导体
2天前

1198 阅读

主板检验标准

郝埃连
433

10积分

67下载

EtherCAT?对该?处理器

jfzhangjin
729 KB

1积分

7下载

该解决方案中的simpler硬化物联网安全的Wi - Fi的连接设计

0.24 MB

免费

9下载

用于ADE7816 6通道能量监视器ASIC的分线板

凤毛麟角
0.16 MB

2积分

4下载

二氧化碳探测器开源分享

王尚岱
0.01 MB

2积分

2下载

电源电路焊接上单片机后电压异常，看看这是什么问题？

jf_56940081
2天前

1399 阅读

【社区活动】电子发烧友八月份活动汇总

dianzi_0101
2天前

1174 阅读

养生壶主板用的是阻容降压，拆了一个养生壶，自己画了电路图，解释不通，没看明白原理？

6551130
2天前

1589 阅读

【Banana Pi BPI-RV2开发板试用体验】SDK部署

chen000000009
3天前

1193 阅读

【HZ-T536开发板免费体验】3、移植星闪WS73模块

jf_50393217
3天前

1169 阅读

推荐企业号
更多

企业产品

资料

方案
更多

abg欧博（原“华强聚丰”）：

电子发烧友

abg欧博开发

abg欧博电路(原"华强PCB")

abg欧博商城(原"华强芯城")

abg欧博智造

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

abg欧博电路

abg欧博商城

abg欧博智造

nextPCB

BOM配单

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

abg欧博

关于我们

投资关系

新闻动态

加入我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

硬声APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

黄晶晶：huangjingjing@elecfans.com

内容合作（海外）

张迎辉：mikezhang@elecfans.com

供应链服务 PCB/IC/PCBA

江良华：lanhu@huaqiu.com

投资合作

曾海银：zenghaiyin@huaqiu.com

社区合作

刘勇：liuyong@huaqiu.com

关注我们的微信

下载发烧友APP

电子发烧友观察

电子工程师社区

1-32层PCB打样·中小批量

元器件现货·全球代购·SmartBOM

SMT贴片·PCBA加工

PCB Manufacturer

abg欧博简介

企业动态

联系我们

企业文化

企业宣传片

加入我们

版权所有 ? 湖南abg欧博数字科技有限公司

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层（0731-88081133）
电子发烧友 （电路图） 湘公网安备43011202000918 工商网监湘ICP备2023018690号-1