0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

爱芯通元NPU赋能SPACEMIT

爱芯元智AXERA ? 来源:爱芯元智AXERA ? 2025-03-13 11:09 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

SPACEMIT:进迭时空是一家计算芯片企业,专注于研发下一代 RISC-V架构的高性能CPU并提供软硬一体优化的计算解决方案。秉承进取不息、迭代不止的企业精神,公司致力于构建“云—边—端”架构原生一体的下一个计算时代。

爱芯通元:以算子为原子指令集的AI计算处理器。高效支持混合精度算法设计和Transformer,为大模型(DeepSeek、Qwen、MiniCPM……)在“云—边—端”的AI应用提供强力基础。

TLDR

模型名称 SPACEMIT M1 SPACEMIT M1 + M.2卡
DeepSeek-R1-1.5B 5.5 tokens/s 17.0 tokens/s
(还有优化空间)
DeepSeek-R1-7B 1.3 tokens/s 4.0 tokens/s
(还有优化空间)

背景

最近,路边社消息说又要大力推广RISC-V产业生态了。还好提前布局,借助于AXCL项目优秀的可移植性,已经完成了国内能顺利买到的基于RISC-V指令集的应用处理器开发板,同时完成内置爱芯通元NPU的M.2算力卡适配,让DeepSeek蒸馏模型在市面上已有的RISC-V开发板上运行更加流畅,给RISC-V生态提供了一种高性价比的AI算力拓展解决方案。

本文简单介绍下SPACEMIT M1社区开发板加装M.2算力卡运行DeepSeek-R1-7B模型的安装细节和注意事项,降低大家踩坑概率。

Milk-V Jupiter

RISC-V PC for Everyone。Milk-V Jupiter由Spacemit K1/M1 SoC提供动力,是世界上第一款同时支持RVA22和RVV1.0的Mini ITX设备。本设备集成标准PCIe连接器,支持常见PCIe器件,如显卡、PCIe转SATA适配器、网卡等。它具有双千兆以太网接口,板载Wi-Fi 6/BT 5.2,并支持NVMe SSD,使其成为入门级RISC-V桌面的理想选择。

cdbbb5ee-fe64-11ef-9310-92fbcf53809c.png

芯茧加速卡

芯茧人工智能算力卡是深圳市云集互联生态科技有限公司推出的基于AXCL软件架构的M.2 2280计算卡。

规格参数

项目 描述
内存 4GiB or 8GiB,64bit LPDDR4x
智能 18TOPs@Int8,72TOPs@Int4;
支持CNN、Transformer模型部署;
支持LLM、VLM部署
视频解码 H.264/H.265,32路
1080@30fps解码
视频编码 H.264/H.265,16路
1080@30fps编码
Host适配 支持IntelAMDNXP、Xilinx、Raspberry Pi、Rockchip、SPACEMIT、StarFive、SG2042等
Host系统 Linux:Ubuntu、Debian、CentOS、OpenKylin等;
Windows(适配中)
外形尺寸 M.2 2280,M Key
M.2 2242(开发中)
工作电压 3.3V
系统功耗 <8w

cdf01f78-fe64-11ef-9310-92fbcf53809c.jpg

硬件安装

cdfd7966-fe64-11ef-9310-92fbcf53809c.jpgce16ff6c-fe64-11ef-9310-92fbcf53809c.jpg

软件安装

适用于SPACEMIT M1的axcl deb包获取链接

https://huggingface.co/AXERA-TECH/AXCL/blob/main/axcl_host_riscv_spacemit_V2.23.0_20250212162521.deb

详细安装流程可参考:AXCL安装 - AXCL V1.0文档

https://axcl-docs.readthedocs.io/zh-cn/latest/doc_guide_setup.html

踩坑记录

在Milk-V Jupiter开发板上预装的Bianbu OS中,如果要使用python环境或者安装pip package,需要启用python虚拟环境进行隔离。很遗憾大家最熟悉的miniconda貌似没有RISC-V版本,建议采用python venv创建python虚拟环境。

当前DEMO依赖Transformer库,pip安装时请选用SPACEMIT提供的pip源。

pip install transformers --index-url https://git.spacemit.com/api/v4/projects/33/packages/pypi/simple

测试

基本功能

DeepSeek

直接尝试DeepSeek-R1 7B模型,可以从AXERA-TECH/DeepSeek-R1-Distill-Qwen-7B-GPTQ-Int4获取。

(https://huggingface.co/AXERA-TECH/DeepSeek-R1-Distill-Qwen-7B-GPTQ-Int4)

安装完成后,可以使用类似nvidia-smi的设备管理工具axcl-smi。

ce2cc022-fe64-11ef-9310-92fbcf53809c.jpg

使用axcl_ut_npu完成NPU功能自测。

ce42b0f8-fe64-11ef-9310-92fbcf53809c.jpg

Tokenizer解析器

DEMO中的Tokenizer解析器采用本地模块与HTTP Server两种方案,其中本地方案又尝试了sentencepiece、tiktoken两种方案。但是我们在实际调试过程中发现sentencepiece对于不同LLM模型的special tokens支持不友好,需要用户自行处理special tokens的拆分,容易导致板端token id与Transformers库中的AutoTokenizer获得的token id存在差异,最终影响LLM的输出结果正确性。因此我们建议前期调试的时候使用Tokenizer HTTP Server的方式直接调用Transformers库中的AutoTokenizer模块进行测试。

Tokenizer HTTP Server的特点:

保证token id正确

方便添加chat template

支持本地、远端部署

支持多用户接入

以huggingface中提供的基于DeepSeek-R1-Distill-Qwen-7B的相关文件为例:

i@m1:~/samples/deepseek-7b-gptq-int4$ tree
.
├── deepseek-r1-7b-gptq-int4-ax650
│  ├── model.embed_tokens.weight.bfloat16.bin
│  ├── qwen2_p128_l0_together.axmodel
......
│  ├── qwen2_p128_l9_together.axmodel
│  └── qwen2_post.axmodel
├── deepseek-r1_tokenizer
│  ├── tokenizer_config.json
│  └── tokenizer.json
├── deepseek-r1_tokenizer.py
├── main_axcl_riscv
├── main_prefill
├── post_config.json
└── run_deepseek-r1_7b_gptq_int4_axcl_riscv.sh

deepseek-r1_tokenizer:是tokenizer相关文件,从DeepSeek/DeepSeek-R1-Distill-Qwen-7B中提取

deepseek-r1_tokenizer.py:是用python实现的Tokenizer HTTP Server

运行说明如下:

python deepseek-r1_tokenizer --host xxx.xxx.xxx.xxx --port 12345,其中--host xxx.xxx.xxx.xxx设置tokenizer解析服务器的IP地址,确保开发板能正常访问该地址。可以在具备python环境的开发板本地运行;

修改run_deepseek-r1_7b_gptq_int4_axcl_riscv.sh中--filename_tokenizer_model的IP信息和步骤1中的一致;

运行run_deepseek-r1_7b_gptq_int4_axcl_riscv.sh即可。

ce502efe-fe64-11ef-9310-92fbcf53809c.jpg

运行视频

结束语

当前,AI芯片行业竞争已从单纯算力比拼转向场景化适配能力。爱芯元智以“普惠AI造就美好生活”为使命,通过爱芯通元NPU与RISC-V产业链深度协同,成为驱动行业从“云端集中”迈向“边缘智能”的关键力量。

因此从今年开始,爱芯通元NPU IP正式启动商业授权服务,欢迎RISC-V产业链中感兴趣的朋友来咨询。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19935

    浏览量

    236265
  • RISC-V
    +关注

    关注

    46

    文章

    2608

    浏览量

    49040
  • NPU
    NPU
    +关注

    关注

    2

    文章

    333

    浏览量

    19843
  • 爱芯元智
    +关注

    关注

    1

    文章

    104

    浏览量

    5158

原文标题:爱芯分享 | 爱芯通元NPU赋能产业链-SPACEMIT

文章出处:【微信号:爱芯元智AXERA,微信公众号:爱芯元智AXERA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NPU适配Qwen2.5-VL-3B视觉多模态大模型

    熟悉NPU的网友很清楚,从去年开始我们在端侧多模态大模型适配上一直处于主动紧跟的节奏。先后适配了国内最早开源的多模态大模MiniCPM V 2.0,上海人工智能实验室的书生多模
    的头像 发表于 04-21 10:56 ?1612次阅读
    <b class='flag-5'>爱</b><b class='flag-5'>芯</b>通<b class='flag-5'>元</b><b class='flag-5'>NPU</b>适配Qwen2.5-VL-3B视觉多模态大模型

    科技”完成新一轮品牌升级,正式更名“智”

    科技正式更名为——智半导体(上海)有限公司(简称为“
    发表于 09-09 12:42 ?1462次阅读
    “<b class='flag-5'>爱</b><b class='flag-5'>芯</b>科技”完成新一轮品牌升级,正式更名“<b class='flag-5'>爱</b><b class='flag-5'>芯</b><b class='flag-5'>元</b>智”

    智CEO仇肖莘出席CISES:AI传统技术,加速智能化转型

    智成立于2019年5月,专注于图像和视频处理领域的AI SOC芯片研发,主要应用于端侧和边缘侧。
    发表于 10-20 09:15 ?1387次阅读
    <b class='flag-5'>爱</b><b class='flag-5'>芯</b><b class='flag-5'>元</b>智CEO仇肖莘出席CISES:AI<b class='flag-5'>赋</b><b class='flag-5'>能</b>传统技术,加速智能化转型

    科技”正式更名“智” 比亚迪半导体推出四合一锁控MCU

    AI视觉芯片研发及基础算力平台公司——科技正式更名为——智半导体(上海)有限公司(简称“
    的头像 发表于 03-16 13:50 ?3149次阅读

    TI科技 中国新基建 | 飞驰之“”——TI科技中国新基建之城际轨道交通

    TI科技 中国新基建 | 飞驰之“”——TI科技
    发表于 10-28 11:59 ?0次下载
    TI<b class='flag-5'>芯</b>科技 <b class='flag-5'>赋</b><b class='flag-5'>能</b>中国新基建 | 飞驰之“<b class='flag-5'>芯</b>”——TI<b class='flag-5'>芯</b>科技<b class='flag-5'>赋</b><b class='flag-5'>能</b>中国新基建之城际轨道交通

    派?AXera-Pi?亮相ICCAD 智开源生态建设加速

    随着人工智能的深入发展,开源开放已成为推动技术持续进步的行业共识和重要驱动力。近日,智推出的开源生态社区开发板「派」AXera-P
    的头像 发表于 12-28 15:06 ?1734次阅读

    智宣布正式入局车载市场

    智成立于2019年5月,致力于打造世界领先的人工智能芯片,拥有混合精度NPU智眸
    的头像 发表于 06-12 14:09 ?1705次阅读

    智混合精度NPU中文名“”正式公布

    目前,智已完成四代多颗芯片产品的研发和量产工作,并逐渐落地智慧城市、智能驾驶和AIoT三大市场。“这些市场都将感知和计算作为基本能力,这也是
    的头像 发表于 07-18 14:32 ?1060次阅读

    智旗下“速”宣布与广汽埃安达成系列智能驾驶项目合作

    2024年5月29日,AI芯片创新公司智旗下车载业务品牌“速”宣布与广汽埃安达成系列
    的头像 发表于 05-30 10:13 ?1333次阅读

    智发布“AI处理器”

    在近日隆重召开的世界人工智能大会(WAIC)这一全球科技盛会上,智科技有限公司凭借其深厚的AI技术研发实力,正式推出了划时代的“
    的头像 发表于 07-09 09:35 ?782次阅读

    MUNIK秒尼科助力NPU工具链Pulsar2通过汽车功能安全认证

    近日,全球领先的检验检测认证机构DEKRA德凯为智半导体有限公司(以下简称:智)颁发
    的头像 发表于 12-29 09:16 ?652次阅读

    智与STRADVISION签署战略合作协议

    近日,智半导体股份有限公司(“智”)与行业领先的AI视觉感知技术公司STRADVIS
    的头像 发表于 04-30 10:30 ?505次阅读

    智亮相2025世界人工智能大会

    近日,2025年世界人工智能大会(WAIC 2025)正式开幕,智作为行业领先的人工智能感知与边缘计算芯片创新研发企业,再次亮相展会。在这场为期3天的展会上,
    的头像 发表于 08-01 10:41 ?255次阅读

    智携手灵境声学推出“声”音频解决方案

    2025年7月26日-7月29日,WAIC 2025世界人工智能大会上,智半导体股份有限公司(以下简称“
    的头像 发表于 08-01 10:43 ?719次阅读

    智重磅发布边缘计算战略

    近日,智在2025世界人工智能大会上重磅发布边缘计算战略。展会现场汇聚了众多行业精英,共同见证了
    的头像 发表于 08-01 10:45 ?279次阅读