背景
春节前,国产大模型 DeepSeek 横空出世,迅速成为AI领域的焦点。作为端侧AI能效比优异的 AX650N、AX630C 芯片平台早已在节前完成 DeepSeek R1 蒸馏版本 1.5B、7B、8B 的适配,并在春节期间,海外开发者已基于 AX630C 平台顺利复现,DeepSeek 端侧部署顺利出海!
本文将通过走马观花的方式,分享基于爱芯元智的 AX650N、AX630C 芯片适配 DeepSeek R1 系列模型的最新进展,向业界对端侧大模型部署的开发者提供一种新的思路,促进社区对端侧大模型的探索。
DeepSeek R1 介绍
DeepSeek R1 是幻方量化旗下大模型公司 DeepSeek 研发的系列推理模型,自诞生起就备受瞩目。它采用强化学习训练,推理时包含大量反思和验证,思维链长度可达数万字。在数学、代码以及复杂逻辑推理任务上,DeepSeek R1 有着出色的表现,能取得媲美 OpenAI o1 的推理效果,还能为用户展现完整的思考过程。
官方链接:https://www.deepseek.com/
论文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
DeepSeek R1 部署
考虑到端侧AI芯片资源的局限性,我们选择部署 DeepSeek-R1-Distill-Qwen-1.5B 版本进行展示。感兴趣的朋友可以通过我们的Pulsar2工具链
(https://pulsar2-docs.readthedocs.io/zh-cn/latest/appendix/build_llm.html)
转换 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B 等模型。
为了方便快速尝鲜,我们已经开源基于 AX650N、AX630C 适配好的模型。
模型获取
可以从 Huggingface 上获取:
https://huggingface.co/AXERA-TECH/DeepSeek-R1-Distill-Qwen-1.5B
上板运行
AX650N:
AX630C:
结束语
随着大语言模型小型化的快速发展,特别是 DeepSeek 推动了大模型的技术平权,相信从今年开始越来越多有趣的大模型应用将逐渐从云端服务迁移到端侧设备,高效AI推理芯片的应用也将迎来更广阔的天地。而爱芯元智作为专注于边端侧的智能芯片平台,必将大有用武之地。
更多开源大模型适配案例请参考:
https://github.com/AXERA-TECH/ax-llm。
-
AI
+关注
关注
88文章
35476浏览量
281280 -
DeepSeek
+关注
关注
2文章
804浏览量
1829
原文标题:爱芯分享 | 基于 AX650N&AX630C 部署 DeepSeek R1
文章出处:【微信号:爱芯元智AXERA,微信公众号:爱芯元智AXERA】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
基于AX650N/AX630C部署多模态大模型InternVL2-1B

AI SoC # 爱芯元智AX650N详细介绍:原生支持Transformer架构模型 适用部署DeepSeek R1

爱芯元智发布第三代智能视觉芯片AX650N,为智慧生活赋能

【爱芯派 Pro 开发板试用体验】爱芯元智AX650N部署yolov8s 自定义模型
【爱芯派 Pro 开发板试用体验】ax650使用ax-pipeline进行推理
爱芯元智第三代智能视觉芯片AX650N高能效比SoC芯片
爱芯元智发布新一代IPC SoC芯片AX630C和AX620Q

爱芯元智AX620E和AX650系列芯片正式通过PSA Certified安全认证

英伟达发布DeepSeek R1于NIM平台
云天励飞上线DeepSeek R1系列模型

扣子平台支持DeepSeek R1与V3模型
重磅发布 | 矽速 M4N Dock 支持 DeepSeek R1,端侧大模型部署新标杆!

评论