0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

部署DeepSeek R1于AX650N与AX630C平台

爱芯元智AXERA ? 来源:爱芯元智AXERA ? 2025-02-09 09:32 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

背景

春节前,国产大模型 DeepSeek 横空出世,迅速成为AI领域的焦点。作为端侧AI能效比优异的 AX650N、AX630C 芯片平台早已在节前完成 DeepSeek R1 蒸馏版本 1.5B、7B、8B 的适配,并在春节期间,海外开发者已基于 AX630C 平台顺利复现,DeepSeek 端侧部署顺利出海!

5753a52e-e604-11ef-9310-92fbcf53809c.jpg

本文将通过走马观花的方式,分享基于爱芯元智的 AX650N、AX630C 芯片适配 DeepSeek R1 系列模型的最新进展,向业界对端侧大模型部署的开发者提供一种新的思路,促进社区对端侧大模型的探索。

DeepSeek R1 介绍

DeepSeek R1 是幻方量化旗下大模型公司 DeepSeek 研发的系列推理模型,自诞生起就备受瞩目。它采用强化学习训练,推理时包含大量反思和验证,思维链长度可达数万字。在数学、代码以及复杂逻辑推理任务上,DeepSeek R1 有着出色的表现,能取得媲美 OpenAI o1 的推理效果,还能为用户展现完整的思考过程。

576c054c-e604-11ef-9310-92fbcf53809c.jpg

官方链接:https://www.deepseek.com/

论文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

DeepSeek R1 部署

考虑到端侧AI芯片资源的局限性,我们选择部署 DeepSeek-R1-Distill-Qwen-1.5B 版本进行展示。感兴趣的朋友可以通过我们的Pulsar2工具链

(https://pulsar2-docs.readthedocs.io/zh-cn/latest/appendix/build_llm.html)

转换 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B 等模型。

为了方便快速尝鲜,我们已经开源基于 AX650N、AX630C 适配好的模型。

模型获取

可以从 Huggingface 上获取:

https://huggingface.co/AXERA-TECH/DeepSeek-R1-Distill-Qwen-1.5B

57a4b6f8-e604-11ef-9310-92fbcf53809c.jpg

上板运行

AX650N:

AX630C:

57d2683c-e604-11ef-9310-92fbcf53809c.jpg

结束语

随着大语言模型小型化的快速发展,特别是 DeepSeek 推动了大模型的技术平权,相信从今年开始越来越多有趣的大模型应用将逐渐从云端服务迁移到端侧设备,高效AI推理芯片的应用也将迎来更广阔的天地。而爱芯元智作为专注于边端侧的智能芯片平台,必将大有用武之地。

更多开源大模型适配案例请参考:

https://github.com/AXERA-TECH/ax-llm。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281280
  • DeepSeek
    +关注

    关注

    2

    文章

    804

    浏览量

    1829

原文标题:爱芯分享 | 基于 AX650N&AX630C 部署 DeepSeek R1

文章出处:【微信号:爱芯元智AXERA,微信公众号:爱芯元智AXERA】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于AX650N/AX630C部署端侧大语言模型Qwen2

    本文将分享如何将最新的端侧大语言模型部署到超高性价比SoC上,向业界对端侧大模型部署的开发者提供一种新的思路。
    的头像 发表于 07-06 17:43 ?4652次阅读
    基于<b class='flag-5'>AX650N</b>/<b class='flag-5'>AX630C</b><b class='flag-5'>部署</b>端侧大语言模型Qwen2

    基于AX650N/AX630C部署多模态大模型InternVL2-1B

    InternVL2是由上海人工智能实验室OpenGVLab发布的一款多模态大模型,中文名称为“书生·万象”。该模型在多学科问答(MMMU)等任务上表现出色,并且具备处理多种模态数据的能力。
    的头像 发表于 11-18 17:32 ?1870次阅读
    基于<b class='flag-5'>AX650N</b>/<b class='flag-5'>AX630C</b><b class='flag-5'>部署</b>多模态大模型InternVL2-<b class='flag-5'>1</b>B

    AI SoC # 爱芯元智AX650N详细介绍:原生支持Transformer架构模型 适用部署DeepSeek R1

    AX650N是爱芯元智(AXERA)推出的一款高性能边缘侧AI芯片,专注智能视觉感知与计算,广泛应用于智慧城市、智能制造、机器人等领域。以下是其核心特性及应用场景的详细分析: *附件:AX650N
    的头像 发表于 03-04 11:15 ?4679次阅读
    AI SoC # 爱芯元智<b class='flag-5'>AX650N</b>详细介绍:原生支持Transformer架构模型 适用<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>

    爱芯元智发布第三代智能视觉芯片AX650N,为智慧生活赋能

    中国 上海 2023 年 3 月 6 日 ——人工智能视觉感知芯片研发及基础算力平台公司爱芯元智宣布推出第三代高算力、高能效比的SoC芯片——AX650N。这是继AX620、AX630
    发表于 03-07 10:57 ?2117次阅读
    爱芯元智发布第三代智能视觉芯片<b class='flag-5'>AX650N</b>,为智慧生活赋能

    【爱芯派 Pro 开发板试用体验】爱芯元智AX650N部署yolov8s 自定义模型

    爱芯元智AX650N部署yolov8s 自定义模型 本博客将向你展示零基础一步步的部署好自己的yolov8s模型(博主展示的是自己训练的手写数字识别模型),本博客教你从训练模型到转化成利于
    发表于 11-24 20:40

    【爱芯派 Pro 开发板试用体验】ax650使用ax-pipeline进行推理

    /AXERA-TECH/ax-pipeline.git 下载sdk cd ax-pipeline ./download_ax_bsp.sh ax650 cd
    发表于 12-19 17:36

    爱芯元智第三代智能视觉芯片AX650N高能效比SoC芯片

    爱芯元智正式推出第三代高算力、高能效比的SoC芯片——AX650N。这是继AX620、AX630系列后,爱芯元智推出的又一款高性能智能视觉芯片。 AX650N是一款兼具高算力与高能效比
    的头像 发表于 03-10 17:13 ?5068次阅读

    爱芯元智发布新一代IPC SoC芯片AX630CAX620Q

    中国 深圳 2023 年 10 月 27 日 ——AI视觉芯片研发及基础算力平台公司爱芯元智宣布,发布新一代IPC SoC芯片产品AX630CAX620Q,以领先行业水平的高画质、智能处理和分析等
    发表于 10-27 16:26 ?2436次阅读
    爱芯元智发布新一代IPC SoC芯片<b class='flag-5'>AX630C</b>和<b class='flag-5'>AX</b>620Q

    爱芯元智AX620E和AX650系列芯片正式通过PSA Certified安全认证

    万物互联的时代,安全性已成为物联网产品设计及部署的基本要求。近日,爱芯元智AX620E和AX650系列芯片(包含AX630C/AX620Q/
    的头像 发表于 04-23 15:45 ?1496次阅读
    爱芯元智<b class='flag-5'>AX</b>620E和<b class='flag-5'>AX650</b>系列芯片正式通过PSA Certified安全认证

    英伟达发布DeepSeek R1NIM平台

    英伟达近日宣布,其DeepSeek R1 671b版本已正式上线英伟达NIM(NVIDIA Inference Microservices)平台,并以预览版的形式在build.nvidia.com
    的头像 发表于 02-05 14:48 ?660次阅读

    云天励飞上线DeepSeek R1系列模型

    -Distill-Llama-70B大模型、DeepSeek V3/R1 671B MoE大模型也在有序适配中。适配完成后,DeepEdge10芯片平台将在端、边、云全面支持DeepSeek
    的头像 发表于 02-06 10:39 ?717次阅读
    云天励飞上线<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>系列模型

    扣子平台支持DeepSeek R1与V3模型

    近日,新一代AI应用搭建平台“扣子”宣布了一项重要更新,即正式支持DeepSeekR1和V3模型,并向广大用户开放免费体验。 扣子平台一直以来都致力
    的头像 发表于 02-08 13:42 ?1178次阅读

    重磅发布 | 矽速 M4N Dock 支持 DeepSeek R1,端侧大模型部署新标杆!

    01性能炸裂速度领先RK358815%,性能直逼OrinNano!久等了!矽速M4NDock(爱芯派Pro,AX650N)已支持部署DeepSeekR1大模型,实测运行速度超越RK3588达15
    的头像 发表于 02-18 15:35 ?971次阅读
    重磅发布 | 矽速 M4<b class='flag-5'>N</b> Dock 支持 <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>,端侧大模型<b class='flag-5'>部署</b>新标杆!

    ORinNano离线部署Deepseek R1大模型教程

    ORinNano离线部署Deepseek R1大模型教程
    的头像 发表于 04-10 15:32 ?570次阅读
    ORinNano离线<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大模型教程

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型

    瑞萨RZ/V2H平台支持部署离线版DeepSeek -R1大语言模型
    的头像 发表于 05-13 17:07 ?959次阅读
    瑞萨RZ/V2H<b class='flag-5'>平台</b>支持<b class='flag-5'>部署</b>离线版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大语言模型