0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

墨芯S40计算卡实现DeepSeek大模型部署

墨芯人工智能 ? 来源:墨芯人工智能 ? 2025-02-08 10:40 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近期,“国产之光”DeepSeek系列大模型发展迅猛,领跑开源大模型技术与生态,为中国人工智能行业带来了前所未有的变革动力,对全球科技竞争格局产生积极影响。

1稀疏计算

助力DeepSeek R1模型高效部署

日前,墨芯人工智能(Moffett AI)已完成与DeepSeek R1全系列蒸馏模型的推理部署。凭借自研的双稀疏算法技术,墨芯S40计算卡性能得到充分释放,为DeepSeek R1的高效部署提供了强劲的算力后盾,并在较短时间内完成DeepSeek-R1-70B* 和DeepSeek-R1-32B* 等中、大模型部署,且成功实现单卡支持DeepSeek-R1-32B*部署。

墨芯S40计算卡支持DeepSeek R1-70B和DeepSeek R1-32B推理部署

2软硬件协同

提升DeepSeek R1模型推理效率

DeepSeek-R1蒸馏模型是DeepSeek在模型压缩与优化领域的重要创新,通过蒸馏技术实现了高效、低成本的AI推理,适合企业内部实施部署,实现降本增效。

DeepSeek-R1-70B* 和DeepSeek-R1-32B*是DeepSeek-R1蒸馏模型的中大规模和大规模模型。DeepSeek-R1-32B*推理速度较快,实时性要求高的场景,擅长处理日常对话、文档生成和基础代码辅助;DeepSeek-R1-70B*侧重复杂逻辑推理、科研分析、高质量内容创作。

墨芯的稀疏计算技术则是通过算法与硬件的协同设计,有效地减少蒸馏模型部署所需的资源,其中稀疏化技术将模型中的稠密张量转换为等效的稀疏张量,使张量中产生大量的零元素,通过剪枝,有效消减模型冗余,以显著加快计算速度,实现了大模型的高效稀疏化,显著提升DeepSeek-R1系列蒸馏模型的推理速度并降低能耗。

此外,相较于传统推理平台,墨芯S40算力卡能够实现“单卡推理大模型”,简化了多卡分布式处理大模型的复杂部署流程,降低了时间、功耗和成本。这一优势在DeepSeek-R1蒸馏模型的部署中得到了充分体现,墨芯的S40计算卡满足了高算力需求,降低了总拥有成本(TCO),为 AI大模型在各行业的应用提供了支持。

墨芯人工智能与DeepSeek-R1蒸馏模型的成功部署,实现了国产AI算力基座和国产大模型在应用层面的“双向奔赴”,展示了稀疏计算技术在大模型领域的实践成果,也为企业部署“高性能”且“用得起”的大模型提供新思路。

备注:

DeepSeek-R1-70B*:指DeepSeek-R1-Distill-Llama-70B模型

DeepSeek-R1-32B*:指DeepSeek-R1-Distill-Qwen-32B模型

关于墨芯人工智能

墨芯人工智能是稀疏计算引领者,致力于提供云端和终端AI计算平台和服务。通过全球领先的稀疏计算技术优势,打造软硬协同的新一代智能计算平台。产品性能位居行业领先,相较行业主流产品,在算力、能效比与成本等方面均实现数量级优化。面向互联网、运营商、金融、制造、医疗、交通、能源、生命科学、自动驾驶等众多行业与场景,提供高算力、低功耗、高性价比的AI算力服务,赋能前沿科技的进步与社会的智能化升级。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 墨芯
    +关注

    关注

    0

    文章

    13

    浏览量

    1172
  • 大模型
    +关注

    关注

    2

    文章

    3231

    浏览量

    4227
  • DeepSeek
    +关注

    关注

    2

    文章

    807

    浏览量

    1946

原文标题:墨芯S40计算卡完成DeepSeek大模型部署, 支持单卡推理大模型

文章出处:【微信号:墨芯人工智能,微信公众号:墨芯人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【幸狐Omni3576边缘计算套件试用体验】CPU部署DeekSeek-R1模型(1B和7B)

    优化:动态分配计算资源至关键token 中文优化:在Wudao Corpus等中文数据集上强化训练 技术突破: 相比传统LLM,DeepSeek-R1通过以下创新实现低资源部署: Mo
    发表于 04-21 00:39

    ORinNano离线部署Deepseek R1大模型教程

    ORinNano离线部署Deepseek R1大模型教程
    的头像 发表于 04-10 15:32 ?619次阅读
    ORinNano离线<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> R1大<b class='flag-5'>模型</b>教程

    DeepSeek在昇腾上的模型部署的常见问题及解决方案

    2024年12月26日,DeepSeek-V3横空出世,以其卓越性能备受瞩目。该模型发布即支持昇腾,用户可在昇腾硬件和MindIE推理引擎上实现高效推理,但在实际操作中,部署流程与常见
    的头像 发表于 03-25 16:53 ?1030次阅读
    <b class='flag-5'>DeepSeek</b>在昇腾上的<b class='flag-5'>模型</b><b class='flag-5'>部署</b>的常见问题及解决方案

    【幸狐Omni3576边缘计算套件试用体验】DeepSeek 部署及测试

    【幸狐 Omni3576 边缘计算套件测评】DeepSeek 部署及测试 本文介绍了幸狐 Omni3576 边缘计算套件实现
    发表于 03-21 19:31

    RK3588开发板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效
    发表于 02-27 16:45

    全面部署DeepSeek R1大模型

    近日,基于兆高性能通用处理器的PC终端、工作站以及服务器成功实现DeepSeek-R1-Distill模型(1.5B/7B/32B/70B/671B等)的本地
    的头像 发表于 02-25 13:45 ?618次阅读

    完成DeepSeek-R1大模型本地化部署

    近日,行正式宣布完成 DeepSeek-R1 大模型本地化部署实现在多场景、多产品中应用。解锁“
    的头像 发表于 02-24 15:17 ?961次阅读

    摩尔线程图形显卡MTT S80实现DeepSeek模型部署

    摩尔线程“全功能”图形显卡MTT S80,不仅游戏渲染性能强大,能玩《黑神话:悟空》,现在还能本地部署DeepSeek R1蒸馏模型。搭配最新发布的MUSA SDK RC3.1.1版本
    的头像 发表于 02-21 15:46 ?2631次阅读
    摩尔线程图形显卡MTT <b class='flag-5'>S</b>80<b class='flag-5'>实现</b><b class='flag-5'>DeepSeek</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    绍兴数据局率先实现政务环境下的DeepSeek模型部署

    2月14日,绍兴数据局率先基于华为昇腾服务器,成功部署上线DeepSeek全尺寸大模型,在全省率先实现政务环境下的DeepSeek
    的头像 发表于 02-20 11:22 ?1533次阅读
    绍兴数据局率先<b class='flag-5'>实现</b>政务环境下的<b class='flag-5'>DeepSeek</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    研华发布昇腾AI Box及Deepseek R1模型部署流程

    。这一举措标志着研华在AI边缘计算领域迈出了重要一步。 研华边缘AI Box MIC-ATL3S依托昇腾芯片的强大异构计算能力,结合研华在边缘计算领域的高可靠特点,为用户提供了高效、稳
    的头像 发表于 02-19 10:41 ?838次阅读

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    DeepSeek 模型部署与测试,开启这场充满挑战与惊喜的技术探索之旅。 RK3588 开发板:AI 性能担当 RK3588 开发板基于先进的 8nm LP 制程工艺精心打造,其硬件配置堪称豪华,在 AI
    发表于 02-14 17:42

    研华边缘AI Box MIC-ATL3S部署Deepseek R1模型

    随着深度求索(DeepSeek)大模型的发布引发行业热议,研华科技基于昇腾Atlas平台边缘AI Box MIC-ATL3S正式发布与Deepseek R1
    的头像 发表于 02-14 16:08 ?1592次阅读
    研华边缘AI Box MIC-ATL3<b class='flag-5'>S</b><b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> R1<b class='flag-5'>模型</b>

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    ); 二者均支持API调用,可根据业务需求混合部署(如用V3处理前端交互,R1负责后端计算)。 在电子工程领域选用哪个模型最合适,有其他更好的模型推荐吗? 在电子工程领域的电路设计与
    发表于 02-14 02:08

    摩尔线程宣布成功部署DeepSeek蒸馏模型推理服务

    近日,摩尔线程智能科技(北京)有限责任公司在其官方渠道发布了一则重要消息,宣布公司已经成功实现了对DeepSeek蒸馏模型推理服务的部署。这一技术突破,标志着摩尔线程在人工智能领域迈出
    的头像 发表于 02-06 13:49 ?905次阅读

    2024世界人工智能大会精彩回顾

    日前,国家级AI顶级盛会——2024世界人工智能大会(简称“WAIC 2024”)现场,人工智能展出的最新智能客服系统和高性能计算S40
    的头像 发表于 08-28 14:58 ?969次阅读