0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对标OpenAI o1,DeepSeek-R1发布

OSC开源社区 ? 来源:OSC开源社区 ? 2025-01-22 13:46 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。

DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。

DeepSeek-R1 上线API对用户开放思维链输出,通过设置 `model='deepseek-reasoner'` 即可调用。

DeepSeek 官网与 App 即日起同步更新上线。

性能对齐OpenAI-o1正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

3522fd82-d7e6-11ef-9310-92fbcf53809c.png

在此,我们将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。

论文链接

https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

蒸馏小模型超越 OpenAI o1-mini

我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

352acfee-d7e6-11ef-9310-92fbcf53809c.png

HuggingFace链接

https://huggingface.co/deepseek-ai

3548f4a6-d7e6-11ef-9310-92fbcf53809c.png

开放的许可证和用户协议

为了推动和鼓励开源社区以及行业生态的发展,在发布并开源 R1 的同时,我们同步在协议授权层面也进行了如下调整:

模型开源 License 统一使用 MIT。我们曾针对大模型开源的特点,参考当前行业的通行实践,特别引入 DeepSeek License 为开源社区提供授权,但实践表明非标准的开源 License 可能反而增加了开发者的理解成本。为此,此次我们的开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。

产品协议明确可“模型蒸馏”。为了进一步促进技术的开源和共享,我们决定支持用户进行“模型蒸馏”。我们已更新线上产品的用户协议,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

App与网页端

登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。

355a0516-d7e6-11ef-9310-92fbcf53809c.gif

API 及定价

DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元

3579a718-d7e6-11ef-9310-92fbcf53809c.jpg

358b602a-d7e6-11ef-9310-92fbcf53809c.png

详细的 API 调用指南请参考官方文档:

https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3754

    浏览量

    43971
  • OpenAI
    +关注

    关注

    9

    文章

    1211

    浏览量

    8989
  • DeepSeek
    +关注

    关注

    2

    文章

    804

    浏览量

    1826

原文标题:DeepSeek-R1发布,性能对标OpenAI o1正式版

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OpenAI发布o1大模型,数理化水平比肩人类博士,国产云端推理芯片的新蓝海?

    电子发烧友网报道(文/吴子鹏)9月12日晚,OpenAI正式对外发布一款名为o1的新模型。OpenAI o1的内部代号为“草莓”,具备超强的
    发表于 09-14 00:04 ?1851次阅读
    <b class='flag-5'>OpenAI</b><b class='flag-5'>发布</b><b class='flag-5'>o1</b>大模型,数理化水平比肩人类博士,国产云端推理芯片的新蓝海?

    如何使用OpenVINO运行DeepSeek-R1蒸馏模型

    DeepSeek-R1在春节期间引发了全球科技界的热度,DeepSeek-R1 是由 DeepSeek 开发的开源推理模型,用于解决需要逻辑推理、数学问题解决和实时决策的任务。
    的头像 发表于 03-12 13:45 ?1492次阅读
    如何使用OpenVINO运行<b class='flag-5'>DeepSeek-R1</b>蒸馏模型

    RK3588开发板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效能跃迁、多模态
    发表于 02-27 16:45

    Infinix AI接入DeepSeek-R1满血版

    传音控股旗下Infinix品牌正式宣布接入DeepSeek-R1满血版,2月26日起支持XOS 14.5及以上版本的Infinix机型可通过升级使用,3月份将发布的全新NOTE系列也将接入DeepSeek-R1,开启“Infin
    的头像 发表于 02-21 16:08 ?847次阅读

    OpenAI O3与DeepSeek R1:推理模型性能深度分析

    OpenAI刚推出的O3和DeepSeekR1代表了推理模型领域的重大进步。这两种模型都因在各种基准测试中的出色表现而备受关注,引发了人们对人工智能的未来及其对各个行业的潜在影响的讨
    的头像 发表于 02-18 11:07 ?998次阅读

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实质性
    发表于 02-14 02:08

    超星未来惊蛰R1芯片适配DeepSeek-R1模型

    日前,超星未来研发团队成功完成了惊蛰R1芯片对DeepSeek-R1模型的适配工作,实现了与用户之间的流畅对话。这一成果标志着超星未来在人工智能芯片和模型优化方面取得了重要进展
    的头像 发表于 02-13 14:05 ?740次阅读

    PerfXCloud上线DeepSeek系列模型

    零门槛体验DeepSeek-R1满血版本,性能对OpenAI o1,即刻开启一场震撼人心的AI探索之旅。
    的头像 发表于 02-10 10:20 ?2976次阅读

    DeepSeek V3/R1架构解读:探讨其是否具有国运级创新

    可挑战?OpenAI?闭源的 o1 模型。 随着热度的提升,DeepSeek也被大模型行业之外的各路媒体不断提起,“打破CUDA垄断”,“挖了NVLink的墙角”,“引发英伟达市值大跌”,“证明大模型
    的头像 发表于 02-10 10:15 ?5218次阅读
    <b class='flag-5'>DeepSeek</b> V3/<b class='flag-5'>R1</b>架构解读:探讨其是否具有国运级创新

    AIBOX 全系产品已适配 DeepSeek-R1

    国产AI大模型DeepSeek以出色的性价比和高效的模型技术,迅速成为全球AI关注的焦点。Firefly开源团队率先实现AIBOX系列产品对DeepSeek-R1的全面适配。R1模型性能数据
    的头像 发表于 02-08 17:30 ?641次阅读
    AIBOX 全系产品已适配 <b class='flag-5'>DeepSeek-R1</b>

    DeepSeek-R1本地部署指南,开启你的AI探索之旅

    R1 2025.01.20 DeepSeek-R1 发布DeepSeek R1DeepSeek
    的头像 发表于 02-08 10:30 ?5690次阅读
    <b class='flag-5'>DeepSeek-R1</b>本地部署指南,开启你的AI探索之旅

    deepin UOS AI接入DeepSeek-R1模型

    DeepSeek-R1 模型自发布以来吸引了众多用户关注,为了让 deepin 用户更好地体验这一前沿技术,UOS AI 现已适配接入 DeepSeek-R1 端侧模型!无需忍受服务器崩溃,两步即可在本地独享
    的头像 发表于 02-08 09:52 ?1170次阅读

    芯动力神速适配DeepSeek-R1大模型,AI芯片设计迈入“快车道”!

    OpenAI o1的推理效果,还能为用户展现完整的思考过程 。在1月24日的Arena上,DeepSeek-R1 基准测试已经
    的头像 发表于 02-07 16:55 ?668次阅读
    芯动力神速适配<b class='flag-5'>DeepSeek-R1</b>大模型,AI芯片设计迈入“快车道”!

    DeepSeek-R1实现自动生成Manim动画

    ? 作者:算力魔方创始人/英特尔创新大使刘力 前面我们分享了在本地运行能与OpenAI-o1 能力相媲美的DeepSeek-R1 模型。本文将介绍如何使用DeepSeek-R1实现自动生成Manim
    的头像 发表于 02-07 12:31 ?3460次阅读
    用<b class='flag-5'>DeepSeek-R1</b>实现自动生成Manim动画

    赶紧在本地运行与OpenAI-o1能力近似的DeepSeek-R1模型

    类似GPT4-V的能力:MiniCPM-V 2.6 》。本文将分享在本地运行能与OpenAI-o1 能力相媲美的 DeepSeek-R1? 模型。 [编者注]:OpenAI-o1OpenAI
    的头像 发表于 01-21 14:29 ?3880次阅读
    赶紧在本地运行与<b class='flag-5'>OpenAI-o1</b>能力近似的<b class='flag-5'>DeepSeek-R1</b>模型