0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DeepSeek-R1:别被它的光环迷了眼,这些能力局限你得知道!

jf_23871869 ? 来源:刘力 ? 作者:刘力 ? 2025-03-11 17:19 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:算力魔方创始人/英特尔创新大使刘力

最近,DeepSeek-R1 可是火遍了全网,号称“超越人类专家”,数学竞赛夺冠、代码能力碾压人类开发者……听起来是不是很厉害?但别急着被这些光环迷了眼,这款被吹上天的 AI,其实也有不少能力局限呢。今天,咱们就抛开那些营销滤镜,根据官方论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》以及我多年的产品设计经验,来好好聊聊 DeepSeek-R1 的那些“小秘密”!

wKgZPGfP_-OAaRY4AABkUQX_07s545.png

一,“低情商偏科王”:只会做题,不会“沟通”


DeepSeek-R1 在数学、编程这些“考试型任务”上确实表现惊艳,可一旦到了跟人沟通的场景,那可就翻车翻得一塌糊涂了。DeepSeek 团队自曝:它的训练数据主要集中在学术领域,这就导致它像个“书呆子”,只知道闷头解决问题,却不懂得怎么跟人打交道。

大家都知道,沟通可是一门温暖的艺术,可不是一堆冰冷的技术。就像在咱们日常的管理工作中,都是先处理情绪再处理问题。DeepSeek-R1 这样的“书呆子”,要是用在需要提供情绪价值的产品上,那可就惨了。试想一下,当客户气冲冲地打来投诉电话,你的“智能客服”却跟客户有条不紊地分析问题的根因和解决方法,客户能不气得更厉害吗?

现在很多自媒体都在嘲笑 OpenAI 发布的最新模型 GPT-4.5,说它卷不动数学,开始走高情商路线了。但我反倒觉得,从产品的角度来看,OpenAI 选择的大模型能力发展方向才是正确且极有价值的呢。著名产品人梁宁在《给温度以技术,给商业以文明》的演讲里也提到:下一个时代,比拼的就是情绪价值。DeepSeek-R1 这种“低情商偏科王”,在情绪价值方面可就差得远了。

wKgZO2fP_-iAUKKGABYpWa6f9Ns518.png

二,小语种能力不足:除了中文和英文,它可能“胡言乱语”


虽说 DeepSeek-R1 支持多语言,但 DeepSeek 团队也坦白了,它的训练语料里小语种语料少得可怜。小语种,就是除了联合国六大通用语种(汉语、英语、法语、西班牙语、俄语、阿拉伯语)之外的其他语言。要是用小语种让 DeepSeek-R1 去思考数学或者解决推理问题,那可就真要闹笑话了,搞不好就会“胡言乱语”。

那些做小语种国家产品的人可得注意了,可不是像很多自媒体说的那样,把产品接入 DeepSeek-R1 就万事大吉了。比如马来西亚人日常说的马来西亚式英语,那可是一种独特的英语变体,它把马来语、汉语(包括普通话和方言)等语言的语法和词汇都混在了一起,一句话里可能夹杂着普通话、马来语和粤语。要是你直接把接入了 DeepSeek-R1 的产品出口到马来西亚,那面对这种“夹杂英语、普通话、马来语和粤语”的问题,DeepSeek-R1 恐怕就得傻眼了。

wKgZPGfP_-qAI4s2AABjDgqlFDU167.png

三,“玻璃心”:面对有示例的提示词,智商暴跌50%


DeepSeek-R1 对提示词可是很挑剔的!官方明确指出,要是提示词里带有示例,也就是少样本提示词(few-shot prompt),它会先从示例里学习,然后再回答,这样一来,答案的准确率可能就会从 90% 直接掉到 40%。

官方建议:直接用零样本提示词(Zero-shot Prompt),不要加入任何示例。这样一来,DeepSeek-R1 就能发挥出它应有的水平了。

wKgZO2fP_-6AJNqhAAtTULCNEyY545.png

四,职场“菜鸟”:代码写得好,但做工程就是个“实习生”


DeepSeek-R1 在 Codeforces 竞赛里击败了 96% 的人类,这代码能力看起来确实很厉害。可一到真实的软件工程里,它就露馅了:

复杂项目管理:它压根儿就不懂“模块化开发”“版本控制”这些概念,面对复杂项目,估计得一头雾水。

跨团队协作:DeepSeek-R1 只能独自编程,完全不会团队协作,要是放到一个需要多人协作的项目里,那可就麻烦了。

玄学 debug:遇到 bug 时,它可能还会给出“重启试试”这种无厘头的解决方案,这可真是让人哭笑不得。

为啥会出现这种情况呢?原因就在于 DeepSeek-R1 在 RL 训练中缺乏真实工程数据,所以它虽然能解题,但真到了工程项目里,可就不是那么回事儿了,说白了,它就是一个“解题高手”,但不是工程项目高手。

五,结语:AI 的未来,在清醒认知中前行


DeepSeek-R1 的突破确实值得喝彩,但它绝对不是完美的“通用人工智能”。这些能力局限的存在,正好说明了 AI 的“智能”依然是“窄化”的,还远远无法替代人类的综合能力。不过好消息是,DeepSeek 团队已经知道这些局限的存在了,他们已经在着手解决这些问题了。

在这里,我要友情提示大家一句:当你看到“AI 秒杀人类”这种惊悚新闻的时候,可千万别被吓到了,这可能只是特定场景下的“贩卖焦虑”。真正的 AGI 革命,还在路上呢。那么,你有没有发现 DeepSeek-R1 的其他短板呢?欢迎在评论区一起聊聊呀!

如果你有更好的文章,欢迎投稿!

稿件接收邮箱:nami.liu@pasuntech.com

更多精彩内容请关注“算力魔方?”!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DeepSeek
    +关注

    关注

    2

    文章

    804

    浏览量

    1845
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何使用OpenVINO运行DeepSeek-R1蒸馏模型

    DeepSeek-R1在春节期间引发了全球科技界的热度,DeepSeek-R1 是由 DeepSeek 开发的开源推理模型,用于解决需要逻辑推理、数学问题解决和实时决策的任务。
    的头像 发表于 03-12 13:45 ?1499次阅读
    如何使用OpenVINO运行<b class='flag-5'>DeepSeek-R1</b>蒸馏模型

    RK3588开发板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效能跃迁、多模态
    发表于 02-27 16:45

    Infinix AI接入DeepSeek-R1满血版

    传音控股旗下Infinix品牌正式宣布接入DeepSeek-R1满血版,2月26日起支持XOS 14.5及以上版本的Infinix机型可通过升级使用,3月份将发布的全新NOTE系列也将接入DeepSeek-R1,开启“Infinix AI∞ 时代”新篇章。
    的头像 发表于 02-21 16:08 ?850次阅读

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两个不同定位的大模型,其核心差异主要体现在目标场景、能力侧重和技术优化方向上。以下是二者的实
    发表于 02-14 02:08

    超星未来惊蛰R1芯片适配DeepSeek-R1模型

    DeepSeek-R1模型采用了创新的MoE(Mixture of Experts)架构,显著降低了推理成本。同时,该模型还通过GRPO(一种强化学习策略)进行了优化,进一步提升了模型的推理能力。这使
    的头像 发表于 02-13 14:05 ?748次阅读

    OPPO Find N5将接入DeepSeek-R1,可直接语音使用

    DeepSeek-R1 带来联网搜索的能力,帮助用户实时获取热点新闻及解读;Find N5 还支持将DeepSeek-R1生成的结果导出为本地文件,方便用户
    发表于 02-08 17:39 ?449次阅读

    AIBOX 全系产品已适配 DeepSeek-R1

    DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,目前基于开源的R1模型具有1.5B-70B可选,这些蒸馏模
    的头像 发表于 02-08 17:30 ?643次阅读
    AIBOX 全系产品已适配 <b class='flag-5'>DeepSeek-R1</b>

    DeepSeek-R1本地部署指南,开启的AI探索之旅

    的进一步使用。 论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 1|0一、什么是
    的头像 发表于 02-08 10:30 ?5714次阅读
    <b class='flag-5'>DeepSeek-R1</b>本地部署指南,开启<b class='flag-5'>你</b>的AI探索之旅

    deepin UOS AI接入DeepSeek-R1模型

    DeepSeek-R1 模型自发布以来吸引了众多用户关注,为了让 deepin 用户更好地体验这一前沿技术,UOS AI 现已适配接入 DeepSeek-R1 端侧模型!无需忍受服务器崩溃,两步即可在本地独享 DeepSeek-R1
    的头像 发表于 02-08 09:52 ?1179次阅读

    芯动力神速适配DeepSeek-R1大模型,AI芯片设计迈入“快车道”!

    DeepSeek研发的系列推理模型,自诞生起就备受瞩目。采用强化学习训练,推理时包含大量反思和验证,思维链长度可达数万字。在数学、代码以及复杂逻辑推理任务上,DeepSeek-R1有着出色的表现,能取得媲美
    的头像 发表于 02-07 16:55 ?671次阅读
    芯动力神速适配<b class='flag-5'>DeepSeek-R1</b>大模型,AI芯片设计迈入“快车道”!

    网易有道全面接入DeepSeek-R1大模型

    DeepSeek-R1大模型为基础,进一步优化其AI学习助手“有道小P”的个性化答疑功能。借助DeepSeek-R1的超长思维链能力,“有道小P”将能够为用户提供更加深入、准确的解题思路,帮助用户更好地理解和掌握知识点。 此次升
    的头像 发表于 02-07 14:42 ?1089次阅读

    原生鸿蒙版小艺App上架DeepSeek-R1, AI智慧体验更丰富

    2月5日,HarmonyOS NEXT的小艺 App正式上架DeepSeek-R1 Beta版,帮助消费者在代码编写、数学计算、逻辑推理等方面提供智能问询服务。华为小艺上架的DeepSeek-R1
    的头像 发表于 02-07 13:24 ?1276次阅读

    DeepSeek-R1实现自动生成Manim动画

    ? 作者:算力魔方创始人/英特尔创新大使刘力 前面我们分享了在本地运行能与OpenAI-o1 能力相媲美的DeepSeek-R1 模型。本文将介绍如何使用DeepSeek-R1实现自动
    的头像 发表于 02-07 12:31 ?3461次阅读
    用<b class='flag-5'>DeepSeek-R1</b>实现自动生成Manim动画

    行业首家!数势科技SwiftAgent全面接入DeepSeek-R1

    」。数势科技此次接入DeepSeek-R1,将DeepSeek领先的MOE专家架构,以及长思维链推理能力,注入SwiftAgent内核,打造出行业首个具备「认知进化能力」的智能分析产品
    的头像 发表于 02-06 14:27 ?605次阅读
    行业首家!数势科技SwiftAgent全面接入<b class='flag-5'>DeepSeek-R1</b>

    对标OpenAI o1,DeepSeek-R1发布

    DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版
    的头像 发表于 01-22 13:46 ?2391次阅读
    对标OpenAI o<b class='flag-5'>1</b>,<b class='flag-5'>DeepSeek-R1</b>发布