0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超过150万个大模型,DeepSeek全球最受欢迎

Felix分析 ? 来源:电子发烧友 ? 作者:吴子鹏 ? 2025-02-25 00:13 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文 / 吴子鹏)北京时间 2 月 24 日凌晨 3 点,全球最大开源平台之一 huggingface 联合创始人兼首席执行官 Clement Delangue 发布的最新数据显示,中国开源大模型 DeepSeek-R1 在 huggingface 平台上超过 150 万个模型中脱颖而出,成为该平台最受欢迎的开源大模型,点赞数突破 1 万。


目前,DeepSeek 已在全球范围内成为爆火的 AI 大模型。1 月 26 日,DeepSeek 首次登上苹果 App Store 全球榜首并持续领先。上线 18 天,其下载量达到 1600 万次,几乎是同期 ChatGPT 下载量的两倍,其中印度是新用户增长的最大来源地。据统计,DeepSeek 目前在全球 140 多个国家的 App 榜单中位居第一。

在流量方面,2025 年 1 月,DeepSeek 网站的桌面和移动访问量飙升至 2.78 亿次,而2024年12月仅为 1200 万次。中国贡献了近四分之一的桌面流量,美国、巴西、印度、德国等国家也占据一定比例。

此前,Clement 特意发文祝贺 DeepSeek-R1 下载量突破 1000 万次,这一成绩也创造了 huggingface 平台有史以来最受欢迎模型的记录。

那么,DeepSeek 究竟给开源大模型的发展带来了什么,使其如此火爆?

DeepSeek 给开源大模型发展带来的影响

DeepSeek 通过技术创新和商业策略的突破,重塑了开源大模型行业的竞争格局,为开源 AI 大模型的发展带来了积极影响。

带动技术创新
DeepSeek 在模型训练中采用强化学习和模型蒸馏技术,在减少模型参数规模的同时提升性能。例如,R1 模型在数学推理任务中的准确率高达 97.3%。在架构设计方面,以 DeepSeek-V3 为例,其首创多头潜注意力机制,有效解决了长文本推理时的显存效率瓶颈问题,还革新了动态路由算法,提高了专家利用率。

降低成本
DeepSeek 降低了开源大模型的训练成本、推理成本和模型使用成本。其采用的混合专家模型(MoE)架构利用动态冗余策略,将计算成本降低至传统模型的 1/10。结合自研的稀疏结构(MLA 架构),提升了推理效率,实现了性能与成本的平衡。通过纯深度学习方法,DeepSeek 使 AI 涌现出自发推理能力,在数学、代码、自然语言推理等任务上达到国际顶尖水平(如比肩 GPT-4/o1)。借助这些创新,DeepSeek 将大模型训练成本压缩至 560 万美元量级,仅为美国同类模型的 1/100,打破了动辄数亿美元投入的行业惯例。同时,DeepSeek 通过开源以及提供低成本的 API开发者可以自由定制和二次开发。其 API 定价亲民,仅为 OpenAI 同类产品的 1/10,让中小企业能够以较低成本进入 AI 领域,推动了大模型在更多领域的应用和创新。

拓展应用边界
DeepSeek 拓展了开源大模型新的应用边界,使 AI 大模型得以广泛落地。DeepSeek 采用免费商用开源策略,完全开放模型源码并支持衍生开发,推动开发者生态快速扩张。这种 “零门槛 + 零成本” 模式直接导致行业价格体系崩塌,API 使用成本降至 OpenAI 的 5%,最终引领市场进入 “按厘计价” 甚至零成本时代。这一举措激发了全球开发者的热情,推动了技术共享与社区协作。众多开发者基于 DeepSeek 的模型进行创新,加速了垂直领域小模型的发展。同时,DeepSeek 凭借模型压缩等技术,成功适配智能眼镜、工业终端等边缘设备。在金融交易、工业质检、医疗影像分析等众多垂直领域展现出独特的应用优势,为各行业的数字化转型提供了强大动力,极大地拓展了开源大模型的应用场景。

推动模型融合
DeepSeek 推动了开源大模型和闭源大模型的融合。其开源模型 R1 发布后,迫使阿里、腾讯等巨头跟进降价,同时刺激全球开发者社区加速创新。在这个过程中,相当一部分闭源大模型选择与 DeepSeek 进行融合。例如,2025 年 2 月,文心一言(现更名为 “文小言”)App 的 4.9.0 版本更新,接入了 DeepSeek-R1 开源大模型,借助该模型优化了拍照解题功能,通过 “思维链” 技术将解题过程可视化;2 月 6 日,吉利汽车宣布将自研的星睿车控 FunctionCall 大模型、汽车主动交互端侧大模型等与 DeepSeek R1 大模型深度融合,以重新定义智能汽车的人机交互及智能驾驶;医渡科技的 “AI 医疗大脑” YiduCore、智云健康的 “智云大脑” 等医疗领域的闭源模型也接入了 DeepSeek-R1 模型,用于升级智能预问诊、病历生成与质控等核心医疗 AI 应用。DeepSeek 的成功促使其他大模型开发者如 OpenAI、百度等开始重新审视开源策略,对整个行业的发展起到了积极的推动作用。

毫无疑问,DeepSeek 改变了 AI 大模型的市场格局。凭借低成本、高性能、全国产的特点,引发人工智能产业生态巨变,在一定程度上冲击了 OpenAI 等巨头主导的市场格局,加快形成大模型市场的新增长极,推动了整个行业的创新发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DeepSeek
    +关注

    关注

    2

    文章

    804

    浏览量

    1830
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【「DeepSeek 核心技术揭秘」阅读体验】--全书概览

    DeepSeek对人工智能技术格局的一影响 第六章 DeepSeek开源技术剖析 第七章 大模型发展未来展望 全书图文并茂,对专业技术属于进行了讲解,也有对流程、框架、参数的展示,结
    发表于 07-21 00:04

    【「DeepSeek 核心技术揭秘」阅读体验】书籍介绍+第一章读后心得

    模型圈子,其多项性能超过了当时处于领先地位的ChatGPT 4,也证明了不需要高昂的费用也能训练出优质大模型。这激起了我的好奇心,借着这次机会好好阅读一下DeepSeek的核心技术。
    发表于 07-17 11:59

    最受欢迎的单板计算机 x 最流行的移动操作系统

    在本文中,我们将揭秘:应在树莓派上使用Android的4理由从哪里获取树莓派的Android系统?该选择哪一?未来展望。在树莓派上使用Android的4理由树莓派无疑是世界上最受欢迎
    的头像 发表于 06-18 17:20 ?224次阅读
    <b class='flag-5'>最受欢迎</b>的单板计算机 x 最流行的移动操作系统

    如何使用OpenVINO运行DeepSeek-R1蒸馏模型

    DeepSeek-R1在春节期间引发了全球科技界的热度,DeepSeek-R1 是由 DeepSeek 开发的开源推理模型,用于解决需要逻辑
    的头像 发表于 03-12 13:45 ?1493次阅读
    如何使用OpenVINO运行<b class='flag-5'>DeepSeek</b>-R1蒸馏<b class='flag-5'>模型</b>

    RK3588开发板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作为国产AI大数据模型的代表,凭借其卓越的推理能力和高效的文本生成技术,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效
    发表于 02-27 16:45

    鸿蒙原生应用开发也可以使用DeepSeek

    近期DeepSeek火爆全球,那一样很火的开发鸿蒙原生应用的DevEco Studio如果把它接入,会发生什么“化学反应”呢?下面我们将详细分享如何在DevEco Studio中利用CodeGPT
    发表于 02-20 18:06

    开源大模型DeepSeek的开放内容详析

    当大家讨论为什么 DeepSeek 能够形成全球刷屏之势,让所有厂商、平台都集成之时,「开源」成为了最大的关键词之一,图灵奖得主 Yann LeCun 称其是「开源的胜利」。模型开源一直备受关注,从
    的头像 发表于 02-19 09:48 ?1529次阅读
    开源大<b class='flag-5'>模型</b><b class='flag-5'>DeepSeek</b>的开放内容详析

    添越智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    在 AI 技术日新月异的当下,新的模型与突破不断涌现。近期,DeepSeek(深度求索)模型以其卓越性能和亲民成本,迅速在全球开发者圈子里引发热议。作为一款强大的语言
    发表于 02-14 17:42

    了解DeepSeek-V3 和 DeepSeek-R1两个大模型的不同定位和应用选择

    DeepSeek-V3 和 DeepSeek-R1 是深度求索公司(DeepSeek)推出的两不同定位的大模型,其核心差异主要体现在目标场
    发表于 02-14 02:08

    【实测】用全志A733平板搭建一端侧Deepseek算力平台

    ? 随着DeepSeek 的蒸馏技术的横空出世,端侧 SoC 芯片上运行大模型成为可能。那么端侧芯片跑大模型的效果如何呢?本文将在全志 A733 芯片平台上部署一
    发表于 02-13 10:19

    DeepSeek本地部署硬件配置推荐

    近日,关于 DeepSeek 的话题如同一场风暴,席卷了整个大语言模型领域。
    的头像 发表于 02-11 10:54 ?3069次阅读
    <b class='flag-5'>DeepSeek</b>本地部署硬件配置推荐

    里红全面支持DeepSeek系列大模型

    新年伊始,DeepSeek模型及其应用横空出世,凭借着出色的推理能力,迅速激发了千行百业的使用热情。里红积极响应市场需求,快速迭代大模型知识应用系统,最新版本已全面支持私有化部署
    的头像 发表于 02-10 10:45 ?557次阅读

    商汤大装置接入DeepSeek系列模型

    即日起,企业客户和开发者可在商汤大装置象平台中,快速部署DeepSeek-V3、DeepSeek-R1等模型,可享受3月内1000
    的头像 发表于 02-10 10:16 ?690次阅读

    在龙芯3a6000上部署DeepSeek 和 Gemma2大模型

    serve 2.运行deepseek-r1大模型 到以下网站选择不同参数的大模型 https://ollama.com/library/deepseek-r1 新开一
    发表于 02-07 19:35

    采用FP8混合精度,DeepSeek V3训练成本仅557.6美元!

    一, 前言? ? 在AI领域,训练一个大型语言模型(LLM)是一耗时且复杂的过程。根据之前在《从零开始训练一个大语言模型需要投资多少钱?》
    的头像 发表于 01-13 11:12 ?1326次阅读