0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产AI新星DeepSeek崛起:日活超2000万,百万年薪抢人,或适配国产GPU

Felix分析 ? 来源:电子发烧友 ? 作者:吴子鹏 ? 2025-02-06 09:08 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)在蛇年春节期间,国产AI大模型DeepSeek爆火,频繁登上国内外的热搜榜单,成为科技界最炙手可热的新星。根据第三方统计数据,DeepSeek应用上线仅仅20天,日活用户数量就突破了2000万大关,其日活增长速度已经超过了当初爆火的ChatGPT。


爆火之后,发布DeepSeek的幻方量化旗下AI公司杭州深度求索人工智能(AI)基础技术研究有限公司开始招兵买马,开放了多个岗位的招聘,并且给出了丰厚的薪资报酬。同时,有业内人士指出,DeepSeek或许会接入国产GPU,对国产GPU发展有着积极的带动作用。

DeepSeek现象级爆火后,公司和产业发展都将提速

今年1月20日,DeepSeek正式发布DeepSeek-R1,并同步开源模型权重。据介绍,DeepSeek-R1遵循MIT License,允许用户通过蒸馏技术借助R1训练其他模型。DeepSeek-R1上线API,对用户开放思维链输出,通过设置`model='deepseek-reasoner'`即可调用。

在性能方面,DeepSeek-R1比肩OpenAI的GPT-4。这款AI大模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,DeepSeek-R1性能比肩OpenAI o1正式版。同时,由于这款模型采用的是开源策略,因此被认为具有更好的成长性。

目前DeepSeek-R1和更早之前发布的DeepSeek-V3得到了行业的广泛认可,包括京东云、百度云、华为云等云产品都已经接入DeepSeek大模型。以京东云来说,京东云已正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式。华为云方面,2月1日,华为云宣布经过连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。同时,英伟达平台也已经宣布上线DeepSeek,英伟达网站显示,DeepSeek-R1模型已作为NVIDIA NIM微服务预览版在英伟达面向开发者的网站上发布。根据介绍内容,英伟达认为,DeepSeek-R1模型是最先进、高效的大型语言模型,在推理、数学和编码方面表现出色。

多家分析机构认为,DeepSeek-R1和DeepSeek-V3模型的发布将加速AI应用落地。中信证券研报表示,DeepSeek火爆全球,对全球AI产业链带来强大借鉴意义,意味着AI大模型的应用将逐步走向普及,有望开启全新的Scaling Law,模型重心逐步从预训练切换到强化学习、推理阶段,助力算力需求持续增长;中航证券指出,DeepSeek在基础模型训练和推理模型训练方面均有创新,有效克服了推高模型成本的FP8训练精度不足、高质量数据匮乏等困难,极大降低了训练和推理成本;国泰君安认为,DeepSeek-R1的推出体现了开源范式下技术进步的速度,以及在AI训练、推理上成本大幅度压缩的可能,AI的广泛落地有望加速。

DeepSeek爆火之后,深度求索AI公司也进一步快速扩张。公开资料显示,DeepSeek员工数量大约为150人,属于规模较小的AI公司。作为对比,OpenAI目前约有1700名员工。为了扩张队伍,在招聘网站上,深度求索AI公司放出了一系列职位,涵盖客户端研发工程师深度学习研发工程师、全栈开发工程师、自然语言处理算法、深度学习研究员等不同工作内容。

薪酬方面,从正式员工岗位的招聘信息看,DeepSeek对员工薪酬采取“14薪”的模式。在Deepseek挂出的职位中,大部分岗位的起薪在2万元以上,不少年薪能够达到百万元级别。以深度学习研究员岗位为例,薪资水平为50—80k*14薪,工作地点为北京,招聘要求是在校或者应届的硕士生。这意味着,若按照最高月薪8万元计算,应届生入职DeepSeek,年薪就可达到112万元。除了正式员工,DeepSeek还招聘AGI大模型-数据百晓生实习生、深度学习-AGI实习生等实习岗位,实习工资为每天500元左右。

同时,DeepSeek爆火对美国AI产业造成了巨大的冲击。此前,DeepSeek的优异表现以及不及OpenAI近1/20的算力成本令英伟达股价曾一夜暴跌17%,市值蒸发近6000亿美元,这是美股单日最大跌幅。当天,DeepSeek给美国科技股带来了重创,除了英伟达外,博通、台积电、AMD和ASML等公司均出现了不同程度的下跌。

另外,DeepSeek的强大也引起了一些国家的担忧。比如,美国国会近日提出《2025年美国人工智能能力与中国脱钩法案》。法案主要内容包括:禁止美国人在中国境内推进人工智能能力,禁止下载或使用DeepSeek,否则将被定性为犯罪,最高可判处20年监禁。随后,意大利宣布,由于缺乏有关人工智能模型DeepSeek使用个人数据的信息,该机构已经下架了DeepSeek;法国隐私监管机构国家信息与自由委员会(CNIL)表示,该机构将对中国初创公司DeepSeek进行质询;澳大利亚称,DeepSeek对政府技术构成了“不可接受的风险”,立即实施禁令是为了“保护澳大利亚的国家安全和国家利益”。

DeepSeek有望接入国产GPU

笔者也在DeepSeek平台向这款大模型提问:DeepSeek为什么会爆火?

DeepSeek给出了6条总结,分别是:

·高性能与精准度:DeepSeek采用了先进的深度学习算法和大规模数据集进行训练,使其在多个应用场景中表现出色,如自然语言处理、图像识别等。其高精准度和快速响应能力赢得了用户的广泛认可。
·技术创新:DeepSeek在模型架构和训练方法上进行了多项创新,例如引入了更高效的神经网络结构和优化算法,这些技术突破显著提升了模型的性能和效率。
·强大的硬件支持:DeepSeek利用了NVIDIA的高性能GPU(如A100和H100),这些硬件提供了强大的计算能力,使得模型训练和推理过程更加高效,进一步提升了用户体验。
·广泛的应用场景:DeepSeek不仅在学术研究中表现出色,还在商业应用中展现了巨大的潜力。无论是智能客服、内容推荐,还是自动驾驶、医疗诊断,DeepSeek都能提供强有力的支持,满足了多样化的市场需求。
·开放与合作:DeepSeek团队积极与学术界和产业界合作,推动了技术的快速迭代和应用落地。同时,部分技术和工具的开放也吸引了大量开发者和研究者的参与,形成了良好的生态系统。
·市场推广与用户口碑:DeepSeek通过有效的市场推广策略和优质的用户体验,迅速积累了大量的用户和粉丝。用户的口碑传播进一步加速了其知名度的提升。

业内人士称,虽然DeepSeek曾一度重创英伟达股价,但是其也是基于英伟达的高性能计算芯片训练而来,英伟达芯片的领先性依然是毋庸置疑的。只不过,DeepSeek改变了传统AI大模型Scaling Law的逻辑,在训练过程中提升强化学习的权重,且更加注重推理。这一改变相较于此前的预训练权重高,可能会降低英伟达芯片的影响力,这也是美国科技产业恐慌的地方。

不过,无论如何,算力芯片依然是DeepSeek的基础,这一AI大模型并不是凭空出现的,只是改变了运用算力芯片的侧重点。有业内人士爆料称,在使用英伟达H800芯片训练DeepSeek时,没有采用CUDA代码,而是从CUDA生态的中间态表示入手,用PTX代码直接编写,而后转为目标GPU架构的机器码,这和传统英伟达CUDA生态的应用是有一定差异的。

此举引发了大量的猜测。其中一种猜测是,直接使用PTX代码编写就是为了绕开CUDA生态,为接入国产GPU做准备。在相关讨论中,也有研发人员表示,直接使用PTX代码编写对GPU有很强的针对性,H100上的代码一旦转移到H800或者A100上,效果可能就会打折扣,不过这一做法确实能够更好地发挥国产GPU的性能。PTX代码被称为GPU硬件的“母语”,并不是只针对英伟达GPU,这种做法确实容易引起联想。

目前,国产计算芯片可用于AI计算的产品有摩尔线程的MTT系列,燧原科技的云燧系列,寒武纪的思元系列,天数智芯的Big Island系列,以及华为的昇腾(Ascend)系列等,这些产品都有望在DeepSeek开启的AI大模型新纪元里广泛受益。

结语

DeepSeek的爆火是现象级的,颠覆了此前由OpenAI引领的预训练技术路线,提升了强化学习和推理的作用和权重,并在硬件的使用上独辟蹊径,将会引领全球AI产业发展的新潮流。DeepSeek的强大也展示了国内AI创新力量的强大,由于DeepSeek没有采用传统CUDA语言编程的做法,更是让人们对国产AI大模型产业的后续发展充满了无限想象。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DeepSeek
    +关注

    关注

    2

    文章

    807

    浏览量

    1947
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科技巨头疯狂抢人年薪126起,AI人才岗位暴增三倍

    的需求如何?一则公开的招聘信息显示,DeepSeek正在用百万年薪AI人才。智联招聘的报告显示,2024年三季度企业招聘薪酬T20职业中,人工智能工程师的平均薪酬月薪高达2.19
    的头像 发表于 02-14 01:26 ?5406次阅读
    科技巨头疯狂<b class='flag-5'>抢人</b>!<b class='flag-5'>年薪</b>126<b class='flag-5'>万</b>起,<b class='flag-5'>AI</b>人才岗位暴增三倍

    CPU\GPU引领,国产AI PC进阶

    电子发烧友网报道(文/黄晶晶)当前AI PC已经成为PC产业的下一个浪潮,国产CPU、GPU厂商在PC市场一直处于追赶态势,AI PC给了大家新的机遇,在这个赛道
    的头像 发表于 09-01 02:15 ?5786次阅读
    CPU\<b class='flag-5'>GPU</b>引领,<b class='flag-5'>国产</b><b class='flag-5'>AI</b> PC进阶

    国产封装测试技术崛起,江西万年芯构建实力护城河

    的需求呈现爆发式增长。国内封装测试行业迎来黄金发展期,而江西万年芯微电子凭借其技术创新实力,正成为国内封测产业的重要推动者。重塑封装产业格局,国产力量加速崛起随着半导
    的头像 发表于 05-21 16:47 ?881次阅读
    <b class='flag-5'>国产</b>封装测试技术<b class='flag-5'>崛起</b>,江西<b class='flag-5'>万年</b>芯构建实力护城河

    国产AI芯片破局:国产TCB设备首次完成CoWoS封装工艺测试

    DeepSeek的突破性进展,让中国在AI产业领域似乎迅速缩小了和美国的差距,然而整个国产大模型的运行仍高度依赖英伟达的芯片支持。尽管国产GPU
    的头像 发表于 03-14 11:09 ?942次阅读
    <b class='flag-5'>国产</b><b class='flag-5'>AI</b>芯片破局:<b class='flag-5'>国产</b>TCB设备首次完成CoWoS封装工艺测试

    深圳发力机器人AI芯片攻关,万年芯助推国产化替代

    人工智能和机器人产业方面展现出强大的创新活力与发展潜力,旨在引导各方资源汇聚,全力推动芯片技术迈向新高度,为国产化替代奠定坚实基础。万年芯作为半导体领域国产化替代的知
    的头像 发表于 03-04 13:54 ?689次阅读
    深圳发力机器人<b class='flag-5'>AI</b>芯片攻关,<b class='flag-5'>万年</b>芯助推<b class='flag-5'>国产</b>化替代

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    ...... 2) AI算革命:FPGA集群功耗比GPU降低62%;混合精度计算效率提升5.8倍...... 3) 6G通信突破:软件无线电实现Sub-6GHz/毫米波全频段覆盖;Massive MIMO波束
    发表于 03-03 11:21

    后摩智能携手联想开天打造基于DeepSeek的信创AI PC

    AI技术重构产业生态的关键节点,国产芯片与国产AI模型的深度融合正成为推动信创产业发展的关键力量。后摩智能自主研发的NPU芯片后摩漫界M30,已成功
    的头像 发表于 02-24 17:51 ?1497次阅读

    DeepSeek、晶振在AI终端中的相关应用

    国产AI大模型DeepSeek崛起,2025年1月27DeepSeek应用登顶苹果美国地区、
    的头像 发表于 02-19 14:44 ?687次阅读

    无问芯穹实现七家国产芯片DeepSeek适配

    近日,无问芯穹宣布了一个重大进展:其DeepSeek-R1、V3系列模型已成功适配并优化至壁仞、海光、摩尔线程、沐曦、昇腾、燧原以及天数智芯等七家国产芯片平台。这一成就标志着无问芯穹在国产
    的头像 发表于 02-13 16:04 ?736次阅读

    deepseek国产芯片加速 DeepSeek国产AI芯片天团

    ,从而纷纷继续“卷”起来,效仿DeepSeek的“开源”模式。 对于DeepSeek本身,人们关注其如何在有限算力实现强大性能,更关注其在重重条令围城之下的未来之路。而在最近,全世界的芯片厂商集体出动,纷纷宣布支持DeepSeek
    的头像 发表于 02-10 15:07 ?4117次阅读
    <b class='flag-5'>deepseek</b><b class='flag-5'>国产</b>芯片加速 <b class='flag-5'>DeepSeek</b>的<b class='flag-5'>国产</b><b class='flag-5'>AI</b>芯片天团

    瀚博完成DeepSeek全版本训推适配

    国产高端GPU芯片提供商瀚博半导体(以下简称“瀚博”)已完成DeepSeek-V3与R1全系列模型训推适配,单机可支持V3与R1 671B全量满血版模型部署。
    的头像 发表于 02-08 11:28 ?2070次阅读

    “兆瀚”算力产品强力支持DeepSeek,共筑国产AI新生态!

    ,“兆瀚”系列AI服务器及相关产品已全面完成与DeepSeek-R1/V3系列大模型的深度适配,以卓越性能全面支持DeepSeek加快实现本地化部署,为
    的头像 发表于 02-07 19:37 ?805次阅读
    “兆瀚”算力产品强力支持<b class='flag-5'>DeepSeek</b>,共筑<b class='flag-5'>国产</b><b class='flag-5'>AI</b>新生态!

    芯动力神速适配DeepSeek-R1大模型,AI芯片设计迈入“快车道”!

    近期,国产大模型 DeepSeek-R1横空出世,迅速成为AI领域的焦点。 芯动力在24小时内完成了与DeepSeek-R1大模型的适配
    的头像 发表于 02-07 16:55 ?684次阅读
    芯动力神速<b class='flag-5'>适配</b><b class='flag-5'>DeepSeek</b>-R1大模型,<b class='flag-5'>AI</b>芯片设计迈入“快车道”!

    首发 | 昆仑芯 | 国产AIDeepseek训练推理全版本适配、性能卓越,一键部署等您来(附文档下载方式)

    全球增速最快的AI应用。凭借卓越的性能和广泛的应用场景,这匹大模型黑马已然成为行业标杆,为千行百业提供了AI解决方案新选择。 蛇年开工当天,昆仑芯新一代产品P800卡集群点亮的消息引发关注,三万卡集群也将于近日点亮,为
    发表于 02-06 15:28 ?966次阅读
    首发 | 昆仑芯 | <b class='flag-5'>国产</b><b class='flag-5'>AI</b>卡<b class='flag-5'>Deepseek</b>训练推理全版本<b class='flag-5'>适配</b>、性能卓越,一键部署等您来(附文档下载方式)

    雷军千万年薪挖角95后AI天才少女 DeepSeek开源大模型DeepSeek-V2关键开发者之一罗福莉

    95后AI“天才少女”刷屏;原因是雷军千万年薪挖角。人工智能时代最贵的依然是人才! 这位?95后AI“天才少女”是DeepSeek开源大模型Deep
    的头像 发表于 12-30 10:58 ?1496次阅读