0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI|股价暴涨30%!商汤发布日日新5.0,暴打GPT-4

新火种 ? 来源:新火种 ? 作者:新火种 ? 2024-04-25 23:22 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:一号

编辑:美美

沉寂多时的AI巨头商汤,这次站在了市场焦点上。

股价沉寂多日的AI巨头商汤,在4月24日迎来了大爆发,当日股价飙升31.15%。这样的大涨行情,也让商汤成为了市场焦点,在当天上午11时15分起,公司股票暂停了买卖。

wKgaomYqdSSAcHy6AAB1X6RzQko490.jpg

而到了4月25日,商汤已涨超15%,如此火热的背后,是商汤在4月23日推出了其6000亿参数的大模型“日日新5.0”,在知识、数学、推理和代码能力方面大幅提升,综合性能甚至能够全面对标GPT-4 Turbo。

谁能想到,如此火热的商汤,在之前还面临着亏损危机。

暴打GPT-4,推理速度快到看不清

目前市场上将商汤近期股价暴涨归功于其日前发布的“日日新5.0”大模型。第一代“日日新”大模型体系发布于2023年4月,并在同年8月获批上线。据其官网资料显示,日日新大模型体系包括了商量大语言模型、秒画文生图大模型、语音大模型和向量模型等。

wKgZomYqdSWAR7mNAATUfQL2C20086.jpg

时隔一年,“日日新5.0”正式诞生,它基于超过10TB tokens训练,覆盖了大量合成数据;同时也采用了当前业内主流的混合专家架构(MoE架构),上下文窗口可达到200K左右,在综合能力上,可以全面对标GPT-4 Turbo,“主流客观评测上达到或超越GPT-4 Turbo”。

wKgZomYqdSWAXqWJADJ9FIgi3zc985.jpg

在发布会现场上,商汤还上演了一次《街头霸王》游戏PK,两个角色分别由商汤新发布的日日新端侧大模型SenseChat Life(商量轻量版)和GPT-4操纵,其中绿人由GPT-4操纵,红人则由商量轻量版操作,当GPT-4还在思考如何决策时,商量轻量版的拳头就已经打了上去,名副其实的“暴打GPT-4”,生动地体现了商量轻量版推理速度之快。

wKgaomYqdSaAeRs6AACNmb_vc04180.jpg

而且它还是一个端侧大模型,采用了端云联动的MoE框架,“以小博大”,已经在多项测试中击败了Llama2-7B,甚至是13B,在同等尺度上性能已经达到了SOTA水平。在中等性能手机上,商量轻量版可以达到18.3字/秒的推理速度,而人眼一般的阅读速度为20字/秒。而在高端旗舰手机上,它的推理速度更是可以达到78.3字/秒。

大版本升级,全面对标GPT-4 Turbo

除了端侧大模型的展示,商汤在此次发布会上还在“大基座”方面,把自家的日日新大模型来了个大版本升级——日日新SenseNova 5.0,全面对标GPT-4 Turbo!

wKgZomYqdSaAFY1xAADPaMPkPM0574.jpg

从评测榜单的数据上来看,商量5.0在常规客观评测已经达到或超越了GPT-4 Turbo。其主要依靠两点做到了这一点,一是数据,二是算力。首先,商汤采用了超过10T的tokens,让日日新5.0具备了高质量数据的完备性,此外,商汤还合成构造了高达数千亿tokens的思维链数据,以激活大模型推理的能力。

在算力方面,商汤将算法设计和算力设施进行了联合的优化:算力设施的拓扑极限用来定义下一阶段的算法,而算法上的新进展又要重新指导算力设施的建设。

wKgZomYqdSeAGeXnAAB_DB8cIOk751.jpg

整体上来说,日日新5.0的亮点可以总结为:①采用MoE架构;②基于超过10TB tokens训练,拥有大量合成数据;③推理上下文窗口达到200K;④知识、推理、数学和代码等能力全面对标GPT-4 Turbo。

wKgaomYqdSeAReKXAACWoeyZO4o300.jpg

在多模态能力方面,日日新5.0也有整体的提升,在识图、生图以及代码能力等方面均可比肩行业领先模型,可以说是够全面了,这也是商汤所一直强调的“大模型+大装置”的打法。

股价暴涨之后,商汤能否走出亏损阴云?

作为“AI四小龙”之首的商汤,不久前,刚发布了2023年年度业绩公告,公司实现营收34亿元,同比下滑10.6%;年度亏损64.95亿元,较2022年同期的60.93亿元增加了6.6%,自2018年以来,商汤已经亏损了近500亿。

但与此同时,年报显示,生成式AI成为了商汤业绩的亮点,生成式AI收入突破11.84亿元,实现199.9%的飞速增长,占公司总收入的比例由2022年的10.4%提升到了34.8%。因此,商汤在2024年战略目标中提到,推动核心业务盈利,集中资源于生成式AI业务以改善现金流和减少亏损。

wKgZomYqdSeAcdDJAABSeDo97O0064.jpg

可见,商汤正在践行这一目标,在日日新5.0的发布会上,商汤也交出了一份客户的使用反馈。华为、WPS、小米、阅文、海通证券,从办公到文娱,从金融到终端,均分享了他们使用商汤日日新大模型体系后,给自身业务带来的奖杯呢增效,也因此,商汤股价在发布会之后迎来了大涨。

wKgaomYqdSiAetpSAADffbHQjCU727.jpg

可见,有技术、有算力、有方法论还有使用场景的商汤,或许真的成功转型称为生成式AI新的龙头,在AIGC时代,获得不错的发展。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35506

    浏览量

    281390
  • AIGC
    +关注

    关注

    1

    文章

    388

    浏览量

    2553
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤科技与新华医院联合发布AI儿童全科医生”

    近日,知名三级甲等医院上海交通大学医学院附属新华医院奉贤院区正式起航。 在开业仪式上,新华医院联合商汤医疗重磅发布基于商汤“深思考”日日新大医·医疗大模型的
    的头像 发表于 07-01 15:05 ?2136次阅读
    <b class='flag-5'>商汤</b>科技与新华医院联合<b class='flag-5'>发布</b>“<b class='flag-5'>AI</b>儿童全科医生”

    商汤日日新SenseNova融合模态大模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI多模态大模型首轮评估。 商汤日日新SenseNova融合模态大模型在所有模型中,获得当前最高评级——4+级,并成为国内首家
    的头像 发表于 06-11 11:57 ?754次阅读

    商汤科技日日新V6大模型斩获“双料第一” 一项国内榜首,一个全球第一

    卫冕“双冠”! 通用语言能力并列国内榜首、多模态能力全球最强,商汤日日新V6」近期斩获“双料第一”。 5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新
    的头像 发表于 05-30 11:13 ?935次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>日日新</b>V6大模型斩获“双料第一” 一项国内榜首,一个全球第一

    商汤科技与上海徐汇区文旅局达成合作

    近日,商汤科技与上海徐汇区文旅局达成合作,基于商汤最新AI大模型日日新SenseNova V6,打造智慧文旅新技术与应用成果,可为游客提供拟人化的“贴身导游”服务。
    的头像 发表于 04-24 16:23 ?485次阅读

    商汤科技日日新大模型SenseNova上线声网云市场

    日前,商汤科技日日新大模型SenseNova即将正式上线声网云市场,开发者和企业用户可通过声网的实时互动云服务进行调用,将商汤领先的模型能力集成到各类应用场景中,快速构建基于日日新大模
    的头像 发表于 04-08 17:24 ?954次阅读

    商汤日日新”融合大模型登顶大语言与多模态双榜单

    据弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布的《2025年中国大模型年度评测》结果显示:在语言和多模态核心能力测评中,商汤日日新”融合大模型斩获国内第一梯队成绩。
    的头像 发表于 03-18 10:35 ?610次阅读

    OpenAI即将发布GPT-4.5与GPT-5

    GPT-4.5将在未来几周内率先亮相,它将是OpenAI通用GPT-4模型的继承者。这款新的算法在技术上进行了诸多优化和升级,旨在为用户提供更加精准、高效的AI服务。 而在GPT-4
    的头像 发表于 02-13 13:43 ?699次阅读

    商汤日日新”融合大模型荣获双料冠军

    近日,商汤科技正式推出了其创新力作——“日日新”融合大模型。该模型在技术上实现了原生融合模态的突破,使得其深度推理能力和多模态信息处理能力均得到了显著提升。这一成果的发布,标志着商汤
    的头像 发表于 01-13 16:10 ?605次阅读

    商汤科技推出“日日新”融合大模型

    刚刚,商汤正式推出“日日新”融合大模型,领先实现原生融合模态,深度推理能力与多模态信息处理能力均大幅提升,并在两大权威评测榜单夺得第一,成为“双冠王”。
    的头像 发表于 01-10 15:59 ?679次阅读

    商汤日日新多模态大模型权威评测第一

    刚刚,商汤科技日日新SenseNova多模态大模型,在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第一。
    的头像 发表于 12-20 10:39 ?1073次阅读

    商汤科技回应组织架构调整

    近日,有爆料称商汤科技正在进行组织调整和裁员,重点保留了日日新大模型和大装置相关的两个业务,而其他业务线如安防、自动驾驶、医疗等则面临调整。
    的头像 发表于 10-28 16:45 ?648次阅读

    Llama 3 与 GPT-4 比较

    随着人工智能技术的飞速发展,我们见证了一代又一代的AI模型不断突破界限,为各行各业带来革命性的变化。在这场技术竞赛中,Llama 3和GPT-4作为两个备受瞩目的模型,它们代表了当前AI领域的最前
    的头像 发表于 10-27 14:17 ?1220次阅读

    商汤科技亮相2024中国人力资本发展大会

    终于,人才招聘迎来“AI”时刻。 在10月23日的2024中国人力资本发展大会上,商汤科技董事长兼CEO徐立介绍了AI 2.0时代,商汤日日新
    的头像 发表于 10-27 11:48 ?854次阅读

    科大讯飞发布讯飞星火4.0 Turbo:七大能力超GPT-4 Turbo

    超过GPT-4 Turbo,数学能力和代码能力更是超过了Open AI最新一代GPT模型GPT-4o。此外,其效率相对提升50%。
    的头像 发表于 10-24 11:39 ?1134次阅读

    商汤Sensechat向香港用户免费开放

    「Sensechat 」基于商汤今年5月推出的“商量多模态大模型粤语版”。依托商汤日日新”出色语言和多模态能力,以及对粤语及本地文化、热点的深入理解,「Sensechat」简直是香港用户的贴心小棉袄!
    的头像 发表于 09-18 15:53 ?1245次阅读