0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤科技推出“日日新”融合大模型

商汤科技SenseTime ? 来源:商汤科技SenseTime ? 2025-01-10 15:59 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今年大模型还要如何进化,还有怎样的想象空间?

刚刚,商汤正式推出“日日新”融合大模型,领先实现原生融合模态,深度推理能力与多模态信息处理能力均大幅提升,并在两大权威评测榜单夺得第一,成为“双冠王”。

国内权威大模型测评机构SuperCLUE最新发布的《中文大模型基准测评2024年度报告》:商汤“日日新”融合大模型以总分68.3的优异成绩,与 DeepSeek V3 一起并列国内榜首,成为年度第一。

在近期另一个权威综合评测机构OpenCompass的多模态评测中,商汤以同一款模型同样取得了榜单第一,分数大幅领先GPT-4o。

“一个模型、双料冠军”,意味着商汤科技率先在原生融合模态训练取得实质性突破,这将引领业界从大语言模型和多模态大模型分立的普遍现状,走向真正意义的模型一统。

商汤“日日新”突破了模态融合的技术,跨越了模态之间的鸿沟,就为深度推理能力和多模态信息的结合铺平了道路。

文理兼修,能写能看能推理

商汤“日日新”融合大模型性能上文理兼修,在SuperCLUE年度评测中,文科成绩以81.8分位列全球第一,超越OpenAI的o1模型;理科成绩夺得金牌,其中计算维度以78.2分位列国内第一。

实现原生模态融合后,“日日新”融合大模型不止能达到人类“看”和“想”的水平,还可以帮助你解决更多复杂问题,看不清的字体、数据图表里的信息、文学创作与撰写……这些都可以实现。

融合模态开拓应用新维度

在实际应用场景中,相较于传统大语言模型仅支持单一文本输入的模式,"日日新"融合大模型展现出显著优势,尤其是在自动驾驶视频交互、办公教育、金融、园区管理、工业制造等天然拥有丰富模态信息的场景中。

“日日新"融合大模型能够有效满足用户对图像、视频、语音、文本等多源异构信息的综合处理与识别需求。

例如,在办公、金融领域,其行业属性拥有很多复杂的富模态文档:表格、文本、图片、视频,以及融合上述形式的丰富信息,基于“日日新”融合大模型的商汤应用——办公小浣熊就可以高效地完成处理分析相关的复杂任务。

与此同时,基于融合大模型的优势,商汤“日日新”在视觉交互上也有丰富的应用场景,例如,在线上教育、语音客服等场景,均可以结合语音和自然语言来提升交互体验。

去年年底开始,原生多模态大模型就逐渐成为业内探讨的重要方向。然而由于数据和训练方法的局限,业内很多机构的尝试并不成功——多模态训练过程往往会导致纯语言任务尤其是指令跟随和推理任务的性能严重下降。

得益于在计算机视觉领域十年深耕以及人工智能赋能场景的丰富经验,商汤一直坚信多模态模型是 AI 2.0 进行场景落地的必由之路,对于多模态大模型的研发也有自己的独特见解。在推动语言模型和多模态模型融合的过程中,发展出两项关键的创新技术:融合模态数据合成与融合任务增强训练,进而完成“日日新”融合大模型的训练,推向市场。

在预训练阶段,商汤不仅采用了天然存在的海量图文交错数据,还通过逆渲染、基于混合语义的图像生成等方法合成了大量融合模态数据,在图文模态之间建立起大量交互桥梁,使得模型基座对于模态之间的丰富关系有更扎实的掌握,也为更好地完成跨模态任务打下坚实的基础,从而实现整体性能的提升。

在后训练阶段,商汤基于对广泛业务场景的认知,构建了大量的跨模态任务,包括视频交互、多模态文档分析、城市场景理解、车载场景理解等。通过把这些任务融入到增强训练的过程,商汤的融合模态模型不仅被激发出强大的对多模态信息进行整合理解分析的能力,而且还形成了对业务场景有效的响应能力,走通了应用落地反哺基础模型迭代的闭环。

实现多模态交互与深度融合、走向真正意义的模型一统,是走向世界模型的必经之路,商汤科技已在该赛道实现领跑优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1809

    文章

    49151

    浏览量

    250612
  • 商汤科技
    +关注

    关注

    8

    文章

    570

    浏览量

    36848
  • 大模型
    +关注

    关注

    2

    文章

    3191

    浏览量

    4146

原文标题:商汤推出“日日新”融合大模型,勇夺“双冠王”

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤日日新SenseNova融合模态大模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI多模态大模型首轮评估。 商汤日日新SenseNova融合模态大模型在所有
    的头像 发表于 06-11 11:57 ?749次阅读

    商汤科技日日新V6大模型斩获“双料第一” 一项国内榜首,一个全球第一

    卫冕“双冠”! 通用语言能力并列国内榜首、多模态能力全球最强,商汤日日新V6」近期斩获“双料第一”。 5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5
    的头像 发表于 05-30 11:13 ?920次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>日日新</b>V6大<b class='flag-5'>模型</b>斩获“双料第一” 一项国内榜首,一个全球第一

    商汤科技与敦煌当代美术馆达成战略合作

    敦煌的星辰在壁画上流转了二十个世纪,而今正折射出数字文明的光辉。近日,商汤科技与敦煌当代美术馆正式达成战略合作,基于商汤科技最新日日新模型体系,双方将共同推动人工智能技术在文化旅游领
    的头像 发表于 05-08 16:48 ?579次阅读

    商汤科技与上海徐汇区文旅局达成合作

    近日,商汤科技与上海徐汇区文旅局达成合作,基于商汤最新AI大模型日日新SenseNova V6,打造智慧文旅新技术与应用成果,可为游客提供拟人化的“贴身导游”服务。
    的头像 发表于 04-24 16:23 ?476次阅读

    商汤科技与麒麟软件推出全国产化办公智能助手一体机解决方案

    在4月10日的商汤技术交流日上,商汤科技联合麒麟软件正式推出基于商汤日日新V6大模型和银河麒麟智
    的头像 发表于 04-15 16:48 ?531次阅读

    商汤科技日日新模型SenseNova上线声网云市场

    日前,商汤科技日日新模型SenseNova即将正式上线声网云市场,开发者和企业用户可通过声网的实时互动云服务进行调用,将商汤领先的模型能力
    的头像 发表于 04-08 17:24 ?952次阅读

    商汤日日新融合模型登顶大语言与多模态双榜单

    据弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布的《2025年中国大模型年度评测》结果显示:在语言和多模态核心能力测评中,商汤日日新融合
    的头像 发表于 03-18 10:35 ?609次阅读

    商汤科技推出SenseNova-5o,限时免费实时音视频对话服务

    商汤科技近日正式推出了其“日日新融合模型的交互版本——SenseNova-5o,并宣布即日起对外提供限时免费的实时音视频对话服务。 Se
    的头像 发表于 01-20 15:11 ?758次阅读

    商汤科技日日新融合模型交互版开放商用

    能说会看,还响应快、记性好、算得准——如此完美的AI,ta来了!
    的头像 发表于 01-20 14:10 ?573次阅读

    商汤日日新融合模型荣获双料冠军

    近日,商汤科技正式推出了其创新力作——“日日新融合模型。该模型在技术上实现了原生
    的头像 发表于 01-13 16:10 ?603次阅读

    商汤日日新多模态大模型权威评测第一

    刚刚,商汤科技日日新SenseNova多模态大模型,在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第一。
    的头像 发表于 12-20 10:39 ?1067次阅读

    商汤日日新·商量大模型位列国内大模型第一梯队

    刚刚,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》。
    的头像 发表于 11-08 15:38 ?1041次阅读

    商汤科技回应组织架构调整

    近日,有爆料称商汤科技正在进行组织调整和裁员,重点保留了日日新模型和大装置相关的两个业务,而其他业务线如安防、自动驾驶、医疗等则面临调整。
    的头像 发表于 10-28 16:45 ?642次阅读

    商汤科技亮相2024中国人力资本发展大会

    终于,人才招聘迎来“AI”时刻。 在10月23日的2024中国人力资本发展大会上,商汤科技董事长兼CEO徐立介绍了AI 2.0时代,商汤日日新模型加持人力资源行业的三大能力。
    的头像 发表于 10-27 11:48 ?850次阅读

    商汤Sensechat向香港用户免费开放

    「Sensechat 」基于商汤今年5月推出的“商量多模态大模型粤语版”。依托商汤日日新”出色语言和多模态能力,以及对粤语及本地文化、热点
    的头像 发表于 09-18 15:53 ?1238次阅读