0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤“日日新”融合大模型登顶大语言与多模态双榜单

商汤科技SenseTime ? 来源:商汤科技SenseTime ? 2025-03-18 10:35 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布的《2025年中国大模型年度评测》结果显示:在语言和多模态核心能力测评中,商汤“日日新”融合大模型斩获国内第一梯队成绩。

其中,核心的通用基础能力与多模态图像理解能力上,商汤“日日新”实现双双登顶,在16家国产主流大模型中排名第一。

通用基础能力:三大维度全面领先

此次评测的“通用基础能力”涵盖数理科学、语言能力和道德风险控制三大核心维度。商汤日日新在这三个方面均表现出色,位列第一,得分超越国际均线,展现出多维度的综合优势。

数理科学能力方面,商汤日日新以 88 分的高分位列第二,在数学推理、代码编写、科学常识等细分领域,展现出极强的逻辑推理和计算能力。报告特别指出,逻辑推理和数学能力已成为衡量大模型实力的关键分水岭。而商汤在这方面的优势尤为显著。

语言能力方面,在意图理解、角色扮演、开放式推理等方面表现优异,尤其是在语境适应性、指令遵循及输出稳定性上表现出色,确保了生成内容的准确性和一致性。

道德责任能力方面,以 75.88 分的成绩位居榜首,在风险信息识别、偏见控制等方面表现突出,充分体现了商汤在伦理安全与风险控制上的严格标准。

多模态能力:图像理解与生成双突破

在多模态能力评测中,商汤日日新同样表现亮眼。在多模态图像理解能力评测中,商汤日日新以 84.05的高分位居榜首,在文字识别、物体定位、图像风格识别、图片逻辑理解等九个细分维度中夺得三项第一,显示出强大的图像理解能力。

其中,文字识别能力在复杂背景和低质量图像中表现远超中国及国际行业平均水平;物体定位能力精准度国内领先;图像风格识别准确率显著高于中国大模型均线。

在多模态生成能力评测中,商汤秒画在商业型和艺术型图像生成方面表现优异,尤其是在商业图像生成中,图像质量、指令遵循和风格多样性得分领先,展现出强大的技术实力和应用潜力,能够很好地满足广告、电商等商业场景的需求。

专业应用能力:多行业场景表现优异

在专业应用能力评测中,商汤日日新同样处于第一梯队,位居前二。其综合能力涵盖 AI 智能体、专业文本处理及超长文本处理,展现出在复杂决策、专业知识理解与长文本推理方面的强大能力。

在行业应用能力方面,商汤日日新在金融、医疗、政务、教育等 14 个行业场景中均表现优异,体现了其对不同领域知识的深度理解和应用能力,以及强大的行业适配性和落地能力。

自 2023 年 4 月首次发布以来,日日新 SenseNova 大模型体系已进行了多次大版本迭代。今年 1 月推出的日日新融合大模型更是在行业内率先实现了原生融合模态训练的突破,打破了大语言与多模态分立的局面,支持文本、图像、视频、语音等多源异构信息的综合处理,为多场景应用奠定了坚实基础,推动了AI大模型的工业化发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281261
  • 商汤科技
    +关注

    关注

    8

    文章

    570

    浏览量

    36850
  • 大模型
    +关注

    关注

    2

    文章

    3191

    浏览量

    4147

原文标题:大语言通用能力第一!多模态图像理解能力第一!

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    润和软件荣登2025模态AI大模型排行榜单

    近日,《互联网周刊》联合eNET研究院、德本咨询、中国社会科学院信息化研究中心共同发布了“2025模态AI大模型榜单。江苏润和软件股份有限公司(以下简称“润和软件”)自主研发的“润
    的头像 发表于 06-25 14:37 ?545次阅读

    商汤日日新SenseNova融合模态模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI模态模型首轮评估。 商汤日日新SenseNova
    的头像 发表于 06-11 11:57 ?752次阅读

    商汤科技日日新V6大模型斩获“双料第一” 一项国内榜首,一个全球第一

    卫冕“冠”! 通用语言能力并列国内榜首、模态能力全球最强,商汤日日新V6」近期斩获“双料第
    的头像 发表于 05-30 11:13 ?928次阅读
    <b class='flag-5'>商汤</b>科技<b class='flag-5'>日日新</b>V6大<b class='flag-5'>模型</b>斩获“双料第一” 一项国内榜首,一个全球第一

    商汤科技助力如影数字人超级直播间全新升级

    作为数字人全行业首创,如影数字人超级直播间可实现模态智能运营,依托“商汤日日新SenseNova”
    的头像 发表于 04-23 16:31 ?489次阅读

    海康威视发布模态模型AI融合巡检超脑

    基于海康观澜大模型技术体系,海康威视推出新一代模态模型AI融合巡检超脑,全面升级人、车、行为、事件等算法,为行业带来全新的
    的头像 发表于 04-17 17:12 ?891次阅读

    商汤科技日日新模型SenseNova上线声网云市场

    日前,商汤科技日日新模型SenseNova即将正式上线声网云市场,开发者和企业用户可通过声网的实时互动云服务进行调用,将商汤领先的模型能力
    的头像 发表于 04-08 17:24 ?952次阅读

    海康威视发布模态模型文搜存储系列产品

    模态模型为安防行业带来重大技术革新,基于观澜大模型技术体系,海康威视将大参数量、大样本量的图文模态
    的头像 发表于 02-18 10:33 ?734次阅读

    商汤日日新融合模型荣获双料冠军

    近日,商汤科技正式推出了其创新力作——“日日新融合模型。该模型在技术上实现了原生融合
    的头像 发表于 01-13 16:10 ?603次阅读

    商汤科技推出“日日新融合模型

    刚刚,商汤正式推出“日日新融合模型,领先实现原生融合模态,深度推理能力与
    的头像 发表于 01-10 15:59 ?678次阅读

    商汤日日新模态模型权威评测第一

    刚刚,商汤科技日日新SenseNova模态模型,在权威综合评测权威平台OpenCompass的
    的头像 发表于 12-20 10:39 ?1067次阅读

    一文理解模态语言模型——下

    /understanding-multimodal-llms ? 《一文理解模态语言模型 - 上》介绍了什么是
    的头像 发表于 12-03 15:18 ?642次阅读
    一文理解<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>——下

    一文理解模态语言模型——上

    /understanding-multimodal-llms 在过去几个月中, OpenVINO? 架构师 Yury阅读了众多有关模态语言模型的论文和博客,在此基础上,推荐了一篇解
    的头像 发表于 12-02 18:29 ?1253次阅读
    一文理解<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>——上

    利用OpenVINO部署Qwen2模态模型

    模态模型的核心思想是将不同媒体数据(如文本、图像、音频和视频等)进行融合,通过学习不同模态之间的关联,实现更加智能化的信息处理。简单来说
    的头像 发表于 10-18 09:39 ?1325次阅读

    云知声山海模态模型UniGPT-mMed登顶MMMU测评榜首

    近日,模态人工智能模型基准评测集MMMU更新榜单,云知声山海模态
    的头像 发表于 10-12 14:09 ?731次阅读
    云知声山海<b class='flag-5'>多</b><b class='flag-5'>模态</b>大<b class='flag-5'>模型</b>UniGPT-mMed<b class='flag-5'>登顶</b>MMMU测评榜首

    商汤Sensechat向香港用户免费开放

    「Sensechat 」基于商汤今年5月推出的“商量模态模型粤语版”。依托商汤日日新”出色
    的头像 发表于 09-18 15:53 ?1241次阅读