0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百度文心大模型X1 Turbo获得信通院当前大模型最高评级证书

百度 ? 来源:百度 ? 2025-05-21 18:19 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

百度在520居然还领了个证?是它,信通院当前大模型最高评级证书

7999959c-3570-11f0-afc8-92fbcf53809c.png

在5月20日的百度AI Day 上,中国信通院公布了大模型推理能力评估结果——

百度文心大模型X1 Turbo在24项能力评估中,16项达5分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。文心X1 Turbo逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。

AI Day现场,百度吴甜系统性讲解了文心大模型最新版的技术创新。她介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。

79b02a14-3570-11f0-afc8-92fbcf53809c.jpg

中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示:

评估结果表明,文心X1 Turbo擅长结构化的逻辑思考,并具备平衡模型能力与效率的优化技术,其有效的数据机制保障了模型的可信及可用程度,其推理服务能广泛支持各类应用。文心X1 Turbo强化推理泛化能力,拓宽工具链应用生态,加强安全机制建设,构筑可信应用保障壁垒。

79c72d5e-3570-11f0-afc8-92fbcf53809c.jpg

举两个例子——

当你把一张外文的药品说明书拍照上传到文心大模型4.5 Turbo,它可以:

◎ 看懂图片:不仅能识别图片中的文字,还能根据图片内容判断这是“用于缓解肌肉或关节疼痛的药品”;

◎ 多语种翻译:把识别出的日文翻译成中文,并根据图示中的红色字标记重点,比如注意事项等。

这样一来,即使你完全不懂日语,也能快速搞明白这药是干什么的、怎么用才安全。

79d82a46-3570-11f0-afc8-92fbcf53809c.png

你还可以拍照上传作业题目,让文心X1 Turbo解答:

7a1059c0-3570-11f0-afc8-92fbcf53809c.png

◎它会先思考解答这个题目的思路;

◎ 自主规划,识别图片中的明面信息和隐藏含义;

◎ 再思考分析,反思每个答案的准确性;

◎ 最后,给出详细步骤和答案。

思维与行动融合的指导模式,绝对比家长辅导有耐心!

7a6af1aa-3570-11f0-afc8-92fbcf53809c.gif

//多模态大模型:提升学习效率和效果

文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。

针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。

//自反馈增强框架:让模型学会“自我迭代”

后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

在训练阶段,通过融合偏好学习的强化学习技术,实现多元统一奖励机制,提升了对结果质量判别的准确率,通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。此外,因为通过偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力全面提升。

//深度思考:从“单线思维”到“复合思维”

深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

//数据建设闭环:实现快速、高效的数据生产

数据方面,打造了“数据挖掘与合成 - 数据分析与评估 - 模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。

从多项基准测试结果来看,文心大模型4.5 Turbo、X1 Turbo表现出色,效果领先。

7a9e4b04-3570-11f0-afc8-92fbcf53809c.png

7ab0e322-3570-11f0-afc8-92fbcf53809c.png

7acf5956-3570-11f0-afc8-92fbcf53809c.png

//更前瞻、更具想象力的创新应用

大模型的能力进一步拓展、效率进一步提升之后,可以探索更前瞻、更有想象力的创新应用。

以数字人为例,超拟真数字人需要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动等,需要综合运用多模态AI技术。百度研制了“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前这套技术已经支持超过10万数字人主播,直播转化率达31%,降低80%直播开播成本。

而在代码场景上,基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。百度每天新增的代码中,文心快码生成的代码占比已超过40%。截至目前,文心快码向全社会开放,累计服务760万开发者

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。公开数据显示,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。此外,基于飞桨文心,百度在全国范围内落地了7个产业赋能中心和7个教育创新中心,以及两个数据生态中心,形成了繁荣的良性发展生态。

7ae2cf36-3570-11f0-afc8-92fbcf53809c.png

//16岁高中生:打开文心一言,就像打开新华字典一样

本次AI Day ,我们还邀请到了一位16岁的高中生——陈君航。这位来自福建惠安第三中学的高一学生,从2023年就开始接触文心一言,自那以后,文心一言几乎陪伴了他整个中考备考过程。

初次接触文心一言时,陈君航正为语文作文的修改发愁,于是就把作文和老师点评发给文心一言,让它逐句分析给出修改建议。他说,“我打开文心一言,就像打开新华字典一样频繁。在它的陪伴下,我的写作能力得到很大提升。”

陈君航还借助文心一言从零自学了Python,开发出“智能文案生成器”帮妈妈减轻繁重的教学任务,原本三天的工作,现在只需几小时就可以完成。

当大模型学会像人类一样感知世界,像人类一样思考和行动并自我进化,技术进步便真正转化为普惠的社会红利。正如陈君航所说:“技术真正的魅力不是惊艳谁,而是真正解决一个又一个真实的问题”。

“领证”并不是终点,大模型能力的进一步拓展,对创新应用的探索仍在继续!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 百度
    +关注

    关注

    9

    文章

    2338

    浏览量

    92413
  • 文心一言
    +关注

    关注

    0

    文章

    133

    浏览量

    1897
  • 大模型
    +关注

    关注

    2

    文章

    3191

    浏览量

    4146

原文标题:今天520,我们领了个证

文章出处:【微信号:baidu_2000,微信公众号:百度】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    宁畅与与百度模型展开深度技术合作

    近日,百度正式开源模型4.5系列模型。作为
    的头像 发表于 07-07 16:26 ?289次阅读

    商汤日日新SenseNova融合模态大模型 国内首家获得最高评级的大模型

    近日,中国信息通信研究(以下简称“中国信通”)完成可信AI多模态大模型首轮评估。 商汤日日新SenseNova融合模态大模型在所有模型
    的头像 发表于 06-11 11:57 ?749次阅读

    百度发布4.5 TurboX1 Turbo和多款AI应用

    近日,Create2025百度AI开发者大会在武汉举办。百度创始人李彦宏发布了模型4.5 Turb
    的头像 发表于 04-30 10:16 ?597次阅读

    百度发布模型4.5和文模型X1

    模型4.5是百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解
    的头像 发表于 03-18 16:29 ?512次阅读

    百度下一代模型正式开源

    随着模型的迭代升级和成本不断下降,一言将于4月1日0时起全面免费,所有PC端和APP端
    的头像 发表于 02-17 13:44 ?572次阅读

    百度搜索与心智能体平台接入DeepSeek及模型深度搜索

    近日,百度搜索与心智能体平台联合宣布了一项重要更新:将全面接入DeepSeek及模型最新的深度搜索功能。这一更新将为用户和开发者带来
    的头像 发表于 02-17 09:14 ?683次阅读

    百度模型将升级并开源

    百度近日宣布,其文模型系列将迎来新版本升级,计划在未来数月内逐步推出文模型4.5系列。这一消息无疑为AI领域注入了新的活力。 据悉,
    的头像 发表于 02-14 14:25 ?494次阅读

    百度模型4月1日起全面免费开放

    近日,百度公司正式对外宣布,其备受关注的模型在经过一系列迭代与优化后,将于4月1日零时全面免费开放给所有用户。此次免费开放的覆盖范围广
    的头像 发表于 02-14 09:19 ?504次阅读

    百度宣布一言将全面免费

    随着模型的迭代升级和成本不断下降,一言将于4月1日零时起,全面免费,所有PC端和APP
    的头像 发表于 02-13 10:46 ?441次阅读

    百度智能云四款大模型应用接入DeepSeek

    近日,百度智能云旗下四款重量级大模型应用产品——客悦、曦灵、一见、甄知,正式迎来了全新升级,接入了先进的DeepSeek模型。这一重要更新,标志着百度智能云在为企业智能化转型提供更强动
    的头像 发表于 02-10 18:00 ?862次阅读

    科大讯飞发布星火深度推理模型X1

    今天,科大讯飞正式发布星火深度推理模型X1,星火4.0 Turbo底座全面升级,首发星火语音同传大模型
    的头像 发表于 01-15 15:54 ?774次阅读

    凌智电子受邀参加模型生态大会

    12月26日在上海·张江科学会堂,由深度学习技术及应用国家工程研究中心主办,百度飞桨及模型承办,以“模力无限星河共创”为主题的
    的头像 发表于 01-03 16:35 ?663次阅读
    凌智电子受邀参加<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>生态大会

    百度模型日均调用量超15亿

    近日,百度在上海世博中心举办了主题为“应用来了”的百度世界2024大会。会上,百度董事长李彦宏分享了关于大模型行业的最新动态和百度
    的头像 发表于 11-12 15:28 ?732次阅读

    李彦宏宣布:百度模型日调用量超15亿

    百度世界2024大会上,百度公司创始人李彦宏宣布了一项令人瞩目的数据:百度模型的日调用量
    的头像 发表于 11-12 10:40 ?629次阅读

    百度一言APP升级为小言

    百度宣布其文一言APP正式升级为小言,标志着百度在智能搜索领域迈出了重要一步。小言作为百度
    的头像 发表于 09-04 16:06 ?1040次阅读