百度文心大模型X1 Turbo获得信通院当前大模型最高评级证书-电子发烧友网

百度在520居然还领了个证？是它，信通院当前大模型最高评级证书！

在5月20日的百度AI Day 上，中国信通院公布了大模型推理能力评估结果——

百度文心大模型X1 Turbo在24项能力评估中，16项达5分，综合评级获当前最高级“4+级”，成为国内首款通过该测评的大模型。文心X1 Turbo逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。

AI Day现场，百度吴甜系统性讲解了文心大模型最新版的技术创新。她介绍，文心大模型4.5是多模态基础大模型，文心4.5 Turbo源自文心4.5，效果更好、成本更低；基于文心4.5 Turbo，文心X1升级到X1 Turbo，性能提升的同时，具备更先进的思维链，问答、创作、逻辑推理、工具调用和多模态能力进一步增强。

中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示：

评估结果表明，文心X1 Turbo擅长结构化的逻辑思考，并具备平衡模型能力与效率的优化技术，其有效的数据机制保障了模型的可信及可用程度，其推理服务能广泛支持各类应用。文心X1 Turbo强化推理泛化能力，拓宽工具链应用生态，加强安全机制建设，构筑可信应用保障壁垒。

举两个例子——

当你把一张外文的药品说明书拍照上传到文心大模型4.5 Turbo，它可以：

◎ 看懂图片：不仅能识别图片中的文字，还能根据图片内容判断这是“用于缓解肌肉或关节疼痛的药品”；

◎ 多语种翻译：把识别出的日文翻译成中文，并根据图示中的红色字标记重点，比如注意事项等。

这样一来，即使你完全不懂日语，也能快速搞明白这药是干什么的、怎么用才安全。

你还可以拍照上传作业题目，让文心X1 Turbo解答：

◎它会先思考解答这个题目的思路；

◎ 自主规划，识别图片中的明面信息和隐藏含义；

◎ 再思考分析，反思每个答案的准确性；

◎ 最后，给出详细步骤和答案。

思维与行动融合的指导模式，绝对比家长辅导有耐心！

//多模态大模型：提升学习效率和效果

文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。

针对不同模态数据在结构、规模、知识密度上的差异，通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术，大幅提升跨模态学习效率和多模态融合效果，学习效率提高近2倍，多模态理解效果提升超过30%。

//自反馈增强框架：让模型学会“自我迭代”

后训练方面，百度研制了自反馈增强的技术框架，基于大模型自身的生成和评估反馈能力，实现了“训练-生成-反馈-增强”的模型迭代闭环，不仅解决了大模型对齐过程中，数据生产难度大、成本高、速度慢等问题，而且显著降低了模型幻觉，模型理解和处理复杂任务的能力大幅提升。

在训练阶段，通过融合偏好学习的强化学习技术，实现多元统一奖励机制，提升了对结果质量判别的准确率，通过离线偏好学习和在线强化学习统一优化，进一步提升了数据利用效率和训练稳定性，并增强了模型对高质量结果的感知。此外，因为通过偏好信号与奖励信号的融合运用，模型的理解、生成、逻辑和记忆等能力全面提升。

//深度思考：从“单线思维”到“复合思维”

深度思考方面，突破了仅基于思维链优化的范式，在思考路径中结合工具调用，构建了融合思考和行动的复合思维链，模型解决问题能力得到显著提升。同时，结合多元统一的奖励机制，实现了思考和行动链的端到端优化，大幅提升了跨领域的问题解决能力。

//数据建设闭环：实现快速、高效的数据生产

数据方面，打造了“数据挖掘与合成 - 数据分析与评估 - 模型能力反馈”的数据建设闭环，为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时，数据建设流程具备良好的可扩展性，能够轻松迁移到全新的数据类型，实现快速、高效的数据生产。

从多项基准测试结果来看，文心大模型4.5 Turbo、X1 Turbo表现出色，效果领先。

//更前瞻、更具想象力的创新应用

大模型的能力进一步拓展、效率进一步提升之后，可以探索更前瞻、更有想象力的创新应用。

以数字人为例，超拟真数字人需要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动等，需要综合运用多模态AI技术。百度研制了“剧本”驱动多模协同的超拟真数字人技术，实现了语言、声音、形象的协调一致。目前这套技术已经支持超过10万数字人主播，直播转化率达31%，降低80%直播开播成本。

而在代码场景上，基于文心大模型的语言和代码能力，百度研制了代码智能体和智能代码助手——文心快码。百度每天新增的代码中，文心快码生成的代码占比已超过40%。截至目前，文心快码向全社会开放，累计服务760万开发者。

文心大模型的能力拓展和效率提升，得益于飞桨文心的联合优化。公开数据显示，飞桨文心开发者数量已超过2185万，服务超过67万家企业，创建的模型达到110万。此外，基于飞桨文心，百度在全国范围内落地了7个产业赋能中心和7个教育创新中心，以及两个数据生态中心，形成了繁荣的良性发展生态。

//16岁高中生：打开文心一言，就像打开新华字典一样

本次AI Day ，我们还邀请到了一位16岁的高中生——陈君航。这位来自福建惠安第三中学的高一学生，从2023年就开始接触文心一言，自那以后，文心一言几乎陪伴了他整个中考备考过程。

初次接触文心一言时，陈君航正为语文作文的修改发愁，于是就把作文和老师点评发给文心一言，让它逐句分析给出修改建议。他说，“我打开文心一言，就像打开新华字典一样频繁。在它的陪伴下，我的写作能力得到很大提升。”

陈君航还借助文心一言从零自学了Python，开发出“智能文案生成器”帮妈妈减轻繁重的教学任务，原本三天的工作，现在只需几小时就可以完成。

当大模型学会像人类一样感知世界，像人类一样思考和行动并自我进化，技术进步便真正转化为普惠的社会红利。正如陈君航所说：“技术真正的魅力不是惊艳谁，而是真正解决一个又一个真实的问题”。

“领证”并不是终点，大模型能力的进一步拓展，对创新应用的探索仍在继续！

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

百度

百度

+关注

关注
9

文章
2338

浏览量
92413
文心一言

文心一言

+关注

关注
0

文章
133

浏览量
1897
大模型

大模型

+关注

关注
2

文章
3191

浏览量
4146

原文标题：今天520，我们领了个证

文章出处：【微信号：baidu_2000，微信公众号：百度】欢迎添加关注！文章转载请注明出处。

搜索历史

百度文心大模型X1 Turbo获得信通院当前大模型最高评级证书

评论