0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

再看2025大模型风云变幻,深根者立于终局

脑极体 ? 来源:脑极体 ? 作者:脑极体 ? 2025-05-22 23:37 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


wKgZO2gvRMKAUpgyAAlL87pbUhw112.jpg

进入2025年,百模大战的参赛者数量收敛了一个数量级,基模牌桌上已经由200多家淘汰至十几家。尽管如此,基模竞赛仍然未到终局。

从模型能力看,多模态大模型仅达到LLM大语言模型两年前的水平,仍在加速进化中。LLM大语言模型的上限也还有提升空间,年初DS带火的基于长思维链实现慢思考的推理能力,各家都积极探索。

从市场格局看,领先者座次也在动态变化中。中国信通院的调研发现,2024年4月还是OAI处于领先,到年底文心就超过了GPT,国内模型能力在快速上升。

百模大战至今,仍未尘埃落定。说明模型竞赛是一场技术马拉松,靠的不是一时一刻的领先,而是持续不停地奔跑。ChatGPT、文心、DS等现象级产品,本质上都是大模型从高技术领域转入普及型全民应用的一个产品,并不是AI大模型技术体系的全部。

模型的创新之花持续绽放,常开不败,离不开底层AI技术体系的长期积累。而放眼国内,百度的AI底蕴,尤其是它的技术全栈布局确实是有目共睹的。

wKgZPGgvRMOAHkhWAAPnn5XegdI984.jpg

5月20日百度AI Day活动上,百度集团副总裁吴甜也分享了文心大模型最新技术进展。在现场,我们感受到,文心4.5系列在多模态、深度思考、复杂推理、智能体等技术方向上,持续演进。

那么,百度能否战至基模终局?我们深入文心4.5的技术机理,为大家扒开百度的AI根系。

wKgZO2gvRMOANUhoAAIaeSCVLqw069.jpg

当下,基础模型创新已经进入了技术摸高阶段,低处易摘的果实都被摘完了,高处的果实又很难被摘下。比如确定性场景下的幻觉问题,类推理模型的深度思考能力还无法解决现实复杂难题等,都很具挑战性,但又是行业应用大模型时的痛点。

基模还能出现大幅度的升级迭代吗?这时候,文心大模型带来了肯定的答案。近两个月以来,文心大模型的技术创新,在速度和锐度上都很突出:

进化速度快,3月16日百度对外发布了文心4.5和深度思考模型文心X1。1个多月之后,就发布了文心4.5 Turbo和X1 Turbo。硬刚的百度又重回大模型视野中心

wKgZPGgvRMOADcjMAAE6YVuUtgg068.jpg

创新点硬核,具有技术锐利度和识别度,比如文心4.5T/X1 T的最新更新,所采用的技术方法就跟此前和业界主流有较大突破。中国信通院的大模型推理能力评估结果也显示,百度文心X1 Turbo在24项能力评估中,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。

主要在两个领域有较大突破:

一是多模态领域。文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5。文心4.5系列模型实现了文本、图像和视频的混合训练。通过构建针对不同模态的“异构专家”,为每种模态设计专门的处理模块。这些模块能够根据各自模态的特点进行优化,例如图像模块专注于视觉特征提取,文本模块专注于语言理解,而视频模块则结合了时间和空间信息的处理能力。这种设计使得文心4.5 Turbo能够充分照顾到不同模态的特点,文本、图像和视频数据无缝融合,从而实现更高效的多模态学习。

结果就是,文心4.5/4.5T的多模态理解能力有比较大的提升,也让不少相关AI应用如虎添翼。比如OCR翻译,文心4.5 Turbo可以迅速识别单据中的外文并翻译出来;解答理科题目,可以对图像进行更好地理解与分析,明确已知条件和所求问题,再整合工具获取到的信息和自身知识,给出最终答案。

wKgZO2gvRMSAYDHMAAN7yw4IL0M417.jpg

二是推理模型reasoning model的深度思考能力。文心X1升级到X1 Turbo,得益于文心4.5 Turbo多模态大模型的增益,X1 Turbo在深度思考上更进一步,实现了更先进的思维链,可进行多步骤的逻辑推理、工具调用和多模态理解能力。

具体来说,深度思考模型爆火之后,各家都在探索进一步优化。但大多数优化都集中于单步骤,让模型通过单步思考、单步调用工具来解决问题。但全靠人一步步填鸭式教学,教AI怎么做,不仅效率低下,而且模型能力提升有限。因此,需要让模型自主进行多步思考,学会举一反三。

百度在后训练环节,设计了多元统一奖励机制,提升模型对结果质量的判别。有了这种多元评判能力,大模型就可以思考很多步,谋定而后动,最后做出最优行动决策。这种多元奖励机制的强化学习,可以让模型探索出更复杂、多步骤的思维链和行动链,让模型在解决真实的长程、复杂性的任务上会有更好的表现。

最硬核的创新之花,同时出现在多模态和推理领域。这说明,哪怕是在创新难度更大的技术摸高阶段,百度仍稳稳站在第一梯队。

wKgZPGgvRMSAeTxtAAGw6Q_FSKM890.jpg

“百度2019年发布文心1.0,从那时到现在,百度大模型技术发展是一脉相承的”,吴甜说到。

大模型持续演进,为什么技术根脉很重要? AI不是一招鲜,而是需要通盘考量的综合问题。

wKgZO2gvRMSAO7EMAARZm8USO_8563.jpg

在吴甜看来,模型上限仍有提升空间,而打开空间是需要很多前提条件的:

1.数据层面来看,在大模型基础体系中,很多人觉得数据建设就是一些标记、清洗等简单处理工作,但数据建设的许多问题如果解决好了,模型会更高效地学到东西。比如文心4.5 Turbo是多模态模型,所以在多模态数据建设方面,就有许多新的工作,像是多模态的平行数据的构建,让模态和模态之间的知识和信息能够共享。此外,模型融合线上反馈的数据进行挖掘,让模型可以有针对性地改进和提升。

2.知识角度,基于知识点的大规模稀缺数据构建也是这次模型的重要创新点。比如通过百度积累的知识体系,可以检测模型的数据分布上有一些地方是欠缺数据的,是冷门的、没什么人用的知识,再针对性地积累和挖掘。更完备的知识体系,可以为文心大模型提供高质量的训练数据。

3.算法层面,文心4.5 Turbo和X1 Turbo在多模态能力上的表现出色,也与百度多年所积累的算法研发能力相关。除了前面说到的多模态异构专家建模,百度还引入了时空信息编码技术、自适应模态感知损失计算等前沿技术。综合下来,让文心4.5 Turbo在训练过程当中学习效率提高了1.98倍,多模态理解效果也有相应的提升。

而在深度思考方面,百度研制了自反馈增强的技术框架,来优化整个模型训练的过程,让训练的过程更加有效率,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

当前模型算法层面还需要不断创新,去提升大模型性能。百度的AI信仰、技术底蕴与人才厚度,支撑着文心持续演进。

4.基础设施infra。大模型性能提升的同时,成本下降也是至关重要的。基础设施层面的积累,对文心4.5 Turbo/X1 Turbo的研发起到了关键作用。文心4.5 Turbo是一个MoE架构的多模态模型,不同模态差异带来的问题更加凸显,不同模型的损失计算协同通信也是难题。而且模型的训练周期很长,训练过程当中,故障中断的解决、自动的恢复等,对基础设施提出了很高要求。绕到文心大模型背后,会发现是深度学习平台飞桨多年的积累以及不断扎实的整个平台的技术能力,支撑着文心大模型的快速迭代。

上述因素,也只是百度AI根系的冰山一角。百度庞大而复杂的AI根系,以及全栈式的AI布局滋养着文心大模型的创新常在。随着大模型走向技术摸高,百模大战也临近终局,我们越来越强烈地感受到,基模很难靠单一技术热点就能屹立不倒。

一方面,摘下高技术领域的果实,需要多要素的长期投入和跨领域协作。另外,进入技术无人区,当主流技术路线遭遇瓶颈时,拥有完整技术体系的企业可以快速切换路径,或尝试多技术交叉的新路径。

所以,当基模竞争的烈度进一步加剧,在风云变幻的技术浪潮中,根系深厚者才可以穿越周期,持续领跑。

文心能否站到终点?做科技媒体这么多年,一直会有读者问我们,“百度AI说得那么强,怎么总是赶不上热席”。但只要让子弹飞一会儿,等到真的需要跟世界一流掰手腕的时候,百度却从未缺席。这是为什么?百度AI的独特性,被一位高一的小朋友敏锐洞察到了。

来自福建省惠安第三中学的陈君航,在本次开放日上分享了自己使用文心的感受:“技术真正的魅力不是惊艳谁,而是真正解决一个又一个真实的问题。”

wKgZPGgvRMWAdUWsAARiX38kp-w674.jpg

他从2023年开始,用文心一言中考备考,定制学习计划,解析搜题软件中无法解析的原创题目,还用文心一言编程写代码,为妈妈做了一款“智能文案生成器”的软件。

教育、解题、编程,这些都是现实场景中复杂的任务要求,需要AI大模型控制幻觉、严密思考推理,确保可信及可用性。这种与场景更适配的使用感,是靠多种技术体系协同解决,以及工程上的系统性创新才能实现。文心大模型,就是在做这样实用的AI。

可以说,文心大模型一直走的是真实实用的路线,演进方向在思考能力建设上的体现是结构化和专业化。

比如X1的先进思维链与多模态能力,就可以让个人和行业伙伴/企业用户去完成更复杂的任务,基于文心的基模能力,打造代码智能体、直播数字人,可以真正帮助程序员、企业营销人员解决现实难题。

所以,文心大模型,不是看得见摸不着的海市蜃楼,而是可以真正被个人和企业移栽到自身生活工作场景中去的AI绿洲,生长着文心系列的一棵棵巨树,可以被嫁接到真实场景,结合各行各业的独特水土,培育出自己的AI根苗。

wKgZO2gvRMaAMHgQAAKdJUPmW1E115.jpg

进一步让AI在产业落地生根,百度多年来也在生态上做了大量基础工作,帮助行业育苗树人。目前,飞桨和文心整个生态上有开发者2815万,支持的企事业单位有67万,模型已经达到了110万。在这个繁荣的AI生态中,智能中国也蔚然成荫。

进入2025,大众与行业都很关切:百模大战,文心能否站到终点?我们不妨拆解为三个小问题:

根在技术的百度,有世界一流的创新能力与首屈一指的技术团队,能否始终确保文心大模型的先进性?

根在全局的百度,具备快速调整技术路径的战略纵深,在瞬息万变的技术领域,相比押注单一主流技术趋势的模厂,百度是否更具弹性和韧性?

根在现实的百度,拥有自主研发的昆仑芯/计算集群、飞桨框架、文心系列模型、繁荣技术生态,那么走向产业时,文心大模型是否更容易被信任?

临近决赛圈的基模格局正风云变幻,但AI根系深厚扎实的文心,或许才是最无惧风雨的那一个。

wKgZPGgvRMaAfOp0AAH6wSeDm5A972.jpg

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35736

    浏览量

    282342
  • 大模型
    +关注

    关注

    2

    文章

    3229

    浏览量

    4221
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    格灵瞳与您相约WAIC 2025

    7月26-29日,2025世界人工智能大会(WAIC)将在上海世博中心和世博展览馆举行。格灵瞳将在第一现场,联合华为昇腾、百度、飞腾等生态合作伙伴,展示金融全系列整体解决方案、墨刃AIPC、
    的头像 发表于 07-26 16:14 ?669次阅读

    格灵瞳六篇论文入选ICCV 2025

    近日,国际顶级会议ICCV 2025(计算机视觉国际大会)公布论文录用结果,格灵瞳团队共有6篇论文入选。
    的头像 发表于 07-07 18:23 ?679次阅读

    展会邀请 | 倒计时!视智能邀您共赴AMTS 2025上海汽车展(附观展指南)

    01AMTS2025AMTS2025上海国际汽车制造技术与装备及材料展览会将于7月9日-11日在上海新国际博览中心盛大举行。作为工业传感领域技术创新的佼佼视智能已整装待发,将以全新面貌与先进
    的头像 发表于 07-07 08:18 ?522次阅读
    展会邀请 | 倒计时!<b class='flag-5'>深</b>视智能邀您共赴AMTS <b class='flag-5'>2025</b>上海汽车展(附观展指南)

    长安汽车与演智能荣获2025爱分析DeepSeek最佳实践案例

    近日,演智能与长安汽车联合打造的 《长安汽车基于大模型的线索清洗创新运营项目》 荣获 2025爱分析·DeepSeek最佳实践案例奖项。面对汽车市场竞争加剧、线索成本攀升的行业痛点,该项目通过AI技术重构营销全链路,为车企数智
    的头像 发表于 06-28 15:59 ?884次阅读

    中软国际携手开鸿亮相华为开发大会2025

    此前,2025年6月20-22日,华为开发大会(HDC 2025)在东莞隆重召开。华为携手各领域客户及伙伴,全面分享了HarmonyOS、昇腾AI云服务、盘古大模型等最新科技创新成果
    的头像 发表于 06-26 14:28 ?582次阅读

    华为开发大会2025(HDC 2025)亮点:华为云发布盘古大模型5.5 宣布新一代昇腾AI云服务上线

    6月20日,华为开发大会2025(HDC 2025)在东莞篮球中心隆重揭幕。本次大会包含主题演讲、峰会、专题论坛、互动体验以及数百场面向开发的特色活动。华为携手各领域客户及伙伴,全
    的头像 发表于 06-20 20:19 ?2632次阅读
    华为开发<b class='flag-5'>者</b>大会<b class='flag-5'>2025</b>(HDC <b class='flag-5'>2025</b>)亮点:华为云发布盘古大<b class='flag-5'>模型</b>5.5 宣布新一代昇腾AI云服务上线

    半导体制造市场中钢结构承重基座的风云变幻-江苏泊苏系统集成有限公司

    在半导体制造这一前沿领域,每一次细微的技术变革都可能引发行业的巨大震动。其中,钢结构承重基座作为保障设备稳定运行的关键基础,正经历着前所未有的风云变幻,其发展态势深刻影响着整个半导体产业的走向。
    的头像 发表于 05-26 16:27 ?193次阅读
    半导体制造市场中钢结构承重基座的<b class='flag-5'>风云变幻</b>-江苏泊苏系统集成有限公司

    2025年半导体制造设备市场:前景璀璨还是风云变幻

    在科技飞速发展的当下,半导体作为现代电子产业的基石,其重要性不言而喻。而半导体制造设备,更是半导体产业发展的关键驱动力。步入 2025 年,半导体制造设备市场正站在一个充满变数的十字路口,前景究竟是一片璀璨,还是会陷入风云变幻的局面,引发了行业内外的广泛关注。
    的头像 发表于 05-22 15:01 ?714次阅读
    <b class='flag-5'>2025</b>年半导体制造设备市场:前景璀璨还是<b class='flag-5'>风云变幻</b>?

    单片机内置ADC和外部ADC的对比

    ADC 江湖风云变幻,局势不断升级,紧张刺激!究竟是内置 ADC 更胜一筹还是外置 ADC 棋高一着?
    的头像 发表于 05-14 15:24 ?703次阅读

    格灵瞳亮相Create2025百度AI开发大会

    近日,Create2025百度AI开发大会在武汉体育中心圆满落幕,作为全球首个AI开发大会,Create2025百度AI开发大会至今已
    的头像 发表于 04-29 16:12 ?592次阅读

    AIoT芯片设计厂商炬芯科技荣获2025 IC风云榜“年度品牌创新奖”

    2024年12月14日,由半导体投资联盟主办、爱集微承办的“2025半导体投资年会暨IC风云榜颁奖典礼”在上海·上海中心圆满举行。凭借卓越的品牌影响力和持续创新的研发实力,在本届2025半导体投资
    的头像 发表于 12-20 09:20 ?1557次阅读

    软通动力跃居中国PC市场份额第二

    在全球科技市场格局风云变幻之际,国内 PC 市场自 2023 年起历经重大转型,本土厂商强势崛起,竞争态势愈演愈烈。
    的头像 发表于 12-19 15:54 ?855次阅读

    兆芯荣获2025 IC风云榜“年度技术突破奖”

    近日,以“筑基石,向未来”为主题的“2025半导体投资年会暨IC风云榜颁奖典礼”在上海成功举办。作为半导体投资年会的“重头戏”,本届“IC风云榜”奖项/榜单的评选着眼于新时代环境下中国集成电路产业
    的头像 发表于 12-19 09:13 ?958次阅读

    康盈半导体荣获2025 IC风云榜“年度技术突破奖”

    近日,由半导体投资联盟主办、爱集微承办,以“筑基石 向未来”为主题的2025半导体投资年会暨IC风云榜颁奖典礼在上海中心成功举办。本届“IC风云榜”新增12项奖项,共设39项大奖,在大会上隆重发布!旨在鼓励和表彰半导体投资与退出
    的头像 发表于 12-17 14:41 ?728次阅读

    灵动微电子荣获2025 IC风云榜“年度市场突破奖”

    近日,由半导体投资联盟和爱集微联合举办的“2025年半导体投资年会暨IC风云榜颁奖典礼”在上海中心隆重召开。本届“IC风云榜”的评委会由超过100家半导体投资联盟会员单位及500+行业CEO组成。上海灵动微电子股份有限公司荣膺“
    的头像 发表于 12-17 11:17 ?1116次阅读