0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从思考,到行动:由Manus爆火谈AI Agent

脑极体 ? 来源:脑极体 ? 作者:脑极体 ? 2025-03-14 15:47 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

wKgZPGfT3wKAcaduAAl-V60c7tk676.jpg

2025年3月,一款名为Manus的AI产品在社交媒体上引发热议。它的内测邀请码一码难求,甚至被炒至数万元,同时带动了150多只AI智能体概念股涨停。

Manus的走红,不仅因为它在GAIA基准测试中超越了OpenAI的Operator模型,达到当前技术最佳水准(SOTA),更因为它代表了一种全新的AI形态——AI Agent(人工智能智能体)。

与我们熟悉的ChatGPT等生成式AI不同,AI Agent实现了从“思考”到“行动”的跨越。ChatGPT更像超级大脑,擅长回答问题、生成内容,但仅停留在思考层面。而AI Agent则更进一步,不仅能思考,还能像人类一样行动。它可以通过感知环境、规划任务、调用工具,自主完成从理解问题到解决问题的全过程。

当AI走向AI Agent,人工智能也从单纯的思考者进化为能够自主决策的行动者。

wKgZPGfT3wOAdW2oAAI83lIU-Ko915.jpg

AI Agent并非横空出世的概念,其思想根源可追溯至古希腊哲学家对“自动机”的想象,以及中国古代《道德经》中“道”作为自主演化实体的隐喻。

20世纪50年代,图灵提出“图灵测试”,将“高度智能有机体”的概念引入人工智能领域,奠定了AI Agent的理论基础。

20世纪60年代,马文·明斯基在其研究中首次提出“Agent”一词,将其定义为一种自主运行的计算或认知实体,具备感知环境、推理决策和执行任务的能力。

此后,AI Agent的演进历经了数十年的迭代:从基于规则的专家系统(如IBM深蓝),到依赖机器学习的反应式代理(如Roomba扫地机器人),再到基于深度学习的复杂决策体(如AlphaGo)。

最初,AI主要依赖于符号主义(Symbolic AI),通过预定义的规则和逻辑推理来解决问题。这种方法在解决简单、结构化的问题时表现出色,但面对复杂、动态的环境时显得力不从心。

随后,反应式AI(Reactive AI)应运而生。它能够根据环境的即时反馈做出快速反应,但缺乏长期规划和记忆能力。例如,早期的自动驾驶系统能根据路况实时调整车辆的行驶方向,但无法进行复杂的路径规划。

直到强化学习(Reinforcement Learning, RL)的出现,AI Agent才真正迎来了突破。强化学习通过奖励机制,让智能体在与环境的交互中学习最优策略。这种方法使得AI Agent能够动态地拆解任务、选择工具,并根据反馈调整行动策略。

2022年,大语言模型的兴起赋予了AI Agent理解能力,犹如为它们装上了人类的大脑。大模型不仅使AI Agent具备了强大的语言理解和逻辑推理能力,让其与人类的交互更加自然,还强化了它们的记忆模块。这让AI Agent能够依据历史交互数据优化决策逻辑,进而提供更个性化的服务。

简言之,Agent=大模型(LLM)+记忆模块+规划引擎+工具库。其最大的特征是“自主性”,不仅能回答问题,还能像人类一样拆解任务、选择工具并完成全流程操作。

例如,当用户提出“规划一次日本深度游”时,AI Agent不再只是推荐景点,而是自动调用机票比价API、分析签证政策、预订酒店,并生成完整的行程文档。

这种“端到端”的执行闭环,让AI从“思考的巨人”转变为“行动的巨人”。

wKgZO2fT3wSAJJqZAAIMl04K9S0027.jpg

AI Agent的爆发绝非偶然。To B与To C市场的双重需求,驱动着科技巨头争相布局。

在To B领域,AI Agent作为24h全天候待命的“数字员工”,为企业降本增效提供新解法。例如Salesforce的Agentforce通过智能化和自动化提升了销售、客服和营销效率,三季度AI相关订单量同比增长两倍多。BuffGPT平台,通过多智能体协作与动态任务调度,支持100+智能体协同操作,跨系统API调用成功率高达99.2%,解决了企业数据孤岛的痛点。

如果说企业市场拼的是“效率”,那么消费者市场则在重塑“体验”。荣耀MagicOS的“YOYO智能体”可通过一句话指令完成外卖点单、打车预约;Manus则能根据用户职业背景,自动筛选并优化简历,甚至模拟面试对话。值得注意的是,AI Agent的角色正从冰冷的工具成为具备“共情能力”的伙伴。例如,心理健康管理应用Wysa通过AI Agent技术,能够实时分析用户的文字对话内容与语音语调,识别焦虑或抑郁情绪,准确率达89%,已帮助超500万用户改善心理状态。

wKgZO2fT3wWABdjTAAG1EwLkpOc087.jpg

面对潜在的市场需求,巨头的战略布局围绕三个维度展开:平台化、垂直化与硬件融合。

平台化旨在构建开放的生态系统,吸引开发者与企业入驻,形成技术壁垒与商业闭环。微软将Copilot Studio升级为Agent开发平台,提供1800个模型,吸引超10万家企业的入驻。百度智能云千帆AppBuilder 打造“企业级”AI Agent开发平台,支持从数据管理、模型训练到预测服务部署的全流程服务。北京市市场监管局便通过千帆平台接入DeepSeek大模型,实现7*24小时的数字公务员在线咨询服务。

wKgZPGfT3wWAMhfMAAHtyD6qlcU310.jpg

垂直化聚焦于特定行业或场景,提供深度定制的解决方案。YC合伙人Jared认为,垂直领域AI Agent的市场规模将非常大,可能诞生市值超过3000亿美元的公司。例如,OpenAI推出月费2万美元的博士级Operator服务,瞄准法律、金融等高端专业市场,提供定制服务。

硬件融合结合终端设备与AI技术,锁定用户入口并提升交互体验,构建“端侧Agent”的护城河。Meta的Ray-Ban智能眼镜则集成多模态Agent,可实时翻译菜单文字,支持免提照片和视频拍摄、语音助手控制音乐播放以及 AI 智能提醒。

巨头们的每一步落子,都在试图定义未来规则:平台化构建生态壁垒,垂直化收割高价值场景,硬件融合锁定用户入口。这场竞争没有终点,只有持续的创新与进化,即AI agent的智能化觉醒之路。

wKgZO2fT3waAACN-AAJrPjP7Cmc974.jpg

AI Agent的崛起标志着技术从“+AI”工具化向AI原生助理的转变。

过去的AI更多是作为附加功能嵌入现有流程(即“+AI”),而未来的AI Agent将围绕任务场景重新设计交互逻辑,成为流程的核心(即“AI原生”)。在医疗领域,传统AI可能辅助医生分析影像数据,而AI原生应用则能自主完成从患者问诊、检查推荐到治疗方案生成的完整链路。

多模态能力的深度融合,是另一关键趋势。未来的AI Agent将像人类一样,通过视觉、语言、听觉等多维度感知环境。结合视觉模型的谷歌RT-1能够在复杂厨房场景中识别食材、操作厨具,执行700多项常见任务,准确率高达97%。结合了视觉语言模型的AI Agent从“单一任务执行者”进化为“多场景适应者”,真正具备了“观察环境”的能力。

行业智能体的专业化发展同样不容忽视。金融领域,AI Agent可通过实时分析市场数据,自主执行高频交易;在教育领域,它能够根据学生知识盲点,动态生成个性化习题库。这种垂直化深耕,精准匹配到细分群体的需求,具有更广阔的市场潜力。

当然,尽管前景广阔,AI Agent仍面临多重挑战。

一是技术壁垒,现在的AI agent都是以LLM-based agent为主要实现路径,底层大模型固有的幻觉等问题,可能会在多任务处理过程中进一步放大。同时,其推理时长和任务复杂度对算力需求提出了更高要求,需要云服务、服务器及国产算力产业链的进一步升级。

其次,伦理问题也值得警醒。AI Agent的爆发,本质上是技术、需求与资本共振的结果。它在提升企业运行效率的同时,也深度嵌入了生活场景,引发出一系列潜在的隐忧。比如,自动驾驶汽车在紧急情况下如何做出道德决策,是优先保护乘客还是行人;AI心理咨询师是否可能黑化,像《猎罪图鉴》里的算法程序一样诱导用户自伤自残;潜在的人类偏见是否会深入到未来的AI政务系统里,加剧现有的不平等与歧视。

当AI从“回答问题”走向“解决问题”,从“辅助人类”进化为“自主执行”,一个更深层次的隐忧出水面:AI Agent的拟人化设计可能导致“人的机器化”。

当机器逐渐具备类人行为和决策能力,算法与人类灵魂的边界逐渐模糊,我们是否会在潜移默化中逐渐丧失情感与道德判断力?

这些问题的答案或许正等待我们去书写,而我们每一个人的选择,都将成为这部未来史书的开篇之笔。

wKgZPGfT3weAMmnMAAI53I2EU7M079.jpg

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35505

    浏览量

    281378
  • 人工智能
    +关注

    关注

    1809

    文章

    49163

    浏览量

    250729
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Manus“跑路”风波背后,AI Agent的商业化困局

    Manus深陷“跑路”疑云,AI Agent将何去何从
    的头像 发表于 07-22 14:29 ?1871次阅读
    <b class='flag-5'>Manus</b>“跑路”风波背后,<b class='flag-5'>AI</b> <b class='flag-5'>Agent</b>的商业化困局

    研华工业AI Agent的发展态势及实践思考

    WISE-IoT 产品总监康宁女士,深入剖析工业 AI Agent 的发展态势及实践思考,期待为您揭开产业智能化跃迁的全新篇章。
    的头像 发表于 06-23 09:31 ?419次阅读

    【「零基础开发AI Agent」阅读体验】+读《零基础开发AI Agent》掌握扣子平台开发智能体方法

    收到发烧友网站寄来的《零基础开发AI Agent》这本书已经有好些天了,这段时间有幸拜读了一下全书,掌握了一个开发智能体的方法。 该书充分零基础入手,先阐述了Agent是什么,它的基
    发表于 05-14 19:51

    【「零基础开发AI Agent」阅读体验】+Agent的工作原理及特点

    如何有效地实现目标。它涉及子目标分解、连续思考和自我反思等复杂的过程。 3)行动 行动是指在感知和规划后所做出的具体操作。 在Agent的应用中,主要是通过提示词来完成的,其编写提示词
    发表于 05-11 10:24

    【「零基础开发AI Agent」阅读体验】+ 入门篇学习

    4.智能体具有自主规划和行动的能力 5.大模型分为3个层次:基础层(心脏)、垂直/行业层(动脉)、应用层(毛细血管) 6.AI Agent具备更显著的去中心化特点,能够充分满足每个人独特的需求
    发表于 05-02 09:26

    【「零基础开发AI Agent」阅读体验】+初品Agent

    期待中的《零基础开发AI Agent——手把手教你用扣子做智能体》终于寄到了,该书叶涛、 管锴、张心雨完成,并由电子工业出版社出版发行。 全书分为三个部分,即入门篇、工具篇及实践篇。由此可见这是
    发表于 04-22 11:51

    不要等Manus的邀请码了,树莓派上也能实现 AI Agent

    本文讨论了Manus、OpenManus、CrewAI这三款AIAgent产品的特点、适用场景,并重点介绍了如何用CrewAI在树莓派上运行多LLM代理,还探讨了AIAgent发展带来的思考。关键
    的头像 发表于 03-25 09:19 ?789次阅读
    不要等<b class='flag-5'>Manus</b>的邀请码了,树莓派上也能实现 <b class='flag-5'>AI</b> <b class='flag-5'>Agent</b> !

    人工智能与物联网深度融合重新诠释“万物互联”

    在科技发展的迅猛浪潮中,当大众还沉浸于对Deepseek的热烈探讨时,AI领域又涌现出一颗“新星” —— 通用型自主AI AgentManus”,其热度瞬间席卷各大媒体平台。短短数
    的头像 发表于 03-21 14:28 ?646次阅读

    《零基础开发AI Agent——手把手教你用扣子做智能体》

    Agent开发的核心技能。即使没有编程基础,也能通过本书轻松上手,设计出属于自己的智能体。无论是个人兴趣还是企业应用,这本书都能为我打开AI世界的大门,抓住AI技术的下一个风口,实现从零
    发表于 03-18 12:03

    Manus与阿里通义达成合作

    据媒体报道,火爆异常的AI Agent新秀Manus和阿里云旗下大语言模型通义千问达成合作。双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能;双方将共同推
    的头像 发表于 03-12 15:47 ?912次阅读

    又一个中国AI产品Manus刷屏 中国AI新星Manus 全网抢邀请码

    ManusAI 产品在科技圈一夜,全球首款通用智能体Manus开启内测
    的头像 发表于 03-06 14:09 ?1392次阅读

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发一个视频应用。AI Agent是一种智能应用,能够根据用户需求和环境变化做出相应响应
    发表于 03-05 19:52

    AI Agent应用与项目实战》阅读体验--跟着迪哥学Agent

    的知识是自由行,那么阅读《Agent》就是跟团游。它让我对AI落地应用有了更系统和清晰的了解。 《Agent》第一章是全书的导引章节,本章让我对Agent的理解
    发表于 03-02 12:28

    AI Agent 应用与项目实战》第1-2章阅读心得——理解Agent框架与Coze平台的应用

    过年前申请的活动,这本书我早就在关注了,也是目前市面上少有的专门技术角度结合实战讲解AI Agent 的书籍。我了解本书主编是被戏称为“深度学习——中国分父”的迪哥,就知道这本书写
    发表于 02-19 16:35

    名单公布!【书籍评测活动NO.55】AI Agent应用与项目实战

    和人类对弈围棋的过程中,还可以根据当前的棋局和对手的行动,来自主决定下一步的动作。难怪事后李昌镐感叹:“我是输了,但不等于人类输了。” 几年前简单的AlphaGo如今更具智能性、交互性的产品
    发表于 01-13 11:04