0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌DeepMind重磅发布Genie 3,首次实现世界模型实时交互

Carol Li ? 来源:电子发烧友网 ? 作者:李弯弯 ? 2025-08-13 08:27 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网综合报道 当地时间2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。这款被英伟达科学家Jim Fan誉为“游戏引擎2.0”的模型,通过单文本提示即可生成实时交互的720p动态世界,将世界模拟技术推向全新高度。

技术突破:实时交互与超真实模拟

Genie3的核心创新在于首次实现了世界模型的实时交互能力。传统生成模型需完整处理输入后输出结果,而Genie3采用流式处理架构,支持每秒24帧的持续生成,用户可实时导航并修改生成环境。这种突破性设计使模型能即时响应用户输入,在动态世界中保持数分钟的环境一致性。

在物理模拟层面,Genie3展现出惊人的真实感。模型可精准呈现水体流动、光影变化等复杂现象,在佛罗里达飓风场景演示中,系统精确模拟了海浪拍打、棕榈树弯曲等细节,连雨衣的褶皱变化都符合物理规律。这种深度模拟能力源于对海量视频数据的无监督学习,模型通过110亿参数构建起对现实世界的深层理解。

视觉记忆技术是Genie3的另一大亮点。系统采用自回归生成机制,每帧生成时需参考此前所有帧信息。当用户一分钟后重返某地,模型能准确还原之前生成的物体状态,建筑物左侧的树木在整个交互过程中始终保持一致。这种"涌现能力"使生成的世界更具沉浸感,远超依赖3D表示的传统方法。

可提示的世界事件功能为模型注入动态灵魂。用户可通过文本指令改变天气、引入新物体,甚至创造反事实场景。在威尼斯汽船演示中,系统不仅重现了运河的逼真倒影,还能根据指令添加贡多拉船和水上出租车,这种灵活性使Genie3超越单纯的环境生成,成为真正的交互式创作平台。

应用革命:从游戏开发到具身智能

在游戏产业,Genie3正引发创作范式的根本变革。传统3D游戏开发需数月构建场景,而Genie3通过单张图片和文本描述即可生成可交互的虚拟世界。在面包房任务演示中,系统为通用智能体SIMA创建了包含工业搅拌机、冷却架的复杂环境,智能体通过发送导航指令即可完成任务学习。这种能力不仅缩短开发周期,更可能催生《我的世界》级别的开放世界游戏革命。

机器人训练领域迎来突破性进展。DeepMind已将Genie3与Gemini Robotics模型结合,为机械臂和双足机器人创建多样化训练场景。在物流分拣测试中,系统生成的动态环境包含随机障碍物和突发状况,使机器人能在接近真实的风险条件下完成策略学习。这种训练方式相比传统方法效率提升300%,且无需实体设备支持。

自动驾驶模拟同样受益匪浅。Genie3可生成包含极端天气的驾驶场景,系统能根据指令随时引入行人、动物等突发因素。在暴雨场景测试中,模型不仅模拟了路面反光和水花飞溅,还能通过世界事件功能制造轮胎打滑等意外状况,为自动驾驶算法提供前所未有的训练数据。
教育领域的应用前景同样广阔。历史教师可通过文本提示重现古罗马斗兽场,学生能在虚拟场景中自由探索;地理课堂可生成实时演变的火山喷发模型,配合可提示的世界事件功能,让学生直观理解地质变化规律。这种沉浸式学习体验,正重新定义教育技术的可能性边界。

尽管Genie3已实现重大突破,仍存在三大技术瓶颈:智能体行动空间受限,复杂多智能体交互模拟不足,地理精度无法完美复现现实世界。DeepMind研究团队透露,下一代模型将重点突破这些限制,计划通过分层强化学习扩展行动维度,引入社会规范约束提升多智能体交互真实度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    商汤大装置重磅发布多项标志性成果

    在2025世界人工智能大会(WAIC 2025)期间,作为“最懂大模型的AI基础设施”,商汤大装置重磅发布多项标志性成果,持续打造AI基础设施发展新范式,力推动产业生态与应用场景的系统
    的头像 发表于 08-05 10:07 ?366次阅读

    广和通发布自研端侧语音识别大模型FiboASR

    7月,全球领先的无线通信模组及AI解决方案提供商广和通,发布其自主研发的语音识别大模型FiboASR。该模型专为端侧设备上面临的面对面实时对话及多人会议场景深度优化,在低延迟语音
    的头像 发表于 08-04 11:43 ?605次阅读

    德赛西威与面壁智能发布端侧大模型语音交互方案

    日前,全球领先的移动出行科技公司德赛西威与端侧大模型技术领军企业面壁智能共同发布业界首个基于高通座舱平台(SA8255P,简称8255)的端侧大模型语音交互方案,这是双方自2024年1
    的头像 发表于 05-14 17:40 ?769次阅读

    软通计算机重磅发布DeepSeek大模型一体机产品

    3月20日,华为中国合作伙伴大会2025在深圳盛大启幕。大会上,软通计算机重磅发布了“DeepSeek大模型一体机产品”,为用户提供一站式的AI应用算力平台,让大
    的头像 发表于 03-22 10:40 ?1074次阅读
    软通计算机<b class='flag-5'>重磅</b><b class='flag-5'>发布</b>DeepSeek大<b class='flag-5'>模型</b>一体机产品

    DeepSeek发表重磅论文!推出NSA技术,让AI模型降本增效

    这是自1月20日DeepSeek发布R1模型震撼AI圈以来,DeepSeek首次发布的技术动态。
    的头像 发表于 02-19 10:22 ?1576次阅读
    DeepSeek发表<b class='flag-5'>重磅</b>论文!推出NSA技术,让AI<b class='flag-5'>模型</b>降本增效

    谷歌加速AI部门整合:AI Studio团队并入DeepMind

    近日,谷歌正紧锣密鼓地推进其人工智能(AI)部门的整合工作。据谷歌AI Studio主管Logan Kilpatrick在领英页面上的透露,谷歌已将AI Studio团队整体转移至DeepMi
    的头像 发表于 01-13 14:40 ?822次阅读

    英伟达发布Cosmos世界基础模型

    近日,在2025年1月6日于拉斯维加斯拉开帷幕的国际消费类电子产品展览会(CES)上,英伟达宣布了一项重大创新——Cosmos世界基础模型平台。该平台集成了先进的生成世界基础模型,旨在
    的头像 发表于 01-09 10:23 ?756次阅读

    望获实时Linux系统与大语言模型深度融合,开创实时智能无限可能!

    控制领域,大语言模型能够显著提升控制系统的智能化水平,确保实时性的同时实现高质量的人机交互,为具身机器人、智能驾驶等对实时性和智能化有强烈需
    的头像 发表于 01-08 13:44 ?787次阅读

    巨人网络发布“千影QianYing”有声游戏生成大模型

    模型YingSound。 YingGame是巨人网络AI Lab与清华大学SATLab携手研发的成果,专为开放世界游戏设计。该模型首次实现
    的头像 发表于 12-13 09:59 ?831次阅读

    谷歌发布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性,旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高级推理和长上
    的头像 发表于 12-12 10:13 ?732次阅读

    Google DeepMind发布Genie 2:打造交互3D虚拟世界

    在OpenAI宣布即将发布模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基础世界模型——
    的头像 发表于 12-05 14:16 ?1192次阅读

    Waymo利用谷歌Gemini大模型,研发端到端自动驾驶系统

    10月31日讯,自动驾驶领域的先锋Waymo,作为Alphabet旗下的一员,长久以来将其与谷歌DeepMind的紧密合作及深厚的AI研究底蕴视为其在自动驾驶竞赛中脱颖而出的关键。如今,Waymo再
    的头像 发表于 10-31 16:55 ?1898次阅读

    谷歌计划12月发布Gemini 2.0模型

    近日,有消息称谷歌计划在12月发布其下一代人工智能模型——Gemini 2.0。这一消息引发了业界的广泛关注,因为谷歌在人工智能领域一直保持着领先地位,而Gemini系列
    的头像 发表于 10-29 11:02 ?1212次阅读

    AI实火!诺贝尔又把化学奖颁给AI大模型

    的蛋白质结构预测大模型——AlphaFold系列。 今年5月9日,谷歌DeepMind重磅发布了AlphaFold-
    的头像 发表于 10-10 10:38 ?472次阅读

    曙光存储实现世界级性能突破

    曙光存储召开了主题为“先进存力,凝聚数据要素”的新品暨品牌发布会,震撼发布全球首个亿级IOPS集中式全闪存储FlashNexus,重磅升级分布式存储ParaStor,同时推出行业首个通存解决方案,应对“强无止境”数据存储性能和成
    的头像 发表于 09-19 15:51 ?699次阅读