0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌发布基础世界模型Genie,世界模型领域竞争升温

CHANBAEK ? 来源:网络整理 ? 2024-02-28 18:20 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

继OpenAI和Meta之后,谷歌也在世界模型领域公布了其最新进展。 近日,谷歌发布了一种新的AI模型Genie,据谷歌官网介绍,Genie是一个基于互联网视频训练的基础世界模型,能够从合成图像、照片、草图等多种来源生成多种动作可控的环境。

随着谷歌的加入,世界模型领域的竞争愈发激烈,但目前尚难以确定谁能引领这一领域的发展风向。此前,Sora作为一款世界模型已引发争议。反对者认为其视频生成方式与世界模型的因果预测存在很大不同。从Sora发布的视频来看,虽然保真度较高,但模拟物理规律似乎是其弱点,且目前难以看出其交互能力。

相比之下,谷歌的Genie在交互性方面下了不少功夫。它能够推断出生成环境中的潜在动作,为用户提供一个可玩的、交互式的虚拟环境。然而,在视频真实性和清晰度的层面,Genie尚未展现出与Sora相当的水平。

总的来说,谷歌的Genie和Sora各自具有不同的优势和挑战。世界模型领域正迎来一场激烈的竞争,未来的发展方向将取决于各大公司在技术创新和市场应用上的表现。我们期待看到这一领域能够涌现出更多创新成果,推动人工智能技术的不断发展和进步。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6233

    浏览量

    108527
  • 模型
    +关注

    关注

    1

    文章

    3543

    浏览量

    50698
  • OpenAI
    +关注

    关注

    9

    文章

    1216

    浏览量

    9061
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    声学世界模型将如何改变我们的生活

    近日,声智科技发表标题为“A Survey on World Models Grounded in Acoustic Physical Information”的声学世界模型综述文章,调研了全球研究
    的头像 发表于 06-27 11:36 ?453次阅读

    自动驾驶中常提的世界模型是个啥?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断成熟,车辆需要在复杂多变的道路环境中安全地行驶,这就要求系统不仅能“看见”周围的世界,还要能“理解”和“推测”未来的变化。世界模型可以被看作一种
    的头像 发表于 06-24 08:53 ?223次阅读
    自动驾驶中常提的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是个啥?

    世界模型:多模态融合+因果推理,解锁AI认知边界

    电子发烧友网综合报道 在人工智能的蓬勃发展进程中,世界模型正崭露头角,成为推动其迈向更高智能水平的关键力量。世界模型作为 AI 系统对外部世界
    的头像 发表于 06-23 04:49 ?2736次阅读

    模型领域常用名词解释(近100个)

    本文总结了大模型领域常用的近100个名词解释,并按照模型架构与基础概念,训练方法与技术,模型优化与压缩,推理与应用,计算与性能优化,数据与标签,模型评估与调试,特征与数据处理,伦理与公
    的头像 发表于 02-19 11:49 ?866次阅读
    大<b class='flag-5'>模型领域</b>常用名词解释(近100个)

    NVIDIA Cosmos世界基础模型平台的主要功能

    随着机器人技术和自动驾驶汽车的发展,加快物理 AI 的开发工作变得至关重要。物理 AI 使自主机器能够感知、理解并执行物理世界中的复杂操作,而这些系统的核心是世界基础模型(WFM)。这种 AI
    的头像 发表于 01-15 11:03 ?1075次阅读
    NVIDIA Cosmos<b class='flag-5'>世界</b>基础<b class='flag-5'>模型</b>平台的主要功能

    英伟达推出基石世界模型Cosmos,解决智驾与机器人具身智能训练数据问题

    CES 2025展会上,英伟达推出了基石世界模型Cosmos,World Foundation Model基石世界模型,简称WFM。 物理 AI
    的头像 发表于 01-14 11:04 ?1413次阅读
    英伟达推出基石<b class='flag-5'>世界</b><b class='flag-5'>模型</b>Cosmos,解决智驾与机器人具身智能训练数据问题

    华为、理想、特斯拉、商汤的世界模型是做什么用的

    最近世界模型(World Model)很火,甚至有人说世界模型是终极自动驾驶解决方案,实际上它只是端到端大模型的一种,和VLM没有本质区别。
    的头像 发表于 01-14 09:27 ?1107次阅读
    华为、理想、特斯拉、商汤的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是做什么用的

    英伟达发布Cosmos世界基础模型

    近日,在2025年1月6日于拉斯维加斯拉开帷幕的国际消费类电子产品展览会(CES)上,英伟达宣布了一项重大创新——Cosmos世界基础模型平台。该平台集成了先进的生成世界基础模型,旨在
    的头像 发表于 01-09 10:23 ?751次阅读

    NVIDIA Cosmos世界基础模型平台发布

    NVIDIA 宣布推出NVIDIA Cosmos,该平台由先进的生成式世界基础模型、高级 tokenizer、护栏和加速视频处理管线组成,将推动自动驾驶汽车(AV)和机器人等物理 AI 系统的发展。
    的头像 发表于 01-08 10:39 ?637次阅读

    【「大模型启示录」阅读体验】营销领域模型的应用

    今天跟随「大模型启示录」这本书,学习在营销领域应用大模型。 大模型通过分析大量的消费者数据,包括购买历史、浏览记录、社交媒体互动等,能够识别消费者的偏好和行为模式。这种分析能力有助于企
    发表于 12-24 12:48

    【「大模型启示录」阅读体验】对大模型更深入的认知

    ,大模型世界远比我想象的要复杂和深刻。 书中不仅详细介绍了大模型的构建过程,还探讨了它们的核心能力和所需的基础设施。我特别喜欢的是,书中用通俗易懂的语言,把大模型的“不可能三角”,即
    发表于 12-20 15:46

    【「大模型启示录」阅读体验】如何在客服领域应用大模型

    在客服领域是大模型落地场景中最多的,也是最容易实现的。本身客服领域的特点就是问答形式,大模型接入难度低。今天跟随《大模型启示录 》这本书,学
    发表于 12-17 16:53

    OpenAI世界最贵大模型:昂贵背后的技术突破

    2023年“双十二”的第一天,OpenAI推出了其最强推理模型o1的满血版及其Pro版本。同时,ChatGPT也推出了每月200美元的Pro订阅计划,这一价格使其一跃成为“世界最贵的大模型”。下面,AI部落小编带您深入了解Ope
    的头像 发表于 12-06 14:46 ?1137次阅读

    Google DeepMind发布Genie 2:打造交互式3D虚拟世界

    在OpenAI宣布即将发布模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基础世界模型——Genie 2。这款
    的头像 发表于 12-05 14:16 ?1179次阅读

    谷歌计划12月发布Gemini 2.0模型

    近日,有消息称谷歌计划在12月发布其下一代人工智能模型——Gemini 2.0。这一消息引发了业界的广泛关注,因为谷歌在人工智能领域一直保持
    的头像 发表于 10-29 11:02 ?1197次阅读