0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达再出AI黑科技,通过生成模型渲染3D环境

张康康 ? 2018-12-21 14:17 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,在蒙特利尔举行的神经信息处理系统大会(NeurIPS)上,英伟达在一篇题为“视频到视频合成(“Video-to-Video Synthesis” )”的技术论文中阐述了其最新AI成果。


据透露,英伟达最新研发的这项成果,是可以渲染合成交互式3D环境的AI技术。在创建逼真的3D环境时,英伟达研发团队不再使用传统的图形技术,而是使用神经网络 ,特别是“生成模型”,通过来自如YouTube等来源的真实视频,进行模型训练,最终构建逼真的3D虚拟世界。

英伟达研发团队之所以使用“生成模型”来提高输出的准确性,是由于这种模型要求机器必须有效地内化数据的本质,它也因此被广泛认为是促进机器“理解”大量数据之间关系的最有前途的方法之一。


但是,像所有神经网络一样,使用这个模型也需要训练数据。幸运的是,英伟达研发团队将AI模型应用于街景,通过自动驾驶项目采集到的大量视频数据,确保了其关于城市街道上行驶车辆的训练镜头,再以分段网络识别不同的对象类别,如地面,树木,汽车,天空,建筑物等,开发算法以了解每个对象与其他对象的关系,最终,这些模型创建了城市环境的基本拓扑结构,然后AI再从基于从训练数据中学到的东西,模拟世界外观,包括照明,材料和动态等,由此生成几乎是还原性的高逼真3D环境。


“由于场景是完全合成生成的,因此可以轻松编辑以删除,修改或添加对象”英伟达表示。

在论文中,英伟达研发团队得出的结论是:“我们提出了一种基于条件生成对抗网络(GAN)的通用视频到视频合成框架:通过精心设计的发生器、鉴别器网络以及时空对抗物镜,我们可以合成高分辨率、照片级真实、时间一致的视频,大量实验表明,我们的结果明显优于最先进方法的结果。”

不得不承认,迄今为止,AI已经是人类最强有力的创新“加速器”,它让人类的能力得以延展,并逐渐变得更加强大。我们都能看到,在全世界范围内,数以万计的科学家们都在为AI技术的前沿突破做出努力,除了英伟达之外,不论是像Google、Facebook这样的海外巨头,还是类似国内旷视科技、极链科技这样的AI科技公司,都致力于全力研发产出能像人一样思考的AI技术。今天,旷视科技已经实现AI识别人脸对象中的各种特征,极链科技已经实现AI理解海量视频的场景表达,而未来,AI必然不仅是会让机器“知其然”,还要做到让它“知其所以然”,以最终实现推动整个AI进入“深度智能”的伟大愿景。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35758

    浏览量

    282461
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    生成AI 重塑自动驾驶仿真:4D 场景生成技术的突破与实践

    生成AI驱动的4D场景技术正解决传统方法效率低、覆盖不足等痛点,如何通过NeRF、3D高斯泼溅等技术实现高保真动态建模?高效
    的头像 发表于 08-06 11:20 ?3490次阅读
    <b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 重塑自动驾驶仿真:4<b class='flag-5'>D</b> 场景<b class='flag-5'>生成</b>技术的突破与实践

    NVIDIA助力影眸科技3D生成工具Rodin升级

    在当今数字化与 AI 飞速发展的时代,3D 生成技术正逐渐成为推动各行业创新的关键力量。影眸科技(上海)有限公司专注于 3D 生成领域的探索
    的头像 发表于 04-27 15:09 ?642次阅读

    IBM携手英伟AI数据平台推动企业级AI创新

    近日,IBM(纽约证券交易所:IBM)宣布与英伟(纳斯达克股票代码:NVDA)开展全新合作,双方将基于英伟 AI 数据平台参考架构(re
    发表于 03-24 19:20 ?274次阅读

    使用海尔曼太通/HellermannTyton 3D CAD 模型进行快速高效的设计

    提供 3D 和 2D CAD 数据,可供免费下载。 直接嵌入三维设计环境模型下载功能 在海尔曼太通官网上点击【产品】选项,工程师现在可以查看和下载众多产品的
    发表于 03-14 16:55

    腾讯混元3D AI创作引擎正式发布

    AI技术,能够根据用户提供的提示词或图片,直接生成高质量的3D模型。这一功能极大地降低了3D内容创作的门槛,使得即使是缺乏专业
    的头像 发表于 01-23 10:33 ?685次阅读

    腾讯混元3D AI创作引擎正式上线

    近日,腾讯公司宣布其自主研发的混元3D AI创作引擎已正式上线。这一创新性的创作工具,标志着腾讯在3D内容生成领域迈出了重要一步。 混元3D
    的头像 发表于 01-22 10:26 ?681次阅读

    英伟发布Cosmos世界基础模型

    近日,在2025年1月6日于拉斯维加斯拉开帷幕的国际消费类电子产品展览会(CES)上,英伟宣布了一项重大创新——Cosmos世界基础模型平台。该平台集成了先进的生成世界基础
    的头像 发表于 01-09 10:23 ?756次阅读

    英伟AI加速器新蓝图:集成硅光子I/O,3D垂直堆叠 DRAM 内存

    加速器设计的愿景。 英伟认为未来整个 AI 加速器复合体将位于大面积先进封装基板之上,采用垂直供电,集成硅光子 I/O 器件,GPU 采用多模块设计,3D 垂直堆叠 DRAM 内存
    的头像 发表于 12-13 11:37 ?771次阅读
    <b class='flag-5'>英伟</b><b class='flag-5'>达</b><b class='flag-5'>AI</b>加速器新蓝图:集成硅光子I/O,<b class='flag-5'>3D</b>垂直堆叠 DRAM 内存

    Google DeepMind发布Genie 2:打造交互式3D虚拟世界

    的交互式体验。 据了解,Genie 2是一个自回归潜在扩散模型,它基于大型视频数据集进行训练。通过自动编码器,视频中的潜在帧被传递到大型Transformer动力学模型中。该模型采用与
    的头像 发表于 12-05 14:16 ?1192次阅读

    鸿海与英伟携手打造下世代AI工厂

    鸿海科技集团与英伟携手合作,共同推进下世代AI工厂的建设。这一合作在去年的鸿海科技日上首次公开亮相,展示了双方在新竹厂房中利用英伟Omn
    的头像 发表于 11-19 16:14 ?770次阅读

    英伟与阿联酋G42合作开发天气预测AI模型

    英伟近期宣布与阿联酋的领先AI应用开发企业G42达成战略合作,共同探索天气预测技术的新前沿。双方将整合各自的技术优势,依托英伟的Eart
    的头像 发表于 09-24 15:41 ?587次阅读

    英伟Blackwell可支持10万亿参数模型AI训练,实时大语言模型推理

    、NVLink交换机、Spectrum以太网交换机和Quantum InfiniBand交换机。 ? 英伟称,Blackwell拥有6项革命性技术,可支持多达10万亿参数的模型进行AI
    的头像 发表于 09-04 09:10 ?3889次阅读

    英伟推出Eagle系列模型

    英伟最新推出的Eagle系列模型,以其1024×1024像素的高分辨率处理能力,重新定义了视觉信息处理的边界。该模型通过多专家视觉编码器架
    的头像 发表于 09-03 16:13 ?884次阅读

    英伟震撼发布:全新AI模型参数规模跃升至80亿量级

    8月23日,英伟宣布,其全新AI模型面世,该模型参数规模高达80亿,具有精度高、计算效益大等优势,适用于GPU加速的数据中心、云及工作站
    的头像 发表于 08-23 16:08 ?1199次阅读

    开源 KiCad/AD 查看器 + AI Copilot?

    目根目录下的封装 3D 模型 使用 gltfpack 压缩模型,以节省带宽及提高渲染效率 集成 Three.js,展示 3D
    发表于 08-18 22:41