0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

下一代神经网络:NVIDIA Research 在 NeurIPS 大会上发布一系列 AI 技术进步

NVIDIA英伟达 ? 来源:未知 ? 2023-11-03 19:15 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA 研究人员正在与世界各地的学术机构合作,推进生成式 AI机器人和自然科学领域的进步。在全球顶级 AI 会议之一 NeurIPS 上,NVIDIA 将介绍其中的十几个项目。

NeurIPS 大会将于太平洋时间 12 月 10 日至 16 日在新奥尔良举行,汇集了生成式 AI、机器学习计算机视觉等领域的专家。在此次大会上,NVIDIA Research 将展示一系列创新,包括将文本转化为图像、将照片转化为 3D 化身,以及将专用机器人转化为多功能机器的新技术。

NVIDIA 学习和感知研究副总裁 Jan Kautz 表示:“NVIDIA Research 继续推动该领域的进步,包括将文本转化为图像或语音的生成式 AI 模型、更快地学习新任务的自主 AI 代理,以及计算复杂物理学的神经网络。这些项目通常与学术界的领军人物合作完成,将有助于加速虚拟世界、模拟和自主机器的开发。”

转换为图像:

改进文本到图像扩散模型

对于将文本转化为逼真的图像,扩散模型已经成为最流行的生成式 AI 模型。NVIDIA 的研究人员与多所大学合作了多个推进扩散模型发展的项目,并将在 NeurIPS 上进行展示。

  • 一篇口头报告论文重点研究让生成式 AI 模型更好地理解文本提示中修饰词和主体之间的联系。当要求现有文本生成图像模型生成一个黄色西红柿和一个红色柠檬时,其可能会生成错误的黄色柠檬和红色西红柿,但新新模型可以分析用户提示词的语法,鼓励在主体与其修饰符之间建立联系,从而更忠实地对文本提示词进行视觉描述。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/oral/73870

  • SceneScape 是一个使用扩散模型根据文本提示词创建 3D 场景长视频的新框架,其将在会议上以海报的形式进行展示。该项目将文本生成图像模型与深度预测模型相结合,有助于视频中看似合理的场景在连续的几帧中保持不变——生成美术馆、鬼屋和冰雪城堡视频。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/71859

  • 另一个海报描述了如何让文本生成图像模型更好地生成那些通常在训练数据中罕见的概念。尝试生成这样的图像通常会导致低质量的视觉效果,不能完全匹配用户的提示词。新方法使用了一小组示例图像,帮助模型识别好的种子——随机数序列,引导 AI 从指定的稀有类中生成图像。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/70922

  • 第三个海报展示了文本生成图像扩散模型如何使用不完整点云的文本描述来生成缺失部分,并创建物体的完整 3D 模型。这可能有助于完善激光雷达扫描仪和其他深度传感器收集的点云数据,用于机器人和自动驾驶汽车 AI 应用。收集的图像通常是不完整的,因为物体是从特定角度扫描的。例如,当汽车沿街行驶时,安装在车上的激光雷达传感器只会扫描每栋建筑的一侧。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/70648

wKgZomVE12-ATpxBAACS3xtASQw094.jpg

角色开发:AI 化身的进步

AI 化身结合了多个生成式 AI 模型来创建虚拟角色并做成动画、生成文本并将其转化为语音。NeurIPS 大会上的两个 NVIDIA 海报展示了可以提高这些任务效率的新方法。

  • 其中一个海报描述了一种新方法,可以将一张肖像图转化为 3D 头像,同时捕捉发型和配饰等细节。不同于当前需要多张图像并且优化过程需要较长时间的方法,该模型在推理过程中无需额外优化即可实现高保真度的 3D 重建。这些头像可以通过混合形状(blendshapes)做成动画,混合形状是 3D 网格表示,用于表示不同的面部表情。这些头像也可以使用参考视频剪辑做成动画,视频中人的脸部表情和动作会应用于头像。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/72615

  • 另一个海报介绍了 NVIDIA 研究人员和大学合作者使用 P-Flow 模型来开展零样本文本到语音合成。P-Flow 是一种生成式 AI 模型,可以在给出三秒参考提示的情况下快速合成高质量的个性化语音。与近期最先进的同类模型相比,P-Flow具有更好的发音、拟人度和说话者相似度。只需一个 NVIDIA A100 Tensor Core GPU,该模型就能即刻将文本转化为语音。

    了解更多信息,请查阅:https://pflow-demo.github.io/projects/pflow/

强化学习、机器人研究领域的突破

在强化学习和机器人领域,NVIDIA 的研究人员将带来两个海报,着重介绍提高 AI 在不同任务和环境中的通用性的创新技术。

  • 第一个海报提出了一个用于开发强化学习算法的框架,该框架可以适应新任务,同时避免常见的梯度偏差和数据低效陷阱。研究人员表明,他们的方法采用新颖的元算法,可以创建任何元强化学习模型的鲁棒版本——在执行多个基准测试任务时表现优秀。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/72040

  • 另一个海报介绍了 NVIDIA 研究人员和大学合作者解决了机器人进行物体操控的挑战。此前,那些帮助机器人用手拾取物体并与之交互的 AI 模型可以处理特定的形状,但难以处理训练数据中未出现过的物体。研究人员引入一个新的框架,该框架可以估计各类物体在几何上的相似性,例如拥有相似把手的抽屉和锅盖,从而使该模型能够更快地推广到新的形状。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/71709

推动科学飞速发展:

AI 加速物理、气候、医疗

在 NeurIPS 大会上,NVIDIA 研究人员还将发表涉及多个自然科学领域的论文,涵盖物理模拟、气候模型和医疗 AI。

  • 为了加速大规模 3D 模拟的计算流体动力学,NVIDIA 的一个研究团队提出了一种神经算子架构,该架构在估计车辆周围的压力场时实现了高精度和高计算效率。这是行业标准的大规模汽车基准测试中第一个基于深度学习的计算流体动力学方法。与另一个基于 GPU 的求解器相比,该方法在单个 NVIDIA Tensor Core GPU 上实现了 10 万倍的加速,同时降低了错误率。研究人员可以使用开源的神经算子库,将该模型整合到自己的应用程序中。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/72670

wKgZomVE12-Ac8nJAACzkqr2fs0481.jpg

  • 来自大学、国家实验室、研究所、Allen AI 和 NVIDIA 的气候科学家和机器学习研究人员组成了一个联盟,合作开发了大规模数据集 ClimSim,用于物理学和基于机器学习的气候研究。这个数据集将在 NeurIPS 大会上的口头报告中进行分享,其中包含多年高分辨率的全球数据。使用这些数据构建的机器学习模拟器可以集成至目前正在使用的气候模拟器中,以提高其保真度、准确性和精度。这可以帮助科学家更好地预测风暴和其它极端事件。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/73569

  • NVIDIA Research 的实习生制作的一个海报介绍了一种 AI 算法,可以个性化地预测药物剂量对患者的影响。利用真实数据,研究人员测试了该模型对患者接受不同剂量时的凝血情况预测。他们还分析了新算法对接受药物治疗的患者体内抗生素万古霉素浓度的预测。结果发现,与以前的方法相比,新算法的预测准确性显著提高。

    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/71940

NVIDIA Research 由全球数百名科学家和工程师组成,团队专注于 AI、计算机图形学、计算机视觉、自动驾驶汽车、机器人学等领域的研究。点击阅读原文,了解更多信息。

GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。扫描下方海报二维码,关注更多会议及活动信息。

wKgZomVE12-AW_EjAAFtccdApf0439.jpg


原文标题:下一代神经网络:NVIDIA Research 在 NeurIPS 大会上发布一系列 AI 技术进步

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3973

    浏览量

    94366

原文标题:下一代神经网络:NVIDIA Research 在 NeurIPS 大会上发布一系列 AI 技术进步

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    安森美携手英伟达推动下一代AI数据中心发展

    安森美(onsemi,美国纳斯达克股票代号:ON)宣布与英伟达(NVIDIA)合作,共同推动向800V直流(VDC)供电架构转型。这变革性解决方案将推动下一代人工智能(AI)数据中心
    的头像 发表于 08-06 17:27 ?507次阅读

    NVIDIA 采用纳微半导体开发新一代数据中心电源架构 800V HVDC 方案,赋能下一代AI兆瓦级算力需求

    全球 AI 算力基础设施革新迎来关键进展。近日,纳微半导体(Navitas Semiconductor, 纳斯达克代码:NVTS)宣布参与NVIDIA 英伟达(纳斯达克股票代码: NVDA) 下一代
    发表于 05-23 14:59 ?1601次阅读
    <b class='flag-5'>NVIDIA</b> 采用纳微半导体开发新<b class='flag-5'>一代</b>数据中心电源架构 800V HVDC 方案,赋能<b class='flag-5'>下一代</b><b class='flag-5'>AI</b>兆瓦级算力需求

    Google Cloud Next 2025大会亮点回顾

    我们 Next 25 大会上展现了企业采用 AI 的强劲动能,并就已全面集成 AI 技术堆栈的各个层面推出
    的头像 发表于 04-16 11:22 ?1254次阅读

    NVIDIA实现神经网络渲染技术的突破性增强功能

    发者能使用 NVIDIA GeForce RTX GPU 中的 AI Tensor Cores,游戏的图形渲染管线内加速神经网络渲染。
    的头像 发表于 04-07 11:33 ?520次阅读

    汽车行业领军企业即将亮相NVIDIA GTC 2025

    全球 AI 盛会NVIDIA GTC将于 3 月 17 日至 21 日加利福尼亚州圣何塞举行。来自世界各地的 NVIDIA 汽车合作伙伴将在本届
    的头像 发表于 03-13 17:06 ?912次阅读

    罗德与施瓦茨和高通合作加速下一代无线通信发展

    罗德与施瓦茨(以下简称“R&S”)与高通成功验证了13 GHz频段的5G NR连接的高吞吐量性能,该频段属于拟议的FR3频率范围。双方MWC 2025大会上联合展示这里程碑技术成果
    的头像 发表于 03-05 16:26 ?639次阅读

    罗德与施瓦茨与英伟达合作展示基于AI/ML的神经接收器

    罗德与施瓦茨(以下简称“R&S”)与英伟达(NVIDIA)携手合作,AI驱动的无线通信研究领域取得技术突破。双方MWC 2025
    的头像 发表于 03-05 15:56 ?459次阅读

    BP神经网络与卷积神经网络的比较

    BP神经网络与卷积神经网络多个方面存在显著差异,以下是对两者的比较: 、结构特点 BP神经网络 : BP
    的头像 发表于 02-12 15:53 ?825次阅读

    人工神经网络的原理和多种神经网络架构方法

    在上篇文章中,我们介绍了传统机器学习的基础知识和多种算法。本文中,我们会介绍人工神经网络的原理和多种神经网络架构方法,供各位老师选择。 01 人工
    的头像 发表于 01-09 10:24 ?1401次阅读
    人工<b class='flag-5'>神经网络</b>的原理和多种<b class='flag-5'>神经网络</b>架构方法

    卷积神经网络与传统神经网络的比较

    神经网络,也称为全连接神经网络(Fully Connected Neural Networks,FCNs),其特点是每层的每个神经元都与下一
    的头像 发表于 11-15 14:53 ?2041次阅读

    LSTM神经网络与传统RNN的区别

    神经网络(RNN) RNN的基本结构 RNN是种特殊的神经网络,它能够处理序列数据。RNN中,每个时间步的输入都会通过个循环结构传递到
    的头像 发表于 11-13 09:58 ?1336次阅读

    关于卷积神经网络,这些概念你厘清了么~

    随着人工智能(AI)技术的快速发展,AI可以越来越多地支持以前无法实现或者难以实现的应用。本文基于此解释了 卷积神经网络 (CNN)及其对人工智能和机器学习的意义。CNN是
    发表于 10-24 13:56

    IBM发布Granite 3.0 AI模型家族

    IBM近日举行的年度TechXchange大会上,正式推出了其迄今为止最先进的AI模型家族——Granite 3.0。这一系列发布标志着
    的头像 发表于 10-23 17:09 ?824次阅读

    Altera推出一系列FPGA软、硬件和开发工具

    近期,英特尔子公司Altera推出了一系列FPGA软、硬件和开发工具,使其可编程解决方案更易应用于广泛的用例和市场。Altera在年度开发者大会上公布了下一代能效与成本优化的Agilex 3 FPGA情况,并宣布针对Agilex
    的头像 发表于 10-12 10:47 ?1085次阅读

    高阶综合(HLS)推动下一代 AI 加速器的发展

    ,这种智能不仅使这些系统的功能更加完善、使用更为便捷,同时更加安全和可靠。 ? 所有这些智能都来源于深度神经网络进步神经网络的关键挑战之是计算复杂度。小型
    发表于 09-10 17:28 ?9485次阅读
     高阶综合(HLS)推动<b class='flag-5'>下一代</b> <b class='flag-5'>AI</b> 加速器的发展