0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用机器学习来实现低延迟移动VR图形的案例

454398 ? 来源:映维网 ? 作者:映维网 ? 2020-12-08 16:42 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Facebook人工智能研究院日前通过博文简述了如何通过集成式机器学习来实现低延迟的移动VR图形。具体来说,团队介绍了一个为VR一体机的渲染管道运行机器学习的全新低延迟高效能框架。这个架构允许所述设备利用机器学习来显著提升图像质量和视频渲染。

研究人员根据这一框架创建了一个示例应用,它能够重建更高分辨率的渲染(称为超分辨率),以最少的计算资源提高移动芯片组的VR图形保真度。这个全新框架同时可以用于执行面向的流式传输内容时的压缩伪影去除,帧预测,特征分析,以及针对引导式注视点渲染的反馈。

1. 工作原理

在典型的移动VR渲染系统中,应用引擎在每个帧的开头检索运动追踪数据,并使用所述信息为每只眼睛生成图像。为了支持VR应用的有效工作,系统通常会严格限制整个图形管道的处理时间。例如为了90Hz的刷新率,两个眼图缓冲区的渲染时间预算为11毫秒。

为了克服所述限制,团队研发的新架构减轻了模型执行的负担,所以专用处理器能够实现异步化。在这种设计中,数字信号处理器(DSP)或神经处理单元(NPU)与图形处理单元(GPU)实现管道化,并获取部分渲染缓冲区或整个渲染缓冲区以进行进一步的处理。系统异步拾取内容,方式是在将其发送到显示器之前GPU为延迟补偿而扭曲线程。

上图说明了如何在图形显示管道中将DSP的机器学习模型执行与其他处理器并行化。

为了提高性能,Facebook修改了操作系统中的图形内存分配系统,将专用分配器用于GPU-DSP共享内存。这比直接映射更为有效,因为图形帧缓冲区通常是优化仅GPU的访问(并且在CPU上的表现不佳),同时需要特殊的内存注册过程来避免在运行时通过远程调用所进行的复制。

团队使用所述示例应用对管道进行了测试,它应用了深度学习来改善中心区域的图像质量,但对场景其他部分使用了更高效,分辨率更低的渲染。超分辨内容在异步时间扭曲中与周围区域混合。如果在每个方向上将分辨率降低大约70%,则可以节省大约40%的GPU时间,并且开发者可以使用节省的资源来生成更优的内容。为了在VR中实现时间连贯且视觉愉悦的结果,Facebook通过专门设计的时间损失函数来训练循环网络。

2. 意义

创建下一代VR和AR体验需要寻找新的、更有效的方法来渲染高质量低延迟图形。由于时间伪影更易感知,VR头显中的低视觉暂留显示器难以接受传统的渲染和超分辨率技术。Facebook人工智能团队提供了利用AI来帮助移动芯片设备应对所述挑战的一种新方法。

他们表示:“除了AR/VR应用外,通过消除内存限制并在图像质量增强,伪影去除和帧外推等方面实现其他创新,我们相信这个新框架可以为移动计算图形领域的创新打开大门。”

编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Ar
    Ar
    +关注

    关注

    25

    文章

    5162

    浏览量

    173387
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    57140
  • 人工智能
    +关注

    关注

    1810

    文章

    49221

    浏览量

    251548
  • 机器学习
    +关注

    关注

    66

    文章

    8513

    浏览量

    135107
  • vr
    vr
    +关注

    关注

    34

    文章

    9680

    浏览量

    153414
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 ?1568次阅读

    延迟至30ms+ LLSM流媒体传输模块延迟方案推荐

    LLSM流媒体传输模块,凭借带宽、延迟的传输特点,一经推出就受到了广泛关注。由于延迟传输跟相机性能以及屏幕刷新率等参数有着密切关系,可
    的头像 发表于 06-04 17:57 ?731次阅读
    <b class='flag-5'>延迟</b><b class='flag-5'>低</b>至30ms+  LLSM流媒体传输模块<b class='flag-5'>低</b><b class='flag-5'>延迟</b>方案推荐

    LLSM——基于RK3588的延迟带宽流媒体传输模块

    随着物联网和人工智能的快速发展,实时视频传输在嵌入式系统中变得越来越重要。无论是智能摄像头、无人机还是工业监控设备,都需要高效、延迟的流媒体传输解决方案。慧视推出的LLSM延迟
    的头像 发表于 04-30 18:36 ?702次阅读
    LLSM——基于RK3588的<b class='flag-5'>低</b><b class='flag-5'>延迟</b><b class='flag-5'>低</b>带宽流媒体传输模块

    **【技术干货】Nordic nRF54系列芯片:传感器数据采集与AI机器学习的完美结合**

    和更多外设接口。无论是运行还是休眠状态,功耗表现都非常出色! 3. 在传感器数据采集与AI机器学习中的优势? 答:主频高、功耗,内置专用核处理数据采集,还配备AI加速器,让AI算法运行更高效! 4.
    发表于 04-01 00:00

    涂鸦运动子系统实现突破性创新!毫米级贴边+高智商清扫重新定义移动机器

    一、移动机器人的核心技术有多难? 在智能化浪潮推动下,可移动智能硬件系统的应用正从服务于家庭的清洁机器人,逐步扩展至工/商业服务领域。而要想实现这类系统在精细场景下的灵活应用,核心技术
    的头像 发表于 03-07 19:01 ?260次阅读

    英伟达带来Reflex 2延迟技术

    ,Reflex 1 主要通过简化 CPU 渲染队列降低延迟,而 Reflex 2 则实现了更直接的信息对接,大大提升了效率。 不过,根据英
    的头像 发表于 02-05 15:15 ?1160次阅读

    机器人如何实现移动功能

    在前面两篇《如何制造足球机器人》文章中,我们主要围绕机器人本体进行了硬件设计,而这次将以控制器为中心,开展软件设计工作。在正式开始之前,先为大家回顾一下机器人如何实现
    的头像 发表于 01-23 10:36 ?968次阅读
    <b class='flag-5'>机器</b>人如何<b class='flag-5'>实现</b><b class='flag-5'>移动</b>功能

    DisplayPort支持的VR设备兼容性

    虚拟现实(VR)技术以其沉浸式体验和互动性,正在逐渐改变我们与数字世界的互动方式。为了实现高质量的VR体验,需要高速、延迟的显示接口
    的头像 发表于 12-28 09:14 ?1050次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能
    的头像 发表于 11-16 01:07 ?1072次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习
    的头像 发表于 11-15 09:19 ?1426次阅读

    pcie在深度学习中的应用

    深度学习模型通常需要大量的数据和强大的计算能力训练。传统的CPU计算资源有限,难以满足深度学习的需求。因此,GPU(图形处理单元)和TPU(张量处理单元)等专用硬件应运而生,它们通过
    的头像 发表于 11-13 10:39 ?1501次阅读

    GPU与VR技术结合应用

    同时处理大量数据,从而实现高速的图形渲染。 VR技术的基本概念 虚拟现实(VR)技术是一种通过计算机生成的三维环境,让用户能够沉浸在虚拟世界中的技术。
    的头像 发表于 10-27 11:23 ?1033次阅读

    交互式延迟音频解码器

    普通音频解码器在处理音频时可能会引入较高的延迟,通常适合于音乐播放或录音等场景。而交互式延迟音频解码器则专为实时应用设计,延迟通常在10毫秒以内。这种快速响应对于游戏、在线会议和直播
    的头像 发表于 09-28 11:15 ?622次阅读
    交互式<b class='flag-5'>低</b><b class='flag-5'>延迟</b>音频解码器

    AI引擎机器学习阵列指南

    云端动态工作负载以及超高带宽网络,同时还可提供高级安全性功能。AI 和数据科学家以及软硬件开发者均可充分利用高计算密度的优势加速提升任何应用的性能。AI 引擎机器学习拥有先进的张量计
    的头像 发表于 09-18 09:16 ?910次阅读
    AI引擎<b class='flag-5'>机器</b><b class='flag-5'>学习</b>阵列指南

    基于机器学习的IWR6843AOP跌倒和姿态检测实现

    电子发烧友网站提供《基于机器学习的IWR6843AOP跌倒和姿态检测实现.pdf》资料免费下载
    发表于 09-03 10:02 ?3次下载
    基于<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的IWR6843AOP跌倒和姿态检测<b class='flag-5'>实现</b>