0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

智能感知与物联网技术研究所 ? 来源:未知 ? 2023-06-11 21:40 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Tracking Everything Everywhere All at Once.

前段时间,Meta 发布「分割一切(SAM)」AI 模型,可以为任何图像或视频中的任何物体生成 mask,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀起了一阵「二创」狂潮,一些工作陆续在分割的基础上结合目标检测、图像生成等功能,但大部分研究是基于静态图像的。

现在,一项称为「追踪一切」的新研究为动态视频中的运动估计提出了新方法,能够准确、完整地追踪物体的运动轨迹。

该研究由来自康奈尔大学、谷歌研究院和 UC 伯克利的研究者共同完成。他们联合提出了一种完整且全局一致的运动表征 OmniMotion,并提出一种新的测试时(test-time)优化方法,对视频中每个像素进行准确、完整的运动估计。

04c39d40-085d-11ee-962d-dac502259ad0.png

  • 论文地址:https://arxiv.org/abs/2306.05422

  • 项目主页:https://omnimotion.github.io/

有网友在推特上转发了这项研究,仅一天时间就收获了 3500 + 的点赞量,研究内容大受好评。

从该研究发布的 demo 看,运动追踪的效果非常好,例如追踪跳跃袋鼠的运动轨迹:

荡秋千的运动曲线:

还能交互式查看运动追踪情况:

即使物体被遮挡也能追踪运动轨迹,如狗在跑动的过程中被树遮挡:

在计算机视觉领域,常用的运动估计方法有两种:稀疏特征追踪和密集光流。但这两种方法各有缺点,稀疏特征追踪不能建模所有像素的运动;密集光流无法长时间捕获运动轨迹。

该研究提出的 OmniMotion 使用 quasi-3D 规范体积来表征视频,并通过局部空间和规范空间之间的双射(bijection)对每个像素进行追踪。这种表征能够保证全局一致性,即使在物体被遮挡的情况下也能进行运动追踪,并对相机和物体运动的任何组合进行建模。该研究通过实验表明所提方法大大优于现有 SOTA 方法。

方法概述

该研究将帧的集合与成对的噪声运动估计(例如光流场)作为输入,以形成整个视频的完整、全局一致的运动表征。然后,该研究添加了一个优化过程,使其可以用任何帧中的任何像素查询表征,以在整个视频中产生平滑、准确的运动轨迹。值得注意的是,该方法可以识别画面中的点何时被遮挡,甚至可以穿过遮挡追踪点。

OmniMotion 表征

传统的运动估计方法(例如成对光流),当物体被遮挡时会失去对物体的追踪。为了在遮挡的情况下也能提供准确、一致的运动轨迹,该研究提出全局运动表征 OmniMotion。

该研究试图在没有显式动态 3D 重建的情况下准确追踪真实世界的运动。OmniMotion 表征将视频中的场景表示为规范的 3D 体积,通过局部规范双射(local-canonical bijection)映射成每个帧中的局部体积。局部规范双射被参数化为神经网络,并在不分离两者的情况下捕获相机和场景运动。基于此种方法,视频可以被视为来自固定静态相机局部体积的渲染结果。

wKgaomTYgtOAbH4KAAXBMZBqqCE495.png

由于 OmniMotion 没有明确区分相机和场景运动,所以形成的表征不是物理上准确的 3D 场景重建。因此,该研究称其为 quasi-3D 表征。

OmniMotion 保留了投影到每个像素的所有场景点的信息,以及它们的相对深度顺序,这让画面中的点即使暂时被遮挡,也能对其进行追踪。

实验及结果

定量比较

研究者将提出的方法与 TAP-Vid 基准进行比较,结果如表 1 所示。可以看出,在不同的数据集上,他们的方法始终能实现最佳的位置准确性、遮挡准确性和时序一致性。他们的方法可以很好地处理来自 RAFT 和 TAP-Net 的不同的成对对应输入,并且在这两种基准方法上提供了一致的改进。

0d73db26-085d-11ee-962d-dac502259ad0.png

定性比较

如图 3 所示,研究者对他们的方法和基线方法进行了定性比较。新方法在(长时间)遮挡事件中显示出了出色的识别和追踪的能力,同时在遮挡期间为点提供合理的位置,并处理很大的摄像机运动视差。

wKgZomTYgxOAVFZRAAepLTl23yo522.png

消融实验与分析

研究者利用消融实验来验证他们设计决策的有效性,结果如表 2 所示。

0e4b0f56-085d-11ee-962d-dac502259ad0.png

在图 4 中,他们展示了由他们的模型生成的伪深度图,以展示学习到的深度排序。

wKgaomTYgy6APHeiAAcuO0q5oxM428.png

需要注意的是,这些图并不对应于物理深度,然而,它们展示了仅使用光度和光流信号时,新方法能够有效地确定不同表面之间的相对顺序,这对于在遮挡中进行追踪至关重要。更多的消融实验和分析结果可以在补充材料中找到。


原文标题:随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2933

    文章

    46461

    浏览量

    395480

原文标题:随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    用树莓派追踪400公里内的飞机?

    都能掌握它们的详细信息,包括它们之前的飞行轨迹。这一切都要归功于树莓派和FlightAwareProStick。将它们组合在起,你就能创建个PiAware系统
    的头像 发表于 08-08 14:59 ?125次阅读
    用树莓派<b class='flag-5'>追踪</b>400公里内的飞机?

    资产追踪与室内导航

    面展现出巨大潜力。 :资产追踪 资产追踪是指通过技术手段实时监控物理资产的位置、状态和使用情况,帮助企业优化资源利用,减少丢失或闲置。无论是医疗设备、物流货物还是零售库存,资产追踪
    的头像 发表于 07-04 18:22 ?187次阅读

    RFID在物流追踪中的应用

    RFID是种通过无线电波进行数据读写和物体识别的技术。它由标签、读写器和天线组成,能够实现非接触式的数据交互。相比传统的条形码技术,RFID具有更高的效率、更强的抗污染能力和更远的读取距离
    的头像 发表于 04-03 15:03 ?515次阅读
    RFID在物流<b class='flag-5'>追踪</b>中的应用

    个树莓派,是如何同时实现飞机追踪、气象监测、家居控制?

    SwadeWhite设计了款非常酷的ADS-B飞机跟踪器,内置气象站和家庭自动化功能。我们已经看过不少树莓派飞机追踪项目,但这个项目绝对有点额外的东西。在Reddit上,制作者和开发者
    的头像 发表于 03-24 14:51 ?379次阅读
    <b class='flag-5'>一</b>个树莓派,是如何同时实现飞机<b class='flag-5'>追踪</b>、气象监测、家居控制?

    随时随地,轻松测量:在线投影图像测量工具?

    在线投影图像测量仪以其随时随地、轻松测量的特性,在工业生产的多种环境中展现出了强大的应用价值。它不仅为企业提供了精准可靠的测量解决方案,还助力企业提升生产效率、保障产品质量,推动工业生产向智能化、数字化迈进。
    的头像 发表于 03-10 11:29 ?914次阅读
    <b class='flag-5'>随时随地</b>,轻松测量:在线投影图像测量工具?

    智慧园区人员定位及轨迹追踪技术哪个好?

    智慧园区作为城市发展的重要组成部分,其管理和服务效率的提升日益受到重视。人员定位及轨迹追踪技术作为智慧园区建设的核心环节之,对于提高园区安全性、优化资源配置、提升服务体验具有重要意义。然而,传统
    的头像 发表于 01-22 11:18 ?586次阅读
    智慧园区人员定位及轨迹<b class='flag-5'>追踪</b>技术哪个好?

    人员轨迹如何追踪管理?人员定位系统键解决难题

    在快节奏的现代工业生产中,有效追踪与管理人员轨迹是确保生产流程顺畅、提升工作效率与保障员工安全的重要环。然而,在大型工厂环境中,人员轨迹的追踪如何做到呢?其实很多重工业已经用上人员定位系统了,来看
    的头像 发表于 12-10 10:42 ?911次阅读

    本源产品丨指数追踪真机应用

    让量子计算机走出实验室造中国自主可控量子计算机指数通常代表了某市场或行业的整体表现,通过指数追踪,即追踪个股票指数或篮子特定金融投资标
    的头像 发表于 11-12 13:38 ?598次阅读
    本源产品丨指数<b class='flag-5'>追踪</b>真机应用

    《DNK210使用指南 -CanMV版 V1.0》第三十六章 image图像色块追踪实验

    第三十六章 image图像色块追踪实验 在上章节中,介绍了image模块中图像特征检测方法给的使用,本章将继续介绍image模块中图像色块追踪方法的使用。通过本章的学习,读者将学习到image模块
    发表于 11-07 09:30

    基于光线追踪的渲染算法实现

    我们已经涵盖了所有需要说的内容!我们现在准备写我们的第个光线追踪器。你现在应该能够猜到光线追踪算法是如何工作的了。首先,注意到自然界中光的传播只是从光源发出无数条射线,反弹直到它们撞
    的头像 发表于 10-30 08:06 ?680次阅读
    基于光线<b class='flag-5'>追踪</b>的渲染<b class='flag-5'>算法</b>实现

    园区封闭化管理之人员和车辆定位及轨迹追踪

    如今园区封闭化管理的需求越来越普遍,特别是化工类的园区,为了实现对园区内人员和车辆的准确高效管控,人车定位及轨迹追踪技术应运而生。本文将介绍这技术在园区封闭化管理中的重要作用。 、 什么是人车
    的头像 发表于 10-11 11:20 ?923次阅读
    园区封闭化管理之人员和车辆定位及轨迹<b class='flag-5'>追踪</b>

    无线定位器追踪器跟手机怎么连接

    无线定位器追踪器与手机的连接方法主要取决于追踪器的类型和功能。以下是些常见的连接方式: 、蓝牙连接 确保兼容性 :首先,确保你的定位器追踪
    的头像 发表于 09-29 10:01 ?29.3w次阅读

    NVIDIA多摄像头追踪工作流的应用架构

    为提高安全性并优化运营,仓库、工厂、体育场、机场等大型区域通常会有数百个摄像头进行监控。多摄像头追踪指的是通过这些摄像头追踪对象,并精确测量其活动,以此实现对空间的有效监控和管理。
    的头像 发表于 09-06 14:23 ?963次阅读
    NVIDIA多摄像头<b class='flag-5'>追踪</b>工作流的应用架构

    如何远离网络追踪

    分享如何避免被网络追踪。 ? 常见的网络追踪方式 1.IP 地址追踪每个设备在网络上都会匹配唯 IP 地址,通过该?IP 地址可以确定设
    的头像 发表于 09-03 16:57 ?1203次阅读
    如何远离网络<b class='flag-5'>追踪</b>

    IP定位技术追踪网络攻击源的方法

    如今,网络安全受到黑客威胁和病毒攻击越来越频繁,追踪攻击源头对于维护网络安全变得尤为重要。当我们遭受网络攻击时,通过IP地址追踪技术结合各种技术手段和算法,可以逐步还原出攻击者的IP地址路径,随着
    的头像 发表于 08-29 16:14 ?929次阅读