0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

ml8z_IV_Technol ? 来源:fqj ? 2019-05-05 09:51 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

图像标注速度提升10倍!

这是多伦多大学与英伟达联合公布的一项最新研究:Curve-GCN的应用结果。

Curve-GCN是一种高效交互式图像标注方法,其性能优于Polygon-RNN++。在自动模式下运行时间为29.3ms,在交互模式下运行时间为2.6ms,比Polygon-RNN ++分别快10倍和100倍。

数据标注是人工智能产业的基础,在机器的世界里,图像与语音、视频等一样,是数据的一个种类。

对象实例分割是在图像中概括给定类的所有对象的问题,这一任务在过去几年受到了越来越多的关注,传统标记工具通常需要人工先在图片上点击光标描记物体边缘来进行标记。

然而,手动跟踪对象边界是一个费力的过程,每个对象大概需要30-60秒的时间。

为了缓解这个问题,已经提出了许多交互式图像分割技术,其通过重要因素加速注释。但是交互式分割方法大多是逐像素的(比如DEXTR),在颜色均匀的区域很难控制,所以最坏的情况下仍然需要很多点击。

Polygon-RNN将humans-in-the-loop(人机回圈)过程进行构架,在此过程中模型按顺序预测多边形的顶点。通过纠正错误的顶点,注释器可以在发生错误时进行干预。该模型通过调整校正来继续其预测。 Polygon-RNN显示在人类协议水平上产生注释,每个对象实例只需点击几下。这里最糟糕的情况是多边形顶点的数量,大多数对象的范围最多为30-40个点。

然而,模型的重复性将可扩展性限制为更复杂的形状,导致更难的训练和更长的推理。此外,期望注释器按顺序纠正错误,这在实践中通常是具有挑战性的。

最新研究成果中,研究人员将对象注释框架化为回归问题,其中所有顶点的位置被同时预测。

在Curve-GCN中,注释器会选择一个对象,然后选择多边形或样条轮廓。

Curve-GCN自动地勾勒出对象的轮廓

Curve-GCN允许交互式更正,并且可以自动重新预测多边形/样条

与Polygon-RNN + +相比:

Curve-GCN具有多边形或样条曲线参数

Curve-GCN可同时预测控制点(更快)

初始化预测

人工校正

模型校正

模型是在CityScapes数据集上训练的

自动模式下的比较。从左到右:ground-truth, Polygon-GCN, Spline-GCN, ps - deeplab

跨域自动模式。(上)cityscaps训练模型的开箱即用输出,(下)使用来自新领域的10%的数据进行微调。

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

将Polygon和Spline-GCN与Polygon-RNN ++和PSP-DeepLab进行比较

模型在最先进的基础上进行了改进,速度显著加快,允许只具有局部效果的交互式更正,从而为注释器提供了更多的控制。这将导致更好的整体注释策略。

论文摘要

通过边界跟踪来手动标记对象是一个繁重的过程。在Polygon-RNN ++中,作者提出了Polygon-RNN,它使用CNN-RNN架构以循环方式产生多边形注释,允许通过humans-in-the-loop(人机回圈)的方式进行交互式校正。

我们提出了一个新的框架,通过使用图形卷积网络(GCN)同时预测所有顶点,减轻了Polygon-RNN的时序性。我们的模型是端到端训练的。它支持多边形或样条对对象进行标注,从而提高了基于线和曲线对象的标注效率。结果表明,在自动模式下,Curve-GCN的性能优于现有的所有方法,包括功能强大的PSP-DeepLab,并且在交互模式下,Curve-GCN的效率明显高于Polygon-RNN++。我们的模型在自动模式下运行29.3ms,在交互模式下运行2.6ms,比Polygon-RNN ++分别快10倍和100倍。

多伦多大学&NVIDIA最新成果 图像标注速度提升10倍

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7274

    浏览量

    92564
  • 人工智能
    +关注

    关注

    1810

    文章

    49296

    浏览量

    252445
  • 英伟达
    +关注

    关注

    22

    文章

    3987

    浏览量

    94716

原文标题:多伦多大学&NVIDIA最新成果:图像标注速度提升10倍!

文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    DeepSeek最新论文:训练速度提升9,推理速度快11

    是上一代Grok2的15左右。在Benchmarks中,Grok3毫无悬念成功地领先Deepseek R1、o3 mini等对手。 ? 不过用如此大规模的算力集群,花费上一代15的计算资源投入,业界认为
    的头像 发表于 02-20 11:25 ?2337次阅读
    DeepSeek最新论文:训练<b class='flag-5'>速度</b><b class='flag-5'>提升</b>9<b class='flag-5'>倍</b>,推理<b class='flag-5'>速度</b>快11<b class='flag-5'>倍</b>!

    小语种OCR标注效率提升10+:PaddleOCR+ERNIE 4.5自动标注实战解析

    摘要 :小语种OCR研发的核心瓶颈在于高质量标注数据的稀缺与高昂成本。本文介绍一种创新的自动化标注方案,利用 PaddleOCR 进行文本检测与裁剪,并调用 ERNIE 4.5 大模型进行双重预测
    的头像 发表于 08-29 11:26 ?425次阅读
    小语种OCR<b class='flag-5'>标注</b>效率<b class='flag-5'>提升</b><b class='flag-5'>10</b>+<b class='flag-5'>倍</b>:PaddleOCR+ERNIE 4.5自动<b class='flag-5'>标注</b>实战解析

    自动驾驶数据标注主要是标注什么?

    [首发于智驾最前沿微信公众号]在自动驾驶系统的研发过程中,数据标注是实现高性能感知模型的基础环节,其核心目标是将车辆从环境中采集到的原始感知数据(主要包括图像、点云、视频序列等)转化为具有语义信息
    的头像 发表于 07-30 11:54 ?364次阅读
    自动驾驶数据<b class='flag-5'>标注</b>主要是<b class='flag-5'>标注</b>什么?

    什么是自动驾驶数据标注?如何好做数据标注

    、精准且高效的数据标注流程显得尤为关键。那什么是数据标注?如何做数据标注? 自动驾驶数据标注是指在自动驾驶系统所采集的感知数据(如摄像头图像
    的头像 发表于 07-09 09:19 ?527次阅读
    什么是自动驾驶数据<b class='flag-5'>标注</b>?如何好做数据<b class='flag-5'>标注</b>?

    NVIDIA Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    前将 67 token / 秒 (TPS) 的速度提升至 253 TPS(提速 3.7 ),而目前这一速度已达 368 TPS(提速 5.5
    的头像 发表于 07-02 19:31 ?2506次阅读
    <b class='flag-5'>NVIDIA</b> Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    AI时代 图像标注不要没苦硬吃

    识别算法的性能提升依靠大量的图像标注,传统模式下,需要人工对同类型数据集进行一步步手动拉框,这个过程的痛苦只有做过的人才知道。越多素材的数据集对于算法的提升越有帮助,常规情况下,一个2
    的头像 发表于 05-20 17:54 ?279次阅读
    AI时代   <b class='flag-5'>图像</b><b class='flag-5'>标注</b>不要没苦硬吃

    意法半导体收购多伦多初创公司Deeplite,助力边缘AI技术发展!

    近日,意法半导体(STMicroelectronics,简称ST)宣布已成功收购加拿大多伦多的初创公司Deeplite。这一战略性收购旨在加强意法半导体在边缘人工智能(AI)技术领域的布局,并将
    的头像 发表于 04-28 11:28 ?702次阅读
    意法半导体收购<b class='flag-5'>多伦多</b>初创公司Deeplite,助力边缘AI技术发展!

    大模型预标注和自动化标注在OCR标注场景的应用

    OCR,即光学字符识别,简单来说就是利用光学设备去捕获图像并识别文字,最终将图片中的文字转换为可编辑和可搜索的文本。在数字化时代,OCR(光学字符识别)技术作为处理图像中文字信息的关键手段,其标注
    的头像 发表于 04-15 15:18 ?518次阅读

    开源软件的价值解读 哈佛商学院和多伦多大学联合撰写

    “ ?周末分享一篇关于开源软件价值的论文,由哈佛商学院和多伦多大学联合撰写,量化地阐述了开源软件对经济及企业的影响。? ” 原文在这里,大家有时间可以仔细阅读: https
    的头像 发表于 03-24 11:11 ?496次阅读

    自动化标注技术推动AI数据训练革新

    标贝自动化数据标注平台在全栈数据标注场景式中搭载了大模型预标注和自动化标注能力,并应用于3D点云、2D图像、音频、文本等数据场景的大规模、复
    的头像 发表于 03-14 16:46 ?820次阅读

    NVIDIA技术助力Pantheon Lab数字人实时交互解决方案

    NVIDIA Triton,Pantheon Lab 训练速度提高 10 、推理延迟降低 50%,以及用户参与度提升 30%。这些进步使
    的头像 发表于 01-14 11:19 ?723次阅读

    AI自动图像标注工具SpeedDP将是数据标注行业发展的重要引擎

    AI大浪潮下,许多企业都在不断借助AI来提升自己的行业竞争力,数据标注企业也不例外,传统人工标注效率不足的弊端困扰了多年,如今新的“引擎”就在眼前,他们当然不会放过这个机会。针对这样的需求,慧视光电
    的头像 发表于 01-02 17:53 ?952次阅读
    AI自动<b class='flag-5'>图像</b><b class='flag-5'>标注</b>工具SpeedDP将是数据<b class='flag-5'>标注</b>行业发展的重要引擎

    盘点NVIDIA 2024年的创新成果

    在2024年,AI 的影响力已经扩展到加速计算和数据科学等多个关键领域,成为驱动各行各业技术革新和产业升级的关键因素。在这一年里,NVIDIA 又带来了哪些创新成果,实现了哪些突破?跟随本文一起盘点 NVIDIA 2024 年重
    的头像 发表于 01-02 14:32 ?786次阅读

    标贝数据标注在智能驾驶训练中的落地案例

    标贝科技深耕AI数据服务多年,在无人驾驶、自动驾驶等智能驾驶领域拥有丰富的合作案例。多次采用点云标注以及3D&amp;2D融合等标注方式为智能驾驶领域客户提供环境感知、决策策划、车道线标注
    的头像 发表于 12-24 15:17 ?2000次阅读
    标贝数据<b class='flag-5'>标注</b>在智能驾驶训练中的落地案例

    极端数据采集引领计算机视觉应用新篇章

    多伦多大学的计算成像研究人员用他们独特的相机捕捉到了奇怪的信号。多伦多计算机成像小组在实验室中使用单光子雪崩二极管 (SPAD) 相机检测到无法解释的 80 千赫 (kHz) 闪烁。 他们利用强大
    的头像 发表于 11-18 10:56 ?627次阅读