0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基本图像处理技术的数据增强方法介绍

新机器视觉 ? 来源:计算机视觉研究院 ? 作者:Edison_G ? 2022-11-23 11:12 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据增强(DA)是训练先进的AI算法模型的必要技术,不过并不是所有的数据增强都能提升模型精度,在今天的分享中,从数据增强的角度,对于多种增强方式的效果进行了验证测试,希望对大家有帮助!

一、前言&简要

为了缓解上述问题,有研究者提出了一种简单而高效的方法,称为保持增强(KeepAugment),以提高增强图像的保真度。其主要思想是首先使用显著性map来检测原始图像上的重要区域,然后在增强过程中保留这些信息区域。这种信息保护策略使我们能够生成更忠实的训练示例。

在实验上,也证明了该方法在一些现有的技术数据增强方案上有了显著的改进,例如:自动增强、裁剪、随机擦除,在图像分类、半监督图像分类、多视点多摄像机跟踪和目标检测等方面取得了很好的效果。

二、知识回顾

首先我们回一下什么叫“数据增强”?数据增强(Data Augmentation)是一种通过让有限的数据产生更多的等价数据来人工扩展训练数据集的技术。它是克服训练数据不足的有效手段,目前在深度学习的各个领域中应用广泛。但是由于生成的数据与真实数据之间的差异,也不可避免地带来了噪声问题。

为什么需要数据增强?

深度神经网络在许多任务中表现良好,但这些网络通常需要大量数据才能避免过度拟合。遗憾的是,许多场景无法获得大量数据,例如医学图像分析。数据增强技术的存在是为了解决这个问题,这是针对有限数据问题的解决方案。数据增强一套技术,可提高训练数据集的大小和质量,以便您可以使用它们来构建更好的深度学习模型。在计算视觉领域,生成增强图像相对容易。即使引入噪声或裁剪图像的一部分,模型仍可以对图像进行分类,数据增强有一系列简单有效的方法可供选择,有一些机器学习库来进行计算视觉领域的数据增强,比如:imgaug (https://github.com/aleju/imgaug)它封装了很多数据增强算法,给开发者提供了方便。

计算视觉数据增强

计算视觉领域的数据增强算法大致可以分为两类:第一类是基于基本图像处理技术技术的数据增强,第二个类别是基于深度学习的数据增强算法。下面先介绍基于基本图像处理技术的数据增强方法:

1、flipping翻转 一般都是水平方向翻转而少用垂直方向,即镜像变换。图像数据集上证实有用(CIFAR-10,ImageNet等),但无法应用在文本识别数据集(MNIST,SVHN等)

2、color space色彩空间 简单做法是隔离单个色彩通道,例如R,G或B,此外可以通过简单的矩阵运算以增加或减少图像的亮度。更高级的做法从颜色直方图着手,更改这些直方图中的强度值(想到了图像处理中的直方图均衡)。

3、cropping裁剪 分统一裁剪和随机裁剪。统一裁剪将不同尺寸的图像裁剪至设定大小,随机裁剪类似translation,不同之处在于translation保留原图尺寸而裁剪会降低尺寸。裁剪要注意不要丢失重要信息以至于改变图像标签

4、rotation旋转 要注意旋转度数。以MNIST为例,轻微旋转(例如1°-20°)可能有用,再往后增加时数据标签可能不再保留。

5、translation位置变换 向左,向右,向上或向下移动图像可能是非常有用的转换,以避免数据中的位置偏差。例如人脸识别数据集中人脸基本位于图像正中,位置变换可以增强模型泛化能力。

6、noise injection添加噪声 添加高斯分布的随机矩阵 7、color space transformations色彩空间增强 照明偏差是图像识别问题中最常见的挑战之一,因此色彩空间转换(也称为光度转换)的比较直观有效。 ①遍历图像以恒定值减少或增加像素值(过亮或过暗) ②拼接出(splice out)各个RGB颜色矩阵 ③将像素值限制为某个最小值或最大值 ④操作色彩直方图以改变图像色彩空间特征 注意将彩色图转换黑白虽然简化了这些操作,但精度会降低 geometric versus photometric transformations几何与光度转换

1、kernel flters内核过滤器 平滑和锐化,即图像处理中用卷积核滑过整幅图像的操作。这一点尚未开发,它和CNN中卷积机制非常相似(就一样啊),因此可以通过调整网络参数更好地改善网络,而不需要额外进行这样的数据增强操作。

2、mixing images图像混合 做法是通过平均图像像素值将图像混合在一起:

51130fb6-6a45-11ed-8abf-dac502259ad0.jpg

mixing images 研究发现是当混合来自整个训练集的图像而不是仅来自同一类别的实例的图像时,可以获得更好的结果。其它一些做法: ①一种非线性方法将图像组合成新的训练实例:

512a9492-6a45-11ed-8abf-dac502259ad0.jpg

非线性方法 ②另一方法是随机裁剪图像并将裁剪后的图像连接在一起以形成新图像:

514b3274-6a45-11ed-8abf-dac502259ad0.jpg

随机裁剪再拼接 这类方法从人的视角看毫无意义,但确实提升了精度。可能解释是数据集大小的增加导致了诸如线和边之类的低级特征的更可靠表示。 3、random erasing随机擦除 这一点受到dropout正规化的启发,随机擦除迫使模型学习有关图像的更多描述性特征,从而防止过拟合某个特定视觉特征。随机擦除的好处在于可以确保网络关注整个图像,而不只是其中的一部分。最后随机擦除的一个缺点是不一定会保留标签(例如文本8->6)。

516a1504-6a45-11ed-8abf-dac502259ad0.jpg

三、新方法

新方法控制数据增强的保真度,从而减少有害的错误信息。研究者的想法是通过显著性映射测量图像中矩形区域的重要性,并确保数据增强后始终呈现得分最高的区域:对于裁剪,通过避免切割重要区域(见下图a5和b5);对于图像级转换,通过将重要区域粘贴到转换图像顶部(参见下图a6和b6)。

517e008c-6a45-11ed-8abf-dac502259ad0.png

51a5b636-6a45-11ed-8abf-dac502259ad0.png

Eq2:

51b99070-6a45-11ed-8abf-dac502259ad0.png

Eq3:

51ca5f5e-6a45-11ed-8abf-dac502259ad0.png

51d8f6ae-6a45-11ed-8abf-dac502259ad0.png

51ec5e42-6a45-11ed-8abf-dac502259ad0.png

四、实验

521c0688-6a45-11ed-8abf-dac502259ad0.png

522987f4-6a45-11ed-8abf-dac502259ad0.png

523a09bc-6a45-11ed-8abf-dac502259ad0.png

52594250-6a45-11ed-8abf-dac502259ad0.png

526a106c-6a45-11ed-8abf-dac502259ad0.png

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4814

    浏览量

    104492
  • AI
    AI
    +关注

    关注

    88

    文章

    35770

    浏览量

    282568

原文标题:检测&分类训练技巧,不是所有的数据增强,都可以提升算法精度!

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    龙门吊箱号识别系统的图像处理技术解析

    识别系统应运而生,成为提升龙门吊作业自动化水平的重要解决方案。 核心技术图像处理与深度学习的融合 1. 高精度图像采集 系统采用工业级高清摄像机,具备宽动态范围(HDR)和低照度
    的头像 发表于 03-25 10:25 ?385次阅读

    基于嵌入式人工智能的高速图像处理的微处理器RZ/A2M数据手册

    RZ/A2M MPU设计用于需要高速e-AI图像处理的智能电器,网络摄像机,服务机器人,扫描仪产品和工业机械。它采用独特的图像识别和机器视觉混合方法,结合了专有的DRP
    的头像 发表于 03-11 15:54 ?592次阅读
    基于嵌入式人工智能的高速<b class='flag-5'>图像</b><b class='flag-5'>处理</b>的微<b class='flag-5'>处理</b>器RZ/A2M<b class='flag-5'>数据</b>手册

    图像采集卡:现代图像处理技术的关键组件

    在现代科技快速发展的背景下,图像处理技术已成为信息技术领域不可或缺的一部分。图像采集卡,作为连接计算机与各种
    的头像 发表于 02-20 10:42 ?547次阅读
    <b class='flag-5'>图像</b>采集卡:现代<b class='flag-5'>图像</b><b class='flag-5'>处理</b><b class='flag-5'>技术</b>的关键组件

    FPGA上的图像处理算法集成与优化

    本文详细介绍了多种图像处理技术,包括RG/GB单通道提取、亮度和对比度调整、图像反转、均值滤波、高斯滤波、
    的头像 发表于 02-14 13:46 ?796次阅读
    FPGA上的<b class='flag-5'>图像</b><b class='flag-5'>处理</b>算法集成与优化

    DFT在图像处理中的作用 DFT在音频信号处理中的应用

    处理中的几个主要作用: 频域滤波 :DFT允许我们分析图像的频率成分,从而可以设计滤波器来增强或抑制特定频率的信号,例如低通滤波器可以减少图像噪声,而高通滤波器可以
    的头像 发表于 12-20 09:18 ?1384次阅读

    傅立叶变换在图像处理中的作用

    傅里叶变换在图像处理中发挥着至关重要的作用。以下是傅里叶变换在图像处理中的几个主要作用: 一、图像增强
    的头像 发表于 12-06 16:55 ?2471次阅读

    百问FB显示开发图像处理 - BMP图像处理

    2 图像处理 ?前言:所有的图像文件,都是一种二进制格式文件,每一个图像文件,都可以通过解析文件中的每一组二进制数的含义来获得文件中的各种信息,如
    发表于 11-28 13:52

    【每天学点AI】实战图像增强技术在人工智能图像处理中的应用

    图像增强(ImageEnhancement)是人工智能和计算机视觉中一项重要的技术,也是人工智能数据集预处理的一个重要步骤。它旨在提高
    的头像 发表于 11-22 17:14 ?1840次阅读
    【每天学点AI】实战<b class='flag-5'>图像</b><b class='flag-5'>增强</b><b class='flag-5'>技术</b>在人工智能<b class='flag-5'>图像</b><b class='flag-5'>处理</b>中的应用

    傅里叶变换与图像处理技术的区别

    在数字信号处理图像分析领域,傅里叶变换和图像处理技术是两个核心概念。尽管它们在实际应用中常常交织在一起,但它们在本质上有着明显的区别。 傅
    的头像 发表于 11-14 09:30 ?915次阅读

    基于差分卷积神经网络的低照度车牌图像增强网络

    网络,将车牌的纹理信息解耦为水平垂直和对角线两个方向,对不同尺度空间的低照度图像进行纹理增强。为了避免增强结果局部过曝或低曝,该方法使用YCbCr颜色空间的损失函数来优化模型。
    的头像 发表于 11-11 10:29 ?877次阅读
    基于差分卷积神经网络的低照度车牌<b class='flag-5'>图像</b><b class='flag-5'>增强</b>网络

    如何使用base64处理图像数据

    Base64是一种编码方法,可以将二进制数据转换为ASCII字符集的文本格式。这种编码方式常用于在不支持二进制数据的系统之间传输图像数据,例
    的头像 发表于 11-10 10:51 ?1958次阅读

    FPGA在图像处理领域的优势有哪些?

    单元和可编程互联线,可以实现高度并行的数据处理。在图像处理任务中,如图像处理、特征提取和图像
    发表于 10-09 14:36

    盛显科技:投影融合处理器如何实现图像处理和融合?

    相信大家都知道,投影融合处理器实现融合投影功能的过程是一个复杂但高度专业化的技术过程,它主要依赖于先进的投影技术图像融合技术,精妙地结合了
    的头像 发表于 09-26 18:14 ?740次阅读
    盛显科技:投影融合<b class='flag-5'>处理</b>器如何实现<b class='flag-5'>图像</b>的<b class='flag-5'>处理</b>和融合?

    图像采集卡:增强视觉数据采集

    图像采集卡介绍:在视觉数据采集领域,图像采集卡在捕获和处理来自各种来源的图像或视频方面发挥着关键
    的头像 发表于 09-24 11:06 ?749次阅读
    <b class='flag-5'>图像</b>采集卡:<b class='flag-5'>增强</b>视觉<b class='flag-5'>数据</b>采集

    说明增强现实技术的产生原因

    增强现实技术(Augmented Reality, AR)的产生,主要源于人类对信息获取和交互方式的不断追求与探索,以及计算机技术图像处理
    的头像 发表于 09-15 14:44 ?1244次阅读