0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于残差精炼的新模块提升图像超分辨性能

nlfO_thejiangme ? 来源:YXQ ? 2019-07-22 16:53 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近年来基于深度学习的单图像超分辨技术得到飞速发展,从SRCNN到VDSR,从DRCN到MSRN深度学习模型,解决了一个又一个超分辨率领域的难题。但目前的研究结果也表明,盲目地使用残差结构和稠密连接将导致模型过分地复用特征,使得网络臃肿膨胀同时难以训练。

为了解决这一问题,来自西安电子科技大学的研究人员基于残差网络提出了一种简单高效的信息提炼方法DRN(distilling with residual network)用于单图像超分辨率技术,利用高效获取信息的残差精炼单元(RDB,residual distilling block)及其堆叠的组操作(RDG, residual distilling group),实现了对于信息更好的抽取和提炼,并平衡了模型的大小与性能,达到了非常好的图像超分辨率效果。

残差精炼模块RDB

为了有效地抽取并提炼低分辨率图像中的信息,研究人员提出了高效的残差精炼单元RDB来对图像进行操作。RDB中包含了两个分支,其中一个分支用于进行基本的残差操作;另一个分支则用于从输入中提炼出有效的信息,在融合信息的同时保持了对于重要特征的抽取能力。

图中显示的残差精炼单元的构造

其中的块状结构为每次操作输出的张量输出

上图显示了RDB模块的基本构成,其中Di表示输入,Di+1表示模块的输出。在模块最开始的位置,输入的Di 通过卷积的作用得到量两个中间输出(1*1,3*3,1*1的卷积),其中Dout,i表示这一层级侧残差输出,而d则表示第i层和第i+1层之间的信息精炼通道。

随后输入Di与残差输出Dout,i相加,并与d相接,构成的整个RDB模块将从中抽取有效的信息辅助超分辨率中高频信息的重建。此外在RDB的最后位置引入了1*1的卷积核用于特征融合。

基于RDB模块,研究人员将RDB堆叠成组操作,并使得RDB模块的输出可以接入下一个RDB模块的每一层,使特征可以进行连续的转换。随后研究人员还在多个堆叠的RDB模块间加入了一条长程的跳接,用于保存先前阶段信息,在有效抽取特征的同时将有助于网络融合局部与全局特征,并得到有利于图像重建的有效特征。

网络架构

在RDB和RDG的基础上,研究人员构建了基于残差网络的精炼模型,其中主要包含三个组成部分:低层级特征抽取LFE,残差精炼组的操作RDGs以及最终进行图像重建的操作。

在这一网络架构中,除了进行底层信息抽取和图像重建的模块外,最重要的就是n个残差精炼的组操作RDGs,其中每个组操作中包含了K个残差精炼模块RDB。整个模型可以表达成下面的式子:

从内到外分别表示了特征提取操作,残差组操作和信息融合以及最后的图像重建。针对每个组操作中的特征抽取模块,可以看作是多个RDB模块操作Fg的融合以及长程跳接的衔接:

整个模型的结构可以理解为多个残差模块的操作堆叠成残差提炼组操作,而多个组操作又结合在一起实现了更有效的特征抽取和残差提炼,最终层层叠加与与融合实现了最后的特征输出。

基于这些特征研究人员利用pixelshuffle的方法进行上采样和图像重建,并选择了MAE作为损失函数进行训练。

最终研究人员在DIV2K上进行了充分地训练,并在Set5,Set14,Urban100,BSDB100,Manga109等基准数据集上进行了测试,分别在2x-3x-4x倍的超方便率尺度上进行了实验。

结果表明,与其他先进的方法相比,DRN系列方法在峰值信噪比和结构相似性等方面均取得了较好的提升。

在使用更少参数的训练下能达到与先前的模型接近甚至更好地结果:

最后来看一下在数据集图像上取得的显著效果,可以看到DRN模型可以更好地克服人工恢复的模糊痕迹,并保留更多的细节信息。

恢复出的文字也较为清晰可辨:

此外对于线条的恢复能力也较强,去除模糊的同时,对于线条细节的恢复较好:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像处理
    +关注

    关注

    27

    文章

    1328

    浏览量

    58275
  • 深度学习
    +关注

    关注

    73

    文章

    5569

    浏览量

    123089

原文标题:拒绝马赛克!基于残差抽取的单图像超分辨率技术

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    HarmonyOS优化应用预置图片资源加载耗时问题性能优化

    考虑在获取更大收益的同时减少其开销造成的影响。因此纹理压缩的性能提升要从收益和开销两部分进行分析: 1.收益 纹理压缩的主要收益是在编译过程中将预置图片转换为纹理格式,能直接被GPU读取进行渲染
    发表于 05-29 16:11

    基于LockAI视觉识别模块:C++使用图像的统计信息

    图像处理中,统计信息可以帮助我们了解图像的特性,例如区域内的像素分布、颜色转换以及特定区域的分析。本文将介绍基于LockAI视觉识别模块如何提取兴趣区域(ROI)、转换颜色通道、计算均值和标准
    的头像 发表于 05-08 10:09 ?303次阅读
    基于LockAI视觉识别<b class='flag-5'>模块</b>:C++使用<b class='flag-5'>图像</b>的统计信息

    Arm精锐超级分辨率技术助力提升游戏性能

    v2.2.2 衍生而来的移动端优化时域类分辨提升技术。Arm ASR 在此基础上进行了多项针对性优化,能够更好地适应资源受限的手游环境。
    的头像 发表于 04-21 13:52 ?566次阅读
    Arm精锐超级<b class='flag-5'>分辨</b>率技术助力<b class='flag-5'>提升</b>游戏<b class='flag-5'>性能</b>

    ?景深3D检测显微镜技术解析

    技术的核心在于其能够实现比传统显微镜更广阔的景深范围,同时保持高分辨率的成像能力,从而为用户提供更为清晰和立体的微观世界视图。 景深3D检测显微镜的实现依赖于先进的光学设计和复杂的图像处理算法。传统
    发表于 02-25 10:51

    xgboost参数调优技巧 xgboost在图像分类中的应用

    一、XGBoost参数调优技巧 XGBoost(eXtreme Gradient Boosting)是一种基于梯度提升决策树(GBDT)的高效梯度提升框架,在机器学习竞赛和实际业务应用中取得了卓越
    的头像 发表于 01-31 15:16 ?1452次阅读

    Mamba入局图像复原,达成新SOTA

    和Transformer的方法更受欢迎。得益于Mamba全局感受野、线性计算复杂度、高效远程依赖处理等诸多优势,它在图像复原(比如分辨率、去噪等)任务
    的头像 发表于 12-30 18:09 ?951次阅读
    Mamba入局<b class='flag-5'>图像</b>复原,达成新SOTA

    新型分辨显微成像技术:突破光学衍射极限

    MLS-SIM应用于清醒小鼠皮层分辨成像 中科院脑科学与智能技术卓越创新中心王凯研究组在《自然·方法》(Nature Methods)上在线发表了题为《Super-resolution
    的头像 发表于 12-19 06:21 ?580次阅读
    新型<b class='flag-5'>超</b><b class='flag-5'>分辨</b>显微成像技术:突破光学衍射极限

    基于图像光谱分辨率的苹果糖度检测

    糖度是衡量苹果品质的关键指标。高光谱成像(由于含有丰富的图谱信息在糖度无损检测中有着广泛的应用前景。光谱分辨率(SSR)可通过建立映射关系从低光谱维度RGB图像获得对应高光谱维度HSI图像
    的头像 发表于 12-09 17:08 ?731次阅读
    基于<b class='flag-5'>图像</b>光谱<b class='flag-5'>超</b><b class='flag-5'>分辨</b>率的苹果糖度检测

    配电网FTU、DTU、FDR用的瞬时压闭锁模块

    瞬时压闭锁模块安装于馈线终端FTU、站所终端DTU、故障搜查控制器FDR内,当终端失去电源停止运行后,开关线路出现瞬时电压或瞬时压时,瞬时压闭锁
    的头像 发表于 11-27 10:16 ?1159次阅读
    配电网FTU、DTU、FDR用的瞬时<b class='flag-5'>残</b>压闭锁<b class='flag-5'>模块</b>

    基于分卷积神经网络的低照度车牌图像增强网络

    车牌识别作为现代化智能交通系统中重要的环节,对提升路网效率以及缓解城市交通压力等问题具有重要的社会意义,然而弱光照车牌图像识别仍然具有重大的挑战。构建了一个基于分卷积神经网络的弱光照车牌图像
    的头像 发表于 11-11 10:29 ?877次阅读
    基于<b class='flag-5'>差</b>分卷积神经网络的低照度车牌<b class='flag-5'>图像</b>增强网络

    性能图像传感器如何选?关键在于这五点

    在当今快速发展的科技领域,图像传感器作为机器视觉和自动驾驶等技术的核心部件,其性能直接关系到系统的效率和准确性。高性能图像传感器的选择不仅需要考虑
    的头像 发表于 10-23 15:05 ?775次阅读

    六类网线是什么样的?如何分辨

    六类网线(Cat6a)作为高性能网络电缆,具有优异的传输性能、广阔的频宽和强大的抗干扰能力。以下是对六类网线的详细描述以及如何分辨它的方
    的头像 发表于 09-29 10:14 ?3545次阅读

    六类非屏蔽模块和屏蔽模块的区别

    六类非屏蔽模块和屏蔽模块在网络通信中各有其独特的特点和应用场景,它们之间的主要区别体现在以下几个方面: 一、抗干扰性能 六类屏蔽
    的头像 发表于 09-09 10:04 ?2005次阅读

    六类非屏蔽模块是什么

    是一种符合高标准网络传输要求的连接模块,它支持更高的数据传输速率和更远的传输距离,适用于现代高速网络环境。与普通的六类非屏蔽模块相比,六类模块
    的头像 发表于 09-09 09:58 ?1290次阅读

    视频分技术是指什么?

    ??分辨率技术(SuperResolution),是通过硬件或软件的方法提高图像或视频帧的分辨率,通过一系列低分辨
    的头像 发表于 09-04 08:05 ?1067次阅读
    视频<b class='flag-5'>超</b>分技术是指什么?