0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Mamba入局图像复原,达成新SOTA

智能感知与物联网技术研究所 ? 来源:智能感知与物联网技术研 ? 2024-12-30 18:09 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

图像复原又来新突破了!还记得性能超越SwinIR(基于Transformer)的MambaIR吗?一种基于Mamba的图像复原基准模型,登上ECCV 2024。最近原作者又开发了新版本MambaIRv2,更高性能、更高效率!另外还有ACM MM 2024上的Freqmamba方法,在图像去雨任务中取得了SOTA性能!

显然,这种基于Mamba的方法在图像复原领域,比基于CNN和Transformer的方法更受欢迎。得益于Mamba全局感受野、线性计算复杂度、高效远程依赖处理等诸多优势,它在图像复原(比如超分辨率、去噪等)任务上实现了更高的复原质量和更低的计算成本!可以说是图像增强领域的研究焦点。

目前这方向研究热情高涨,顶会成果多,为了帮论文er抓紧机会,我已经挑选好了10篇Mamba做图像复原的高质量论文供大家参考,基本都有代码,想速发论文拿下顶会的别错过啦。

MambaIRv2: Attentive State Space Restoration

方法:论文提出了一种基于Mamba架构的图像复原方法MambaIRv2,通过引入非因果建模能力,类似于ViT,来增强Mamba的图像复原性能。这种方法特别关注解决Mamba在因果建模中的局限性,允许模型在整个图像中更有效地利用像素信息,从而提高图像复原任务的性能,如超分辨率、去噪和JPEG压缩减少等。

e39fbd7c-c5ea-11ef-9310-92fbcf53809c.png

创新点:

提出了“注意力状态空间恢复”的新方法,通过将注意力机制与状态空间模型结合,克服了Mamba架构的因果建模限制。

通过语义引导的邻域重构,作者将相似像素在一维序列中重新排列,使其更加接近。

e3c5df5c-c5ea-11ef-9310-92fbcf53809c.png

Freqmamba: Viewing mamba from a frequency perspective for image deraining

方法:论文提出了一种名为FreqMamba的图像复原方法。FreqMamba结合了Mamba模型和频率分析,专注于图像去雨任务。该方法通过结合频率分析和Mamba的状态空间模型来提高去雨效果,包括空间Mamba、频率带Mamba和傅里叶全局建模三个交互结构,旨在利用Mamba捕捉局部相关性的能力,同时通过频率分析增强对全局退化的感知。

e3ee6314-c5ea-11ef-9310-92fbcf53809c.png

创新点:

FreqMamba 是一种创新性的去雨网络,通过结合空间域序列建模和频率域全局建模,以应对图像去雨的挑战。

引入了一种新颖的三分支结构用于低光图像增强,成功应对照明不足和噪声放大的场景。

频率SSM模块利用多尺度U-Net架构,并结合不同尺度的降解图像生成注意力图,捕获不同尺度的降解分布。

e420b63e-c5ea-11ef-9310-92fbcf53809c.png


Multi-dimensional Visual Prompt Enhanced Image Restoration via Mamba-Transformer Aggregation

方法:论文提出了一个名为MTAIR的方法,通过充分利用Mamba和Transformer的互补优势,在不牺牲计算效率的情况下,处理包括图像去噪、去雨和去雾等多种图像退化问题。MTAIR通过在空间和通道维度上设计多维提示学习模块,来动态调整特征分布并挖掘与特定退化任务相关的上下文信息,从而提高了“全能型”图像复原模型的性能。

e4476ee6-c5ea-11ef-9310-92fbcf53809c.png

创新点:

结合了Mamba和Transformer的优势,通过选择性扫描机制在空间维度进行长距离依赖建模,同时利用Transformer的自注意力机制在通道维度进行判别特征学习。

设计了一种新颖的多维提示学习模块,能够从多尺度层中学习提示流,有助于从空间和通道角度揭示各种退化的底层特征,从而增强"多合一"模型解决各种恢复任务的能力。

e46e8ae4-c5ea-11ef-9310-92fbcf53809c.png

Cu-mamba: Selective state space models with channel learning for image restoration

方法:论文介绍了一个名为CU-Mamba的模型,该模型结合了U-Net架构和双状态空间模型框架,用于图像复原任务。CU-Mamba模型利用空间SSM模块进行全局上下文编码,以及通道SSM组件来保留通道相关特征,两者都具有相对于特征图大小的线性计算复杂度。

e49d9a1e-c5ea-11ef-9310-92fbcf53809c.png

创新点:

提出了一种新型的通道感知U形Mamba模型(CU-Mamba),通过结合U-Net框架与双向选择性状态空间模型(SSM),显著提升了图像复原能力。

在CU-Mamba模型中,作者创新性地在通道维度引入选择性SSM机制,以弥补现有Mamba-based U-Net在捕获通道信息方面的不足。

e4c063f0-c5ea-11ef-9310-92fbcf53809c.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1094

    浏览量

    41500
  • 建模
    +关注

    关注

    1

    文章

    317

    浏览量

    61655

原文标题:超越Transformer!Mamba入局图像复原,达成新SOTA!

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    大疆官宣,将重塑“扫地机器人”行业新格局?

    兴起,以五年研发周期的长期主义姿态,首款扫地机器人ROMO将于8月6日发布,终结了长达五年的市场猜测,这款内部代号“地面空间智能探索者”的产品,承载着大疆从天空到地
    的头像 发表于 08-01 11:53 ?526次阅读
    大疆官宣<b class='flag-5'>入</b><b class='flag-5'>局</b>,将重塑“扫地机器人”行业新格局?

    华为与河北省气象达成战略合作

    近日,河北省气象与华为技术有限公司(以下简称“华为”)签署战略合作协议。河北省气象党组书记、局长薛春芳、河北省气象副局长赵妙文、华为公共事业军团副总裁夏侯宇、华为河北政企业务数字政府业务部总经理刘骏出席本次签约仪式。
    的头像 发表于 07-15 10:46 ?401次阅读

    华为与上海市气象达成战略合作

    上海市气象与华为技术有限公司(以下简称“华为”)签署战略合作框架协议。上海市气象党组书记、局长冯磊、华为上海政企总经理李然见证签约。上海市气象副局长陶立英、华为上海政企副总经理王学林代表双方签约。
    的头像 发表于 07-15 10:41 ?312次阅读

    大鱼半导体安防,直击行业通信“堵点”

    2025年6月25日,在刚刚开幕的深圳国际安防展上,深耕无线通信领域多年的芯片设计公司南京大鱼半导体,正式宣布其首安防市场,并发布了全新的“大鱼安防通讯解决方案”。以其在通信芯片领域的核心技术
    发表于 06-26 11:01 ?1114次阅读
    大鱼半导体<b class='flag-5'>入</b><b class='flag-5'>局</b>安防,直击行业通信“堵点”

    兆威机电eBike千亿市场,高端领域挑战德日三巨头?

    电子发烧友网报道(文/梁浩斌)去年7月,大疆推出DJI Avinox,强势eBike市场,也让eBike这个赛道受到更多的关注。实际上,在过去五年,eBike领域的投资持续加码,相关产品加速
    的头像 发表于 06-25 18:06 ?8754次阅读

    小马智行与迪拜道路交通管理达成战略合作

    近日,小马智行宣布与迪拜道路交通管理(RTA)日前达成战略合作,将在当地落地Robotaxi车队。此次合作标志着小马智行全球化战略布局取得新突破,其自动驾驶解决方案经过中国一线城市复杂场景验证,将在迪拜这一国际都市实现战略延伸和快速落地。
    的头像 发表于 05-27 18:20 ?607次阅读

    商汤科技与上海徐汇区文旅达成合作

    近日,商汤科技与上海徐汇区文旅达成合作,基于商汤最新AI大模型日日新SenseNova V6,打造智慧文旅新技术与应用成果,可为游客提供拟人化的“贴身导游”服务。
    的头像 发表于 04-24 16:23 ?479次阅读

    首个Mamba系列模型量化方案MambaQuant解读

    MambaQuant在Mamba系列模型上实现了W8A8/W4A8量化的方法,精度逼近浮点,超过Quarot等SOTA方法。该工作已被人工智能顶会ICLR-2025接收。
    的头像 发表于 03-05 11:10 ?634次阅读
    首个<b class='flag-5'>Mamba</b>系列模型量化方案MambaQuant解读

    地平线ViG基于视觉Mamba的通用视觉主干网络

    Vision Mamba的成功预示着将视觉表征学习转换为线性复杂度视觉序列表征学习具有巨大的潜力。尽管以Vision Mamba为代表的线性视觉序列表征学习结构在高清图像上展示了显著的效率优势,但在更为常见的分辨率,仍略逊于Tr
    的头像 发表于 01-08 09:33 ?664次阅读
    地平线ViG基于视觉<b class='flag-5'>Mamba</b>的通用视觉主干网络

    港大提出SparX:强化Vision Mamba和Transformer的稀疏跳跃连接机制

    本文分享香港大学计算和数据科学学院俞益洲教授及其研究团队发表于 AAAI 2025 的论文——SparX,一种强化 Vision Mamba 和 Transformer 的稀疏跳跃连接机制,性能强大
    的头像 发表于 01-03 09:28 ?735次阅读
    港大提出SparX:强化Vision <b class='flag-5'>Mamba</b>和Transformer的稀疏跳跃连接机制

    放变频电源哪家做的比较好?

    放变频电源 放量测试小于10PC 功率600KVA 输出电压0-1000V 频率45-300HZ 哪家做的比较好?
    发表于 12-26 16:49

    华为正式人形机器人领域

    11月29日最新消息,华为正式人形机器人领域,有望明年量产。该消息瞬间引爆市场!华为人形机器人,一方面是一个新的科技项目启动与攻关,另一方面,其实又是各项科技成果的一次系统集成
    的头像 发表于 12-03 09:57 ?1409次阅读
    华为正式<b class='flag-5'>入</b><b class='flag-5'>局</b>人形机器人领域

    万年芯解读国产半导体产业年内新增16万家

    的万年芯看来,者激增是好是坏,还有待商榷。OR搅局据报道数据显示,国内现存半导体相关企业91.33万家,近十年相关企业注册量持续稳步增长。2023年注册量首
    的头像 发表于 12-02 17:14 ?592次阅读
    万年芯解读国产半导体产业年内新增16万家<b class='flag-5'>入</b><b class='flag-5'>局</b>者

    关于\"OPA615\"的SOTA的跨导大小的疑问求解

    关于OPA615的SOTA部分,看datasheet的page9的figure22,我们可以知道跨导大小大概是35mA/V左右,并且可以知道其Chold输出一般在5mA以内,但是我从社区里面找到
    发表于 09-13 06:25

    大疆eBike千亿市场,芯片厂商有哪些机遇?

    电子发烧友网报道(文/梁浩斌)今年7月,大疆首次亮相了其用于eBike(电助力自行车)的电助力系统DJI Avinox,正式eBike市场。这也是大疆继户外电源之后,又一次跨界迈入新的领域
    的头像 发表于 08-21 09:02 ?4745次阅读
    大疆<b class='flag-5'>入</b><b class='flag-5'>局</b>eBike千亿市场,芯片厂商有哪些机遇?