0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微美全息(NASDAQ:WIMI)探索全局-局部特征自适应融合网络框架在图像场景分类中的创新运用

科技讯息 ? 来源:科技讯息 ? 作者:科技讯息 ? 2024-01-05 16:08 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着计算机视觉技术的不断发展以及数字图像规模的爆炸式增长,图像场景分类已成为许多领域的关键任务,已经得到了广泛的研究和应用。图像场景分类旨在识别和理解图像中的场景类型,在实际应用中,图像场景分类仍然面临着许多挑战,如复杂的场景等。然而,现有的图像场景分类方法往往只关注全局或局部特征的提取,而忽略了全局和局部特征之间的互补关联。为了解决这些问题,微美全息(NASDAQ:WIMI)不断探索新的网络架构和算法,正在将全局-局部特征自适应融合(Global-local feature adaptive fusion,“GLFAF”)网络框架运用于图像场景分类的实践中,以进一步提高图像场景分类的准确性。

全局-局部特征自适应融合(GLFAF)网络框架采用设计的CNN来提取多尺度和多层次的图像特征。通过利用这些多尺度和多层次特征的互补优势,该框架还设计了全局特征聚合模块,以发现全局注意力特征,并进一步学习这些全局特征之间的空间尺度变化的多重深度依赖关系。同时,该框架还设计了局部特征聚合模块,用于聚合多尺度和多层次的特征。基于通道注意力融合同一尺度的多级特征,然后基于通道依赖聚合不同尺度的空间融合特征。此外,空间上下文注意力旨在跨尺度细化空间特征,不同的Fisher向量层旨在学习空间特征之间的语义聚合。另外,还引入了两个不同的特征自适应融合模块,以探索全局和局部聚合特征的互补关联,从而获得全面和差异化的图像场景呈现。

据悉,WIMI微美全息试图将全局-局部特征自适应融合 (GLFAF) 网络框架运用在图像场景分类的实践中,不仅提高了分类的准确性,还增强了特征提取的鲁棒性。通过全局特征聚合模块,网络能够捕捉到图像的全局特征,理解图像的整体结构和内容。而局部特征聚合模块则关注于图像的细节信息,能够提取出图像中的关键特征和细节信息。通过融合全局和局部特征,充分利用它们之间的互补关联,从而更全面、更准确地理解图像场景。同时,这种融合方式也能够更好地应对图像中的噪声和干扰。通过全局特征和局部特征的自适应融合,能够充分利用图像的上下文信息,提高场景分类的准确性和鲁棒性。同时,该网络也具有较好的通用性和可扩展性,可以应用于不同的场景分类任务。进一步提高了其在实际应用中的灵活性。

wKgaomWXuQWAPBs3AAE0XpPK3HQ090.jpg

全局-局部特征自适应融合 (GLFAF) 网络框架在图像场景分类的运用为计算机视觉领域的研究提供了一种新的思路和方法。此外,这种网络框架还具有很好的可扩展性。通过简单地调整网络结构,可以适应不同的图像场景分类任务,提高其在实际应用中的灵活性。同时,这种网络框架的设计思路也可以应用于其他计算机视觉任务,如目标检测、图像分割等,为这些任务提供更全面、更准确的特征表示。

在未来的研究中,WIMI微美全息将不断完善和优化网络结构,提高算法的性能和鲁棒性。此外,WIMI微美全息还将致力于将全局-局部特征自适应融合网络框架应用于其他更多的实际场景中,如智能交通、安防监控、医疗诊断等,为相关领域的发展和应用提供有力的支持。


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7689

    浏览量

    91210
  • 计算机视觉
    +关注

    关注

    9

    文章

    1711

    浏览量

    46958
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    配电房自适应滤波声纹传感器

    文章由山东华科信息技术有限公司提供在电力配送网络的核心节点——配电房,设备运行状态监测一直是保障电网安全的关键环节。自适应滤波声纹传感器通过融合数字信号处理与人工智能技术,为配电设备
    的头像 发表于 08-08 09:36 ?195次阅读
    配电房<b class='flag-5'>自适应</b>滤波声纹传感器

    具备光照鲁棒和自适应特征剔除的VSLAM前端框架

    现有的基于特征的VSLAM系统依赖于固定的前端参数,这使得它们在面对光照突变时显得十分脆弱,且特征跟踪也不稳定。为应对这些挑战,我们提出了“IRAF-SLAM”,这是一种具备光照鲁棒性且能自适应
    的头像 发表于 07-30 10:38 ?193次阅读
    具备光照鲁棒和<b class='flag-5'>自适应</b><b class='flag-5'>特征</b>剔除的VSLAM前端<b class='flag-5'>框架</b>

    基于模糊自适应PID控制的永磁同步电机伺服系统研究

    在对模糊控制的基本理论和PD控制的功能进行分析的基础上,对永礁同步电机进行数学建模,通过d-q变换和park变换,得到永磁同步电机数学模型的传递画数,在此基础上,运用模糊控制理论,采用模糊自适应PD
    发表于 07-29 16:16

    CYW43907使用AP功能时是否具有自适应功能?

    我们想在我们的产品中使用这种芯片来获得 CE 注册证书,CE 需要自适应功能,但是我们在数据表和源包找不到任何消息。functions 要执行如下: 启动时自动扫描并选择干扰较小的频道,遇到干扰
    发表于 07-09 08:21

    无模型自适应控制在永磁同步电机转速的仿真研究

    的可行性和有效性。 纯分享帖,点击下方附件免费获取完整资料~~~ *附件:无模型自适应控制在永磁同步电机转速的仿真研究.pdf 【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时
    发表于 06-25 13:01

    基于事件相机的统一帧插值与自适应去模糊框架(REFID)

    )的解决方案。团队提出了一种基于事件相机的统一帧插值与自适应去模糊框架(REFID)。该框架基于双向递归网络,结合事件流和图像信息,
    的头像 发表于 03-14 11:48 ?939次阅读
    基于事件相机的统一帧插值与<b class='flag-5'>自适应</b>去模糊<b class='flag-5'>框架</b>(REFID)

    GLAD应用:大气像差与自适应光学

    概述 激光在大气湍流传输时会拾取大气湍流导致的相位畸变,特别是在长距离传输的激光通信系统。这种畸变会使传输激光的波前劣化。通过在系统引入自适应光学系统,可以对激光传输时拾取的低频
    发表于 03-10 08:55

    六足仿生机器人地形自适应步态规划研究

    本研究针对六足机器人在复杂地形环境下的运动适应性问题,提出了一种融合多模态感知与动态优化的地形自适应步态规划方法。首先建立基于改进DH参数的机器人运动学模型,并通过三维点云特征提取构建
    的头像 发表于 03-07 16:56 ?1263次阅读

    探索 RK3576 方案:卓越性能与灵活框架,诚邀开发定制合作!

    地扩展了应用的功能范围。同时,它支持大模型运行和多模态检索功能,能够处理复杂的监控数据和场景信息,为开发者实现各种创新应用提供了有力支持1。我司 RK3576 主板 使用案例:人脸识别图像
    发表于 02-05 15:21

    xgboost在图像分类的应用

    和易用性,在各种机器学习任务得到了广泛应用,包括分类、回归和排序问题。在图像分类领域,尽管深度学习模型(如卷积神经网络CNN)占据主导地位
    的头像 发表于 01-19 11:16 ?1142次阅读

    基于自适应优化的高速交叉矩阵设计

    提出了一种基于自适应优化的交叉矩阵传输设计,采用AHB协议并引入自适应突发传输调整和自适应优先级调整的创新机制。通过动态调整突发传输的长度和优先级分配,实现了对数据流的有效管理,提升了
    的头像 发表于 01-18 10:24 ?473次阅读

    洽荣登2024国生成式AI 创新企业系列榜单-智能客服创新企业榜

    近日,由第一新声联合天眼查发起的“2024国生成式AI创新企业系列榜单”正式发布,洽凭借在智能客服领域AI创新应用能力与落地场景案例荣登
    的头像 发表于 12-31 15:12 ?661次阅读
    <b class='flag-5'>美</b>洽荣登2024<b class='flag-5'>中</b>国生成式AI <b class='flag-5'>创新</b>企业系列榜单-智能客服<b class='flag-5'>创新</b>企业榜

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    的规律,从而降低了模型在新数据上的泛化能力。 对抗攻击易感性:图像分类模型容易受到精心设计的对抗样本的影响,这些样本在人类看来几乎与原始图像相同,但却会导致模型做出错误的分类。 背景干
    发表于 12-19 14:33

    SSM框架在Java开发的应用 如何使用SSM进行web开发

    。以下是对SSM框架在Java开发的应用,以及如何使用SSM进行web开发的介绍: SSM框架的组件及其作用 Spring :Spring是一个开源的Java/Java EE全功能栈
    的头像 发表于 12-16 17:28 ?1761次阅读

    使用语义线索增强局部特征匹配

    视觉匹配是关键计算机视觉任务的关键步骤,包括摄像机定位、图像配准和运动结构。目前最有效的匹配关键点的技术包括使用经过学习的稀疏或密集匹配器,这需要成对的图像。这些神经网络对两幅
    的头像 发表于 10-28 09:57 ?959次阅读
    使用语义线索增强<b class='flag-5'>局部</b><b class='flag-5'>特征</b>匹配