0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员最近开发了一种新的CNN,用于识别视频中的人类行为

倩倩 ? 来源:百度粉丝网 ? 2020-09-10 13:48 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

诸如卷积神经网络(CNN)之类的深度学习算法已在各种任务上取得了显著成果,包括那些涉及识别图像中特定人物或物体的任务。基于视觉的人类动作识别(HAR)是计算机科学家经常尝试使用深度学习解决的任务,它特别需要识别图像或视频中捕获的人类动作。

HITEC大学和巴基斯坦伊斯兰堡基础大学,韩国世宗大学和中正大学,英国莱斯特大学和沙特阿拉伯苏丹王子大学的研究人员最近开发了一种新的CNN,用于识别视频中的人类行为。该CNN在Springer Link的“多媒体工具和应用程序”期刊上发表的一篇论文中进行了介绍,经过培训可以区分几种不同的人类动作,包括拳击,拍手,挥舞,慢跑,跑步和散步。

研究人员在论文中写道:“我们设计了一种新的26层卷积神经网络(CNN)架构,用于精确的复杂动作识别。” “这些特征是从全局平均池化层和完全连接(FC)层中提取的,并通过建议的基于高熵的方法进行融合。”

当试图识别人类在图像或视频中的动作时,CNN通常会将其分析重点放在许多潜在的相关特征上。但是,某些人类动作(例如慢跑和步行)可能非常相似,这使得这些算法很难区分它们,特别是如果它们专注于相似性核心的特征时。为了克服这一挑战,研究人员使用了一种方法,该方法将称为Poisson分布的特征选择方法与单变量测量(PDaUM)合并在一起。

研究人员观察到,CNN所基于的分析功能有时可能不相关或多余,这导致它们做出错误的预测。为了降低发生这种情况的风险,他们的PDaUM方法仅选择最强大的功能来识别特定的人类行为,并确保CNN基于这些功能做出最终预测。

研究人员在HMDB51,UFC Sports,KH和Weizmann数据集这四个数据集上训练和评估了两个截然不同的CNN,一个极端机器学习(EML)和一个Softmax分类器。这些数据集包含几个人类执行不同类型动作的视频。

然后,研究人员比较了两个CNN的性能,这两个CNN均使用其特征选择方法进行了增强。在他们的评估中,ELM分类器的性能明显优于Softmax算法,可以从视频中识别出人类动作,其在HMDB51数据集上的准确性为81.4%,在UCF Sports数据集上的准确性为99.2%,在KTH数据集上的准确性为98.3%,在KTH数据集上的准确性为98.7%。魏茨曼数据集。

值得注意的是,PDaUM增强的ELM分类器在准确性和预测时间方面也优于研究人员将其与之相比的所有现有深度学习技术。因此,这些结果凸显了研究人员介绍的特征选择方法在提高CNN在HAR任务上的性能方面的潜力。

将来,本文介绍的ELM分类器和PDaUM方法可以开发更有效的工具,以自动区分人类在录制和实况录像中正在做什么。这些工具可以通过几种不同的方式证明其价值,例如,帮助执法人员监视CCTV视频上嫌疑犯的行为,或者允许研究人员快速分析大量视频。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4814

    浏览量

    104099
  • 深度学习
    +关注

    关注

    73

    文章

    5564

    浏览量

    122961
  • cnn
    cnn
    +关注

    关注

    3

    文章

    354

    浏览量

    22783
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI视频识别系统的应用领域

    、城市治理现代化 AI视频识别技术 正深度重构城市管理体系。在城市安防领域,系统通过行为模式分析实现异常事件主动预警,对人员聚集、异常滞留
    的头像 发表于 07-24 11:06 ?188次阅读

    无刷直流电机双闭环串级控制系统仿真研究

    Madlab进行BLDC建模仿真的方法,并且也提出了很多的建模仿真方案。例如有研究人员提出采用节点电流法对电机控制系统进行分析,通过列写m函数,建立BLDC控制系统真模型,这种方法实质上是一种整体建模
    发表于 07-07 18:36

    【高云GW5AT-LV60 开发套件试用体验】基于开发板进行深度学习实践,并尽量实现皮肤病理图片的识别

    Equalization,对比度受限自适应直方图均衡化)是一种改进的直方图均衡化算法,主要用于增强图像的局部对比度,同时避免传统直方图均衡化可能导致的过度增强和噪声放大问题。当然还是AHE比较简单
    发表于 06-11 22:35

    工地AI行为识别系统作用

    工地AI行为识别系统作用 工地AI行为识别系统是什么? 工地AI行为识别系统是
    的头像 发表于 05-08 12:00 ?336次阅读

    景区AI行为识别系统作用

    景区AI行为识别系统作用 景区AI行为识别系统是什么? 景区AI行为识别系统是利用人工智能技术(
    的头像 发表于 05-07 15:32 ?344次阅读
    景区AI<b class='flag-5'>行为</b><b class='flag-5'>识别</b>系统作用

    研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾

    疟疾曾度在委内瑞拉销声匿迹,但如今正卷土重来。研究人员已经训练出个模型来帮助检测这种传染病。
    的头像 发表于 04-25 09:58 ?448次阅读

    AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断

    你是否想过,LLM也有着自己的小心思?最新研究揭示了个有趣的现象:LLM在被研究人员测试时,会有意识地改变自己的行为。在面对那些旨在评估人格特质的问题时,它们给出的答案会尽可能地讨人
    的头像 发表于 04-08 11:37 ?711次阅读
    AI也有人格面具,竟会讨好<b class='flag-5'>人类</b>?大模型的「小心思」正在影响<b class='flag-5'>人类</b>判断

    讯维AI视频行为分析系统:打造全方位智能安防解决方案

    分析、报警联动于体的AI视频行为分析系统。这系统通过人工智能和深度学习技术,实现了对视频内容的智能分析和
    的头像 发表于 01-16 09:33 ?1391次阅读
    讯维AI<b class='flag-5'>视频</b><b class='flag-5'>行为</b>分析系统:打造全方位智能安防解决方案

    研究人员利用激光束开创量子计算新局面

    演示设备 威特沃特斯兰德大学(Wits)的物理学家利用激光束和日常显示技术开发出了一种创新的计算系统,标志着在寻求更强大的量子计算解决方案方面取得了重大飞跃。 该大学结构光实验室的研究人员取得的这
    的头像 发表于 12-18 06:24 ?409次阅读
    <b class='flag-5'>研究人员</b>利用激光束开创量子计算新局面

    一种混合颜料光谱分区间识别方法

    古代彩绘颜料的分析是科技考古与文物保护研究的重要内容,高光谱是近年来发展迅速的新兴技术,在物质识别上具有广泛应用,提出一种基于高光谱分区间的混合颜料识别方法。
    的头像 发表于 12-02 16:22 ?511次阅读
    <b class='flag-5'>一种</b>混合颜料光谱分区间<b class='flag-5'>识别</b>方法

    AI智能体逼真模拟人类行为

    近日,据外媒最新报道,斯坦福大学、华盛顿大学与Google DeepMind的科研团队携手合作,成功开发一种能够高度逼真模拟人类行为的AI智能体。 该智能体的构建得益于
    的头像 发表于 11-26 10:24 ?886次阅读

    AI行为识别摄像机

    摄像机是一种利用深度学习算法和计算机视觉技术,对视频图像进行实时分析的智能设备。它能够自动识别并分析人类的各种行为,如抽烟、打斗、跌倒等,并
    的头像 发表于 11-21 10:49 ?731次阅读
    AI<b class='flag-5'>行为</b><b class='flag-5'>识别</b>摄像机

    爱普生开发了一种烤箱控制的晶体振荡器,其功耗比传统OCXOs1低56%

    爱普生开发了一种烤箱控制的晶体振荡器,其功耗比传统OCXOs1低56%-该振荡器小巧且节能,是下代通信基础设施参考信号源应用的理想选择-精工爱普生公司(TSE:6724,“爱普生”
    的头像 发表于 10-29 11:28 ?644次阅读
    爱普生<b class='flag-5'>开发了</b><b class='flag-5'>一种</b>烤箱控制的晶体振荡器,其功耗比传统OCXOs1低56%

    深度识别算法包括哪些内容

    CNN是深度学习处理图像和视频等具有网格结构数据的主要算法。它通过卷积层、池化层和全连接层等组件,实现对图像特征的自动提取和识别。 应用领域 :
    的头像 发表于 09-10 15:28 ?886次阅读

    攀高行为检测识别摄像机

    攀高行为检测识别摄像机是一种结合了图像识别技术和智能算法的设备,旨在监测和识别人员在高空作业
    的头像 发表于 08-29 10:17 ?506次阅读
    攀高<b class='flag-5'>行为</b>检测<b class='flag-5'>识别</b>摄像机