0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于深度图像的人体关节定位算法

新机器视觉 ? 来源:上海交大类脑智能应用技 ? 作者:上海交大类脑智能 ? 2022-07-15 10:05 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人体姿态估计是当前计算机视觉领域的热点研究问题。对人体骨架关节点进行准确提取并构建人体骨架模型,为进一步的人体姿态识别、实时交互游戏等应用提供了基础。但是传统的基于RGB图像的方法容易受到光照、阴影、复杂背景的影响,准确度不高并且算法复杂。利用深度图像技术可以有效地解决上述问题,利用深度信息可以快速地进行背景分割,抗干扰性能好,算法效率高。

本文主要研究基于深度图像的人体关节定位算法。算法对深度图像素点周围区域的深度进行格点化采样以提取其深度特征,再使用随机森林分类器进行像素点分类,对同一类别的点使用Mean Shift算法聚类出中心点,以该中心点作为关节点位置。该算法可对人体全身关节点进行定位。

局域深度特征提取

本文中采用如图1所示的局域深度采样特征。其中蓝色点表示图像I中给定的像素x,以该像素为中心生成一个5*5的格点矩阵,红色的格点表示要进行深度采样的点。

734edd8c-037d-11ed-ba43-dac502259ad0.png

图1 局域深度采样示意图

随机森林分类器

分类器是对样本进行分类的算法的统称,在机器学习中有许多种分类器可供我们选择使用,包括逻辑回归、朴素贝叶斯、支持向量机(SVM)、决策树、随机森林、神经网络等算法。综合考虑分类的精度与效率,本课题中采用的是随机森林分类器。

随机森林分类器是由多棵决策树组合而成的分类器,如图2所示。决策树的结构类似二叉树,由分裂结点和叶结点构成。每一个分裂结点包含一个特征与阈值,像素x从根部开始,根据特征与阈值划分进入左子树还是右子树,这样不断地分裂直到叶结点。在每棵树的叶结点能够得到该像素对于各个身体部件的概率分布,将各棵树得到的结果相加,得到最终的概率分布,拥有最高概率的一类作为最终的分类结果。

随机森林将多棵决策树合并在一起,准确度相较于单棵决策树有较大提升,并且多棵决策树可以并行训练,提高了训练效率。

735cdb58-037d-11ed-ba43-dac502259ad0.png

图2随机森林分类器

训练完随机森林分类器后,我们利用其对像素点进行分类,判断其属于身体的哪个部位。对于图像中的每个像素,使用分类器对其分类后得到分类的结果,以及预测结果的概率。我们只选取图像中预测概率高于80%的点,这样就能得到密度不同的分类点。越靠近关节点位置,预测概率越高,点的密度越大,远离关节点位置的密度则小。

关节点位置估计

在得到像素点分类后,我们使用Mean Shift聚类算法得到属于同一部位像素点的中心,作为关节位置。

Mean Shift算法一般为一个迭代过程,先计算感兴趣区域内的偏移均值,移动区域中心到计算出的质心处,然后以此处作为新的起点,继续移动。在迭代过程中,不断向密度更大的地方偏移,直到移动到这类像素点密度最高的中心位置而停止。此时这个位置最能代表这一类点,我们将其作为该部位的关节点位置。分别对所有类别的点都运行一遍此算法后,我们就能得到全身关节点的位置。

但是由于分类结果并不一定准确,聚类出的结果可能与真实关节点的位置有所偏移,这时我们可以采用人体骨架长度比例约束条件,来矫正一部分偏移较大的关节点,对预测结果进行优化。

流程介绍

训练流程:对一幅深度图,取关节附近的点作为训练集,对这些点提取深度特征,再训练随机森林分类器

736b3266-037d-11ed-ba43-dac502259ad0.png

图3训练流程示意图

测试流程:深度图背景分割得到人体区域图像,使用随机森林分类器对人体的像素点进行分类,选取预测概率大于设定阈值的点,则得到疏密不同的各关节部位像素点,越接近关节点位置,像素点越密,再使用Mean shift算法进行聚类,得到关节点位置

739e8a26-037d-11ed-ba43-dac502259ad0.png

测试流程示意图

运行效果

图4为关节定位算法的运行效果,(a)为NTU数据集中关节点的标准位置;(b)是算法对同一张深度图中关节点的定位结果;(c)为自制的Kinect测试集上的运行效果;(d)为采用公司研制的TOF相机模块拍摄的深度图的运行效果。可以直观地看出定位效果较为良好。TOF相机的分辨率为320*240,因此相同距离下人体在画面中所占比例更大。

73aacc8c-037d-11ed-ba43-dac502259ad0.png

(a) (b)

73c01f6a-037d-11ed-ba43-dac502259ad0.png

(c) (d)

图4 算法运行效果示例

注:

(a)NTU测试集真值,25关节

(b)NTU测试集

(c)自制测试集

(d)TOF相机拍摄图像

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4715

    浏览量

    95740
  • 机器学习
    +关注

    关注

    66

    文章

    8510

    浏览量

    134856
  • 深度图像
    +关注

    关注

    0

    文章

    19

    浏览量

    3623

原文标题:3D视觉在人体姿态估计算法的应用

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于卫星图像的智能定位系统软件

    基于卫星图像的智能定位系统软件是卫星导航、图像处理与智能算法融合的前沿技术结晶,在高精度定位领域具有卓越表现。以下是对这类软件的详细介绍:
    的头像 发表于 04-01 09:55 ?420次阅读

    基于卫星图像的智能定位系统全面解析

    智慧华盛恒辉基于卫星图像的智能定位系统,作为融合卫星导航、图像处理以及智能算法的前沿科技,在高精度定位领域表现卓越。下面为您全方位深入剖析该
    的头像 发表于 03-31 16:55 ?403次阅读

    电学电压放大器基于静电传感器的人体室内定位研究的应用

    实验名称:基于静电传感器的人体室内定位研究 测试目的:设计并制作了一种能够对人体运动进行检测的静电传感器。静电传感器由感应电极与信号调理电路组成,调理电路包括电荷放大器、电压放大器、截止频率为
    的头像 发表于 03-18 11:16 ?319次阅读
    电学电压放大器基于静电传感器<b class='flag-5'>的人体</b>室内<b class='flag-5'>定位</b>研究的应用

    VirtualLab Fusion应用:锥形相位掩模的Talbot图像

    摘要 在传统的 Talbot 光刻中,在光敏层中仅使用一个图像。 但是,可以使用特殊的相位掩模以深度方式生成相位掩模的两个图像。 在本案例中,按照 I.-H. Lee 等人在 VirtualLab
    发表于 02-26 08:54

    DLPC7540EVM是否支持自定义的图像处理算法,以及如何进行算法的移植?

    是否支持自定义的图像处理算法,以及如何进行算法的移植?
    发表于 02-17 08:25

    亚历山大医院研发全球新颖的人工智能算法(已获国际专利)

    一种用于机器人全膝关节置换(rTKR)的人工智能算法获得了国际专利合作条约(PCT)专利,保护机器人全膝关节置换的计算算法的独特性,新颖性和专有权。该专利自2024年八月起在150多个
    的头像 发表于 02-15 10:16 ?352次阅读

    FPGA上的图像处理算法集成与优化

    、Tophat形态学滤波、RAW8转RGB888、彩色图像均值滤波、Alpha背景叠加、直方图灰度拉伸算法以及自动白平衡算法。每种算法都提供了实现方法和相关公式,涵盖了
    的头像 发表于 02-14 13:46 ?715次阅读
    FPGA上的<b class='flag-5'>图像</b>处理<b class='flag-5'>算法</b>集成与优化

    矽典微新品XenD101H人体生命存在感应参考设计

    静止人体生命存在毫米波传感器采用FMCW调频连续波技术,对空间内的静止、微动、运动的人体目标进行探测,通过精确的生命存在感应和测距算法,即可独立配置区间感应灵敏度,也可以自动化生成传感器配置参数
    的头像 发表于 12-30 15:29 ?565次阅读
    矽典微新品XenD101H<b class='flag-5'>人体</b>生命存在感应参考设计

    ADS1293获取的人体心电信号,如何实现隔直?

    1. ADS1293获取的人体心电信号,如何实现隔直?ECG信号没有隔直处理的话,基线会偏离0电压位置,并且不同的人在不同的时间,偏置的电压不尽相同。 2. ADS1293评估板手册上,波形十分
    发表于 12-10 08:25

    使用ADS1298测出的人体心电信号基准线不在Y=0轴,如何解决呢?

    这是我采用加压单极左下肢导联实测出的人体心电信号,但是基准线不在Y=0轴上,而且每次飘忽不定,总需要重新调整坐标轴,大家有没有什么解决的办法呢?谢谢啦。
    发表于 12-03 08:05

    常见人体姿态评估显示方式的两种方式

    人体姿态评估中有两种常见的显示方式,分别是火柴人效果与BodyPix效果。其中火柴人效果本质就是基于关键点的深度学习模型推理以后的显示效果;Bodypix本质就就是语义分割模型
    的头像 发表于 11-11 11:21 ?714次阅读
    常见<b class='flag-5'>人体</b>姿态评估显示方式的两种方式

    图像算法工程师的利器——SpeedDP深度学习算法开发平台

    随着人工智能的兴起,AI工程师特别是基于图像算法工程师日益成为炙手可热的香饽饽。特别是在一些行业市场例如工业领域等行业领域,需要根据具体场景对检测识别算法进行不断地优化完善,以达到更高的准确率
    的头像 发表于 11-08 01:06 ?873次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>算法</b>工程师的利器——SpeedDP<b class='flag-5'>深度</b>学习<b class='flag-5'>算法</b>开发平台

    深度识别算法包括哪些内容

    :CNN是深度学习中处理图像和视频等具有网格结构数据的主要算法。它通过卷积层、池化层和全连接层等组件,实现对图像特征的自动提取和识别。 应用领域 :CNN在
    的头像 发表于 09-10 15:28 ?880次阅读

    可穿戴设备的人体成分测量 (BCM)申请简介

    电子发烧友网站提供《可穿戴设备的人体成分测量 (BCM)申请简介.pdf》资料免费下载
    发表于 09-10 09:22 ?0次下载
    可穿戴设备<b class='flag-5'>的人体</b>成分测量 (BCM)申请简介

    基于新型蓝牙技术的人定位方案

    云酷科技“基于新型蓝牙技术的人定位项目”在结合行业相关制度及项目管理经验基础上,利用蓝牙定位、4G/5G通讯等技术,以较低成本投入,实现生产区域的“作业安全”、“人员安全”、“机具安全”闭环管理
    的头像 发表于 09-03 11:57 ?490次阅读