0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何打造一个属于自己的手势识别应用

恩智浦MCU加油站 ? 来源:恩智浦MCU加油站 ? 2025-07-29 10:12 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

上一期小编给大家介绍了和MediaPipe的相遇之路,本期小编将带着大家一起来动手,如何打造一个属于自己的手势识别应用。

欢迎感兴趣的小伙伴们到这里访问MediaPipe中的手势识别任务:

https://ai.google.dev/edge/mediapipe/solutions/vision/gesture_recognizer?hl=zh-cn

下面就让我们开始今天的任务吧!

1模型在哪?

我们知道,一个AI应用最精华的部分就是他的模型,换句话来说,如果我们能拿到MediaPipe的模型文件,是不是就可以让模型为我们所用了?说干就干。要不说还得是Google,真的是大方,直接贴上了用到的模型:

45e346fa-6831-11f0-a6aa-92fbcf53809c.png

既然有了模型就成功了一大步了,而且还贴心的告诉了我们模型的输入大小,让我们下载下来看下,文件扩展名是.task,不要管他,直接解压缩,我们会得到两组模型,共四个:

归属于hand_gensture_recognizer的两个:

45f6669a-6831-11f0-a6aa-92fbcf53809c.png

以及归属于hand_landmarker的两个:

46029e2e-6831-11f0-a6aa-92fbcf53809c.png

2模型怎么用?

得到模型之后,万里长征才刚刚开始。由于这个模型是依靠于MediaPipe来进行推理的,并没有更多的信息来告诉我们这几个模型是要怎么使用,接下来就需要我们根据一些直觉来进行分析了:

先来分析模型怎么用,根据文件命名,我们可以分析出:前两个模型是负责手势识别的,后两个模型是进行手部检测+手部关键点识别的,这么一看,好像有了点思路。算法流程看起来是先进行手部检测,即首先检测到手的位置,随后在进行手势识别。

那新的问题来了,landmark模型有什么作用呢?下面就让我们先打开landmark模型看下他的输入输出结构:

460e2906-6831-11f0-a6aa-92fbcf53809c.png

461a6e3c-6831-11f0-a6aa-92fbcf53809c.png

我们可以确定,他的输入是一张224x224大小的RGB图像,然后输出有四个维度,好消息是,模型里面很贴心的标上了输出所代表的含义。从这里,我们可以知道模型本身可以识别出左右手、是否有手以及手部关键点,这里提供了两种类型的关键点信息,一种是归一化坐标,一种是世界坐标。那具体用哪一个,还要我们测试才能知道。

接下来打开手势识别模型,先看一下gesture_embedder.tflite模型的输入输出结构:

46294254-6831-11f0-a6aa-92fbcf53809c.png

他的输入有三个,分别是hand,handedness,以及world_hand,输出是一个128维的向量。看到这,是不是有些激动了?没错,这个输入是不是和刚才landmark的模型名字很像。也就是说,刚才的landmark模型的输出就是这里embed模型的输入,是不是有种福尔摩斯的感觉了?

还没有结束,还有个疑问?输出这个128维的向量要怎么用?不要急,这里不是还有一个叫canned_gesture_classifier.tflite的模型:

46364cf6-6831-11f0-a6aa-92fbcf53809c.png

不用小编多说,是不是细心的大家已经发现了端倪?输入刚好是128维的向量,然后输出是手势的分类得分,具体是哪8类呢?mediapipe上已经告诉了我们:

0 - Unrecognized gesture, label: Unknown

1 - Closed fist, label: Closed_Fist

2 - Open palm, label: Open_Palm

3 - Pointing up, label: Pointing_Up

4 - Thumbs down, label: Thumb_Down

5 - Thumbs up, label: Thumb_Up

6 - Victory, label: Victory

7 - Love, label: ILoveYou

现在,我们已经分析出来了三个模型的作用,那么还剩一个叫做hand_detector.tflite的模型,他是干什么用的呢?

4642a064-6831-11f0-a6aa-92fbcf53809c.png

通过分析模型的输入输出,我们可以知道:这个模型的作用是为了检测出图像中的手部位置以及手部得分,那看起来一切都通顺了。原来一个小小的手势识别任务需要四个模型来实现,并且各个模型之间是串行的关系,一环套一环。每一个模型的输出都要作为下一个模型的输入来得到最终的手势分类结果。

那么本期小编就为大家抽丝剥茧,分析出了整个手势识别的模型处理关系,接下来我们就要实际进行模型转换,让他们为我们所用。提前预告下:

下一期小编将为大家带来如何量化tflite模型的篇章!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 手势识别
    +关注

    关注

    8

    文章

    229

    浏览量

    48346
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281223
  • 模型
    +关注

    关注

    1

    文章

    3531

    浏览量

    50565

原文标题:站在巨人肩膀上开发AI应用分享(二)

文章出处:【微信号:NXP_SMART_HARDWARE,微信公众号:恩智浦MCU加油站】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于毫米波雷达的手势识别算法

    )信息提取:该模块将信号构建成手势点云模型,并将其提供给下一个神经网络模块进行识别。在点云模型中,每个内部点都有自己的五特征,即反射点的x
    发表于 06-05 19:09

    红外手势识别方案 红外手势感应模块 红外识别红外手势识别

    红外手势识别方案,适用于多种领域,如音响,可实现通过手势识别暂停,开始,上首,下首;智能家居
    发表于 08-27 16:37

    使用SensorTile识别手势

    在空中画一个字母或符号,这可能是实现这个的方法吗?我知道open.mems库在代码中编码有限数量的手势,我可以识别自定义
    发表于 09-10 17:18

    打造属于自己的Linux操作系统

    跟大神起15分钟制作属于自己的Linux操作系统!
    发表于 04-16 14:18

    如何用无源传感器PIR搭建属于自己手势识别模块?

    主流的手势识别方法及其原理是什么?各种手势识别方法的优缺点是什么?都是手势识别有什么区别吗?如何
    发表于 07-04 07:45

    如何设计手势识别装置?

    如何设计手势识别装置?
    发表于 11-12 06:56

    介绍基于单片机的手势识别系统

    文章目录1 简介2 实现效果3 使用场景4 参数说明5 注意事项6 最后1 简介Hi,大家好,这里是丹成学长,今天向大家介绍学长做的单片机项目基于单片机得手势识别系统大家可用于 课
    发表于 11-19 09:19

    HarmonyOS/OpenHarmony(Stage模型)应用开发组合手势)连续识别

    组合手势中有手势识别失败时,所有的手势识别失败。
    发表于 09-07 15:20

    HarmonyOS/OpenHarmony(Stage模型)应用开发组合手势(二)并行识别

    并行识别组合手势对应的GestureMode为Parallel。并行识别组合手势中注册的手势将同时进行
    发表于 09-08 16:17

    如何建立属于自己的AVR的RTOS

    如何建立属于自己的AVR的RTOS 自从03 年以来,对单片机的RTOS 的学习和应用的热潮可谓浪高过
    发表于 03-11 09:02 ?45次下载

    如何采用MCU定制属于自己的语音识别应用

    TI还发布了用C语言代码编写的语音识别器库,这个库使得基于MSP432 MCU的应用能够识别用户个人经常使用的语音短语,在忽略其它语音内容的情况下可
    发表于 12-20 16:14 ?2470次阅读

    手势识别系统的程序和资料说明

    本项目在python 2.7上使用opencv实现了手势识别手势识别系统。
    发表于 04-28 08:00 ?12次下载
    <b class='flag-5'>手势</b><b class='flag-5'>识别</b>系统的程序和资料说明

    手势识别技术及其应用

    手势识别技术是种通过计算机视觉和人工智能技术来分析和识别人类手势动作的技术。它主要利用传感器、摄像头等设备捕捉
    的头像 发表于 06-14 18:12 ?2905次阅读

    车载手势识别技术的原理及其应用

    车载手势识别技术是种利用计算机视觉和人工智能技术来识别和理解驾驶员手势的技术。该技术通过使用传感器、摄像头等设备捕捉驾驶员的
    的头像 发表于 06-27 18:09 ?2101次阅读

    如何快速打造属于自己的工业物联网云平台

    如何快速打造属于自己的工业物联网云平台 工业物联网云平台是工业4.0的核心,是实现智能制造、智能物流、智能工厂的重要手段。在快速发展的信息化时代,如何快速打造
    的头像 发表于 01-25 16:51 ?1035次阅读
    如何快速<b class='flag-5'>打造</b><b class='flag-5'>属于</b><b class='flag-5'>自己</b>的工业物联网云平台