说话过程中的喉部运动为信息传输提供了一条有前途的途径,但声带和周围肌肉的复杂动态会在喉咙中产生复杂的信号,这给传感器的最佳放置以获取信号带来了挑战。本文,深圳大学刁东风院士团队在《Carbon》期刊发表名为“Throat map of speech recognition achieved by flexible ultrasensitive carbon array sensors with deep learning”的论文,研究提出一种“喉部地图”,利用柔性碳阵列传感器和基于深度学习的信号处理方法,以确定高精度语音识别所需的传感器最佳放置坐标。在传感器制备过程中,通过电子回旋共振法沉积石墨烯纳米晶碳膜作为传感单元,随后将其转移至聚二甲基硅氧烷(PDMS)基底并集成可拉伸电路。该传感器在2×2 cm?的区域内包含16个传感单元,实现超高的灵敏度系数(>1000)和10000 Hz的频率响应极限。 在信号处理方面,我们首次提出了一种基于卷积神经网络算法的信号-位置分类方法。该方法可可视化以喉结为中心的坐标信息并构建喉部地图,从而识别产生最独特且一致信号的位置。借助喉部地图,选定的传感单元通过深度学习模型对14个音素的分类准确率超过96%。该喉部地图可作为语音及喉部语言识别应用中传感器布局的指导依据。
2图文导读
图1.“喉咙图”研究的总体图。
图2.超灵敏阵列传感器的表征。
图3.语音识别的喉咙图。
图4.用于语音识别的喉咙图验证。
3小结
我们提出了一种构建“喉部地图”的方法,通过检测喉部运动信号来提升音素信息的识别能力。该方法基于两项关键技术突破:一种可行的制备柔性超敏感碳阵列传感器技术,用于在狭窄的喉部区域捕捉多点细微喉部运动信号;以及一种基于深度学习的SPC方法,通过位置权重累积来创建喉部地图。碳阵列传感器在2×2 cm?的面积内拥有16个传感单元,具有高灵敏度系数(>1000)和高达10000 Hz的高频响应极限。喉部地图的构建提供了在喉部区域布置传感单元的坐标信息,以实现音素识别。通过使用5个传感单元,该方法在14个音素识别中实现了超过96%的高准确率。本文提出喉部地图构建方法为多传感器单元在运动识别中的位置布局提供了高效解决方案。
文献:
https://doi.org/10.1016/j.carbon.2025.120720
审核编辑 黄宇
-
传感器
+关注
关注
2569文章
53360浏览量
770820
发布评论请先 登录
清华大学:研发高柔性压电驻极体声学传感器,抗环境噪声能力远超商用麦克风

芯森电子FR6V系列磁通门电流传感器在光伏阵列中的应用

新思科技携手深圳大学助力数字集成电路人才培养
南洋理工大学:研究通过 4D 打印开发增强对应变、温度和磁场的灵敏度的超柔性传感器

0.3s高灵敏NTC温度传感器用于消费电子
西安交通大学:受章鱼触角接触行为启发的仿生触觉传感阵列

柔性传感器的常用材料有哪些?
线性传感器的灵敏度是什么是多少
Sitara Linux ALSA DSP麦克风阵列语音识别

力敏传感器的灵敏度单位是什么
哈尔滨工业大学/南方科技大学:聚焦离子束制备高分辨率电化学-电致发光耦合双极纳米电极阵列传感器

评论