0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为研发语音唤醒方法及电子设备的语音交互技术

454398 ? 来源:搜狐 ? 作者:搜狐 ? 2021-01-09 09:07 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

通常语音交互过程通常分为唤醒、响应、输入、理解、反馈几个环节,语音交互技术也一直是IBM、微软、百度等遥遥领先。

几个月前,华为消费者业务CEO余承东表示华为正在研发国际版的语音助手,同时建立自己的AI服务,并将在未来扩展到国际市场。

人工智能的潮流推动下,智能化语音技术不断发展,许多电子设备中都添加了语音助手,如Siri、小爱同学、天猫精灵等,用来协助用户进行人机交互过程。为了使得语音助手能够及时检测并响应用户发出的语音交互指令,电子设备一般会预设一些唤醒词,如“Hi Siri”等,当检测到用户输入唤醒词时,可触发电子设备与用户进行交流。通常设备设置唤醒词的声强门限60dB,当用户输入声强大于60dB时,电子设备检测成功,然而当用户距离设备较远时,由于输入声强的降低,电子设备往往难以检测到输入语音信号从唤醒失败。在这种情况下,如何在远距离下提高语音助手唤醒成功率成为诸多企业竞相研究的热点。

华为公司于2019年7月25日提出了一项名为“一种语音唤醒方法及电子设备”的发明专利(申请号:201910677390 .9),申请人为华为技术有限公司。

此发明专利介绍了一种语音唤醒方法及相对应的电子设备,可以在较广的位置范围内保证电子设备被成功唤醒的几率,从而提高用户的使用体验,而该种方法可以被应用于诸如智能家居设备、PC、手机、音箱等具有语音交互功能的电子设备之中。

o4YBAF9uXB6ASSloAACJI4NT3Lc054.png

图1 语音交互过程示意图

通常语音交互过程可分为唤醒、响应、输入、理解、反馈几个环节。当设备处于待机状态时,需要识别用户输入的语音唤醒信号,如果识别成功则切换到工作状态,此后则可以通过语音识别算法用户对输入的语义内容进行识别并响应,整个过程如图1所示。

从上述过程可以看出,成功唤醒电子设备是实现人机语音交互的基础,而唤醒设备的过程就是通过预设的唤醒参数检测用户的语音输入。唤醒参数如唤醒门限、拾音方向、噪声抑制参数、放大增益等的取值决定了电子设备在检测唤醒输入语音时唤醒率的高低。在实际使用过程中,用户相对设备的位置差异导致了唤醒率的不同,因此根据用户所在的位置动态设置唤醒参数可以使得电子设备在不同位置场景下保持较高的唤醒率。

pIYBAF9uXCCACWbGAAEKoHGuKwk742.png

图2 语音唤醒方法应用场景示意图

图2为上述提到的基于用户位置信息来划分区域,从而进行语音唤醒的示意图。电子设备在待机状态时可周期性地通过摄像头采集用户图像信息,并根据图像确定用户所在的位置信息。对于不同区域,设备可预先设置对应的唤醒参数,以声强为例,在近处的区域设置较大的门限,而在远处区域设置较小的门限,从而使各个区域都达到较高的唤醒率。如图2所示的三个区域各自具有一套唤醒参数,从而提高了语音交互场景下用户的使用体验。

o4YBAF9uXCGAUjaBAAITFAM0hTk601.png

图3 语音唤醒方法流程图

图3是此专利提供的一种语音唤醒方法流程示意图。以智能电视为例,首先设备通过摄像头采集图像,并通过采集的图像确定其中是否包含用户,如果包含则确定图像中第一用户所在的第一目标位置,并获取该位置下的唤醒参数。当用户输入语音后,设备根据上述唤醒参数处理输入语音信号。如果用户从区域1切换到区域2,则设备获取区域2中的唤醒参数并进行信号处理,包括模数转换、降噪、放大等,因此该设备可根据用户所在位置实时动态的对切换唤醒参数,达到更好的人机交互效果。

在智能语音服务上,Google和亚马逊的是目前公认的业界巨头,然而从此项专利可以推断出华为在语音业务上也在不断努力发展!

编辑:hfy
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    216

    文章

    35284

    浏览量

    256921
  • 人工智能
    +关注

    关注

    1810

    文章

    49213

    浏览量

    251419
  • 语音交互
    +关注

    关注

    3

    文章

    311

    浏览量

    28680
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    普强智能语音技术重新定义车载交互边界

    普强凭借自主研发的智能语音技术,为某国内头部车企提供的语音前处理、唤醒词、ASR、TTS等技术
    的头像 发表于 07-11 14:00 ?547次阅读

    告别 “起床气”!NV340D 语音芯片解锁电子闹钟唤醒新体验!

    在快节奏的现代生活中,电子闹钟作为我们每天清晨的“唤醒伙伴”,其重要性不言而喻。如今,随着科技的飞速发展,电子闹钟也在不断进化,功能日益丰富。而这背后,离不开关键技术——
    的头像 发表于 07-05 11:09 ?693次阅读
    告别 “起床气”!NV340D <b class='flag-5'>语音</b>芯片解锁<b class='flag-5'>电子</b>闹钟<b class='flag-5'>唤醒</b>新体验!

    语音助手只能聊天?启明云端AI语音交互方案偷偷修炼了音乐才艺!

    语音助手只能聊天?太out了!”语音交互的新乐章已经奏响!启明云端基于乐鑫科技芯片的AI语音方案正式解锁音乐技能树,只需一句指令,智能设备
    的头像 发表于 06-27 18:03 ?241次阅读
    <b class='flag-5'>语音</b>助手只能聊天?启明云端AI<b class='flag-5'>语音</b><b class='flag-5'>交互</b>方案偷偷修炼了音乐才艺!

    芯资讯|广州唯创电子WTK6900P语音识别芯片:离线语音交互的革新者

    在智能设备全面普及的浪潮中,语音交互技术正逐步从“云端依赖”向“本地化高效处理”演进。广州唯创电子推出的WTK6900P
    的头像 发表于 05-22 09:22 ?336次阅读
    芯资讯|广州唯创<b class='flag-5'>电子</b>WTK6900P<b class='flag-5'>语音</b>识别芯片:离线<b class='flag-5'>语音</b><b class='flag-5'>交互</b>的革新者

    芯资讯|广州唯创电子WTV系列语音芯片:以技术创新赋能智能语音交互

    在万物互联的智能化时代,语音交互技术已成为人机交互的重要桥梁。广州唯创电子深耕语音芯片领域多年,
    的头像 发表于 05-21 08:45 ?262次阅读
    芯资讯|广州唯创<b class='flag-5'>电子</b>WTV系列<b class='flag-5'>语音</b>芯片:以<b class='flag-5'>技术</b>创新赋能智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>

    智能收银语音交互新标杆—WT3000T8语音合成芯片TTS技术应用解析

    一、行业应用背景在零售业态智能化转型的浪潮中,收银设备正经历从功能型向服务型转变的关键阶段。WT3000T8语音合成芯片应运而生,专为满足新零售场景下智能收银终端的语音交互需求而设计。
    的头像 发表于 04-24 08:45 ?350次阅读
    智能收银<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新标杆—WT3000T8<b class='flag-5'>语音</b>合成芯片TTS<b class='flag-5'>技术</b>应用解析

    智能语音交互方案在客服领域的应用

    着客服行业的面貌,为企业和用户带来了全新的体验。 语音识别模型优化私部署 方案:精准高效,定制专属服务 语音识别技术作为智能语音交互的基础,
    的头像 发表于 04-11 14:35 ?356次阅读

    零知开源——ESP32语音交互系统(AI小智)开发教程

    小智AI聊天机器人是一个基于嵌入式硬件与人工智能技术深度融合的智能交互系统。该项目以ESP32开发板为核心,结合语音唤醒、自然语言处理、音频解码播放及图形化
    的头像 发表于 03-29 15:33 ?7810次阅读
    零知开源——ESP32<b class='flag-5'>语音</b><b class='flag-5'>交互</b>系统(AI小智)开发教程

    芯资讯|WT3000T8语音合成芯片:高性价比语音交互解决方案

    在智能终端设备快速普及的当下,语音交互已成为提升用户体验的关键功能。广州唯创电子推出的WT3000T8语音合成芯片,凭借其卓越的
    的头像 发表于 03-24 09:05 ?505次阅读
    芯资讯|WT3000T8<b class='flag-5'>语音</b>合成芯片:高性价比<b class='flag-5'>语音</b><b class='flag-5'>交互</b>解决方案

    WTV380-8S语音芯片:智能清洁设备的“语音助手”,小体积大能量,重塑人机交互体验

    随着智能家居的普及,扫地机器人、擦窗机器人、洗地机等清洁设备正从“功能型”向“智能交互型”跃迁。用户不仅需要高效的清洁能力,更期待直观的语音提示、多传感器协同以及稳定可靠的性能。WTV380-8S
    的头像 发表于 03-14 09:12 ?412次阅读
    WTV380-8S<b class='flag-5'>语音</b>芯片:智能清洁<b class='flag-5'>设备</b>的“<b class='flag-5'>语音</b>助手”,小体积大能量,重塑人机<b class='flag-5'>交互</b>体验

    基于WT3000A-M6语音识别模组的智慧厨房语音交互系统设计方案

    %唤醒率多模态交互:支持语音+手势复合指令(需扩展传感器)安全防护:燃气泄漏/干烧等风险场景100ms级应急响应生态兼容:无缝接入HomeKit/Alexa/华为HiLink等主流平台
    的头像 发表于 03-12 09:18 ?574次阅读
    基于WT3000A-M6<b class='flag-5'>语音</b>识别模组的智慧厨房<b class='flag-5'>语音</b><b class='flag-5'>交互</b>系统设计方案

    基于WTV380-8S语音芯片的智能电子语音交互系统设计方案介绍

    ?一、方案背景与需求智能电子锁作为现代家居安防的核心设备,用户对交互友好性、功能多样性和系统稳定性的需求日益提升。WTV380-8S语音芯片凭借多模式控制、高集成度、低功耗设计及丰富的
    的头像 发表于 03-06 08:56 ?474次阅读
    基于WTV380-8S<b class='flag-5'>语音</b>芯片的智能<b class='flag-5'>电子</b>锁<b class='flag-5'>语音</b><b class='flag-5'>交互</b>系统设计方案介绍

    【智能语音交互新标杆】WTK6900HC语音识别芯片:重新定义离线语音控制体验

    在万物智联时代,离线语音控制技术正以革命性姿态重塑智能设备交互方式。WTK6900HC语音识别芯片凭借其突破性的
    的头像 发表于 03-05 09:26 ?481次阅读
    【智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新标杆】WTK6900HC<b class='flag-5'>语音</b>识别芯片:重新定义离线<b class='flag-5'>语音</b>控制体验

    基于智能语音交互的智能呼叫中心工作机制

    作为实现智能呼叫中心的关键技术之一的智能语音交互技术,它通过集成自然语言处理(NLP)、语音识别(ASR)和
    的头像 发表于 12-03 16:44 ?784次阅读
    基于智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>的智能呼叫中心工作机制

    智能语音的驱动力:揭秘8脚语音芯片在智能设备中的非凡角色

    语音技术渗透生活,8脚语音芯片以微缩体积、低功耗、卓越性能成智能设备语音功能核心,集成识别、合成、压缩解码等功能,实现精准
    的头像 发表于 12-02 14:23 ?586次阅读