0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音交互设备中的ASR和TTS技术

安富利 ? 来源:安富利 ? 作者:安富利 ? 2022-06-16 17:23 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本期导读

-Hi Siri,今天天气怎么样?

-今天天气晴,18℃至27℃,空气质量指数36,优。

手机、手表、音箱等智能设备极大地便利了我们的生活,随着语音交互设备的发展,智能交互依然面临很多挑战。

我们每天要说成百上千句话,长短不一。即便是一些转瞬即逝的口头语,也可以成为传达自我意识的载体,向他人准确传达信息。可语言似乎是人类群体特有的专利,在过往的时间中,想借助语言与其他物种、物体建立清晰明确沟通关系的可能性无限趋近于零,直到智能语音技术的出现。

作为最早落地的人工智能技术之一,AI语音技术已经得到了长足的发展。如今,智能语音技术已经被广泛集成的就是家居产品之中。在即将到来的万物互联时代,以语音交互为主的智能设备无疑将极具竞争力与吸引力。仔细一想,一众充满科技感与未来感的智能设备,将天然具备人类最熟悉的“原始交互方式”,也颇有些化繁为简、返璞归真的意味。

语音交互设备的“助听器”——ASR

在复杂环境中,我们总是可以忽略或弱化无关噪声,集中注意力进行沟通,但语音交互设备在如此环境中只会无所适从,不免陷入“交互尚未开始,便已结束”的囧境。故此,设备拥有对各类“声学场景”的声源信号进行处理、优化功能的必要性不言而喻。而借助降噪NS、语音增强SE等技术,可以对声学场景中的非语音噪音信号进行抑制,从含有噪音的语音信号中提取纯净语音,提升语音识别效果,让语音交互设备可以分辨、倾听出目标声音,进而为后续的语音交互扫清障碍。

在语音识别技术(ASR)的加持下,语音交互设备能对声音信号进行特征提取,提取而出的“特征”会作为参数,为模型计算做准备。简单理解就是将语音信息数字化,再通过相应的模型对数字化信息进行计算。后续通过声学模型计算得出相应的音素(即把声音转成音素),其目的是根据音素来找到对应的汉字或者单词,最终转换成设备可以理解的文本。

语音交互设备的“声卡”——TTS

基于语音合成技术(TTS),语音交互设备可对文本逐句分析,进行词汇、语法的和语义的分析,以确定句子的低层结构和每个字的所对应的音素组成,包括文本的断句、字词切分、多音字处理以及数字处理等。

在内置芯片和神经网络技术的支持下,语音交互设备可把处理好的文本所对应的单字或短语从语音合成库中提取,使语言学描述转化成言语波形,即把文字智能地转化为自然语音流。至此,一次完整的语音交互便成功完成。当然,在特有的智能语音控制器作用下,文本输出的语音音律将会更加流畅,使得听者在听取信息时感觉自然、毫无机器语音输出的冷漠与生涩感。

写在最后

诚然,已普遍应用于智能家居设备中的语音交互技术仍面临诸多挑战,在设备唤醒率、识别率、误报率、环境降噪等方面仍有改进的空间。但毫无疑问,在未来语音作为人类最自然、最便捷的沟通方式,将会成为所有设备和产品至关重要的入口和人与机器之间的通信纽带,而强逻辑、无视觉或者弱视觉的智能语音技术也会找到更多用武之地。

原文标题:智能交互的尽头是聊天?

文章出处:【微信公众号:安富利】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ASR
    ASR
    +关注

    关注

    2

    文章

    44

    浏览量

    19199
  • TTS
    TTS
    +关注

    关注

    0

    文章

    56

    浏览量

    11225
  • 语音交互
    +关注

    关注

    3

    文章

    311

    浏览量

    28681

原文标题:智能交互的尽头是聊天?

文章出处:【微信号:AvnetAsia,微信公众号:安富利】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    从开发工程师视角看TTS语音合成芯片

    从开发工程师视角看TTS语音合成芯片 在语音交互领域,TTS 语音合成芯片作为关键角色,正不断革
    的头像 发表于 08-13 14:52 ?119次阅读

    普强智能语音技术重新定义车载交互边界

    普强凭借自主研发的智能语音技术,为某国内头部车企提供的语音前处理、唤醒词、ASRTTS技术
    的头像 发表于 07-11 14:00 ?553次阅读

    Air8000 TTS开源,语音合成从此“零距离”!

    文本转语音)——是一种将书面文本转换为人类可听语音技术,通过算法和模型模拟人类发声,实现机器“说话”。其核心目标是生成自然、流畅且富有表现力的语音。 ?
    的头像 发表于 07-03 16:33 ?261次阅读
    Air8000 <b class='flag-5'>TTS</b>开源,<b class='flag-5'>语音</b>合成从此“零距离”!

    广州唯创电子WT3000A离在线TTS语音提示器芯片IC设计方案深度解析

    引言:语音交互的智能化跃迁在全球化与智能化深度融合的今天,语音交互设备的应用场景已从单一提示功能向多语言支持、情感化表达及AI深度交互演进。
    的头像 发表于 04-25 09:13 ?388次阅读
    广州唯创电子WT3000A离在线<b class='flag-5'>TTS</b><b class='flag-5'>语音</b>提示器芯片IC设计方案深度解析

    智能收银语音交互新标杆—WT3000T8语音合成芯片TTS技术应用解析

    一、行业应用背景在零售业态智能化转型的浪潮,收银设备正经历从功能型向服务型转变的关键阶段。WT3000T8语音合成芯片应运而生,专为满足新零售场景下智能收银终端的语音
    的头像 发表于 04-24 08:45 ?351次阅读
    智能收银<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新标杆—WT3000T8<b class='flag-5'>语音</b>合成芯片<b class='flag-5'>TTS</b><b class='flag-5'>技术</b>应用解析

    TTS语音播报控制器能做什么?

    TTS(Text-to-Speech)语音播报控制器,作为一种能够将文本信息转换为语音输出的技术设备,在现代社会的各个领域中展现出了广泛的应
    的头像 发表于 02-20 18:18 ?795次阅读

    TTS语音播报模块简介

    的桥梁,不仅在智能家居、车载导航、电子阅读器等众多领域发挥着关键作用,还逐渐渗透到教育、医疗、娱乐等多个行业,成为提升用户体验、增强信息交互效率的重要工具。 TTS语音播报模块,作为现代人机
    的头像 发表于 02-18 16:16 ?1183次阅读

    TTS语音播报控制器应用场景

    TTS(Text-to-Speech)语音播报控制器,作为一种能够将文本信息转换为语音输出的技术设备,在现代社会的各个领域中都展现出了广泛的
    的头像 发表于 02-18 16:15 ?631次阅读

    HarmonyOS NEXT 应用开发练习:AI智能语音播报

    一、DEMO思路 在这个HarmonyOS NEXT原生应用DEMO,我们将使用ArkTS开发语言创建一个简单的AI智能语音播报应用。 该应用能够接收用户输入的文本,并使用TTS
    发表于 01-06 15:33

    基于智能语音交互的智能呼叫中心工作机制

    作为实现智能呼叫中心的关键技术之一的智能语音交互技术,它通过集成自然语言处理(NLP)、语音识别(ASR
    的头像 发表于 12-03 16:44 ?788次阅读
    基于智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>的智能呼叫中心工作机制

    ASR与传统语音识别的区别

    ASR(Automatic Speech Recognition,自动语音识别)与传统语音识别在多个方面存在显著的区别。以下是对这两者的对比: 一、技术基础
    的头像 发表于 11-18 15:22 ?1534次阅读

    ASR和机器学习的关系

    语音识别技术的目标是将人类语音转换成可读的文本。这项技术在多个领域都有应用,包括语音助手、语音
    的头像 发表于 11-18 15:16 ?868次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。
    的头像 发表于 11-18 15:12 ?2224次阅读

    语音提示器-WT3000A离在线TTS方案-打破语种限制/AI对话多功能支持

    TTS(Text To Speech )技术作为智能语音领域的重要组成部分,能够将文本信息转化为逼真的语音输出,为各类硬件设备提供便捷的
    的头像 发表于 10-25 10:36 ?757次阅读
    <b class='flag-5'>语音</b>提示器-WT3000A离在线<b class='flag-5'>TTS</b>方案-打破语种限制/AI对话多功能支持

    WT2605C TTS在线语音合成芯片:赋能多行业领域,引领产品智能化

    在当今科技日新月异的时代,语音技术正逐步渗透到我们生活的方方面面,而TTS(Text-To-Speech,文本到语音技术作为其中的重要一环
    的头像 发表于 09-12 15:54 ?681次阅读
    WT2605C <b class='flag-5'>TTS</b>在线<b class='flag-5'>语音</b>合成芯片:赋能多行业领域,引领产品智能化