0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

剑桥语音博士俞凯解读智能语音技术

思必驰 ? 来源:djl ? 作者:思必驰 ? 2019-08-05 16:02 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1 智能语音技术发展与siri

智能语音技术发展过程可以理解为两个阶段,第一是输入和输出阶段,即识别与合成,第二是理解和思考阶段,即语义理解、对话系统、人工智能反馈。并且每一个细分领域均为单独研究,例如语音识别、自然语言处理、声纹处理,语义解析等等。

siri 目前最大的优势在于语义单项理解的算法,在一个限定的领域下,siri表现确实很好,但在整个语音领域内,尤其不限定领域和语音识别不稳定的情况下,显得有些后劲不足,这也与目前技术有关。而思必驰与siri不同的地方在与交互的理论,目前思必驰以任务型对话为目标,并专注于此。

2 一体化综合解决技术增强用户体验

目前的智能语音基本是单独模块定义单独的功能,例如语义理解、语音识别模块,彼此之间没有控制与调度,这也是造成目前语音延迟现象的部分原因,而造成延迟另外的原因是语音的处理、理解、交互系统设计方式。

用户最希望的是智能语音界面能像人与人的交流一样,语音能够迅速反馈。但目前,虽然单独语音识别很多单位都能做的很快,但组装成交互系统之后就大都无法做到这一点了。目前思必驰推出的一体化解决方案,针对利于用户体验方面进行优化,达到端到端的用户体验,优化整个控制流程,在识别的基础上同时进行输出,达到一个快速智能反馈的效果。我们是面向终端用户体验去做语音交互优化,而不仅仅提供一个模块而已。

3 人性化交互的智能语音方向

未来的智能语音交互发展方向一定是混合发展模式,将以用户为中心,综合应用全面的语音技术,而不仅仅是单纯的语音识别。第一,智能语音技术会与环境、语境自适应的结合;第二,语音的发展在自然场景下应用会越来越多,例如在高噪声环境中的处理是未来的一个方向;第三,结合上下文的语义理解以及端到端的语音交互解决。目前单独的识别以不能解决所有问题与满足用户需求,将识别、理解、对话的交互控制等融合,提供整套的解决方案才是最终的方向。

人工智能层面的语音技术中,单纯的识别率是以科研指标为中心,而人工智能角度与工程科研指标在某些方面截然不同。而我们一直以用户为中心,面向指标是令人工智能语音真正人性化,在多类环境下准确识别并反馈,以个性化色彩进行交流。语音交互的未来应当是面向用户,人性化的智能交互,而非过去模块化的交互。

俞凯博士背景:拥有剑桥大学语音识别专业的学术背景,也是国内学术界“青年***”里唯一一位来自智能语音技术行业领域的语音专家,曾多次获得美国国家标准局和美国国防部语音识别评测冠军,是国际最早的认知型人机口语对话系统原型的主要实现者,在上海交通大学创建了智能语音实验室。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1810

    文章

    49237

    浏览量

    251715
  • 智能语音
    +关注

    关注

    11

    文章

    808

    浏览量

    49642
  • 思必驰
    +关注

    关注

    4

    文章

    346

    浏览量

    15531
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    蓝牙语音遥控器:智能家居的智慧控制核心

    和低功耗特性,成为理想选择。 蓝牙语音遥控器不仅是智能家居控制的枢纽,更是技术进步的缩影。其便捷的操作、智能语音交互和低功耗设计,为用户
    发表于 06-01 20:24

    芯资讯|广州唯创电子WTV系列语音芯片:以技术创新赋能智能语音交互

    在万物互联的智能化时代,语音交互技术已成为人机交互的重要桥梁。广州唯创电子深耕语音芯片领域多年,凭借自主研发的WTV系列语音芯片,持续为
    的头像 发表于 05-21 08:45 ?276次阅读
    芯资讯|广州唯创电子WTV系列<b class='flag-5'>语音</b>芯片:以<b class='flag-5'>技术</b>创新赋能<b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互

    智能收银语音交互新标杆—WT3000T8语音合成芯片TTS技术应用解析

    一、行业应用背景在零售业态智能化转型的浪潮中,收银设备正经历从功能型向服务型转变的关键阶段。WT3000T8语音合成芯片应运而生,专为满足新零售场景下智能收银终端的语音交互需求而设计。
    的头像 发表于 04-24 08:45 ?363次阅读
    <b class='flag-5'>智能</b>收银<b class='flag-5'>语音</b>交互新标杆—WT3000T8<b class='flag-5'>语音</b>合成芯片TTS<b class='flag-5'>技术</b>应用解析

    智能语音交互方案在客服领域的应用

    着客服行业的面貌,为企业和用户带来了全新的体验。 语音识别模型优化私部署 方案:精准高效,定制专属服务 语音识别技术作为智能语音交互的基础,
    的头像 发表于 04-11 14:35 ?367次阅读

    HarmonyOS NEXT 应用开发练习:AI智能语音播报

    一、DEMO思路 在这个HarmonyOS NEXT原生应用DEMO中,我们将使用ArkTS开发语言创建一个简单的AI智能语音播报应用。 该应用能够接收用户输入的文本,并使用TTS
    发表于 01-06 15:33

    【「嵌入式系统设计与实现」阅读体验】+ 基于语音识别的智能杯垫

    语音命令Q 识别,适用于智能家居控制、玩具、人机交互等多个领域。该模块以其高识别率、低功耗和易于集成的特点受到广大开发者的青睐。 主要技术及功能有: 磁力搅拌、重量采集、语音识别、
    发表于 01-02 18:15

    解锁个性化语音交互新时代:九芯智能语音云平台,让创意声音触手可及!

    九芯智能语音云平台提供全面高效安全的智能语音服务,支持自定义语音内容,简化烧录流程,依托AI技术
    的头像 发表于 01-02 16:51 ?997次阅读
    解锁个性化<b class='flag-5'>语音</b>交互新时代:九芯<b class='flag-5'>智能</b><b class='flag-5'>语音</b>云平台,让创意声音触手可及!

    离线语音识别技术引领智能语音灯具市场——NRK3502

    智能语音灯具集高科技与人性化设计,内置NRK3502离线语音识别芯片,支持远场识别与自定义指令,提供便捷智能体验,推动智能家居行业发展。
    的头像 发表于 12-30 15:04 ?869次阅读
    离线<b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b>引领<b class='flag-5'>智能</b><b class='flag-5'>语音</b>灯具市场——NRK3502

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将
    的头像 发表于 12-20 10:35 ?668次阅读

    标贝智能语音识别在智能会议场景中的落地案例

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将
    的头像 发表于 12-20 10:31 ?833次阅读
    标贝<b class='flag-5'>智能</b><b class='flag-5'>语音</b>识别在<b class='flag-5'>智能</b>会议场景中的落地案例

    基于智能语音交互的智能呼叫中心工作机制

    作为实现智能呼叫中心的关键技术之一的智能语音交互技术,它通过集成自然语言处理(NLP)、语音识别
    的头像 发表于 12-03 16:44 ?793次阅读
    基于<b class='flag-5'>智能</b><b class='flag-5'>语音</b>交互的<b class='flag-5'>智能</b>呼叫中心工作机制

    智能语音的驱动力:揭秘8脚语音芯片在智能设备中的非凡角色

    语音技术渗透生活,8脚语音芯片以微缩体积、低功耗、卓越性能成智能设备语音功能核心,集成识别、合成、压缩解码等功能,实现精准
    的头像 发表于 12-02 14:23 ?606次阅读

    语音识别技术的应用与发展

    语音识别技术的发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习技术的进步,这项技术才真正成熟并广泛应用于各个领域。语音
    的头像 发表于 11-26 09:20 ?1760次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于
    的头像 发表于 11-18 15:12 ?2249次阅读

    语音集成电路是指什么意思

    系统、智能家居等领域。以下是关于语音集成电路的介绍: 1. 语音集成电路的基本概念 语音集成电路是一种集成了多种语音处理功能的电子芯片。它能
    的头像 发表于 09-30 15:44 ?1010次阅读