0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究自然语音交互系统带来人机对话新体验

bNZh_Ali ? 来源:AliOS ? 作者:AliOS ? 2021-05-19 14:16 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

不难发现,现在「车载语音交互」的体验越来越完善。它不仅能完成更多的指令,而且能和我们进行情感交互,甚至还懂得一些基本的伦理纲常。AI语音交互,同样正在占据我们生活应用中的每一个入口,现在,被视作“第三空间”的汽车场景,通过自然连续对话完成人车之间的主动交互,正在成为现实。

回顾发展之初,车载语音虽然能完整跑通 ASR、TTS 这些流程,能实现一些简单的 NLU/NLP 能力,但体验有很多漏洞,比如有可能识别失败,指令完成缓慢,交互逻辑不合常理等等。如今来看,这些基础能力正变得更强,基本可以称得上是一个「有价值的工具」。

另一方面,语音交互作为智能网联汽车的“灵魂”,一直是车联网公司和主机厂发力的重点领域。目前市面上常见的车载系统每次交互都得说出唤醒词,无法做到自然连续对话。相比市场同类车载系统,基于AliOS底层技术开发的斑马智行VENUS系统,在AI语音功能智能化程度上有了更高突破,不仅具备人类亲和力的特质和逻辑思维能力,同时,整个对话体验更加自然流畅,能带给用户更具情景化、更有温度的用车体验。

实际上,新斑马语音产品在快、准、自然的交互体验基础上,开创了全双工、全场景、全闭环的交互特色,并第一次在车内实现了个性化声音克隆的技术。

语音基础能力方面,新斑马语音背靠阿里巴巴达摩院,提供ECNR、VW、ASR、TTS等全链路语音基础能力,并且在汽车语义上投入重兵与达摩院合作共建,保障在核心能力上的领先性和特色。

语音交互特性方面,重点演进了全双工交互能力,并且开发了可见即可说、全时唤醒、灵动唤醒词、多TTS引擎、双模态交互、个性化声音克隆等交互特色。其中声音克隆技术可以将用户的声音复制到车内,提供更加个性化的趣味体验。

同时,在与车场景结合方面,斑马语音拥有全场景、全闭环的交互体验。在地图导航、多媒体、通讯、车控车设四大场景上进行了深度挖掘,与语音进行深度结合,实现动口不动手的语音交互体验。同时为支付宝车载小程序开放平台提供语音开放能力,让接入汽车的支付宝车载小程序都可以使用语音进行交互。

自然语音交互系统- 全双工交互技术

一次唤醒多次输入

更高效更接近人类交互习惯

基于场景的上下文预测

边说边听,边听边想

全双工交互具有一次唤醒多次输入、边说边听边听边想、基于场景进行上下文预测等能力。相比传统语音交互方式,全双工更接近人类习惯,是语音交互到自然交互的必备阶段。

实现全双工语音交互,面临着多项技术挑战:如何在机器说话的同时清楚地接收用户说话的信号?如何保证持续不断地接收用户完整的信息表达?如何在保证准确理解的前提下控制误触发?这些问题在汽车环境中会被不断放大,阻碍技术的落地应用。

斑马依托达摩院降噪、回声消除、流式ASR、流式NLU、专项NLU拒识模型等前沿技术,在大规模实车数据的训练下,实现了真正的全双工交互技术在车内的大规模使用。

自然语音交互系统- 声音克隆技术

基于深度神经网络

快速生成TTS声音模拟

个性化自然交互体验

让最熟悉的声音一路相伴

声音克隆技术只需要提取用户5-10分钟的声音片段,就可以提取出他的声音特征,进而训练出和他的声音相似的TTS声音。传统的TTS技术需要获得几十小时的数据才能够进行TTS的发音人训练。而基于深度神经网络,斑马声音克隆系统在5-10分钟的声音片段中,就可以通过声音特征提取训练、声音合成器训练和声码器训练完成TTS声音的模拟。

声音克隆技术在车内可以为你带来更加个性化的自然交互体验,你可以把车内的声音设置成自己的爱人、子女、父母等亲人的声音,为自己的行车生活增添更多的温暖。

有了声音及语意上的天然优势,再加之AI大数据的后端支持,斑马智行VENUS实现了“智商情商双进步,聊啥都懂”的突出能力。具体来看,斑马智行VENUS AI语音技能将覆盖500多个常用知识领域,无论是查天气、查股票,还是幽默段子,都能“随问随答”。

随着5G物联网自动驾驶等技术的成熟,车载语音助手必然会替代我们现有的人车交互方式,一款好的车机语音对汽车而言,显得尤为重要。在近日对外透露的斑马5计划中,「对话式导航」将成为下一项语音交互黑科技。不久的将来,影视剧中如霹雳游侠那般的人车对话也终将会实现。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2933

    文章

    46463

    浏览量

    395598
  • ASR
    ASR
    +关注

    关注

    2

    文章

    44

    浏览量

    19203
  • 5G
    5G
    +关注

    关注

    1360

    文章

    48851

    浏览量

    576776
  • 自动驾驶
    +关注

    关注

    790

    文章

    14396

    浏览量

    171464

原文标题:自然语音交互系统 带来人机对话新体验

文章出处:【微信号:AliOS,微信公众号:AliOS】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人机交互:连接人类与数字世界的桥梁

    人机交互(Human-Computer Interaction, HCI)是研究人与计算机系统之间信息交流方式的学科,旨在优化用户体验,提高交互效率。随着人工智能、虚拟现实(VR)和物
    的头像 发表于 08-11 15:21 ?122次阅读

    广州唯创电子WTN6/WTV系列语音芯片:赋能净水机智能升级新体验

    新体验。一、智能语音交互:重塑净水机人机交互体验唯创电子语音芯片通过深度集成,为净水机带来三大核
    的头像 发表于 07-24 08:35 ?144次阅读
    广州唯创电子WTN6/WTV系列<b class='flag-5'>语音</b>芯片:赋能净水机智能升级<b class='flag-5'>新体验</b>

    蓝牙语音遥控器:智能家居的智慧控制核心

    和低功耗特性,成为理想选择。 蓝牙语音遥控器不仅是智能家居控制的枢纽,更是技术进步的缩影。其便捷的操作、智能的语音交互和低功耗设计,为用户带来了智慧生活的全
    发表于 06-01 20:24

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    通过网络连接云端服务器进行快速检索和分析,然后利用语音合成技术将答案以自然流畅的语音反馈给用户。同时,借助开发板的网络连接功能,语音机器人还可以与后台管理
    发表于 05-28 11:36

    蓝牙语音遥控器 低功耗芯片选型HS6621CxC/OM6621

    系列凭借高集成度和低功耗特性,成为理想选择 蓝牙语音遥控器不仅是智能家居控制的枢纽,更是技术进步的缩影。其便捷的操作、智能的语音交互和低功耗设计,为用户带来了智慧生活的全
    发表于 05-22 15:23

    具身智能工业机器人人机交互设计:重新定义人机协作新体验

    在工业 4.0 时代,机器人不再是冰冷的机械臂,而是成为与人类协同创造价值的 “智能伙伴”。富唯智能凭借具身智能工业机器人人机交互设计,突破传统操作界面的局限,通过自然语言、手势识别、力控反馈等多模态交互技术,构建了安全、高效、
    的头像 发表于 04-07 15:02 ?492次阅读

    零知开源——ESP32语音交互系统(AI小智)开发教程

    小智AI聊天机器人是一个基于嵌入式硬件与人工智能技术深度融合的智能交互系统。该项目以ESP32开发板为核心,结合语音唤醒、自然语言处理、音频解码播放及图形化
    的头像 发表于 03-29 15:33 ?7873次阅读
    零知开源——ESP32<b class='flag-5'>语音</b><b class='flag-5'>交互</b><b class='flag-5'>系统</b>(AI小智)开发教程

    RTC实时语音对话:开启人机交互新生态,AI大模型智能联动

    在当今科技飞速发展的时代,AI大模型技术的爆发让语音交互成为了人机协同的关键入口。就像Gartner预测的那样,到2028年,15%的日常工作决策将由AIAgent自主完成。但传统基于Http的
    的头像 发表于 02-26 18:23 ?1711次阅读
    RTC实时<b class='flag-5'>语音</b><b class='flag-5'>对话</b>:开启<b class='flag-5'>人机交互</b>新生态,AI大模型智能联动

    OPPO Find N5接入DeepSeek-R1,打造智能交互新体验

    备受瞩目的全球最薄折叠旗舰OPPO Find N5即将正式发布,并将率先接入DeepSeek-R1智能系统。这一创新结合将为用户带来前所未有的智能交互体验,首批购买用户将有机会率先体验这一
    的头像 发表于 02-12 14:16 ?526次阅读

    清华牵头深开鸿参与:混合智能人机交互系统获批立项

    攻关任务,由工业和信息化部主责推进。 该项目的目标是研发一套面向混合智能的自然人机交互软硬件系统,旨在提升人机交互自然性、智能性和高效性。通过结合清华大学在人工智能、
    的头像 发表于 01-23 16:33 ?949次阅读

    启英泰伦新推出多意图自然说,重塑离线人机交互新标准!

    智能语音识别技术作为人机交互领域的一场革命性突破,正逐步重塑我们与智能设备的交互方式。近期,启英泰伦新推出了多意图自然说技术,进一步增强了人机交互
    的头像 发表于 01-03 16:01 ?634次阅读
    启英泰伦新推出多意图<b class='flag-5'>自然</b>说,重塑离线<b class='flag-5'>人机交互</b>新标准!

    语音芯片赋能可穿戴设备:开启个性化音频新体验

    语音芯片与可穿戴设备合作,带来定制化音效、智能降噪、个性化推荐、语音交互及跨设备共享等,引领个性化音频时代,提升用户听觉体验。
    的头像 发表于 12-14 15:44 ?1003次阅读

    语音识别与自然语言处理的关系

    人机交互的革命,使得机器能够更加自然地与人类沟通。 语音识别技术概述 语音识别,也称为自动语音识别(ASR),是指将人类的
    的头像 发表于 11-26 09:21 ?1635次阅读

    具身智能对人机交互的影响

    在人工智能的发展历程中,人机交互一直是研究的核心领域之一。随着技术的进步,人机交互的方式也在不断演变。从最初的命令行界面,到图形用户界面,再到现在的自然语言处理和
    的头像 发表于 10-27 09:58 ?1109次阅读

    科大讯飞发布星火极速超拟人交互,重塑智能对话新体验

    8月19日,科大讯飞震撼宣布了一项关于其明星产品——星火语音大模型的重大革新,即将推出的“星火极速超拟人交互”功能,预示着人机交互的新纪元。该功能定于8月30日正式登陆讯飞星火App,面向广大用户开放体验,引领一场前所未有的智能
    的头像 发表于 08-20 16:46 ?831次阅读