0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里语音机器人首次实现与主播的实时互动 反应速度是Siri的20倍

工程师邓生 ? 来源:猎云网 ? 作者:猎云网 ? 2020-11-02 17:47 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

10月30日消息,刚刚结束的李佳琦直播间里,剁手党通过阿里语音机器人首次实现与主播的实时互动。直播过程中,数十万用户同时用语音回答李佳琦的提问,最终机器人在50毫秒内就完成了语音识别和语音反馈全过程,反应速度是传统语音的20倍。

淘宝直播间观众用语音与李佳琦互动

今年双11期间,淘宝直播间推出 “语音猜价格”功能,观众在直播间也能实现语音交互,例如动动嘴就可以响应主播发出的猜产品价格任务。语音机器人成为决定这一互动过程能否顺畅的关键。

据介绍,一场淘宝直播的观众数量可达百万甚至千万,并且用户分布在全国各地,口音差异较大,目前主流的语音技术方案很难做到短时间内快速响应如此体量的用户语音,例如类似Siri识别用户语音的响应时长就在1秒以上,无法满足直播场景强互动的要求。

此次淘宝直播间采用了达摩院最新的移动端离线端到端语音识别技术。基于全新的网络结构和语音识别框架,即便在低配手机上,也能在50毫秒内完成语音交互过程,速度是传统语音识别的20倍;此外,该技术还解决了快语速、重口音等问题,高难度场景中的语音识别错误率降低近三成。

达摩院语音实验室技术专家万玉龙表示,“在实时性要求极高的场景,传统的云端语音方案无法满足需求,这套语音技术的创新在于同时实现了识别速度和准确度的提升,语音AI模型部署在每个用户的淘宝直播APP上,即便直播间有千万级别的用户,AI也不会漏听慢判。”

过去几年,阿里语音AI在基础研究和应用上取得了一系列突破。2019年,阿里语音AI入选《麻省理工评论》“全球十大突破性技术”,是唯一上榜的中国科技公司;今年7月IDC发布的《中国AI云服务市场半年度研究报告》显示,阿里语音AI以44%的市场份额,在云上语音AI市场中位居第一。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    29835

    浏览量

    213695
  • 语音识别
    +关注

    关注

    39

    文章

    1786

    浏览量

    114353
  • Siri
    +关注

    关注

    4

    文章

    206

    浏览量

    37919
  • 阿里
    +关注

    关注

    6

    文章

    455

    浏览量

    33383
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业机器人的特点

    的基础,也是三者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、智能农机、3D 打印机等领域。而智能制造装备中工业
    发表于 07-26 11:22

    机器人遇上“语言障碍”:CCLINKIE转Profinet的“破冰外挂”来啦\\!

    的时间); 即插即用部署:某国产车企焊装线实测,无需修改原有PLC程序,3小时完成网关部署,改造后机器人响应速度提升8,单班产能增加120台。 三、从“设备孤岛”到“协同作战” 在新能源汽车电驱产线
    发表于 06-04 14:31

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    的四核1.4GHz处理器具备强劲的运算性能,能够高效处理语音机器人运行过程中的复杂任务。语音识别和合成需要大量的计算资源,该处理器可以快速对语音信号进行分析、处理和转换。在
    发表于 05-28 11:36

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    详细介绍机场智能指路机器人的工作原理

    和周围环境变化。激光雷达和摄像头持续检测前方是否有障碍物,一旦发现障碍物,导航系统会立即调整路径,引导机器人避开障碍物,确保行走安全。同时,机器人会根据实时的人流情况,动态调整行走速度
    发表于 05-10 18:26

    【「# ROS 2智能机器人开发实践」阅读体验】+内容初识

    讲解了如何在 ROS 2 中实现机器人的运动控制,包括速度控制、位置控制等。通过编写运动控制节点,可以接收来自上层的控制指令,如速度指令或目标位置指令,然后通过底层的驱动程序控制
    发表于 04-27 11:24

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    识别联调。 进迭时空致力于为智能机器人提供完整全栈优化的RISC-V AI软硬件解决方案,第一代RISC-V AI CPU芯片K1已完成AI视觉感知、AI语音处理、自动避障、路径规划、运动控制等
    发表于 04-25 17:59

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    ,一次生成深度信息。 自主机器人定位任务的本质是对机器人自身状态的估计问题,包括位置,朝向,速度等问题。 路径规划旨在找到从起点到目标区域的路径,确保路径的可行性和最优性。路径规划方法包括变分方法,图搜
    发表于 01-04 19:22

    开源项目!能够精确地行走、跳舞和执行复杂动作的机器人—Tillu

    认识Tillu——机器人 Tillu是一款融合先进机器人技术与创造力的独特机器人,旨在激发学习与创新!它由运行Debian操作系统的UNIHIKER驱动,利用强大的控制系统实现逼真的动
    发表于 01-02 17:24

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    中取得了令人瞩目的效果。 阅读感悟 从传统的手动编程到借助大模型实现智能化、自主化,从单一模态的交互到多模态信息的深度融合,再到扩散模型的应用,机器人控制技术正在以惊人的速度进化。这不仅让机器
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    现状和前沿研究,详细介绍大模型的构建方法、训练数据、模型架构和优化技术。 第4部分(第10章到第13章)深入探讨提升机器人计算实时性、算法安全性、系统可靠性及具身智能数据挑战的具身智能机器人系统研究
    发表于 12-28 21:12

    【「具身智能机器人系统」阅读体验】+初品的体验

    解决许多技术的和非技术的挑战,如提高智能体的自主性、处理复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感技术与机器人技术相结合,以探索更加先进的知识表示和记忆模块,利用强化学习进一步优化决策过程
    发表于 12-20 19:17

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    ,互联网行业占成熟经济体的GDP增长的21%,世界经济正面向数字经济转型的大趋势。具身智能机器人集成人工智能、高端制造、新材料等技术,其核心在于通过智能体与环境的动态互动实现智能行为。 在第2章“具身
    发表于 12-19 22:26

    汤姆猫发布AI语音情感陪伴机器人研发进展

    ,能够智能识别声音来源的位置与方向,实现120°的自由转头,确保始终面向用户进行语音对话。这一设计不仅增强了机器人互动性,还大大提升了用户的沟通体验。 此外,汤姆猫AI
    的头像 发表于 12-17 11:27 ?1315次阅读

    机器人语音功能

    经典卡通角色的声音成为了它们的“名片”。那么,机器人语音功能究竟是如何实现的?它与智能模组有什么关系?谁是这类服务机器人语音“指挥官”?
    的头像 发表于 12-02 10:50 ?1245次阅读