0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软在人工智能TTS语音合成技术上的最新进展

微软科技 ? 来源:微软科技 ? 作者:微软科技 ? 2022-02-08 09:27 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

小编说:在这个技术快速更迭的时代,人工智能的可能性在逐渐拓宽。为了让大家可以更好的理解人工智能在智能语音方面的强大能力,今天小编就来详细为大家介绍微软在人工智能TTS语音合成(Text-to-Speech)技术上的一些最新进展。

不同对话场景

用户期待不同语气的拟人 AI 语音

TTS 语音已被越来越多地用于支持人机对话或机器辅助的日常交流——例如人与人之间对话的同声传译。在这些场景中,人们普遍期待能够实现更自然、更口语化的对话风格。我们不妨从以下三个典型场景中,来理解用户对于对话声音和风格的不同需求。

客服机器人:语气要自然、友好且专业

很多企业正在使用支持语音的聊天机器人或 IVR(互动式语音应答)系统,为客户带来相比传统方式更为高效、体贴的客户服务。例如国际移动通讯网络公司沃达丰就成功地创建了一个拥有自然语音的客服机器人 TOBi。Azure 的人工智能和自然语言处理功能赋予了 TOBi 鲜明的个性,使客户与 TOBi 之间的人机对话变得轻松自然,让客户更乐于与之交流。

设想这样的情景:在客户对 TOBi 报出姓名后,当 TOBi 需要了解客户的地址以便提供进一步服务时,TOBi 并不会生硬地接着发问:「请说出您的地址。」而是会这样表达:「嘿,好名字!接下来我还需要了解一下您住在哪里?」此时此刻,客户一定希望 AI 能够以听起来热情、友好、温暖,且又专业的声音来说出这句话。类似的需求不仅体现在 AI 解答客户疑问时,还适用于 AI 语音向客户打招呼,或表达共情态度时。个人助理:表情符号、重点强调要读懂

随着虚拟助手和虚拟现实技术的兴起,使用 Neural TTS 来支持闲聊和日常对话功能的客户数量正在不断增加。想要让 AI 与人类的对话更加自然,最主要的挑战之一在于如何让 AI 理解包含特殊字符在内的聊天用语——比如「呵呵」、「哈哈」、「哎哟」这类词汇。

这类表情符号,还有重复字母如「soooo good」——然后再以自然的语气提供即时响应。此外,让 AI 能使用不同的信息来表达相应情感,从而表现出对人类感受的共鸣感,也正在成为一种越来越普遍的用户需求。同声传译:翻译前后说话风格、语气要一致

语音互译是又一个对话式 AI 语音可支持的典型场景。Azure Neural TTS 已覆盖 110 多种不同语言,被应用于多种翻译场景中。不过,如何在翻译的同时保持讲话者的原始语气风格,一直都是个挑战。尤其是在较为随意的对话场景中,讲话者往往会使用语气上的细微差别来与听众建立情感联系。在这种情况下,如果 AI 语音可在提供同步翻译的同时,又能捕捉并理解讲话者的风格,就能使不同语言之间的对话依然生动且具有吸引力。

Azure Neural TTS

进化:多国语言皆可栩栩如生户

Sara(英语):更能表现自然情感的聊天机器人语音

Sara 是一个新近推出的美式英语音色,尤其擅长轻松的对话。「她」有着轻松自然的年轻女性声线,能够胜任各种需要聊天机器人的场景。Sara 拥有三种情绪:快乐、悲伤和气愤。她在阅读表情符号时,可以发出笑声、叹息或气愤语气,而且还能发出「太~(拉长语调)好了」这种人类特有的语调。播放下面的语音,亲耳感受一下效果。

下面这段录音,来自 Sara 作为聊天机器人与人类用户之间的自然对话。(此示例来自机器人和人类用户之间的闲聊,对话很随意,可能包含错误。)

除了预设的几种「情绪」,用户还可以通过 SSML 让 Sara 在常规交流、欢快、悲伤和愤怒等几种语气风格之间随意切换。

晓辰和晓颜(中文普通话):专为日常对话及客服场景而优化的全新中文语音

晓辰和晓颜是专为中文用户提供的普通话语音。其中晓辰擅长逼真的自然语气,晓颜与客户服务场景更匹配。晓辰和晓颜最显著的特征,在于能逼真模仿人类在日常场合下的交流。与朗诵、播音这类「严肃」场合不同,人们的日常对话中除了语气随意,韵律多变,而且常常出现词语发音不完整,句子语法不像课本那么严谨,且会出现重复、不完整、或者啰嗦等情况。借助先进的建模技术,晓辰和晓颜的 AI 语音能够学习并活用这些人类表达的「缺陷」,并逼真地还原这些「不完美」,使合成语音听起来更加真实亲切。在下面这段客服场景模拟对话中,晓颜是客服助理,晓辰是客户。您可以从中感受到他们如同真人一般轻松、自然的对话语气。

Nanami(日语):元气满满的东瀛女声

Nanami 是拥有动听女性声线的日语语音。「她」有着三种不同语音风格:聊天风格、客服风格和开朗风格,让合成语音在各种场景中都更具吸引力。

来听一听 Nanami 元气满满的声音:

现在就来感受

Azure Neural TTS 拟人语音的动人表现力吧!

微软不断倾听全球用户对于 Azure Neural TTS 在不同情况下语音发音准确性的反馈,以负责任的 AI 及公平、可靠和安全、隐私和保障、包容、透明、负责的六项人工智能准则为前提,进行了这次更新,为用户带来表达更自然、语义更清晰的语音体验。现在,微软的文本转语音可以支持超过 110 种语言的 270 多种 AI 语音。如果想亲身感受 Azure Neural TTS 的强大,就来 Azure 官网亲自体验吧!还有声音定制平台可以即刻为企业创建多种语言和风格的独特品牌语音。

原文标题:什么!跟我说话的竟然是AI!

文章出处:【微信公众号:微软科技】欢迎添加关注!文转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6690

    浏览量

    105977
  • AI
    AI
    +关注

    关注

    88

    文章

    35505

    浏览量

    281375
  • 人工智能
    +关注

    关注

    1809

    文章

    49163

    浏览量

    250729

原文标题:什么!跟我说话的竟然是AI!

文章出处:【微信号:mstech2014,微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英特尔持续推进核心制程和先进封装技术创新,分享最新进展

    近日,2025英特尔代工大会上,英特尔展示了多代核心制程和先进封装技术最新进展,这些突破不仅体现了英特尔技术开发领域的持续创新,也面向
    的头像 发表于 05-09 11:42 ?272次阅读
    英特尔持续推进核心制程和先进封装<b class='flag-5'>技术</b>创新,分享<b class='flag-5'>最新进展</b>

    百度AI领域的最新进展

    近日,我们武汉举办了Create2025百度AI开发者大会,与全球各地的5000多名开发者,分享了百度AI领域的新进展
    的头像 发表于 04-30 10:14 ?699次阅读

    智能收银语音交互新标杆—WT3000T8语音合成芯片TTS技术应用解析

    一、行业应用背景零售业态智能化转型的浪潮中,收银设备正经历从功能型向服务型转变的关键阶段。WT3000T8语音合成芯片应运而生,专为满足新零售场景下
    的头像 发表于 04-24 08:45 ?329次阅读
    <b class='flag-5'>智能</b>收银<b class='flag-5'>语音</b>交互新标杆—WT3000T8<b class='flag-5'>语音</b><b class='flag-5'>合成</b>芯片<b class='flag-5'>TTS</b><b class='flag-5'>技术</b>应用解析

    芯资讯|WT3000T8语音合成芯片TTS智能收款机中的创新应用设计方案介绍

    一、智能语音播报技术演进与市场需求随着人工智能技术的快速发展,TTS(Text-to-Speech)技术
    的头像 发表于 04-15 08:55 ?376次阅读
    芯资讯|WT3000T8<b class='flag-5'>语音</b><b class='flag-5'>合成</b>芯片<b class='flag-5'>TTS</b><b class='flag-5'>在</b><b class='flag-5'>智能</b>收款机中的创新应用设计方案介绍

    谷歌Gemini API最新进展

    体验的 Live API 的最新进展,以及正式面向开发者开放的高质量视频生成工具 Veo 2。近期,我们面向 Google AI Studio 中使用 Gemini API 的开发者推出了许多不容错过的重要更新,一起来看看吧。
    的头像 发表于 04-12 16:10 ?1077次阅读

    京东方华灿光电氮化镓器件的最新进展

    日前,京东方华灿的氮化镓研发总监马欢应半导体在线邀请,分享了关于氮化镓器件的最新进展,引起了行业的广泛关注。随着全球半导体领域对高性能、高效率器件的需求不断加大,氮化镓(GaN)技术逐渐成为新一代电子器件的热点,其优越的性能使其
    的头像 发表于 03-13 11:44 ?911次阅读

    TTS语音播报模块简介

    现代科技日新月异的时代,语音技术作为人工智能领域的重要分支,正以前所未有的速度改变着我们的生活方式。其中,TTS(Text To Spee
    的头像 发表于 02-18 16:16 ?1107次阅读

    垂直氮化镓器件的最新进展和可靠性挑战

    过去两年中,氮化镓虽然发展迅速,但似乎已经遇到了瓶颈。与此同时,不少垂直氮化镓的初创企业倒闭或者卖盘,这引发大家对垂直氮化镓未来的担忧。为此,本文中,我们先对氮化镓未来的发展进行分析,并讨论了垂直氮化镓器件开发的最新进展以及相关的可靠性挑战。
    的头像 发表于 02-17 14:27 ?1262次阅读
    垂直氮化镓器件的<b class='flag-5'>最新进展</b>和可靠性挑战

    Qorvo在手机RF和Wi-Fi 7技术上最新进展及市场策略

    供应商保持着长期合作关系。近日,Qorvo资深产品行销经理陈庆鸿(Footmark Chen)与Qorvo亚太区无线连接事业部高级行销经理林健富(Jeff Lin)接受了DigiTimes的专访,深入探讨了Qorvo在手机RF和Wi-Fi 7技术上最新进展及市场策略,以
    的头像 发表于 01-15 14:45 ?839次阅读

    FF将发布FX品牌最新进展

    "、"FF"或 "公司")今天宣布,将于2025年1月8日盘后公布其自2024年9月19日FX品牌发布以来的最新进展,包括最新项目进展、重大里程碑、新产品品类战略及下一步计划。
    的头像 发表于 01-03 15:58 ?701次阅读

    揭秘超以太网联盟(UEC)1.0 规范最新进展(2024Q4)

    近期,由博通、思科、Arista、微软、Meta等国际顶级半导体、设备和云厂商牵头成立的超以太网联盟(UEC)OCP Global Summit对外公布其最新进展——UEC规范1.
    的头像 发表于 11-18 16:53 ?1470次阅读
    揭秘超以太网联盟(UEC)1.0 规范<b class='flag-5'>最新进展</b>(2024Q4)

    Qorvo射频和电源管理领域的最新进展

    了半导体行业的重大变革,还成功引领Qorvo成为射频技术的领导者。本次专访中,Philip将为大家分享Qorvo射频和电源管理领域的最新进展,并探讨HPA事业部如何通过
    的头像 发表于 11-17 10:57 ?937次阅读

    智能优化的自动点焊控制系统:电源技术新进展与应用实践

    优化的自动点焊控制系统以其高效、精确的优势,成为了提升焊接质量及生产效率的关键所在,尤其电源技术上新进展为其发展提供了强大动力。 首先,智能优化的自动点焊控制系?
    的头像 发表于 11-16 09:10 ?771次阅读

    芯片和封装级互连技术最新进展

    近年来,计算领域发生了巨大变化,通信已成为系统性能的主要瓶颈,而非计算本身。这一转变使互连技术 - 即实现计算系统各组件之间数据交换的通道 - 成为计算机架构创新的焦点。本文探讨了通用、专用和量子计算系统中芯片和封装级互连的最新进展,并强调了这一快速发展领域的关键
    的头像 发表于 10-28 09:50 ?1221次阅读

    5G新通话技术取得新进展

    探讨5G新通话这一话题时,我们需首先明确其背景与重要性。自2022年4月国内运营商正式推出以来,5G新通话作为传统语音通话的升级版,迅速吸引了公众的目光,并引起了社会的广泛关注。它基于5G网络,代表了通信技术
    的头像 发表于 10-12 16:02 ?1384次阅读