0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA助力阿里巴巴天猫精灵大幅提升服务运行效率

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 作者:NVIDIA英伟达企业解 ? 2022-07-14 10:05 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

天猫精灵智能引擎团队、智能合成团队与 NVIDIA 团队合作,通过利用 NVIDIA TensorRT 加速流式语音合成(Text-to-Speech,以下简称 TTS)深度学习模型,并借助 NVIDIA Triton 推理服务器在 NVIDIA T4 GPU 上进行高效部署,帮助阿里巴巴天猫精灵流式 TTS 服务将吞吐提升 50%,首包延时降低 35%,大幅提升服务运行效率,提升资源利用率。

天猫精灵(Tmall Genie)是阿里巴巴消费者人工智能一级公司,于 2017 年 9 月发布第一代天猫精灵智能终端 X1。让用户以自然语言对话的交互方式,实现影音娱乐、购物、信息查询、生活服务等功能操作,成为消费者的家庭助手。目前,天猫精灵已经服务超过 3000 万中国家庭,在三方权威统计中不仅智能音箱产品出货量排名中国前列,其产品并已可连接 3 亿以上的家庭 AIoT 生态设备。

除了智能音箱终端产品外,天猫精灵推出 AliGenie 开放平台,旨在构建基于 AI 的多模态交互及服务系统,为多种云应用提供跨系统服务能力,实现端云协同、跨平台多终端快速接入。该开放平台提供高性能且高质量的语音 AI 能力,包括多种不同音色的高度拟人、高度流畅的语音合成算法等。

此外,天猫精灵基于 AliGenie 开放平台,还提供基于芯片/模组的硬件解决方案,以及通用的热门行业解决方案。专注生活多个领域,提供一站式解决方案。

本案例中负责实施的是天猫精灵智能引擎团队以及天猫精灵智能合成团队。天猫精灵智能合成团队负责语音合成等生成式算法的研究及开发;天猫精灵智能引擎团队主要支撑天猫精灵业务线各项业务的工程化落地,如语音识别、语义理解、语音合成、图像处理等 AI 核心场景。

流式 TTS 是天猫精灵工作流中最为重要的 AI 环节之一。在这一场景中,天猫精灵智能引擎团队面临着如下挑战:

首先流式 TTS 对于首包延时有着严格要求,否则用户将会因为较长的反馈迟滞而感到不适,这就要求 TTS 工作管线的每个模块的推理能够高效地执行。

另一方面,团队希望 TTS 服务的吞吐能够达到较高水平,这就需要在服务端对收到的多个流式合成请求进行 Batching 的处理。但流式 TTS 工作管线包含声学模型和声码器等多个模块,在 GPU 上进行 Batching 操作需要正确维护和切换每个合成请求所需的模型状态,因此需要特别设计工作管线和调度逻辑。

最后,如何尽可能提升 GPU 资源利用率是降本增效的关键。最直接的思路便是在一张 GPU 上部署多个模型来提升利用率。因此,如何在同一张 GPU 上对多个模型进行高效的调度和管理也成为了一个挑战。

基于以上挑战,天猫精灵智能引擎团队、智能合成团队与 NVIDIA 解决方案架构团队合作,采用NVIDIA TensorRT对模型进行推理加速,并利用NVIDIA Triton 推理服务器在 T4 GPU 上进行在线部署,形成了一套高效的流式 TTS 推理部署方案。在提升用户体验的同时,大幅降低了服务成本。

首先,该方案使用 TensorRT 对流式 TTS 工作管线中的每一个模型进行优化加速。我们将训练好的声学模型和声码器,导出为 ONNX 模型格式,再使用 TensorRT 将 ONNX 模型转换为最优化的 TensorRT Engine。使用 TensorRT 加速的 TTS 模型,能显著提升推理执行的速度,从而尽可能压缩首包延时。

另一方面,天猫精灵智能引擎团队与 NVIDIA 团队合作设计并实现了一种基于 Triton 的流式 TTS 推理部署管线。在该方案中,我们使用 Triton Custom Backend 实现串联 TTS 各个模型的调度管线。对于管线中的每一步推理处理,会调用部署在 Triton 上的 TTS TensorRT Engine。如此一来,Triton 便可将发送到服务端的 TTS 请求,有条不紊地调度到管线中的每个模块进行推理执行。并且,在该管线中,我们实现了适用于 GPU 平台的流式 TTS 高效调度机制,通过在服务端 Custom Backend 中维护每个合成请求的状态,实时地将模型输入和状态动态聚合为对 GPU 友好的 Batch,交由管线中各个模块的 TensorRT Engine 进行推理,从而大幅提升管线吞吐和 GPU 利用率,同时保证了对每个合成请求的快速响应。此外,流式 TTS 中一句话的合成请求会对应多个回包,每个回包承载一个音频块。针对这种一收多发的推理模式,我们利用 Triton 提供的 Decoupled Responses 机制,保证一个请求的多个回包能够正确高效地发送给对应的客户端,使用户能听到完整且流畅的音频。

最后,为了进一步提升 GPU 资源利用率,该方案利用了 Triton 的 Concurrent Model Execution 特性。该特性将部署在 Triton 上的模型或模块,以模型实例的方式管理:一个模型可以部署多个实例,不同模型的实例也可部署在同一GPU上。因此该方案开启了 Concurrent Model Execution 后,同一个 T4 GPU 上可部署多个 TTS 发音模型,使得多个模型实例的推理在 GPU 算力资源充足时可以达到并行执行。如此一来,GPU 算力资源可以被多个模型的并行执行充分利用起来,达到降本增效的目的。

通过使用基于 NVIDIA TensorRT 和 Triton 推理服务器的流式 TTS 推理部署方案,天猫精灵 TTS 服务的吞吐提升约 50%,首包延时降低约 35% ,帮助天猫精灵节省了业务成本,提升了用户体验。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5324

    浏览量

    106644
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1638

    浏览量

    48287
  • TTS
    TTS
    +关注

    关注

    0

    文章

    53

    浏览量

    11200
  • 天猫精灵
    +关注

    关注

    4

    文章

    96

    浏览量

    11768

原文标题:NVIDIA TensorRT 和 Triton 助力阿里巴巴天猫精灵显著提升流式语音合成服务运行效率

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    阿里云是什么?企业不可不知的云端架构服务

    阿里云是什么?中国高速连线阿里云 CDN 服务 阿里云为国内云端市场中市占有率第一的云平台,由阿里巴巴集团自主研发,在国内使用的线路品质稳定
    的头像 发表于 03-16 09:43 ?610次阅读

    阿里云爆发式的跨越

    表示,阿里巴巴与苹果的合作,将不仅仅局限于手机服务领域,未来还将涉及更多的业务板块。 当媒体都在惊叹与讨论苹果为什么选择阿里巴巴时,背后真正的主角还需要加上一个 “云” 字。 长期以来,相比淘宝、
    的头像 发表于 03-12 16:54 ?461次阅读
    <b class='flag-5'>阿里</b>云爆发式的跨越

    Arm与阿里巴巴合作加速端侧多模态AI体验

    Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)近日发布与阿里巴巴集团轻量级深度学习框架 MNN 的又一新合作。
    的头像 发表于 03-10 09:07 ?681次阅读

    谷景阿里巴巴国际站正式上线

    在行业发展的关键节点,谷景电子取得了重大突破,谷景阿里巴巴国际站正式上线!此次上线聚焦电感领域,旨在为全球客户提供更较大好的电感产品与服务,也标志着谷景电感业务在国际化道路上迈出了关键一步。
    的头像 发表于 02-26 09:44 ?485次阅读

    阿里巴巴否认投资DeepSeek传闻

    近日,市场流传出一则消息,称阿里巴巴计划向人工智能企业DeepSeek投资10亿美元,意在获取该公司10%的股份,并考虑将阿里云作为其首要推理算力平台。此消息一出,立即引起了市场的广泛关注和热议
    的头像 发表于 02-10 09:10 ?610次阅读

    阿里巴巴否认投资DeepSeek

    近日,有传闻称阿里巴巴计划以100亿美元的估值,投资10亿美元认购中国AI初创企业DeepSeek的10%股权。然而,阿里高管颜乔迅速对此进行了否认,他表示:“同为中国杭州企业,我们为DeepSeek的成就鼓掌,但外界流传的阿里
    的头像 发表于 02-08 16:47 ?696次阅读

    猫精灵与夸克团队携手设计AI眼镜

    近日,阿里巴巴集团内部的智能互联事业群迎来了新的管理变革,由总裁吴嘉正式接管这一关键业务板块。作为阿里巴巴面向广大消费者的重要硬件业务之一,“猫精灵”将继续保持其独立运营的特色与优势
    的头像 发表于 01-20 10:28 ?2101次阅读

    阿里AI To C业务调整:猫精灵与夸克融合,探索AI眼镜

    近日,阿里集团内部进行了一次业务调整,智能互联事业群正式由智能信息事业群总裁吴嘉接管。智能互联事业群是阿里在2022年成立的一级业务部门,其核心品牌为猫精灵,是
    的头像 发表于 01-17 10:16 ?792次阅读

    阿里巴巴出售高鑫零售股权,聚焦核心业务

    近日,阿里巴巴集团正式对外发布公告,宣布其子公司及New Retail与德弘资本达成了一项重要协议。根据该协议,阿里巴巴将出售其所持有的高鑫零售全部股权,这些股权合计占高鑫零售已发行股份总数的约
    的头像 发表于 01-02 10:54 ?480次阅读

    阿里巴巴74亿出售银泰百货予雅戈尔

    近日,电子商务巨头阿里巴巴集团宣布了一项重大决策,决定将旗下银泰百货的全部股权转让给由雅戈尔集团与银泰管理团队联合组成的财团。这一消息引起了业界的广泛关注。 据悉,此次交易涉及的金额高达74亿元
    的头像 发表于 12-18 10:04 ?493次阅读

    阿里巴巴将在美国推出AI电商工具PIC COPILOT

    人工智能领域的一次重要尝试,旨在利用先进的AI技术为美国电商市场提供更加智能化、便捷化的服务。该工具将深度融合阿里巴巴在大数据、云计算以及电子商务领域的深厚积累,通过智能算法和数据分析,帮助商家更加精准地把握市场需求,提升运营
    的头像 发表于 12-06 10:52 ?1098次阅读

    阿里巴巴整合电商资源,成立全新电商事业群

    业群将由蒋凡担任CEO,直接向吴泳铭汇报。该事业群将全面覆盖并整合阿里巴巴旗下的淘宝猫集团、国际数字商业集团,以及1688、闲鱼等核心电商业务。这一整合举措旨在打造一个覆盖国内外全产业链的综合性业务集群,进一步提升
    的头像 发表于 11-22 10:51 ?542次阅读

    阿里巴巴国际站首推全流程AI产品

    近日,阿里巴巴国际站正式推出了其首个全流程AI产品——AI生意助手2.0。这一创新产品的问世,标志着阿里巴巴助力中小企业外贸经营方面迈出了重要一步。
    的头像 发表于 10-30 16:12 ?804次阅读

    阿里巴巴完成双重主要上市

    8月28日阿里巴巴在香港联交所主板主要上市,成为在港交所、纽交所双重主要上市的公司。如今,阿里巴巴完成双重主要上市。 此外,有投资机构认为阿里巴巴最快有望于9月份就纳入港股通。 截至8月28日收盘,
    的头像 发表于 08-29 16:06 ?651次阅读

    阿里巴巴季报出炉 阿里云二季度营收增长6%

    阿里巴巴季报出炉我们一起来围观一下,根据阿里巴巴集团发布的截至2024年6月30日的第二季度经营业绩数据显示,阿里巴巴该季度营收达到2432.4亿元,而上年同期营收2341.56亿元,同比增4%;经
    的头像 发表于 08-16 16:45 ?850次阅读