0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm与Stability AI携手合作加快文本转音频的响应速度

Arm社区 ? 来源:Arm社区 ? 2025-03-25 15:54 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Arm 终端事业部产品管理总监 Ronan Naughton

想象一下,你正在智能手机上编辑视频,需要为其添加合适的音效;或是你想要生成自定义声音,用于设置铃声、闹钟或发布社交媒体帖子。你无需在网上搜索或购买音频片段,只需输入一段描述,例如“日落时的轻柔海浪声”,几秒钟后,你的设备就会为你生成合适的声音,甚至无需联网就可实现。得益于 Arm 和 Stability AI 的新合作,这种完全在端侧直接生成音频的技术已变为现实。

Arm 与 Stability AI 携手合作,加快文本转音频的响应速度

Stability AI 是一家专注于图像、视频、3D 和音频领域人工智能 (AI) 模型开发的公司。而 Arm KleidiAI 能够提供专门针对 Arm CPU 的经优化的性能关键例程(即微内核)。通过 KleidiAI 与 XNNPack 库和 ExecuTorch 框架的集成,以及 Stability AI 自身的优化,为 Stability AI 的文本转音频开放模型“Stable Audio Open”带来了显著的 AI 性能提升。

令人惊叹的结果包括文本转音频的 AI 生成时间从几分钟大幅缩短至几秒钟,响应速度提高了 30 倍。Stable Audio Open 模型完全在基于 Arm CPU 的智能手机上运行,且无需联网,对于文本转音频 AI 来说是首创之举。

Stability AI 利用 KleidiAI 自动加速功能,加快模型的响应速度,从而在不影响质量的情况下提升了端侧 AI 性能。KleidiAI 带来的性能提升,无需 Stable Audio Open 模型用户额外投入开发精力,节省了时间和成本。Arm 和 Stability AI 将继续合作,以实现更多性能的跃升,带来更为出色的 AI 用户体验。

显著的性能提升表明,具有针对性的硬件和软件集成,使过往无法实现的 AI 应用在移动端变得可行,从而推动了未来的创新机遇。Arm 技术驱动了全球 99% 的智能手机,这也意味着数十亿智能手机用户现可取得先进的 AI 音频功能。

共同应对复杂的 AI 挑战

Stable Audio Open 模型具备出色的效率,但在智能手机的 CPU 上直接由端侧运行该模型仍非易事。在初期尝试时,单个音频样本的生成时间超过四分钟,这对终端用户而言不太能接受。

通过与 Arm 合作,Stability AI 将模型的训练参数量蒸馏到适合移动端的规模。然后,通过新的蒸馏模型,并利用 XNNPack 与 ExecuTorch 集成带来的 KleidiAI 性能加速,实现了在移动端 Arm CPU 上几秒内就生成音频片段。

Stability AI 首席执行官 Prem Akkaraju 表示:随着越来越多的专业创意工作者和企业采用生成式 AI 来帮助提升其生产流程,我们的模型和工作流必须随处可得,以供构建者和创作者使用,这一点至关重要。我们很高兴能就此与 Arm 合作。从服务器到智能手机,Arm 平台在整个生态系统中应用普及,并且 Arm 通过将 Arm Kleidi 集成到软件栈中,致力于加速各类主流框架中的 AI 模型,因此 Arm 是我们的不二之选。

文本转音频 AI 的兴起

自 2022 年以来,Stability AI 始终立于生成式 AI 发展的前沿,曾凭借行业领先的图像模型 Stable Diffusion 引起轰动。依托 Stable Diffusion 的成功,该公司随后推出了 Stable Audio,这是首个完全获得授权的音频模型之一,专为通过文本提示词生成高质量的音乐和音效而设计。这些 AI 模型在 Hugging Face 等主要平台上均排名前茅,拥有多达数百万规模的用户数,构成了一个活跃的技术社区。

人人皆可享先进的音频 AI 体验

这一成果仅仅只是双方合作的开始,Arm 和 Stability AI 已规划了更多的性能优化举措,旨在为用户带来更加出色的使用体验。通过携手合作,Arm 正在为音频、图像、视频和 3D 领域的端侧 AI 打好基础,重塑每个人创作内容和与数字媒体互动的方式。通过蒸馏先进的模型并利用经过优化的软件,部署到人们常用的硬件设备上,从而为未来铺平道路,实现人人都能通过口袋里的设备直接享受先进的 AI 应用、模型和体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9395

    浏览量

    379852
  • 音频
    +关注

    关注

    30

    文章

    3059

    浏览量

    83742
  • AI
    AI
    +关注

    关注

    88

    文章

    35760

    浏览量

    282482
  • 人工智能
    +关注

    关注

    1810

    文章

    49221

    浏览量

    251554

原文标题:加快 30 倍!Arm Kleidi 赋能端侧音频生成提速

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm 洞察与思考:为什么 AI 向边缘迁移的速度超乎想象

    人工智能 (AI) 正在以惊人的速度发展。企业不再仅仅是探索 AI,而是积极推动 AI 的规模化落地,从实验性应用转向实际部署。随着生成式模型日益精简和高效,
    的头像 发表于 08-11 14:43 ?464次阅读

    SOLIDWORKS2025在性能和响应速度方面进行了大幅提升

    在工程设计领域,软件的性能和响应速度是衡量其效率与用户体验的重要指标。SOLIDWORKS作为CAD软件之一,始终致力于为用户提供更有效、更稳定的设计平台。随着solidworks2025版本的发布,其在性能和响应速度方面实现了显著提升,为全球设计师和工程师们带来了流畅设
    的头像 发表于 08-06 10:25 ?158次阅读

    涂鸦OmniAI Foundation 2.2版本正式发布:AI智能体全面升级,响应速度迅猛提高40%

    助手能够更自然、更精准地理解并响应用户意图。同时,我们联合阿里云带来了涂鸦私有版Qwen模型,为用户打造更快的AI对话响应时间,为各业务场景提供更加强大、灵活、贴近
    的头像 发表于 07-18 19:00 ?447次阅读
    涂鸦OmniAI Foundation 2.2版本正式发布:<b class='flag-5'>AI</b>智能体全面升级,<b class='flag-5'>响应速度</b>迅猛提高40%

    Arm 与微软合作,为基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验

    ArmKleidiAI与ONNXRuntime的集成,为Windows和安卓操作系统带来了显著的AI性能优化,实现高达2.6倍的AI推理速度提升,从而加速应用体验。联合作者:
    的头像 发表于 06-03 16:47 ?525次阅读
    <b class='flag-5'>Arm</b> 与微软<b class='flag-5'>合作</b>,为基于 <b class='flag-5'>Arm</b> 架构的 PC 和移动设备应用提供超强 <b class='flag-5'>AI</b> 体验

    Arm与微软合作加速边缘设备上的AI体验

    随着人工智能 (AI) 成为当今个人电脑 (PC) 和移动设备使用体验(从聊天机器人到生产力提升)中不可或缺的一部分,这些设备对 CPU 高效、可扩展的推理需求也在持续增长。Arm 与微软正携手
    的头像 发表于 05-28 13:54 ?441次阅读

    Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N

    与嵌入式系统的优势,该联合解决方案旨在打造更开放、更灵活的软硬件平台。 “此次合作将提升瑞萨在开源社区的知名度。基于 RZ/V2N 的突破性 BPI-AI2N SOM 有望对多个行业产生重大影响,为工程师
    发表于 03-12 09:43

    AI Agent 应用与项目实战》阅读心得3——RAG架构与部署本地知识库

    分析模型在不同类型数据上的表现,来优化文本分割策略和检索参数,使系统在保持响应速度的同时,能够提供更准确的查询结果。 经过对第6-7章的深入学习,我对RAG技术在工程实践中的应用有了更系统的认识。这一
    发表于 03-07 19:49

    Arm 年度技术大会: 预计2025 年底,全球将有超过 1,000 亿台具备 AI 能力的 Arm 设备

    。值得一提的是,在生态伙伴的携手合作下,Arm预计到2025年底,全球将有超过1,000亿台具备AI能力的Arm设备。
    的头像 发表于 11-22 12:41 ?739次阅读
    <b class='flag-5'>Arm</b> 年度技术大会: 预计2025 年底,全球将有超过 1,000 亿台具备 <b class='flag-5'>AI</b> 能力的 <b class='flag-5'>Arm</b> 设备

    Arm与ExecuTorch合作加速端侧生成式AI实现

    Arm 正在与 Meta 公司的 PyTorch 团队携手合作,共同推进新的 ExecuTorch 测试版 (Beta) 上线,旨在为全球数十亿边缘侧设备和数百万开发者提供人工智能 (AI
    的头像 发表于 11-15 11:30 ?878次阅读

    ADS1246输出Data的响应速度可以达到100ms吗?

    你好,请问当采样率设置为20SPS,PGA=1时,输入电流从4mA跳变到20mA,输出Data的响应速度可以达到100ms吗?谢谢
    发表于 11-15 07:22

    如何提升 ChatGPT 的响应速度

    提升 ChatGPT 的响应速度是一个涉及多个层面的复杂问题。以下是一些可能的方法和策略,可以帮助提高 ChatGPT 的响应速度: 优化算法 : 并行处理 :通过并行处理技术,可以让多个计算任务
    的头像 发表于 10-25 17:39 ?1721次阅读

    神盾集团与Arm达成合作,推动AI HPC晶片创新

    近日,神盾集团在美国宣布了一项重要策略合作。旗下神盾公司与安国国际科技正式加入Arm? Total Design计划,与全球领先的半导体公司安谋(Arm)携手
    的头像 发表于 10-21 15:52 ?932次阅读

    usb转音频线是怎么连接的

    USB转音频线是一种将USB接口转换为音频接口的设备,它通常用于将电脑或其他USB设备的声音输出到音响系统、耳机或其他音频设备。这种转换线可以帮助用户在没有传统音频输出接口的情况下,实
    的头像 发表于 10-08 14:26 ?6229次阅读

    Arm如何赋能无处不在的AI

    作为人工智能 (AI) 的创新基础,众多企业都在使用通用且应用广泛的 Arm 计算平台。迄今为止,合作伙伴基于 Arm 架构的芯片出货量已逾 2,800 亿颗。如今,
    的头像 发表于 09-14 09:38 ?979次阅读

    谷歌Gemini 1.5 Flash模型升级,AI聊天速度飙升50%

    谷歌近期对其Gemini AI系列进行了重大更新,推出了Gemini 1.5 Flash模型。此次升级的核心亮点在于显著提升了AI聊天的响应速度,官方宣称最高可达50%的增速,为用户带来前所未有的流畅体验。
    的头像 发表于 09-06 18:06 ?1309次阅读