0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm SME2 技术加速安卓 AI 升级,驱动移动应用下一代功能革新

A面面观 ? 来源:厂商供稿 ? 作者:Arm ? 2025-07-18 20:28 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从按下快门前就对照片进行即时锐化,到通话过程中实时消除背景噪音,再到离线状态下与人工智能 (AI) 助手互动,端侧 AI 正在重塑移动体验。而 Arm 计算平台正是实现这些无缝交互体验的强劲驱动力。

随着 AI 工作负载变得日益复杂且广泛渗透至各个领域,移动开发者面临的需求也与日俱增:他们需要在内存、电力和热预算等严格且多样化的限制下,实现实时且高效的性能表现,同时确保不会给应用及其工作负载增加额外的复杂性。

为了应对这些挑战,Arm 推出了可伸缩矩阵扩展 2 (SME2) 技术,以直接在移动 CPU 上加速高强度的矩阵计算工作负载——这些工作负载对计算机视觉和生成式 AI 应用至关重要。SME2 是 Armv9 架构中的一组高级 CPU 指令,它基于 SME 升级、能够在 AI 异构计算框架下,高效支持图像处理、自然语言处理、语音生成等实时移动端推理任务。

开发者如何获取 SME2 的优势

移动开发者无需改动现有代码、模型或应用程序,即可直接获取 SME2 带来的性能提升。这得益于 Arm 的软件加速层——Arm KleidiAI,它能够无缝集成到主流运行时库和 AI 框架中,为开发者提供开箱即用的性能体验。

得益于 KleidiAI 深入且广泛的集成,SME2 已在 Google 专为安卓系统优化的神经网络推理库 XNNPACK 中实现支持。此外,SME2 也被集成至多个框架中,包括阿里巴巴 MNN、Google LiteRT 和MediaPipe、微软 ONNX Runtime,以及 llama.cpp。这些集成意味着 SME2 已深度嵌入到软件栈中。当设备支持并启用 SME2 时,XNNPACK 会自动通过 KleidiAI 将矩阵计算密集型任务路由至 SME2,从而让开发者在无需改动任何应用逻辑或基础架构的情况下,直接实现性能提升。

与此同时,KleidiAI 不仅着眼于当下的性能加速,更是为满足未来需求而设计。随着 Arm 不断推出新特性与架构升级,KleidiAI 将持续为所支持的 AI 框架和运行时库带来自动的性能提升,而无需开发者投入额外精力。

大规模 AI 性能与能效优化

搭载 SME2 增强硬件的安卓新机即将上市,开发者可率先通过硬件加速解锁 AI 性能跃升。与此同时,SME2 已支持最新的 iOS 设备[1],只要应用中使用了集成 SME2 的 AI 框架,便可自动享受这些性能提升。

在搭载 SME2 增强硬件的设备上运行 Google Gemma 3 模型时,其聊天交互中的 AI 响应速度比未启用 SME2 的同款设备快六倍。此外,仅用单个 CPU 核心,Gemma 3 便可在不到一秒的时间内启动多达 800 字的文本摘要任务。目前,一家领先的独立软件供应商 (ISV) 已承诺将其应用中的大部分词元 (token) 生成工作负载从云端迁移到移动端,这在一定程度上得益于端侧 AI 能力的持续突破。

Google 安卓杰出软件工程师 Iliyan Malchev 表示:借助 SME2 增强的硬件,更先进的 AI 模型(如 Gemma 3)能够直接在各类设备上运行。随着 SME2 的持续扩展,移动开发者能够在不同生态系统中无缝部署下一代 AI 功能,从而为终端用户带来低延迟、广泛可用的智能手机体验。

除了性能的提升,SME2 还为 Arm 生态系统(如 iOS 与安卓)提供了可移植的解决方案。目前,已有 900 万款应用在 Arm 计算平台上运行,超过 2,200 万名软件开发者基于 Arm 平台构建他们的应用和工作负载。

助力开发者构建 AI 的未来

对安卓开发者而言,他们只要将应用构建在集成了 KleidiAI 的 AI 框架和运行时库之上,就能自动获得 SME2 带来的性能提升,并可在各类设备上无缝部署下一代 AI 功能。

开发者若提前布局,即可确保其应用在 SME2 增强硬件推向市场时实现优化,无需改动任何一行代码,便可为用户带来更快的性能、更低的延迟以及更高的能效。

此外,Arm 还发布了开发者启动平台,帮助移动开发者充分利用 SME2 的技术优势,通过丰富案例展示如何针对 KleidiAI 增强框架进行开发,从而默认激活硬件层面的最新加速能力。

作者:Arm 人工智能平台和开发者平台与服务高级副总裁 Alex Spinelli

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9361

    浏览量

    378076
  • AI
    AI
    +关注

    关注

    88

    文章

    35308

    浏览量

    280681
  • 安卓
    +关注

    关注

    5

    文章

    2155

    浏览量

    58754

原文标题:Arm SME2 技术加速安卓 AI 升级,驱动移动应用下一代功能革新

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    主流厂商揭秘下一代无线SoC:AI加速、内存加量、新电源架构等

    标准等方面进行升级。 ? 下一代物联网产品的新需求 ? 芯科科技无线产品营销高级总监Dhiraj Sogani在接受采访时表示,我们的第一代、第二和第三
    的头像 发表于 07-23 09:23 ?4498次阅读

    驱动下一代E/E架构的神经脉络进化—10BASE-T1S

    随着“中央+区域”架构的演进,10BASE-T1S凭借其独特优势,将成为驱动下一代汽车电子电气(E/E)架构“神经系统”进化的关键技术
    的头像 发表于 07-08 18:17 ?524次阅读
    <b class='flag-5'>驱动</b><b class='flag-5'>下一代</b>E/E架构的神经脉络进化—10BASE-T1S

    下一代高速芯片晶体管解制造问题解决了!

    ,10埃)开始直使用到A7。 从这些外壁叉片晶体管的量产中获得的知识可能有助于下一代互补场效应晶体管(CFET)的生产。 目前,领先的芯片制造商——英特尔、台积电和三星——正在利用其 18A、N
    发表于 06-20 10:40

    下一代PX5 RTOS具有哪些优势

    许多古老的RTOS设计至今仍在使用,包括Zephyr(1980年)、Nucleus(1990年)和FreeRTOS(2003年)。所有这些旧设计都有专有的API,通常更大、更慢,并且缺乏下一代RTOS的必要安全认证和
    的头像 发表于 06-19 15:06 ?494次阅读

    Arm 与微软合作,为基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验

    ArmKleidiAI与ONNXRuntime的集成,为Windows和操作系统带来了显著的AI性能优化,实现高达2.6倍的AI推理速度提升,从而
    的头像 发表于 06-03 16:47 ?466次阅读
    <b class='flag-5'>Arm</b> 与微软合作,为基于 <b class='flag-5'>Arm</b> 架构的 PC 和<b class='flag-5'>移动</b>设备应用提供超强 <b class='flag-5'>AI</b> 体验

    NVIDIA 采用纳微半导体开发新一代数据中心电源架构 800V HVDC 方案,赋能下一代AI兆瓦级算力需求

    全球 AI 算力基础设施革新迎来关键进展。近日,纳微半导体(Navitas Semiconductor, 纳斯达克代码:NVTS)宣布参与NVIDIA 英伟达(纳斯达克股票代码: NVDA) 下一代
    发表于 05-23 14:59 ?1461次阅读
    NVIDIA 采用纳微半导体开发新<b class='flag-5'>一代</b>数据中心电源架构 800V HVDC 方案,赋能<b class='flag-5'>下一代</b><b class='flag-5'>AI</b>兆瓦级算力需求

    光庭信息推出下一代整车操作系统A?OS

    ,正式推出面向中央计算架构、支持人机协同开发的下一代整车操作系统A?OS(AI × Automotive OS),赋能下一代域控软件解决方案的快速研发,显著提升整车智能化水平。 A?OS 核心架构 A?OS采用"软硬解耦、软软解
    的头像 发表于 04-29 17:37 ?610次阅读
    光庭信息推出<b class='flag-5'>下一代</b>整车操作系统A?OS

    下一代高速铜缆铁氟龙发泡技术

    为什么下一代高速铜缆需要铁氟龙发泡技术在人工智能与万物互联的双重驱动下,全球数据传输速率正经历场“超速进化”。AI大模型的参数规模突破万亿
    的头像 发表于 03-13 09:00 ?504次阅读
    <b class='flag-5'>下一代</b>高速铜缆铁氟龙发泡<b class='flag-5'>技术</b>

    纳米压印技术:开创下一代光刻的新篇章

    光刻技术对芯片制造至关重要,但传统紫外光刻受衍射限制,摩尔定律面临挑战。为突破瓶颈,下一代光刻(NGL)技术应运而生。本文将介绍纳米压印技术(NIL)的原理、发展、应用及设备,并探讨其
    的头像 发表于 02-13 10:03 ?2093次阅读
    纳米压印<b class='flag-5'>技术</b>:开创<b class='flag-5'>下一代</b>光刻的新篇章

    雷诺下一代车载语音助手Reno将引入生成式AI技术

    11月1日,赛轮思软件技术公司与雷诺公司宣布深化合作,旨在将生成式AI技术和类人交互功能融入雷诺下一代多模态虚拟车载助手Reno中。
    的头像 发表于 11-01 16:39 ?1831次阅读

    下一代机器人技术:工业自动化的五大趋势

    随着人工智能(AI)技术的迅猛发展和全球制造业的转型升级下一代机器人技术正在引领工业自动化领域的新
    的头像 发表于 10-23 15:52 ?1267次阅读

    软件定义汽车与AI驱动的车载技术革新

    在当今汽车产业中,软件定义汽车(SDV)与人工智能(AI)的深度融合正引领着车载技术的飞速发展。众多汽车制造商已明确战略蓝图,致力于在全新架构上构建下一代车辆,旨在简化硬件与软件复杂度,实现车辆全
    的头像 发表于 09-26 15:08 ?1982次阅读

    实现下一代具有电压电平转换功能的处理器、FPGA 和ASSP

    电子发烧友网站提供《实现下一代具有电压电平转换功能的处理器、FPGA 和ASSP.pdf》资料免费下载
    发表于 09-09 09:46 ?0次下载
    实现<b class='flag-5'>下一代</b>具有电压电平转换<b class='flag-5'>功能</b>的处理器、FPGA 和ASSP

    实现具有电平转换功能下一代无线信标

    电子发烧友网站提供《实现具有电平转换功能下一代无线信标.pdf》资料免费下载
    发表于 09-07 10:23 ?0次下载
    实现具有电平转换<b class='flag-5'>功能</b>的<b class='flag-5'>下一代</b>无线信标

    下一代功能一代AI加速器(DRP-AI3):10x在高级AI系统高级AI中更快的嵌入处理

    电子发烧友网站提供《下一代功能一代AI加速器(DRP-AI3):10x在高级
    发表于 08-15 11:06 ?0次下载
    <b class='flag-5'>下一代</b>高<b class='flag-5'>功能</b>新<b class='flag-5'>一代</b><b class='flag-5'>AI</b><b class='flag-5'>加速</b>器(DRP-<b class='flag-5'>AI</b>3):10x在高级<b class='flag-5'>AI</b>系统高级<b class='flag-5'>AI</b>中更快的嵌入处理