0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm解读Armv9 CPU为何是打造高性能、高能效移动计算的关键

Arm社区 ? 来源:Arm ? 2025-03-14 15:51 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Arm 终端事业部产品管理高级总监 Stefan Rosinger

在之前有关 Arm Cortex-X925 CPU 的文章中,Arm 技术专家曾探讨了每时钟周期指令数 (IPC) 作为评估 CPU 性能的关键指标的重要性。与主要将频率作为性能指标的做法不同,IPC 衡量的是 CPU 每个时钟周期内能处理的指令数。对于移动设备而言,电池续航和散热管理是影响实际应用、用户体验和设备处理复杂工作负载的关键所在。因而,IPC 对于评估移动设备性能而言,至关重要。

更高的频率 ≠ 最优表现

IPC 越高,表示在一个时钟周期内执行的指令越多;即便时钟速度较慢,也能带来更好的性能。这对于内存受限的工作负载尤为重要,因为其性能会受到 CPU 外部因素的制约。更高的 IPC 使得 CPU 能以更低的频率运行,从而减少电量消耗和功耗,设备发热也会缓解。这对于需要保持稳定性能的移动设备来说,尤为有利。

虽然高频 CPU 乍听起来很有吸引力,但它并不能反映性能的全貌。频率表示 CPU 每秒完成的时钟周期数量,而 IPC 则表示每个周期所完成的工作量。事实上,最高频率很少会用到。例如,对于游戏和其他算力要求较高的工作负载来说,并不会以最大频率使用 CPU,大多数时间反而是以中档频率运行。此时的能效更高,可以延长电池续航时间并降低设备温度,而这两者是提升整体用户体验的重要指标。

在相同的时间周期内,具有更高 IPC 的 CPU 在处理实际应用和复杂工作负载时会表现出更优的性能。即便是当今具有复杂计算需求的 AI 应用(例如聊天机器人、实时语言翻译和虚拟助手),在 IPC 更高的 CPU 上运行时也会表现得更加出色。此外,就能效而言,在一个周期内执行更多的指令意味着可以更快地完成任务,使得 CPU 处于高能耗状态的时间减少,从而节省电池电量。

卓越的架构设计

在基于 Armv9 架构的 CPU 设计中,可伸缩向量扩展 (SVE2) 是提高 IPC 的关键所在。这一架构特性采用新的专用向量指令,是加速智能手机关键工作负载和应用的理想之选。

SVE2 可将 HDR 视频解码速度提高约 10%,这样用户在主流应用上观看点播视频时,能获得更长的电池续航时间。此外,通过加速常用的图像处理库,SVE2 还增强了视频通话期间用户体验的流畅度,同时提高了画面质量。其中包括更好的摄像头旋转体验,以及图像滤镜的切换和使用体验。

不仅如此,SVE2 还不受向量长度的影响,这意味着代码开发将支持更大的向量长度,例如 256 位。由此可确保与移动计算未来发展的兼容性,包括未来更注重逻辑扩展,而非 RAM 的先进工艺节点。移动端市场将因此能够适应更大的向量长度,有利于游戏和 AI 模型中 SVE 代码的呈现。

通过深入研究设计,IPC 性能可借助一系列特定的微架构改进得以提高。其中包括但不限于:

超标量乱序执行

分支预测和预取器

数据推测

适当的缓存选择

Arm Cortex CPU 一直在逐年推进各种类似的微架构改进,以实现更高的性能水平。

面向移动端的最新 Armv9 CPU

上述的架构特性和微架构提升是 Arm 面向移动端市场的最新 Armv9 CPU 的核心所在。作为 MediaTek 天玑 9400(已被搭载于 vivo X200 系列等旗舰智能手机)的核心,Cortex-X925 对私有 L2 缓存进行了升级,从 2MB 增加到 3MB。再加上 Cortex-X925 能够更加快速、高效地预取数据和复杂指令,从而显著增强了 CPU 的整体性能和能效。得益于此,Arm 计算平台在 2024 年实现了惊人的两位数 IPC 性能提升。

如此一来,终端用户能够享受到一系列实际性能的提升,包括更快的应用响应速度、更好的游戏体验、更流畅的视频流媒体传输、更快的网页浏览和顺畅的多任务处理。同时,更高的 IPC 也带来了能效的提升,延长了用户的沉浸式体验。

与此同时,Cortex-A725 作为 CPU 工作负载的主力,也进行了一系列针对性更新,着力于需要持续出色性能的关键 AI 和游戏用例。与 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。

在 Armv9.2 集群中,每个 CPU 组件都能应对广泛的实际用例和复杂的工作负载。例如,Cortex-X925 可处理应用启动和网页浏览的“突发”工作负载,而 Cortex-A725 则可以在常见的移动端用例(包括游戏、网页浏览、基于摄像头的应用和视频流媒体)中持续提供稳定性能,以延长设备的使用时间(即电量耗尽之前,用户可在设备上使用某些用例的平均时间)。

打造无可比拟的移动端体验

从根本上说,移动设备需要兼具性能与能效,而 IPC 的提升恰好能同时满足这个需求。用户因而能更长时间体验各种需要高算力的应用。最新的 Armv9 CPU 将卓越的 IPC 水平与高时钟频率相结合,将性能和能效提升到一个更高的水平,从而为最终用户带来更加出色的用户体验。这也正是为什么全球 99% 的智能手机都基于 Arm 计算平台打造的原因之一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9373

    浏览量

    378536
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11097

    浏览量

    217575
  • IPC
    IPC
    +关注

    关注

    3

    文章

    370

    浏览量

    53305
  • 移动计算
    +关注

    关注

    0

    文章

    31

    浏览量

    10396

原文标题:内有剧透!打造高性能、高能效移动计算的关键是?

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP
    的头像 发表于 05-29 10:12 ?1323次阅读

    Arm 公司面向 PC 市场的 ?Arm Niva? 深度解读

    面向 PC 市场的 ? Arm Niva ? 深度解读 ? Arm Niva ? 是 Arm 公司为 PC 市场推出的核心计算平台,属于其“
    的头像 发表于 05-29 09:56 ?758次阅读

    Arm 公司面向移动端市场的 ?Arm Lumex? 深度解读

    子系统(CSS)? ? 在移动端的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备在 AI 性能、能比与开发效率上的挑战。以下从技术架构、
    的头像 发表于 05-29 09:54 ?1739次阅读

    Arm 公司面向汽车市场的 ?Arm Zena? 深度解读

    面向汽车市场的 ? Arm Zena ? 深度解读 Arm Zena 是 Arm 公司面向智能汽车领域推出的核心计算平台,属于其“平台优先”
    的头像 发表于 05-29 09:51 ?1429次阅读

    MWC2025亮点放送 探索Arm如何塑造移动端技术未来

    ,彰显了人工智能 (AI) 和移动端技术之间的共生关系。 ?Arm 计算平台赋能从云到边的 AI 体验。Arm 通过提供端到端的高能
    的头像 发表于 03-14 15:40 ?964次阅读
    MWC2025亮点放送 探索<b class='flag-5'>Arm</b>如何塑造<b class='flag-5'>移动</b>端技术未来

    Arm 推出 Armv9 边缘 AI 计算平台,以超高能与先进 AI 能力赋能物联网革新

    架构的超高能 CPU——Arm Cortex-A320 以及对 Transformer 网络具有原生支持的 Ethos-U85 AI 加速器为核心的边缘AI
    的头像 发表于 03-06 11:43 ?1367次阅读
    <b class='flag-5'>Arm</b> 推出 <b class='flag-5'>Armv9</b> 边缘 AI <b class='flag-5'>计算</b>平台,以超<b class='flag-5'>高能</b><b class='flag-5'>效</b>与先进 AI 能力赋能物联网革新

    抢先试用此芯Armv9 AI PC开发套件瑞莎“星睿O6”

    、边缘、机器人等不同场景的“星睿O6”开发套件 。 该套件于2024年12月发布,异构集成Armv9 CPU核心、Arm Immortalis GPU及安谋科技“周易”NPU等自研业务产品,具备强大的多媒体处理能力,并支持灵活的
    的头像 发表于 03-06 08:09 ?753次阅读
    抢先试用此芯<b class='flag-5'>Armv9</b> AI PC开发套件瑞莎“星睿O6”

    Arm Cortex-A320 CPU助力嵌入式设备实现高能AI计算

    Arm Cortex-A320 是目前最小型的 Armv9-A 架构 CPU。得益于该处理器的推出,开发者现在能有更多选择决定如何处理物联网边缘人工智能 (AI) 工作负载。然而,面对多样化的选择
    的头像 发表于 02-27 17:17 ?809次阅读
    <b class='flag-5'>Arm</b> Cortex-A320 <b class='flag-5'>CPU</b>助力嵌入式设备实现<b class='flag-5'>高能</b><b class='flag-5'>效</b>AI<b class='flag-5'>计算</b>

    详解Arm Cortex-A320 CPU的特性

    Arm Cortex-A320 CPU 的推出具有重要的里程碑意义。作为首个基于 Armv9 架构的超高能
    的头像 发表于 02-27 17:13 ?1100次阅读

    Arm发布基于Armv9架构的Cortex-A320处理器

    边缘 AI 需要更卓越的计算性能、更强大的安全性,以及更出色的软件灵活性。随着软件愈发复杂化,Armv9 架构应运而生,以提供先进的机器学习 (ML) 和 AI 功能,并具备增强的安全特性。该架构现已在 Cortex-A3xx
    的头像 发表于 02-27 17:10 ?850次阅读

    Arm推出全球首个Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台以 Cortex-A320 CPU 和 Ethos-U85 NPU 为核心,专为物联网应用优化,支持运行超 10 亿参数的端侧 AI 模型,已获得包括亚马逊云科技 (AWS)、西门子和瑞
    的头像 发表于 02-27 17:08 ?927次阅读

    MediaTek天玑8350移动芯片赋能荣耀平板V9

    想要拥有一款学习、办公、游戏性能全方位拉满的平板?那千万不能错过荣耀平板 V9 ,其搭载天玑 8350 移动芯片,该芯片采用先进的 Armv9 架构,搭载包括 4 个 Cortex-A
    的头像 发表于 02-24 15:20 ?1369次阅读

    鸿蒙原生页面高性能解决方案上线OpenHarmony社区 助力打造高性能原生应用

    NEXT的原生页面高性能解决方案,从页面滑动、跳转及应用冷启动等关键环节,为开发者提供全面的支持。目前,这些解决方案均已上线OpenHarmony开源社区,可在OpenHarmony三方库中心仓进行搜索,欢迎开发者多多使用和共建,打造
    发表于 01-02 18:00

    基于Armv9架构的MediaTek天玑8400移动芯片问世

    如今,基于 Armv9 CPU 技术构建的人工智能 (AI) 旗舰智能手机立于技术前沿,为 AI 创新提供了前所未有的机遇。为了应对持续增长的 AI 工作负载的计算强度及复杂度,Armv
    的头像 发表于 12-24 14:18 ?832次阅读

    Armv9 CPU中SVE2的实际用例

    随着每一代新产品的推出,Arm CPU 都会实现代际性能提升,并引入架构改进,以满足不断演进的计算工作负载的需求。本文将重点介绍三个用例,以展示 A
    的头像 发表于 10-21 09:54 ?1134次阅读
    <b class='flag-5'>Armv9</b> <b class='flag-5'>CPU</b>中SVE2的实际用例