作者:Arm 终端事业部产品管理高级总监 Stefan Rosinger
在之前有关 Arm Cortex-X925 CPU 的文章中,Arm 技术专家曾探讨了每时钟周期指令数 (IPC) 作为评估 CPU 性能的关键指标的重要性。与主要将频率作为性能指标的做法不同,IPC 衡量的是 CPU 每个时钟周期内能处理的指令数。对于移动设备而言,电池续航和散热管理是影响实际应用、用户体验和设备处理复杂工作负载的关键所在。因而,IPC 对于评估移动设备性能而言,至关重要。
更高的频率 ≠ 最优表现
IPC 越高,表示在一个时钟周期内执行的指令越多;即便时钟速度较慢,也能带来更好的性能。这对于内存受限的工作负载尤为重要,因为其性能会受到 CPU 外部因素的制约。更高的 IPC 使得 CPU 能以更低的频率运行,从而减少电量消耗和功耗,设备发热也会缓解。这对于需要保持稳定性能的移动设备来说,尤为有利。
虽然高频 CPU 乍听起来很有吸引力,但它并不能反映性能的全貌。频率表示 CPU 每秒完成的时钟周期数量,而 IPC 则表示每个周期所完成的工作量。事实上,最高频率很少会用到。例如,对于游戏和其他算力要求较高的工作负载来说,并不会以最大频率使用 CPU,大多数时间反而是以中档频率运行。此时的能效更高,可以延长电池续航时间并降低设备温度,而这两者是提升整体用户体验的重要指标。
在相同的时间周期内,具有更高 IPC 的 CPU 在处理实际应用和复杂工作负载时会表现出更优的性能。即便是当今具有复杂计算需求的 AI 应用(例如聊天机器人、实时语言翻译和虚拟助手),在 IPC 更高的 CPU 上运行时也会表现得更加出色。此外,就能效而言,在一个周期内执行更多的指令意味着可以更快地完成任务,使得 CPU 处于高能耗状态的时间减少,从而节省电池电量。
卓越的架构设计
在基于 Armv9 架构的 CPU 设计中,可伸缩向量扩展 (SVE2) 是提高 IPC 的关键所在。这一架构特性采用新的专用向量指令,是加速智能手机关键工作负载和应用的理想之选。
SVE2 可将 HDR 视频解码速度提高约 10%,这样用户在主流应用上观看点播视频时,能获得更长的电池续航时间。此外,通过加速常用的图像处理库,SVE2 还增强了视频通话期间用户体验的流畅度,同时提高了画面质量。其中包括更好的摄像头旋转体验,以及图像滤镜的切换和使用体验。
不仅如此,SVE2 还不受向量长度的影响,这意味着代码开发将支持更大的向量长度,例如 256 位。由此可确保与移动计算未来发展的兼容性,包括未来更注重逻辑扩展,而非 RAM 的先进工艺节点。移动端市场将因此能够适应更大的向量长度,有利于游戏和 AI 模型中 SVE 代码的呈现。
通过深入研究设计,IPC 性能可借助一系列特定的微架构改进得以提高。其中包括但不限于:
超标量乱序执行
分支预测和预取器
数据推测
适当的缓存选择
Arm Cortex CPU 一直在逐年推进各种类似的微架构改进,以实现更高的性能水平。
面向移动端的最新 Armv9 CPU
上述的架构特性和微架构提升是 Arm 面向移动端市场的最新 Armv9 CPU 的核心所在。作为 MediaTek 天玑 9400(已被搭载于 vivo X200 系列等旗舰智能手机)的核心,Cortex-X925 对私有 L2 缓存进行了升级,从 2MB 增加到 3MB。再加上 Cortex-X925 能够更加快速、高效地预取数据和复杂指令,从而显著增强了 CPU 的整体性能和能效。得益于此,Arm 计算平台在 2024 年实现了惊人的两位数 IPC 性能提升。
如此一来,终端用户能够享受到一系列实际性能的提升,包括更快的应用响应速度、更好的游戏体验、更流畅的视频流媒体传输、更快的网页浏览和顺畅的多任务处理。同时,更高的 IPC 也带来了能效的提升,延长了用户的沉浸式体验。
与此同时,Cortex-A725 作为 CPU 工作负载的主力,也进行了一系列针对性更新,着力于需要持续出色性能的关键 AI 和游戏用例。与 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。
在 Armv9.2 集群中,每个 CPU 组件都能应对广泛的实际用例和复杂的工作负载。例如,Cortex-X925 可处理应用启动和网页浏览的“突发”工作负载,而 Cortex-A725 则可以在常见的移动端用例(包括游戏、网页浏览、基于摄像头的应用和视频流媒体)中持续提供稳定性能,以延长设备的使用时间(即电量耗尽之前,用户可在设备上使用某些用例的平均时间)。
打造无可比拟的移动端体验
从根本上说,移动设备需要兼具性能与能效,而 IPC 的提升恰好能同时满足这个需求。用户因而能更长时间体验各种需要高算力的应用。最新的 Armv9 CPU 将卓越的 IPC 水平与高时钟频率相结合,将性能和能效提升到一个更高的水平,从而为最终用户带来更加出色的用户体验。这也正是为什么全球 99% 的智能手机都基于 Arm 计算平台打造的原因之一。
-
ARM
+关注
关注
134文章
9373浏览量
378536 -
cpu
+关注
关注
68文章
11097浏览量
217575 -
IPC
+关注
关注
3文章
370浏览量
53305 -
移动计算
+关注
关注
0文章
31浏览量
10396
原文标题:内有剧透!打造高性能、高能效移动计算的关键是?
文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
ARM Mali GPU 深度解读
Arm 公司面向 PC 市场的 ?Arm Niva? 深度解读
Arm 公司面向移动端市场的 ?Arm Lumex? 深度解读
Arm 公司面向汽车市场的 ?Arm Zena? 深度解读
Arm 推出 Armv9 边缘 AI 计算平台,以超高能效与先进 AI 能力赋能物联网革新

抢先试用此芯Armv9 AI PC开发套件瑞莎“星睿O6”

Arm Cortex-A320 CPU助力嵌入式设备实现高能效AI计算

评论