0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

强悍的AWS Graviton4处理器及其背后的Arm Neoverse

Felix分析 ? 来源:电子发烧友 ? 作者:吴子鹏 ? 2024-12-19 00:04 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)在今年的亚马逊re:Invent 2024大会上,该公司正式对外发布了旗下第四代自研Arm芯片——Graviton4。作为目前最强大的Graviton处理器,Graviton4相较于上一代产品带来了巨大的性能提升。同时,为Graviton4赋能的Arm Neoverse也跟着受到了更多的关注。

强悍的Graviton4处理器

据介绍,Graviton4处理器每个核心都能提供比上代强30%的性能,vGPU数量和内存容量也是上一代的3倍,能将处理大型Java应用的速度提升45%,可以为企业提供更低成本和高效的高性能计算解决方案。

除了内核性能的提升,亚马逊还着重提升了Graviton4处理器的存储性能,首次创建了双插槽NUMA内存集群。Graviton4处理器配备了高达1.5 TB的DDR5主内存,运行频率为5.6 GHz,提供12个内存通道。与之相比,上一代Graviton 3处理器使用了4.8 GHz主频的DDR5内存,只有8个内存通道。并且,单个Graviton4处理器的内存插槽就可以提供537.6 GB/秒的带宽,能够轻松应对HPC负载。

此前,亚马逊针对Graviton4处理器发布过一些测试实例,通过这些实例体现了这颗处理器强大的性能。比如,基于Graviton4处理器构建UE5 Dedicated Server,据亚马逊的说法,最新的Graviton 4实例是迄今为止亚马逊为各种workload设计的最强大并且最高效节能的CPU。Graviton 4的实例R8g相较于Graviton 3的实例R7g有大约30%的性能提升。实例R8g压测使用Lyra Starter Game项目,通过增加AI Bot和GameClient的方式来增加Dedicated Server(简称DS)的负载,通过对比不同机型以及不同参数编译出的DS在server full的情况下的CPU使用率和帧率(FPS)来对比性能。

结果显示,Graviton 4的实例在UE Dedicated Server应用场景下:
·相较于Graviton 3有约 25+%的性价比提升(均使用优化参数编译);
·相较于Intel Sapphire Rapids和AMD Genoa有30%~35%的性价比提升;
·使用Graviton针对C/C++的优化参数来编译Dedicated Server对性能提升约10%~25%。

根据外媒的测试,在相同的vCPU数量下,新的Graviton4处理器内核大致与Intel Sapphire Rapids性能相当,同时能够与AMD EPYC“Genoa”相媲美,并始终表现出极佳的代际提升。这都离不开Arm Neoverse的赋能。

Graviton4 处理器背后的Arm Neoverse

Graviton4 处理器基于Arm?Neoverse?V2平台,这颗核心发布于2022年9月。Neoverse V2和Neoverse E2都是Arm公司内部代号“Demeter”项目下的产品,Arm?Neoverse?V2平台涵盖Armv9架构的新特性,包括高性能浮点和向量指令支持,以及SVE/SVE2、Bfloat16和INT8?MatMul等特性。这些特性为AI/机器学习?(ML)?以及高性能计算?(HPC)?工作负载提供了卓越性能。

根据Arm官方的介绍信息,得益于全面增强的核心性能、内存带宽和高达两倍的L2缓存大小(每核2MB),Neoverse V2可以在云和ML应用程序上提供两倍于Neoverse V1的性能。根据Arm工程团队实际运行EDA工作负载所得出的结果,Graviton4?提供的RTL仿真工作负载性能比Graviton3高出?37%。同时,Neoverse V2具有出色的平台扩展性,当与新的CMN-700核心网状网络配对时,Neoverse V2 CPU可以配置多达256个内核和512MB的系统级缓存(SLC)。AMBA CHI C2C使用UCIe、CXL、PCIe或自定义PHY来连接计算、内存和加速器,实现高效、高速的芯片连接。

看过Graviton4处理器的性能之后,人们对下一代Arm服务器会更加期待,这些产品将搭载最新的Neoverse V3。2024年2月,Arm宣布推出新一代 Arm Neoverse技术,Neoverse CSS V3则是V系列芯片IP的首款Neoverse CSS产品,单芯片性能可提高50%。官方的资料显示,全新的Neoverse CCS V3 核心基于64核的Neoverse V3 核心,拥有6个DDR5 内存控制器、4个 I/O 控制器和两个芯片间互连,并支持PCIe Gen5和CXL3.0。通过芯片间互联,可以升级至128核。相对于此前的 Neoverse CSS N2,其单芯片性能可提高50%。

除了核心的提升,Arm将继续投入并进一步强化软件生态系统,从而使开发者能够更加轻松地在?Arm平台上构建其应用,并充分利用?Arm计算平台所提供的卓越性能和效率优势。

结语

亚马逊Graviton4处理器是Arm处理器历史上的一次巨大成功,性能全面对标x86处理器当前的旗舰产品。在Graviton4处理器背后,Neoverse V2内核起到了巨大的赋能作用,这让产业界对于下一代基于Neoverse CCS V3 核心的Arm处理器更加期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19935

    浏览量

    236254
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AWS Graviton4处理器上运行大语言模型的性能评估

    亚马逊云科技 (AWS) 新一代基于 Arm 架构的定制 CPU —— AWS Graviton4 处理器已于 2024 年 7 月正式上线
    的头像 发表于 02-24 10:28 ?693次阅读
    在<b class='flag-5'>AWS</b> <b class='flag-5'>Graviton4</b><b class='flag-5'>处理器</b>上运行大语言模型的性能评估

    自主创新,安全可控:申威SW831处理器与国产终端产品推荐

    在信息技术领域,自主可控的硬件技术是保障国家安全和产业发展的核心基础。作为国产处理器的代表之一, 申威(Sunway)SW831处理器 凭借其高性能、低功耗和高度安全性,成为国产信息化设备的核心
    的头像 发表于 02-21 15:38 ?1822次阅读

    RV1109处理器概述

    RV1109处理器是一款集成了先进技术的高性能芯片,其主要特性彰显了在多个领域的强大应用能力。 该处理器搭载了双核设计,结合了ARM Cortex-A7处理器核心与RISC-V MCU
    的头像 发表于 02-08 17:04 ?1479次阅读

    面向NXP i.MX8处理器的电源解决方案

    电子发烧友网站提供《面向NXP i.MX8处理器的电源解决方案.pdf》资料免费下载
    发表于 12-24 15:53 ?0次下载
    面向NXP i.MX8<b class='flag-5'>处理器</b>的电源解决方案

    Arm Neoverse 驱动 AWS Graviton4,加速云计算新时代

    满足性能提升、成本降低以及符合监管和可持续发展目标的新能效基准。 近日,Arm与亚马逊云科技(AWS)的长期合作,正致力于通过专用芯片和计算技术,推动云计算向更高性能、更高效和更可持续的方向发展。在AWS re:Invent 2
    的头像 发表于 12-23 17:38 ?735次阅读

    ArmAWS合作深化,AWS Graviton4展现显著进展

    :Invent 2024大会上,AWS进一步展示了其基于Arm架构的AWS Graviton4处理器的显著进展。
    的头像 发表于 12-18 14:17 ?592次阅读

    Arm NeoverseAWS Graviton4加速云计算创新

    随着人工智能 (AI) 技术的迅猛发展,云计算领域正在经历显著变革。愈发复杂的 AI 应用对计算解决方案的性能、效率和成本效益提出了更高要求。在云端部署工作负载的客户正在重新评估其所需的基础设施,以满足现代工作负载需求,其中不仅包括提高性能和降低成本,还涵盖了需符合监管要求或可持续发展目标的新能效基准。
    的头像 发表于 12-17 10:16 ?539次阅读

    SK-AM68处理器入门套件用户指南

    电子发烧友网站提供《SK-AM68处理器入门套件用户指南.pdf》资料免费下载
    发表于 11-13 15:02 ?1次下载
    SK-AM68<b class='flag-5'>处理器</b>入门套件用户指南

    AM69处理器入门套件用户指南

    电子发烧友网站提供《AM69处理器入门套件用户指南.pdf》资料免费下载
    发表于 11-13 08:34 ?1次下载
    AM69<b class='flag-5'>处理器</b>入门套件用户指南

    ADS8361与TMS470处理器的接口

    电子发烧友网站提供《ADS8361与TMS470处理器的接口.pdf》资料免费下载
    发表于 10-22 10:13 ?0次下载
    ADS8361与TMS470<b class='flag-5'>处理器</b>的接口

    ADS786x与TMS470处理器的接口

    电子发烧友网站提供《ADS786x与TMS470处理器的接口.pdf》资料免费下载
    发表于 10-22 10:11 ?0次下载
    ADS786x与TMS470<b class='flag-5'>处理器</b>的接口

    恩智浦i.MX8处理器的集成电源设计

    电子发烧友网站提供《恩智浦i.MX8处理器的集成电源设计.pdf》资料免费下载
    发表于 09-18 14:25 ?0次下载
    恩智浦i.MX8<b class='flag-5'>处理器</b>的集成电源设计

    基于全志V853处理器的智能辅助驾驶算法介绍

    全志V853处理器,是专为智慧视觉领域设计的AI处理器,配备了高效的NPU算力和丰富的外设接口,能够提供稳定的AI边缘计算支持;同时,基于V853处理器这一性能优势,全志还为客户提供了一整套完整的智能辅助驾驶算法。
    的头像 发表于 09-14 09:23 ?1860次阅读
    基于全志V853<b class='flag-5'>处理器</b>的智能辅助驾驶算法介绍

    使用TPS6521815 PMIC为NXP i.MX 7处理器供电

    电子发烧友网站提供《使用TPS6521815 PMIC为NXP i.MX 7处理器供电.pdf》资料免费下载
    发表于 09-13 09:40 ?0次下载
    使用TPS6521815 PMIC为NXP i.MX 7<b class='flag-5'>处理器</b>供电

    高通骁龙6 Gen 3处理器发布

    高通公司近日正式推出了骁龙6 Gen 3处理器,这款芯片采用先进的三星4nm工艺打造,代号为SM6475-AB,标志着中端处理器市场的新一轮性能革新。
    的头像 发表于 09-04 15:43 ?1921次阅读