0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm Neoverse家族新增V1和N2两大平台,突破高性能计算瓶颈

E4Life ? 来源:电子发烧友原创 ? 作者:周凯扬 ? 2021-04-30 16:20 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Arm 近日公开了Arm? Neoverse V1 和 N2 平台的产品细节,两者满足了基础设施应用的各种需求。这两个平台的设计旨在解决当前正在运行的各种工作负载和应用问题,与上一代N1相比,并分别带来 50%和 40%的性能提升。此外,Arm也同时发布了CMN-700,作为构建基于Neoverse V1和 N2 平台高性能SoC的关键部件。

Neoverse V1:最宽微架构+SVE矢量运算

Neoverse V1平台 / Arm

与上一代N1相比,Neoverse V1带来了50%的性能提升和1.8倍的矢量工作负载优化、以及4倍的机器学习工作负载优化。得益于Arm迄今为止最宽的微架构以及SVE功能,Neoverse V1可以容纳更多运行中的指令,延长了代码存活期,也为芯片设计人员提供了灵活性。Arm 现有的 SIMD 指令集 NEON 难以对某些代码进行矢量化处理,而 SVE 可以直接取用相同的代码,并很好地对其进行自动矢量化,相比于 NEON,SVE可将处理速度提高近3.5倍。

已经用到Neoverse V1的HPC项目 / Arm

目前法国芯片公司SiPearl、印度信息技术部(MEITY)韩国电子通信研究所(ETRI)都在各自的HPC项目中用到了Neoverse V1。

Neoverse N2:首个Armv9+SVE2平台

Neoverse N2提高云端到边缘性能效率 / Arm

Arm在几周前发布了Armv9架构,以满足全球对无所不在的专用处理能力的需求,而新公布的Neoverse N2平台正是第一个基于Armv9架构的平台。

SVE2 / Arm
相比于N1,Neoverse N2在保持相同水平的功率和面积效率的基础上,单线程性能提升了40%。不仅如此,Neoverse N2也是第一个具备SVE2功能的平台,作为SVE和Neon的超集,SVE2为云端到边缘的性能效率带来了巨大提升。SVE主要用于加速HPC,而SVE2可广泛运用于机器学习、数字信号处理和5G等应用场景,同时兼具SVE的编程简易性和可移植性等优势。

CMN-700:下一代总线赋能异构SoC

Neoverse CMN-700 / Arm

作为上一代CMN-600的升级,CMN-700支持的最大核心数可达512颗。通过对CCIX 2.0和CXL 2.0的支持,也为客户提供了更多的定制和扩展选项,为紧密耦合的异构计算提供了更大的灵活性。

异构计算的趋势

随着异构计算的逐步发展,我们已经看到了很多CPUGPU搭配的趋势,比如英伟达近期公布的基于Arm Neoverse的Grace芯片,就是一个用于AI超算的CPU。英伟达在互联技术上采用的是自研的NVLink技术,而非PCIE。Arm基础设施事业部高级副总裁兼总经理 Chris Bergey提到,与多样化的加速器功能进行互联,比如AI加速器,这对未来的市场时相当关键的。比如CMN-700已经支持了CXL和CCIX这样的互联标准,未来Arm期待给市场带来更多的灵活性,并支持更多像Grace这样的系统。

这样的异构趋势也囊括了FPGA,Arm基础设施事业部全球高级总监邹挺补充道,现在已经有合作伙伴将Neoverse N2和FPGA加速卡放在异构计算系统中使用。有的Arm合作伙伴还将FPGA加速器和N2放在一个芯片上做成SoC,通过Chiplet的技术来实现异构计算的灵活性。

公有云的广泛应用

腾讯云加码Arm生态 / Arm 腾讯云

Neoverse的广泛应用在公有云厂商中尤为明显,比如AWS、阿里云和腾讯云等。腾讯专项测试技术中心总监黄闻欣提到腾讯去年和Arm正式签署了一份合作协议,希望通过合作加速Arm Neoverse技术的测评和适配。通过TencentBench测试框架发现,得益于更多可扩展的CPU核心数,Arm服务器比传统的服务器性能表现更强劲,尤其是在AI推理和图片处理领域。

Arm架构为Java性能带来的提升 / Arm 阿里云

阿里巴巴首席工程师周经森(Kingsum Chow)谈道:Arm的CPU资源的话,在我们现有的软件里会有两个考虑的点,一个是我们有些软件是需要重新编译的,另外一种不需要重新编译,只需要我们把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在这方面,一年之前,我们就跟Arm的员工一起合作,把JVM的性能提高。过去一年里,我们从JDK8到JDK11,通过OpenJDK, 通过阿里巴巴 Dragonwell(OpenJDK的一个发行版),就把我们现有一些Java应用的一些性能提高了50%。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9373

    浏览量

    378600
  • HPC
    HPC
    +关注

    关注

    0

    文章

    333

    浏览量

    24386
  • 高性能计算
    +关注

    关注

    0

    文章

    91

    浏览量

    13666
  • Neoverse
    +关注

    关注

    0

    文章

    12

    浏览量

    4808
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    知合计算:RISC-V架构创新,阿基米德系列剑指高性能计算

    在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM
    的头像 发表于 07-18 14:17 ?1507次阅读
    知合<b class='flag-5'>计算</b>:RISC-<b class='flag-5'>V</b>架构创新,阿基米德系列剑指<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R
    的头像 发表于 07-03 14:37 ?468次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> <b class='flag-5'>N2</b><b class='flag-5'>平台</b>实现DeepSeek-R<b class='flag-5'>1</b>满血版部署

    AMD实现首个基于台积电N2制程的硅片里程碑

    代号为“Venice”的新一代AMD EPYC CPU是首款基于台积电新一代N2制程的高性能计算产品。 ? AMD表示,其代号为“Venice”的新一代AMD EPYC?处理器是业界首款完成流片并
    的头像 发表于 05-06 14:46 ?278次阅读
    AMD实现首个基于台积电<b class='flag-5'>N2</b>制程的硅片里程碑

    解读基于Arm Neoverse V2平台的Google Axion处理器

    计算需求在人工智能 (AI) 时代的爆发式增长,推动了开发者寻求性能优化且高能效的解决方案,以降低总体拥有成本 (TCO)。Arm 致力于通过 Arm
    的头像 发表于 04-21 13:47 ?575次阅读

    如何在基于Arm Neoverse平台的CPU上构建分布式Kubernetes集群

    在本文中,我们将以 X(原 Twitter)为例,演示如何在基于 Arm Neoverse 平台的 CPU 上构建分布式 Kubernetes 集群,以根据推文实时监控情绪变化。如此一来,你可以充分利用
    的头像 发表于 03-25 15:58 ?379次阅读
    如何在基于<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b><b class='flag-5'>平台</b>的CPU上构建分布式Kubernetes集群

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    RZ/V2N——近期在嵌入式世界2025上新发布,为 AI 计算、嵌入式系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性
    发表于 03-19 17:54

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    2025年3月19日——Banana Pi 今日正式发布 BPI-AI2N & BPI-AI2N Carrier,基于瑞萨电子(Renesas)同步发布的最新的高性能处理器RZ/V2N
    的头像 发表于 03-19 17:53 ?955次阅读
    Banana Pi 发布 BPI-AI<b class='flag-5'>2N</b> &amp; BPI-AI<b class='flag-5'>2N</b> Carrier,助力 AI <b class='flag-5'>计算</b>与嵌入式开发

    英特尔18A与台积电N2工艺各有千秋

    TechInsights与SemiWiki近日联合发布了对英特尔Intel 18A(1.8nm级别)和台积电N2(2nm级别)工艺的深度分析。结果显示,者在关键性能指标上各有优势。
    的头像 发表于 02-17 13:52 ?565次阅读

    瑞萨电子RZ MPU家族精品RZ/N2L产品介绍

    瑞萨生态合作伙伴RT-Thread推出了一款高性能、多功能以太网MPU开发板EtherKit,搭载瑞萨电子RZ/N2L,并携手瑞萨电子举办了产品发布会和产品研讨。瑞萨电子在本次活动中介绍了瑞萨明星
    的头像 发表于 12-23 14:10 ?793次阅读
    瑞萨电子RZ MPU<b class='flag-5'>家族</b>精品RZ/<b class='flag-5'>N2</b>L产品介绍

    Arm Neoverse如何加速实现AI数据中心

    在快速演进的云计算和人工智能 (AI) 时代,企业需要能助力其优化性能、降低成本并在市场竞争中保持领先的方法。Arm Neoverse 已成为众多前沿企业的选择,他们希望在推动创新的同
    的头像 发表于 11-26 09:30 ?702次阅读

    N2台安变频器的应用及参数设置

    详细介绍N2台安变频器的应用及参数设置
    发表于 11-16 13:44 ?0次下载

    AI高性能计算平台是什么

    AI高性能计算平台不仅是AI技术发展的基石,更是推动AI应用落地、加速产业升级的重要工具。以下,是对AI高性能计算
    的头像 发表于 11-11 09:56 ?741次阅读

    基于Arm Neoverse的微软全新Azure虚拟机上线

    Neoverse CSS N2 所构建。这是我们与微软长期合作中的一个重要里程碑,通过提供强大的平台,为各种工作负载带来出色的性能、可扩展性和繁荣的软件生态系统。
    的头像 发表于 10-27 11:00 ?856次阅读

    基于高通主板的ARM架构服务器

    参考架构,2020 年衍生出 E、NV 系列,近期推出 Neoverse V2V1N2
    的头像 发表于 09-11 10:53 ?1203次阅读

    OFFSET N1N2个引脚不是都是个输入性质的引脚吗?为什么会有固定的-12V输出呢?

    N2)发现,均存在一个-12V的电源电压。 请问,OFFSET N1N2个引脚不是都是
    发表于 09-10 07:58