从去年11月公布的最新TOP500超算系统排名上,我们可以看出AMD已经开始蚕食原本属于英特尔的份额,而且速度不容小觑。而英伟达则因为在GPU上的头号交椅地位,成了坚持所有坚持CPU+GPU架构超算的首选。
非但如此,英伟达开始在ARM生态上有所动作,推出了Grace这样的高性能CPU,并被瑞士超算中心的超级计算机系统阿尔卑斯所用。然而近来的一系列动向表明,超算市场并不会就此维持定局。
英特尔:GPU和异构开始猛追
英特尔耕耘了这么多年HPC和超算市场,自然不会白白认输,尤其是自己的图形部门正在崛起的情况下。于是,就在上周的投资者大会上,英特尔公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一个Xeon插槽的设计,由此推出全新的XPU,代号名为FalconShores。
FalconShores将融合通用x86处理器核心和高度并行计算的Xe-HPC GPU核心,并结合英特尔自研的高带宽共享内存。根据英特尔的说法,这种CPU+GPU+通用内存的架构可以将单个插槽的计算密度提升5倍,与现有的设计相比,可将性能功耗比提升5倍以上。
非但如此,英伟达开始在ARM生态上有所动作,推出了Grace这样的高性能CPU,并被瑞士超算中心的超级计算机系统阿尔卑斯所用。然而近来的一系列动向表明,超算市场并不会就此维持定局。
英特尔:GPU和异构开始猛追
英特尔耕耘了这么多年HPC和超算市场,自然不会白白认输,尤其是自己的图形部门正在崛起的情况下。于是,就在上周的投资者大会上,英特尔公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一个Xeon插槽的设计,由此推出全新的XPU,代号名为FalconShores。
FalconShores将融合通用x86处理器核心和高度并行计算的Xe-HPC GPU核心,并结合英特尔自研的高带宽共享内存。根据英特尔的说法,这种CPU+GPU+通用内存的架构可以将单个插槽的计算密度提升5倍,与现有的设计相比,可将性能功耗比提升5倍以上。

FalconShoresXPU / 英特尔
这对于英特尔目前的战略来说,基本上可以说是必选的一条技术路线。考虑到英特尔在先进封装技术上并未止步,工艺节点也开始跟上主流代工厂的节奏,异构计算的设计已经在英特尔近期推出的诸多产品中得到了验证,通用内存也已经在业界成了改善延迟提高带宽的常用手段之一。况且英特尔已经在其Sapphire Rapids Xeon服务器处理器上用到了HBM2e这类高带宽内存,FalconShores中自研的高带宽内存会有何等性能确实令人好奇。
FalconShores的另一大优势在与灵活的核心配比,根据工作负载来调整x86核心与Xe核心。英特尔在会上不断给出十万亿亿级的概念,这样的性能在FalconShores的性能下似乎是可行的,不过这一XPU正式进入超算市场的时间不会太快,而是要等到2024年,借助那时的埃米级工艺和Foveros封装技术才能实现。
英伟达:不放弃ARM,也不放弃互联
前阵子英伟达收购ARM失败的消息传来,不少人认为英伟达会就此放弃这块蛋糕,然而英伟达CEO黄仁勋却表示他们并不会就此放弃ARM生态,未来将继续推出Grace这样基于ARM架构的CPU。之所以能有如此的底气,在于英伟达那20年的ARM架构授权。
目前拥有ARM架构授权的企业屈指可数,更不用说64位的授权,并将其用于HPC市场了。英伟达如今这种ARM CPU+GPU的路线,看似是在抢英特尔和AMD的生意,但面向的市场其实又有所不同。

GraceCPU /英伟达
Grace虽然性能不差,但与这些x86 CPU在通用计算上相比还是略逊一筹,况且也不是所有研究机构或超算中心都会像日本一样,构建富岳或紫藤花这种规模的ARM超算。英伟达追求的并不是在通用计算上超过其他两家数十年的积累,而是专注于AI算力。训练自然语言处理模型、利用GPU加速深度学习,这才是英伟达的优势所在。
这时问题来了,为何超算不选择其它通用CPU或其它的GPU产品呢?这样既能兼顾通用计算性能,也能用的GPU的加速性能。这是因为英伟达准备了专用于自家CPU和GPU的互联技术NVLink。过去仅有GPU产品的英伟达仅仅将NVLink技术用于GPU之间的互联,如今在Grace出现后,NVLink4.0可以为GraceCPU和英伟达GPU牵线搭桥。
更不用说英伟达已经在2020年收购了Mellanox,要知道在最新的TOP500超算中,除了使用常规的25/100G以太网互联外,基本都用到了Mellanox的互联技术。英伟达与Mellanox的结合,直接覆盖了三分之二的顶级超算系统。未来的NVLink有了Mellanox的帮忙更是难以匹敌,所以并不是英伟达担心竞品的出现,而是其性能表现之强,让你不得不选择他们旗下的产品。
小结
英特尔在超算上的发力归根结底还是靠XeHPC这样的GPU核心,但作为GPU新秀的英特尔短时间还是无法撼动英伟达在超算上的地位。而英伟达的ARM计划未来如何演进也令人十分期待,毕竟这一产品线不像其消费级GPU,还未有任何路线图公布。但喜人的一点是,超算从百亿亿级过渡到十万亿亿级的过程中,势必会有更多的创新方案出现。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
cpu
+关注
关注
68文章
11121浏览量
218389 -
gpu
+关注
关注
28文章
4984浏览量
132173 -
超算
+关注
关注
1文章
117浏览量
9391
发布评论请先 登录
相关推荐
热点推荐
科技赋能汽车制造玩出新花样
汽车行业正处于数字化复兴时期。汽车制造的线性、劳动密集型流程已几乎一去不复返。如今,汽车制造已成为机器人技术、人工智能和数据驱动的协同工作,机器不仅能够制造,还能思考、适应和不断优化。
移远Zigbee+BLE 多协议模组来了!让智能连接玩出新花样
7月17日,全球领先的物联网整体解决方案供应商移远通信宣布,正式发布其全新高性能MCUZigbee+BLE模组KCMA32S。该模组以多协议融合技术为核心,集高性能、小尺寸、高安全性于一体,凭借先进的连接技术和紧凑的外形设计,将有力驱动智能照明、智能楼宇、智能家居等场景的连接技术迭代升级。硬核配置加持,夯实性能与安全底座KCMA32S搭载SiliconLab

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理
前言
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一直从事的事芯片
发表于 06-18 19:31
车牌识别新花样:树莓派打造智能车牌监控系统!
树莓派是创客们打造家庭安防系统的热门之选,这得益于其具备运用人工智能(AI)的能力。AI系统能识别潜在威胁,在此情境下,还能识别过往车辆的牌照信息。创客YashIndane就开发了一款这样的车牌识别

云 GPU 加速计算:突破传统算力瓶颈的利刃
,犹如一把利刃,成功突破了传统算力的瓶颈。 传统的 CPU 计算在面对大规模并行计算任务时,往往显得力不从心。CPU 核心数量有限,且设计侧重于复杂的逻辑控制和串行处理,无法高效处理海量的并行数据。而
GPU算力租用平台有什么好处
当今,GPU算力租用平台为科研机构、企业乃至个人开发者提供了灵活高效的算力解决方案。下面,AI部落小编带您深入探讨GPU算力租用平台所带来的
算智算中心的算力如何衡量?
(ComputationalPower)是指智算中心通过其内部的计算设备(如CPU、GPU、AI芯片等)对数据进行处理和计算的能力。它体现了智算中心在单位时间内能够完成的计算任务量,

涂鸦将高科技取暖玩出新花样!超级省电更节能,个性化取暖更极致
又到了一年一度的冬季极寒时节,不同于东北普遍供暖、暖气片子能玩出上百种花样的惬意,南方湿冷的空气让南方人再次陷入了靠一身正气取暖的哀嚎时刻。虽然南方还没实现供暖,但近几年靠着国家红利政策的支持

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU
着色器(Pixel shader)是图形流水线中算力相当强大的功能单元,因为它可以为每个片段执行复杂的计算,从而为最终渲染的图像添加细节和视觉效果。
DirectX API推动 GPU 演进
发表于 11-03 12:55
GPU算力租用平台是什么
GPU算力租用平台是一种基于云计算的服务模式,它允许用户通过互联网按需租用高性能GPU资源,而无需自行购买、部署和维护这些硬件。
【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览
本帖最后由 1653149838.791300 于 2024-10-16 22:19 编辑
感谢平台提供的书籍,厚厚的一本,很有分量,感谢作者的倾力付出成书。
本书主要讲算力芯片CPU
发表于 10-15 22:08
名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析
这个想法被否决了,因为投入较大、难以落地,且客户对算力的认同远不及今天这种高度。
这几年间其实我们联系甚少,但是作者一直没有脱离对芯片的应用和关注。特别是目睹GPU从消费电子转向算力芯片,目睹
发表于 09-02 10:09
评论