0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超算硝烟再起,CPU+GPU还能玩出新花样?

21克888 ? 来源:电子发烧友网 ? 作者:周凯扬 ? 2022-02-24 09:33 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从去年11月公布的最新TOP500超算系统排名上,我们可以看出AMD已经开始蚕食原本属于英特尔的份额,而且速度不容小觑。而英伟达则因为在GPU上的头号交椅地位,成了坚持所有坚持CPU+GPU架构超算的首选。

非但如此,英伟达开始在ARM生态上有所动作,推出了Grace这样的高性能CPU,并被瑞士超算中心的超级计算机系统阿尔卑斯所用。然而近来的一系列动向表明,超算市场并不会就此维持定局。

英特尔:GPU和异构开始猛追

英特尔耕耘了这么多年HPC和超算市场,自然不会白白认输,尤其是自己的图形部门正在崛起的情况下。于是,就在上周的投资者大会上,英特尔公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一个Xeon插槽的设计,由此推出全新的XPU,代号名为FalconShores。

FalconShores将融合通用x86处理器核心和高度并行计算的Xe-HPC GPU核心,并结合英特尔自研的高带宽共享内存。根据英特尔的说法,这种CPU+GPU+通用内存的架构可以将单个插槽的计算密度提升5倍,与现有的设计相比,可将性能功耗比提升5倍以上。
FalconShoresXPU / 英特尔

这对于英特尔目前的战略来说,基本上可以说是必选的一条技术路线。考虑到英特尔在先进封装技术上并未止步,工艺节点也开始跟上主流代工厂的节奏,异构计算的设计已经在英特尔近期推出的诸多产品中得到了验证,通用内存也已经在业界成了改善延迟提高带宽的常用手段之一。况且英特尔已经在其Sapphire Rapids Xeon服务器处理器上用到了HBM2e这类高带宽内存,FalconShores中自研的高带宽内存会有何等性能确实令人好奇。

FalconShores的另一大优势在与灵活的核心配比,根据工作负载来调整x86核心与Xe核心。英特尔在会上不断给出十万亿亿级的概念,这样的性能在FalconShores的性能下似乎是可行的,不过这一XPU正式进入超算市场的时间不会太快,而是要等到2024年,借助那时的埃米级工艺和Foveros封装技术才能实现。

英伟达:不放弃ARM,也不放弃互联

前阵子英伟达收购ARM失败的消息传来,不少人认为英伟达会就此放弃这块蛋糕,然而英伟达CEO黄仁勋却表示他们并不会就此放弃ARM生态,未来将继续推出Grace这样基于ARM架构的CPU。之所以能有如此的底气,在于英伟达那20年的ARM架构授权。

目前拥有ARM架构授权的企业屈指可数,更不用说64位的授权,并将其用于HPC市场了。英伟达如今这种ARM CPU+GPU的路线,看似是在抢英特尔和AMD的生意,但面向的市场其实又有所不同。
GraceCPU /英伟达

Grace虽然性能不差,但与这些x86 CPU在通用计算上相比还是略逊一筹,况且也不是所有研究机构或超算中心都会像日本一样,构建富岳或紫藤花这种规模的ARM超算。英伟达追求的并不是在通用计算上超过其他两家数十年的积累,而是专注于AI算力。训练自然语言处理模型、利用GPU加速深度学习,这才是英伟达的优势所在。

这时问题来了,为何超算不选择其它通用CPU或其它的GPU产品呢?这样既能兼顾通用计算性能,也能用的GPU的加速性能。这是因为英伟达准备了专用于自家CPU和GPU的互联技术NVLink。过去仅有GPU产品的英伟达仅仅将NVLink技术用于GPU之间的互联,如今在Grace出现后,NVLink4.0可以为GraceCPU和英伟达GPU牵线搭桥。

更不用说英伟达已经在2020年收购了Mellanox,要知道在最新的TOP500超算中,除了使用常规的25/100G以太网互联外,基本都用到了Mellanox的互联技术。英伟达与Mellanox的结合,直接覆盖了三分之二的顶级超算系统。未来的NVLink有了Mellanox的帮忙更是难以匹敌,所以并不是英伟达担心竞品的出现,而是其性能表现之强,让你不得不选择他们旗下的产品。

小结

英特尔在超算上的发力归根结底还是靠XeHPC这样的GPU核心,但作为GPU新秀的英特尔短时间还是无法撼动英伟达在超算上的地位。而英伟达的ARM计划未来如何演进也令人十分期待,毕竟这一产品线不像其消费级GPU,还未有任何路线图公布。但喜人的一点是,超算从百亿亿级过渡到十万亿亿级的过程中,势必会有更多的创新方案出现。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11121

    浏览量

    218389
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4984

    浏览量

    132173
  • 超算
    +关注

    关注

    1

    文章

    117

    浏览量

    9391
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科技赋能汽车制造玩出新花样

    汽车行业正处于数字化复兴时期。汽车制造的线性、劳动密集型流程已几乎一去不复返。如今,汽车制造已成为机器人技术、人工智能和数据驱动的协同工作,机器不仅能够制造,还能思考、适应和不断优化。
    的头像 发表于 07-21 14:52 ?530次阅读

    移远Zigbee+BLE 多协议模组来了!让智能连接玩出新花样

    7月17日,全球领先的物联网整体解决方案供应商移远通信宣布,正式发布其全新高性能MCUZigbee+BLE模组KCMA32S。该模组以多协议融合技术为核心,集高性能、小尺寸、高安全性于一体,凭借先进的连接技术和紧凑的外形设计,将有力驱动智能照明、智能楼宇、智能家居等场景的连接技术迭代升级。硬核配置加持,夯实性能与安全底座KCMA32S搭载SiliconLab
    的头像 发表于 07-17 19:04 ?324次阅读
    移远Zigbee+BLE 多协议模组来了!让智能连接<b class='flag-5'>玩出新花样</b>

    【「力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    前言 【「力芯片 | 高性能 CPU/GPU/NPU 微架构分析」书中的芯片知识是比较接近当前的顶尖芯片水平的,同时包含了芯片架构的基础知识,但该部分知识比较晦涩难懂,或许是由于我一直从事的事芯片
    发表于 06-18 19:31

    车牌识别新花样:树莓派打造智能车牌监控系统!

    树莓派是创客们打造家庭安防系统的热门之选,这得益于其具备运用人工智能(AI)的能力。AI系统能识别潜在威胁,在此情境下,还能识别过往车辆的牌照信息。创客YashIndane就开发了一款这样的车牌识别
    的头像 发表于 04-26 09:03 ?316次阅读
    车牌识别<b class='flag-5'>新花样</b>:树莓派打造智能车牌监控系统!

    GPU 加速计算:突破传统力瓶颈的利刃

    ,犹如一把利刃,成功突破了传统力的瓶颈。 传统的 CPU 计算在面对大规模并行计算任务时,往往显得力不从心。CPU 核心数量有限,且设计侧重于复杂的逻辑控制和串行处理,无法高效处理海量的并行数据。而
    的头像 发表于 02-17 10:36 ?338次阅读

    GPU力租用平台有什么好处

    当今,GPU力租用平台为科研机构、企业乃至个人开发者提供了灵活高效的力解决方案。下面,AI部落小编带您深入探讨GPU力租用平台所带来的
    的头像 发表于 02-07 10:39 ?507次阅读

    中心的力如何衡量?

    (ComputationalPower)是指智中心通过其内部的计算设备(如CPUGPU、AI芯片等)对数据进行处理和计算的能力。它体现了智中心在单位时间内能够完成的计算任务量,
    的头像 发表于 01-16 14:03 ?2898次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b>力如何衡量?

    蔚来ET9行业首创飞航环影影像系统

    智能汽车的摄像头越来越多,每个摄像头各司其职,还能玩出什么新花样吗?蔚来ET9告诉你,想象空间还很大。
    的头像 发表于 01-08 10:21 ?1158次阅读

    FPGA+GPU+CPU国产化人工智能平台

    平台采用国产化FPGA+GPU+CPU构建嵌入式多核异构智终端,可形成FPGA+GPU、FPGA+CPUCPU+FPGA等组合模式,形成
    的头像 发表于 01-07 16:42 ?1227次阅读
    FPGA+<b class='flag-5'>GPU+CPU</b>国产化人工智能平台

    涂鸦将高科技取暖玩出新花样!超级省电更节能,个性化取暖更极致

    又到了一年一度的冬季极寒时节,不同于东北普遍供暖、暖气片子能玩出上百种花样的惬意,南方湿冷的空气让南方人再次陷入了靠一身正气取暖的哀嚎时刻。虽然南方还没实现供暖,但近几年靠着国家红利政策的支持
    的头像 发表于 12-26 18:08 ?562次阅读
    涂鸦将高科技取暖<b class='flag-5'>玩出新花样</b>!超级省电更节能,个性化取暖更极致

    【「力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解力芯片GPU

    着色器(Pixel shader)是图形流水线中力相当强大的功能单元,因为它可以为每个片段执行复杂的计算,从而为最终渲染的图像添加细节和视觉效果。 DirectX API推动 GPU 演进
    发表于 11-03 12:55

    【一文看懂】大白话解释“GPUGPU力”

    随着大模型的兴起,“GPU力”这个词正频繁出现在人工智能、游戏、图形设计等工作场景中,什么是GPU,它与CPU的区别是什么?以及到底什么是GPU
    的头像 发表于 10-29 08:05 ?3145次阅读
    【一文看懂】大白话解释“<b class='flag-5'>GPU</b>与<b class='flag-5'>GPU</b><b class='flag-5'>算</b>力”

    GPU力租用平台是什么

    GPU力租用平台是一种基于云计算的服务模式,它允许用户通过互联网按需租用高性能GPU资源,而无需自行购买、部署和维护这些硬件。
    的头像 发表于 10-16 10:15 ?776次阅读

    【「力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 编辑 感谢平台提供的书籍,厚厚的一本,很有分量,感谢作者的倾力付出成书。 本书主要讲力芯片CPU
    发表于 10-15 22:08

    名单公布!【书籍评测活动NO.43】 力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    这个想法被否决了,因为投入较大、难以落地,且客户对力的认同远不及今天这种高度。 这几年间其实我们联系甚少,但是作者一直没有脱离对芯片的应用和关注。特别是目睹GPU从消费电子转向力芯片,目睹
    发表于 09-02 10:09