0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

两种GPU之间的延迟对比 AMD RDNA2完胜NVIDIA安培

ss ? 来源:快科技 ? 作者:快科技 ? 2021-04-21 13:51 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

CPU缓存与内存延迟测试,相信大家都有所耳闻,但是GPU同样的测试却几乎没人做过。

ChipsAndCheese就做了一次特别的测试,对比考察了AMD、NVIDIAGPU架构的缓存、显存迟问题。

首先是AMDRDNA2、NVIDIAAmpere两家最新架构的比拼,代表是RX6900XT、RTX3090,前者在几乎所有阶段都完胜。

RNDA2架构创新性地加入了InfinityCache无限缓存,提升带宽的同时,延迟也可圈可点,二级缓存命中率上只增加了大约20ns的延迟,明显低于Ampere。

更惊人的是,RDNA2显存延迟和Ampere几乎一模一样,但是别忘了,Ampere只有两个层级的缓存,RDNA2却有四个。

Ampere的缓存架构更加传统,SM阵列私有一级缓存到二级缓存要增加超过100ns的延迟,RDNA2从零级缓存到二级缓存则只增加了约66ns。看起来,GA102核心面积过大,也直接增加了延迟。

这正好可以解释AMDRDNA2架构在低分辨率下性能、能效更优秀,因为二级缓存、三级缓存延迟很低,更适合执行较小的负载。Ampere则相反,高负载下优势明显,比如说4K分辨率。

说完了GPU之间的对比,那么GPU、CPU放在一起怎么样呢?这里以RX6900XT、Intel四代酷睿i7-4770为例来看看。

CPU的缓存自然不是一个级别的,所以这里Y轴用了线性数据,可以看到全程大大低于RDNA2,搭配DDR3-1600CL9内存延迟只有63ns,RX6900XT、GDDR6的组合则有226ns,另外末级缓存平均延迟分别是53.42ns、123.2ns。

再看看前几代的NVIDIAGPU,包括Maxwell架构的GTX980Ti、Pascal架构的GTX1080、Turing架构的RTX2060Mobile。

Maxwell、Pascal其实差不多,前者整体略高一些,可能是受制于芯片面积较大、核心频率较低。

Turing则已经有了Ampere的样子,一级缓存延迟低得多,二级差不多,奇怪的是显存延迟在32MB之后偏高,原因未知。

AMD考察了TeraScale架构的HD5850/6950、GCN架构的HD7970,再加上RX6900XT,很明显在逐代降低,而且是各级缓存都在同时进步。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5604

    浏览量

    136836
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11117

    浏览量

    218323
  • 数据
    +关注

    关注

    8

    文章

    7264

    浏览量

    92415
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4981

    浏览量

    132125
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的头像 发表于 08-18 11:50 ?32次阅读

    NVIDIA Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    本文将探讨 NVIDIA TensorRT-LLM 如何基于 8 个 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延迟场景中的性能纪录:在 G
    的头像 发表于 07-02 19:31 ?2413次阅读
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>优化DeepSeek-R1性能 打破DeepSeek-R1在最小<b class='flag-5'>延迟</b>场景中的性能纪录

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    两种结构: ①GPU-GPU ②CPU-GPU 这是书中介绍的一个包括了个完全通过NVlink连接的8 GPU混合立方网状拓扑结构: N
    发表于 06-18 19:31

    专访AMD王启尚 从RDNA 4到FSR 4,AMD GPU技术创新引领行业新发展

    在近日于珠海举办的AMD新一代Radeon RX 9070系列显卡发布会后,AMD GPU技术与工程研发副总裁王启尚接受了我们的专访。在本次交谈中,他详细分享了RDNA 4架构的设计理
    的头像 发表于 03-06 11:19 ?477次阅读
    专访<b class='flag-5'>AMD</b>王启尚 从<b class='flag-5'>RDNA</b> 4到FSR 4,<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>技术创新引领行业新发展

    NVIDIA RTX 4500 Ada与NVIDIA RTX A5000的对比

    基于大众所熟知的 NVIDIA Ada Lovelace 架构,NVIDIA RTX 4500 Ada Generation是一款介于 NVIDIA RTX 4000 Ada 和 NVIDIA
    的头像 发表于 03-05 10:30 ?1913次阅读

    纳米铜烧结为何纳米银烧结?

    在半导体功率模块封装领域,互连技术一直是影响模块性能、可靠性和成本的关键因素。近年来,随着纳米技术的快速发展,纳米银烧结和纳米铜烧结技术作为两种新兴的互连技术,备受业界关注。然而,在众多应用场景中
    的头像 发表于 02-24 11:17 ?1092次阅读
    纳米铜烧结为何<b class='flag-5'>完</b><b class='flag-5'>胜</b>纳米银烧结?

    ADC12D1600和ADC12D1600RF这两种型号之间有什么区别?

    您好,板子之前采用的是ADC12D1600,现在想换ADC12D1600RF; 请问: 1.这两种型号之间有什么区别?(一个高速采样,一个射频采样) 2.ADC12D1600RF是pin compatible的,能否在不改变已
    发表于 01-10 06:10

    NVIDIA和GeForce RTX GPU专为AI时代打造

    NVIDIA 和 GeForce RTX GPU 专为 AI 时代打造。
    的头像 发表于 01-06 10:45 ?760次阅读

    AMC1204有两种封装,SOIC-8和SOIC-16,功能一样吗?为什么要推出两种封装?

    呢?AMC1204,AMC1304这样做有什么好处吗? 2、AMC1204有两种封装,SOIC-8和SOIC-16,功能一样吗?为什么要推出两种封装?
    发表于 12-27 07:22

    《CST Studio Suite 2024 GPU加速计算指南》

    的各个方面,包括硬件支持、操作系统支持、许可证、GPU计算的启用、NVIDIAAMD GPU的详细信息以及相关的使用指南和故障排除等内容。 1. 硬件支持 -
    发表于 12-16 14:25

    两种转换控制模式Zone 1 Transfer和Zone 2 Transfer怎么区分使用?

    两种转换控制模式Zone 1 Transfer和Zone 2 Transfer怎么区分使用?现在想用Zone 1 Transfer模式,硬件或软件上应该怎么设置?
    发表于 11-19 06:20

    AMD确认2025年推出RDNA 4显卡,光追与AI性能大幅提升

    10月30日,AMD在2024年第三季度财报电话会议上宣布了一个关于GPU的重要信息:其下一代RDNA 4显卡计划于2025年初发布。AMD首席执行官苏姿丰明确表示:“我们计划在202
    的头像 发表于 10-30 16:50 ?1837次阅读

    AMDNVIDIA GPU优缺点

    在图形处理单元(GPU)市场,AMDNVIDIA大主要的竞争者,它们各自推出的产品在性能、功耗、价格等方面都有着不同的特点和优势。 一、性能
    的头像 发表于 10-27 11:15 ?3095次阅读

    噪声传导的两种模式

    噪声传导有两种模式,一为差模传导,一为共模传导。
    的头像 发表于 10-15 11:33 ?847次阅读
    噪声传导的<b class='flag-5'>两种</b>模式

    嵌入式MXM模块(NVIDIA安培架构)

    电子发烧友网站提供《嵌入式MXM模块(NVIDIA安培架构).pdf》资料免费下载
    发表于 10-09 11:09 ?0次下载