0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Imagination D系列GPU:关于2D 双速率纹理处理

颖脉Imgtec ? 2025-02-08 14:28 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

对于每一代 GPU,Imagination 内部的性能团队都会运行广泛的测试内容,分析并理解不同类型的工作负载及其瓶颈。作为分析的一部分,数据显示许多现代游戏在执行后处理算法上花费了越来越多的时间,以实现景深、光晕、模糊等效果。

大多数这些后处理过程都是以纹理采样为主的过滤效果,它们对算术逻辑单元 (ALU) 的要求不高,但受限于纹理处理单元 (TPU) 的吞吐率。解决这个问题的一种方法是简单地改变 TPU 单元与 USC/ALU 比例。然而,我们的分析表明这并非一个好策略,原因有以下几点。

首先,在常规渲染过程中,D系列 GPU 中 ALU 与 TPU 的比例已经是最佳的,增加更多的 TPU 并不会带来任何好处,因为工作负载受限于 ALU。同时,其他处理过程是 TPU 密集型的,同时也是带宽密集型的,因此增强 TPU 并不会有帮助,因为没有足够的带宽来满足额外的 TPU 吞吐量,因此性能不会得到提升。

我们的团队发现后处理工作负载以及计算图像处理工作负载具有以下特点:

  • 在一个区域内进行规则的处理/采样,有大量的采样点重复利用,这些采样点命中纹理缓存;

  • 对单一渲染目标/纹理进行2D采样,不涉及层次细节 (LOD) 和透视。

上述两个特性促使我们在 D系列 GPU 中实现了新的 TPU 模式,可以使性能翻倍,但仅当硬件检测到这些特性时才生效。第一个特性是重要的,因为常规的采样加上样本重复利用率高(例如,移动窗口滤波器)可以避免带宽限制。第二个特性也是重要的,因为它使我们能够保持重复逻辑的数量较低,避免所有 TPU 逻辑均翻倍的前提下,提供峰值吞吐率翻倍的效果。

这种方法的结果是适度增加了TPU 的大小,但在策略生效的情况下性能翻倍,同时保持与总体特性相平衡。IMG D 系列 GPU 实现了真正的加速,并避免了 ALU 和/或带宽瓶颈情况,这些情况下 TPU 已经足够快。这意味着对于某些类型的处理,DXT-48-1536 将有效地表现出等同 DXT-96-1536的性能,每时钟处理双倍数量的双线性滤波纹理样本,与前代 CXT-48-1536 相比则可提供两倍的执行速率。

作为示例,下图显示了一个典型的手机游戏及其渲染过程。顶部的条形图从左边开始,显示了各种 Vulkan 渲染过程,其中包含几个预处理过程,通常用于阴影贴图,对深度测试单元造成很大压力。渲染的第二阶段是主场景,本例中是一个 GBuffer 渲染过程和一个光照过程。我们可以看到,这是帧处理时间的主要部分,ALU和 TPU 的负载相对均衡;这通过红色曲线(TPU 负载)和绿色曲线(ALU 负载)表示。我们可以看到,随着时间的推移,两者都显示出平均利用率,这对于主场景来说是典型的,其中 ALU 和 TPU 工作的混合比例平衡。

f9d6ec80-e5e5-11ef-9434-92fbcf53809c.png

最让我们感兴趣的渲染过程是最后一组,即后处理过程。通常,这是在之前的主渲染过程之上应用光晕、模糊等许多 HDR 风格后处理效果的地方。在这个区域值得注意的是,红色的 TPU 曲线在很多情况下都升高,而绿色的 ALU 曲线却非常低。这表明 TPU 单元造成了处理瓶颈——而这正是 2D 双速率 TPU 设计要解决的问题。它为这些工作负载将 TPU 的速度翻倍,从而将渲染时间减少了一半,加快了帧渲染的速度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4968

    浏览量

    131659
  • TPU
    TPU
    +关注

    关注

    0

    文章

    154

    浏览量

    21240
  • imagination
    +关注

    关注

    1

    文章

    601

    浏览量

    62321
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    TechWiz LCD 2D应用:不同结构下的VT曲线

    我们可以在TechWiz LCD 2D软件中调整电极的宽度,锥度,厚度和位置。 1. 案例结构 2. 建模过程 2.1在TechWiz LCD 2D中创建结构 2.2将com电极两个掩膜的宽度均
    发表于 06-13 08:44

    Techwiz LCD 2D应用:二维LC透镜建模分析

    Techwiz LCD 2D新的Lens掩膜结构 1. 摘要 Techwiz LCD 2D新增Lens掩膜结构,可以方便快捷的对LC 透镜进行建模分析。LC透镜由于体积小、焦距可变等优点,被认为是
    发表于 05-30 08:47

    HT 可视化监控页面的 2D 与 3D 连线效果

    HT 是一个灵活多变的前端组件库,具备丰富的功能和效果,满足多种开发需求。让我们将其效果化整为零,逐一拆解具体案例,帮助你更好地理解其实现方案。 此篇文章中,让我们一起深入探讨 2D 与 3D
    的头像 发表于 04-09 11:28 ?609次阅读
    HT 可视化监控页面的 <b class='flag-5'>2D</b> 与 3<b class='flag-5'>D</b> 连线效果

    TechWiz LCD 2D应用:半透反射式显示模式仿真

    根据具体条件需求,在TechWiz LCD 2D中创建堆栈结构,修改模拟条件和各层属性 3. 生成结果 3.1 半透反射式2D结构 3.2亮度图表
    发表于 04-08 08:49

    亿源通科技OFC 2025展示2D光纤阵列,助力OCS技术创新

    亿源通科技在OFC 2025展会上展示了其最新研发的2D矩阵式M×N光纤阵列(2D FA)。这种高精度2D光纤阵列旨在满足对OCS(光路交换)系统日益增长的需求,OCS(光路交换)系统是下一代光网
    的头像 发表于 04-03 11:25 ?437次阅读

    STM8/STM32 products有2D marking和没有2D marking的工艺有差别吗?

    请教下,STM8/STM32 products 有2D marking 和没有2D marking的工艺有差别吗?同一程序在使用时有2D标识的不能用。
    发表于 03-07 07:21

    从图形处理到AI加速,一文看懂Imagination D系列GPU

    ImaginationD系列于2022年首次发布,见证了生成式AI从云端到智能手机等消费设备中普及。在云端,由于GPU的可编程性、可扩展性和快速
    的头像 发表于 02-27 08:33 ?552次阅读
    从图形<b class='flag-5'>处理</b>到AI加速,一文看懂<b class='flag-5'>Imagination</b> <b class='flag-5'>D</b><b class='flag-5'>系列</b><b class='flag-5'>GPU</b>

    DLP4500能否连接其他2D相机?如何连接?

    DLP4500能否连接其他2D相机,品牌或者款式是否有限制,如何连接,你能提供硬件和程序吗
    发表于 02-27 06:03

    TechWiz LCD 2D应用:不同结构下的VT曲线

    我们可以在TechWiz LCD 2D软件中调整电极的宽度,锥度,厚度和位置。 1. 案例结构 2. 建模过程 2.1在TechWiz LCD 2D中创建结构 2.2将com电极两个掩膜的宽度均
    发表于 02-06 10:18

    AN-1249:使用ADV8003评估板将3D图像转换成2D图像

    电子发烧友网站提供《AN-1249:使用ADV8003评估板将3D图像转换成2D图像.pdf》资料免费下载
    发表于 01-08 14:28 ?0次下载
    AN-1249:使用ADV8003评估板将3<b class='flag-5'>D</b>图像转换成<b class='flag-5'>2D</b>图像

    技术前沿:半导体先进封装从2D到3D的关键

    技术前沿:半导体先进封装从2D到3D的关键 半导体分类 集成电路封测技术水平及特点?? ? 1. 发展概述 ·自20世纪90年代以来,集成电路封装技术快速发展,推动了电子产品向小型化和多功能方向迈进
    的头像 发表于 01-07 09:08 ?1796次阅读
    技术前沿:半导体先进封装从<b class='flag-5'>2D</b>到3<b class='flag-5'>D</b>的关键

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU

    之一,用来构建复杂的3D模型和场景。 在图形学中,图元是图形的基本元素。在图形渲染中,一个三角形的每个顶点都包含位置、颜色、纹理坐标等属性。 ●光栅化衔接 3D2D 世界 在顶点
    发表于 11-03 12:55

    利用Sitara AM57x处理器上的处理器SDK实现工业机器视觉的2D物体识别

    电子发烧友网站提供《利用Sitara AM57x处理器上的处理器SDK实现工业机器视觉的2D物体识别.pdf》资料免费下载
    发表于 10-10 09:36 ?0次下载
    利用Sitara AM57x<b class='flag-5'>处理</b>器上的<b class='flag-5'>处理</b>器SDK实现工业机器视觉的<b class='flag-5'>2D</b>物体识别

    Allegro推出2D霍尔效应速度和方向锁存器

    对于天窗顶电机位置,升降门电机,车窗升降电机和电子驻车制动(EPB)系统等应用,透过使用单个2D磁性速度和方向传感器,可以简化系统设计和生产,减少BOM,并提高系统安全性。APS12625和APS12626系列2D霍尔效应
    的头像 发表于 09-27 09:58 ?806次阅读

    TMAG511x 2D锁扣的优点

    电子发烧友网站提供《TMAG511x 2D锁扣的优点.pdf》资料免费下载
    发表于 09-13 09:53 ?0次下载
    TMAG511x <b class='flag-5'>2D</b>锁扣的优点