0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TOPS 与现实世界的性能:AI 加速器的基准性能

juju宇哥 ? 来源:juju宇哥 ? 作者:juju宇哥 ? 2022-07-14 17:17 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

蓬勃发展的机器学习人工智能新兴用例有望通过加速信息处理和提高决策准确性为行业创造重大价值。但机器学习模型是计算密集型、需要高频和实时 AI 分析场景,这导致企业依赖于使用每秒万亿次操作 (TOPS) 指标的性能指导。TOPS 捕捉到“加速器在一秒钟内可以提供多少数学运算?” 比较和确定给定推理任务的最佳加速器。

虽然 TOPS 是一个“容易”计算的指标,但它通常无法为实际工作负载提供可靠的性能指标。受限于加速器中乘法器和加法器的数量,该指标无法考虑处理神经网络模型的计算硬件结构。随着数据网络模型更快地处理数据,企业如何通过更快、更可靠的决策进行扩展,尤其是在边缘?

在这篇文章中,我们将回顾 TOPS、它在测量延迟方面的挑战以及它与现实世界的性能计算有何不同,并提供一种通过基准测试来计算性能的替代方法,它提供了一种更可靠的方法来解释计算硬件结构。

TOPS 作为绩效衡量标准的现实

TOPS 是一个简化指标:它告诉您 AI 加速器在一秒钟内可以处理多少计算操作,并且利用率为 100%。本质上,它着眼于加速器可以在很短的时间内解决多少数学运算问题。

例如,如果一个 AI 加速器提供 5 TOPS,另一个提供 15 TOPS,则推断后者比前者快三倍。但是,就像 CPU 速度的兆赫兹和千兆赫兹一样,TOPS 也失去了确定整体计算机性能的相关性。随着人们对 AI 应用的兴趣日益浓厚,最新的 AI 加速器可以比简单的算术更快地处理数据,并且更复杂。

然而,TOPS 很少准确地捕捉到 AI 处理器在整个硬件设备中的重要性。如今,相机、边缘服务器和计算机中的 AI 处理器通常是决定计算能力和能源效率的关键组件之一。事实上,TOPS 未能考虑到现实世界的工作量。通常,由于诸如空闲计算机单元等待来自内存的数据、加速器不同部分之间的同步开销和控制开销等因素,实际性能可能会显着低于 TOPS 值。根据加速器的架构和工作负载特性,

更高的 TOPS 不等于更高的性能

虽然较高的 TOPS 值可以表示具有更多计算元素的更大 AI 加速器,但现实情况可能恰恰相反。更高的 TOPS 通常会导致更大的加速器具有更多的计算元素和内存块,以将数据馈送到这些计算单元,这会导致更高的成本和功耗。另一方面,高效的加速器使用较少数量的计算资源提供更高的性能,因此 TOPS 评级较低。最终,理想的 AI 加速器是使用低 TOPS 提供高性能的加速器。

TOPS 不包括所有计算类型

TOPS 指标考虑了加速器的乘法器和加法器,这通常会导致性能指标不准确,因为加速器可以拥有除此之外的其他计算资源。例如,Kinara 的架构采用归约树而不是加法器阵列,从而显着降低能耗。由于在此计算中未捕获归约树的计算能力,TOPS 指标将不够准确。ResNet50、MobileNet V1 和 YOLO_v3 等标准神经网络在比较不同的加速器时非常有用,因为它们也可以用作“猜测”给定加速器是否能够满足开发人员自身工作负载需求的代理。

推理延迟是评估 AI 加速器性能的指标

对于在 Edge AI 上进行投资的企业,通过基准测试计算性能提供了一种可靠的方法来计算计算硬件结构与 TOPS。由于大多数实际应用程序需要极快的推理时间,因此衡量性能的最佳方法是运行特定的工作负载,通常是 ResNet-50、EfficientDet、Transformer 或自定义模型,以了解加速器的效率。使用不同类型、大小、拓扑和输入分辨率的网络进行实时处理,可以得出推理延迟度量。该指标计算加速器完成一个特定 AI 模型的干扰的执行时间。

随着 AI 工作负载及其支持计算架构的发展,通过准确的性能测量确保其可预测性具有重大影响,可以引导开发人员做出更优化的决策。通过使用推理延迟计算,它有助于处理和预测现代 AI 工作负载中的数据流,即使这些工作负载碎片化并且新架构的发展导致更多的不可预测性。最终,基准测试应用程序提供了一种可信且更可靠的 TOPS 替代方案,而 AI 加速器支持更有效的评估。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    828

    浏览量

    39206
  • AI
    AI
    +关注

    关注

    88

    文章

    35506

    浏览量

    281395
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    芯原可扩展的高性能GPGPU-AI计算IP赋能汽车与边缘服务AI解决方案

    与人工智能 (AI) 加速器相融合,这些IP在热和功耗受限的环境下,能够高效支持大语言模型 (LLM) 推理、多模态感知以及实时决策等复杂的AI工作负载。 芯原的GPGPU-AI计算I
    的头像 发表于 06-16 10:44 ?804次阅读

    Banana Pi 发布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    低功耗特性。搭载 Renesas 独有的 DRP-AI 加速器,支持 15 Sparse TOPSAI 计算能力,使其在计算机视觉、边缘 AI
    发表于 03-19 17:54

    嵌入式AI加速器DRP-AI 详细介绍

    的嵌入式设备。此外,人工智能正在不断发展,新的算法不时被开发出来。 在人工智能快速发展的过程中,瑞萨开发了人工智能加速器(DRP-AI)和软件(DRP-AI翻译),既提供高
    的头像 发表于 03-15 16:13 ?1072次阅读
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 详细介绍

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    。? AI加速器的开发:FPGA被广泛用于开发专为AI算法优化的加速器,例如深度学习推理加速器。这种定制化的硬件设计能够显著提升
    发表于 03-03 11:21

    英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司发布了备受瞩目的Janus Pro模型,其凭借超强性能和高精度在业界引发了广泛关注。为了进一步提升该模型的应用效能,英特尔宣布其Gaudi 2D AI加速器已针对Janus
    的头像 发表于 02-10 11:10 ?660次阅读

    EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器

    电子发烧友网站提供《EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器.pdf》资料免费下载
    发表于 01-07 14:12 ?0次下载
    EE-436:使用ADSP-SC59x/2159x高<b class='flag-5'>性能</b>FIR/IIR<b class='flag-5'>加速器</b>

    从版本控制到全流程支持:揭秘Helix Core如何成为您的创意加速器

    加速器
    龙智DevSecOps
    发布于 :2024年11月26日 13:42:47

    IBM与AMD携手部署MI300X加速器,强化AI与HPC能力

    举措预计将于2025年上半年正式推出。 此次合作的核心目标是提升通用人工智能(AI)模型的性能与能效,并为企业客户提供高性能计算(HPC)应用的强大支持。AMD的Instinct MI300X
    的头像 发表于 11-21 11:07 ?823次阅读

    IBM将在云平台部署AMD加速器

    IBM与AMD近期宣布了一项重要合作协议,根据协议,IBM将在其云平台上部署AMD Instinct MI300X加速器。这一举措旨在提升企业客户在生成式AI模型方面的性能和能效,进一步推动A
    的头像 发表于 11-19 16:24 ?634次阅读

    IBM与AMD携手将在IBM云上部署AMD Instinct MI300X加速器

    近日,全球领先的科技企业IBM与AMD共同宣布了一项重要合作。双方计划在IBM云上部署AMD的Instinct MI300X加速器服务,以满足企业客户对于高性能和高效能AI模型的需求。 据悉,这项
    的头像 发表于 11-19 11:03 ?909次阅读

    树莓派新推AI HAT+:26 TOPS性能版本震撼登场

    供了两种性能配置供用户选择。其中,基础版配备了Hailo-8L加速器性能达到13 TOPS(每秒万亿次操作),售价为70美元;而更为强大的高端版本则采用了Hailo-8
    的头像 发表于 11-07 13:44 ?1403次阅读

    最强服务CPU来了!AI性能直接翻倍

    以及AI服务AI数据中心场景的CPU产品。它不仅能支持广泛的第三方GPU及AI加速器,与它们组合形成强大的异构计算平台,还能在其中补足G
    的头像 发表于 09-29 11:00 ?1076次阅读
    最强服务<b class='flag-5'>器</b>CPU来了!<b class='flag-5'>AI</b><b class='flag-5'>性能</b>直接翻倍

    SiFive发布MX系列高性能AI加速器IP

    AI技术日新月异的今天,RISC-V IP设计领域的领军企业SiFive再次引领行业潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。这
    的头像 发表于 09-24 14:46 ?872次阅读

    TDA4 Edge AI处理性能和效率基准测试

    电子发烧友网站提供《TDA4 Edge AI处理性能和效率基准测试.pdf》资料免费下载
    发表于 09-11 09:21 ?0次下载
    TDA4 Edge <b class='flag-5'>AI</b>处理<b class='flag-5'>器</b>的<b class='flag-5'>性能</b>和效率<b class='flag-5'>基准</b>测试

    刷新AI PC NPU算力,AMD锐龙AI 9 HX 375领衔55 TOPS

    电子发烧友网报道(文/黄晶晶)最近AMD官网上线了锐龙AI 300系列中的最新成员锐龙AI 9 HX 375处理。原本Ryzen AI 9 HX 370的NPU达到了50
    的头像 发表于 08-07 00:28 ?4899次阅读
    刷新<b class='flag-5'>AI</b> PC NPU算力,AMD锐龙<b class='flag-5'>AI</b> 9 HX 375领衔55 <b class='flag-5'>TOPS</b>