0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM 新款高能效 AI 芯片:能效比高过 NVIDIA A100

工程师邓生 ? 来源:芯东西 ? 作者:温淑 ? 2021-02-19 11:03 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2 月 18 日报道,本届集成电路设计领域顶会 “国际固态电路会议(ISSCC 2021)”正在进行中(2021 年 2 月 13 日到 22 日)。作为已有近 70 年历史的集成电路产学届盛会,ISSCC 2021 亦被许多厂商视为发布其领先芯片技术的权威舞台。

本届会议上,IBM 发表了据称是 “全球首款”的高能效 AI 芯片,该芯片采用 7nm 制程工艺,可达到 80% 以上的训练利用率和 60% 以上的推理利用率,而通常情况下,GPU 的利用率在 30% 以下。

性能参数方面,IBM 新品的运算密度高于同样采用 7nm 工艺的 NVIDIA A100 GPU;其在多种精度下的整数运算性能,还优于联发科 7nm 专用 AI 芯片等产品。

据 IBM 官网分享,其新款 7nm 高能效 AI 芯片该款芯片在多种场景中均有较好的应用前景,比如,可用于混合云环境中的低能耗 AI 训练、或用于实现更接近边缘的云端训练等。

一、IBM 新款高能效 AI 芯片:能效比高过 NVIDIA A100

对比结果显示,IBM 新款 7nm 高能效 AI 芯片的性能和能效,不同程度地超越了 IBM 此前推出的 14nm 芯片、韩国科学院(KAIST)推出的 65nm 芯片、阿里巴巴旗下芯片公司平头哥推出的 12nm 芯片含光 800、NVIDIA 推出的 7nm 芯片 A100、联发科推出的 7nm 芯片。

IBM 新款 7nm 高能效 AI 芯片支持 fp8、fp16、fp32、int4、int2 混合精度。

在 fp32 和 fp8 精度下,IBM 新款高能效 AI 芯片的每秒浮点运算次数,分别达到 16TFLOPS 和 25.6TFLOPS;运算密度分别为 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2;能效比分别为 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精度下,IBM 新款高能效 AI 芯片的运算密度分别为 3.27TOPS/mm^2 和 5.22TOPS/mm^2;能效比分别为 16.5TOPS/W 和 8.9TOPS/W。

对比之下,IBM 此前推出的 14nm 芯片在 fp32 和 fp8 精度下的每秒浮点运算次数,分别为 2TFLOPS 和 3TFLOPS;在在 fp32 精度下的能效比为 1.4TFLOPS/W。

另外,在 7nm 芯片阵营中,NVIDIA A100 GPU 在 fp16 精度下的能效比为 0.78TFLOPS/W,在 int4 精度下的能效比为 3.12TOPS/W,均低于 IBM 新款高能效 AI 芯片。

pIYBAGAvK12AaOpeAAFehISLSRQ350.jpg

▲ IBM 新款高能效 AI 芯片与同类产品的性能参数对比

二、采用 IBM 自研超低精度训练 / 推理设计

IBM 官网文章写道,其新款 AI 芯片之所以能够兼顾能效和性能,是因为该芯片支持超低精度混合 8 位浮点格式((HFP8,hybrid FP8)。这是 IBM 于 2019 年发布的一种高度优化设计,允许 AI 芯片在低精度下完成训练任务和不同 AI 模型的推理任务,同时避免任何质量损失。

据悉,目前 IBM 将超低精度混合 8 位浮点格式用于训练、超低精度混合 4 位浮点格式用于推理,并开发了数据通信协议,以提升多核心 AI 芯片上不同核心间的数据交换效率。

据 IBM 官网文章,自 2015 年起,该公司每年将芯片的功耗性能提升 2.5 倍。这背后,IBM 致力于实现算法、架构、软件堆栈等各方面的创新。

▲ IBM 在低精度 AI 训练、推理方面的研究历程

除了采用超低精度混合 8 位浮点格式外,IBM 新款高能效 AI 芯片添加了电源管理功能。IBM 研究显示,在同等功率的情况下,通过减缓计算阶段的功率消耗,可以最大限度地提升芯片性能。

结语:AI 发展对芯片能耗提出更高要求

随着智能化浪潮席卷各个领域,AI 模型的复杂性日趋提高。相应地,AI 应用的能源消耗水平亦水涨船高。这一背景下,如何最大限度提升能效,成为 AI 芯片设计玩家们面临的重要命题。

IBM 通过采用超低精度混合 8 位浮点格式和内置电源管理功能,为其新款 AI 芯片实现了业界领先的高能效。但是,这一芯片尚未实现规模化量产,仍有待市场检验。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    460

    文章

    52624

    浏览量

    442793
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1828

    浏览量

    75929
  • NVIDIA
    +关注

    关注

    14

    文章

    5324

    浏览量

    106657
  • AI
    AI
    +关注

    关注

    88

    文章

    35506

    浏览量

    281400
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    优化电机控制以提高能

    机器人及工厂自动化设备密布的工业环境,电机已成为不可或缺的动力核心。 与能耗 根据美国能源信息署数据,全球约50%的能源消耗来自电机系统,而在工业领域,这一比例更高达80%。以2022年美国为例
    发表于 06-11 09:57

    比和算力提升的衡量方法

    一、比的衡量方法 定义与计算公式? 比(EER)定义为制冷量与输入功率的比值,计算公式为:?EER = Q / W?(Q为制冷量,W为输入功率)。公制单位通常采用kW/W,英制
    的头像 发表于 04-28 07:47 ?1650次阅读
    <b class='flag-5'>能</b><b class='flag-5'>效</b>比和算力提升的衡量方法

    Arm 推出 Armv9 边缘 AI 计算平台,以超高能与先进 AI 能力赋物联网革新

    架构的超高能 CPU——Arm Cortex-A320 以及对 Transformer 网络具有原生支持的 Ethos-U85 AI 加速器为核心的边缘
    的头像 发表于 03-06 11:43 ?1369次阅读
    Arm 推出 Armv9 边缘 <b class='flag-5'>AI</b> 计算平台,以超<b class='flag-5'>高能</b><b class='flag-5'>效</b>与先进 <b class='flag-5'>AI</b> 能力赋<b class='flag-5'>能</b>物联网革新

    高速公路综合管理:从理论到实践的跨越

    ,不仅面临着复杂的地质情况和建设难度,更需要在管理上寻求创新与突破。本文将结合都巴高速的实际应用案例,探讨高速公路综合管理的创新实践。 二、项目概述 ? ? ? 都巴高速主线全
    的头像 发表于 02-28 15:42 ?358次阅读
    高速公路综合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理:从理论到实践的跨越

    中央空调系统管理解决方案

    中央空调系统管理解决方案
    的头像 发表于 02-14 08:03 ?392次阅读
    中央空调系统<b class='flag-5'>能</b><b class='flag-5'>效</b>管理解决方案

    英伟达A100和H100比较

    英伟达A100和H100都是针对高性能计算和人工智能任务设计的GPU,但在性能和特性上存在显著差异。以下是对这两款GPU的比较: 1. 架构与核心规格: A100: 架构: 基于Ampere架构
    的头像 发表于 02-10 17:05 ?5005次阅读
    英伟达<b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比较

    IGBT模块在颇具挑战性的逆变器应用中提供更高能

    背景:电力驱动的虽高,但电动汽车、数据中心、热泵等应用仍需大量能源运行,因此提高能至关重要。 技术原理:IGBT(绝缘栅双极晶体管)模块是一种电力电子器件,它结合了MOSFET的
    的头像 发表于 01-16 10:47 ?577次阅读

    安科瑞管理监测云平台

    管理监测云平台的主要内容包括以下几个方面: 制定科学的管理制度和标准; 建立完善的能源监测系统和数据分析平台; 推进节能技术和设备的研发和应用; 加强人员培训和管理,提
    的头像 发表于 12-18 14:52 ?532次阅读
    安科瑞<b class='flag-5'>能</b><b class='flag-5'>效</b>管理监测云平台

    Erp指令

    ErP指令EC244/2009、EC245/2009、EU1194/2012和标签指令EU874/2012已经实行多年,欧盟委员会在近3年通过参照不断改进的照明产品技术、环境和经济因素以及实际
    的头像 发表于 11-20 23:57 ?617次阅读
    Erp指令<b class='flag-5'>能</b><b class='flag-5'>效</b>

    直播预约 |开源芯片系列讲座第24期:SRAM存算一体:赋高能RISC-V计算

    鹭岛论坛开源芯片系列讲座第24期「SRAM存算一体:赋高能RISC-V计算」11月27日(周三)20:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目SRAM存算一体:
    的头像 发表于 11-16 01:10 ?777次阅读
    直播预约 |开源<b class='flag-5'>芯片</b>系列讲座第24期:SRAM存算一体:赋<b class='flag-5'>能</b><b class='flag-5'>高能</b><b class='flag-5'>效</b>RISC-V计算

    上海贝岭超小封装物联网监测芯片BL0971介绍

    为实现这些监测及应用需求,上海贝岭在之前的物联网监测芯片BL0972的基础上,针对直流充电桩的应用需求,推出了超小封装的BL0971交直流
    的头像 发表于 11-15 11:27 ?1384次阅读
    上海贝岭超小封装物联网<b class='flag-5'>能</b><b class='flag-5'>效</b>监测<b class='flag-5'>芯片</b>BL0971介绍

    安森美推动数据中心革新

    随着数据中心为了满足人工智能(AI)计算的庞大处理需求而变得越来越耗电,提高能变得至关重要。与一般的搜索引擎请求相比,搭载AI的引擎需要消耗超过10倍的电力。加快功率半导体的创新以改
    的头像 发表于 11-14 09:41 ?635次阅读

    智慧水务综合管理系统-提高污水厂

    简婷 安科瑞电气股份有限公司 上海嘉定 201801 AcrelEMS-SW智慧水务管理平台 1平台概述 安科瑞电气具备从终端感知、边缘计算到管理平台的产品*态体系,Acrel
    的头像 发表于 10-21 14:14 ?550次阅读
    智慧水务综合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理系统-提高污水厂<b class='flag-5'>能</b><b class='flag-5'>效</b>

    联发科天玑9400发布:比与端侧AI引领移动芯片行业革新

    AI大模型的推动下,智能手机市场的高端化进程进一步加速,旗舰机型的竞争已不再单纯依赖于“大力飞砖”式的极限性能比拼,而是更加注重综合素质的提升。特别是在手机芯片领域,高性能与低功耗、高能
    的头像 发表于 10-12 15:56 ?1202次阅读

    使用TPS2116实现建筑自动化应用的高能

    电子发烧友网站提供《使用TPS2116实现建筑自动化应用的高能.pdf》资料免费下载
    发表于 09-25 11:12 ?0次下载
    使用TPS2116实现建筑自动化应用的<b class='flag-5'>高能</b><b class='flag-5'>效</b>