0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

建立AI芯片新的衡量标准势在必行

454398 ? 来源:机器之心 ? 作者:半导体观察 ? 2020-10-28 12:06 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

因为人工智能的持续火热,AI芯片在过去几年里如雨后春笋般在全球各地冒出来。这就驱动行业去探索评估AI芯片性能的最优方法。

就如传统的芯片设计师追求PPA、CPU对比MIPS、GPU衡量Pixel和Texture一样,一个好的评估方法能够让开发者可以针对场景进行设计,同时可以指导研发调整优化防线,引导客户进行正确选择,同时能够促进行业有序协同向前发展。

快速提升的AI算法和落后的衡量方法

地平线联合创始人&技术副总裁黄畅在日前于深圳举办的2020全球人工智能和机器人峰会上指出,Intel联合创始人戈登摩尔在1965年提出摩尔定律,这揭示信息技术进步速度的定律得到了充分的行业验证。但进入最近几年,半导体工艺已经接近了尾声。

“与此同时,AI对算力的要求大幅度增加,那就意味着如果我们如果仅靠半导体工艺的提升来满足快速增长AI需求,那就变得不甚现实。”黄畅说。为此大家都开始将目光投向计算效率。

以ImageNet为例,作为AI领域的奥林匹克竞赛,它吸引了学术界和产业界的关注,而在过去的发展中,则分为三个阶段:第一阶段是通过算法专家精心设计网络结构,不断增加计算量提升ImageNet的精度;到了第二阶段的ResNet,它的精度、计算量都有显著提升;在后续几年,来自谷歌等等各个领域的专家通过手工设计新的网络结构,不断地推动这个算法演进,使得我们可以以更低的计算量达到更高的精度。

“ 从2016年到2018年,我们发现在ImageNet上的精度基础趋近饱和,精准度始终保持在80%的水平,精度发生饱和之后,大家开始关注计算的效率,越来越多的效率也得到了重视,并推出了非常多轻量级网络”,黄畅补充说。“去年EfficientNet的推出更是震惊了长期关注ImageNet的所有的学术研究者”,黄畅强调。

他指出,EfficientNet的基准网络和硬件无关,它只关注计算量本身,也就是进行了多少次乘法或加法的运算,其中最小的网络只有0.4G,并且还能自动化搜索网络的所有结构。此外,它还要搜索层次、图像分别率,所带来的的不仅是参数提升了,分辨率也同时提升了,有助于它提升图像识别的精度。

然而回到人工智能的性能评估领域,从TFLOPS,到TOPS,再到近三年MLPerf的崛起,AI芯片依然没能找到准确的衡量标准。以MLPerf为例,虽然这个评估标准给大家提供了一个展现AI芯片能力的平台,但它依然面临着几方面的挑战,这与他们在测试前必须选定模型有关。“模型更新非常慢,根本无法及时反应整个算法效率的提升。而模型又非常少,也很难反映各个精度上速度全貌”,

由此可见,为AI芯片建立一个新的衡量标准势在必行。

全新的芯片AI性能评估方式——MAPS

在黄畅看来,评估芯片的AI性能,可以从准、快、省这三个维度来看。其中“准”是反映实际需求任务上的算法精度,比如说图像分类里面我们用Top-1或者Top-5的精度判断它是不是准;“快”的方面,通常有延迟和吞吐率两个维度,前者更侧重于处理单个任务的最快反应时间,后者应用于你可以在服务器层面上用最大的处理方式处理它的吞吐率;“省”就是看它的成本和功耗。

“对于AI芯片的性能评估来讲,准和快是两个非常重要的因素”。黄畅强调。

基于此,地平线提出了新的芯片AI性能评估方式——MAPS,即MeanAccuracy-guaranteed processing speed(在精度有保障范围内的平均处理速度)。这个新方式的提出,是想在精度有保障的范围测出芯片的平均效能表现,并得到一个全面、完整、客观和真实的评估。按照黄畅的说法,这个全新的评估方式对行业来说有六大创新之处:

第一,它可以可视化芯片的Benchmark,我们可以通过可视化的图形更精确的表达;

第二,我们关注真实、面向结果的需求,只在乎精度和速度,不在乎中间任何关于算法的取舍和选择;

第三,可以统一表示精度与速度,关注主流精度区间;

第四,隐藏与最终结果无关的中间变量,包括模型、输入大小、批处理的量是多大;

第五,通过这种方法可以在算力之外帮助用户理解这个芯片到底能跑多快以及多好,最终留有最大的空间引导客户使用最优的方式使用这颗芯片,指导客户使用这个芯片的最佳实践。

第六,有最大的空间引导客户使用最优的方式使用这颗芯片,作为指导客户使用芯片最佳实践的这一点非常重要。

作为 AI 领域的奥林匹克竞赛,ImageNet 比赛产生了几乎所有机器视觉中最重要的模型,它们在 ImageNet 上的精度可充分迁移到其他机器视觉任务(如物体检测、语义分割等)。在 ImageNet 的主流精度范围(75~80%)下,速度最快的模型所代表的点(由精度和帧率确定)所围多边形面积大小即为芯片处理ImageNet AI任务的能力大小,其公式为MAPS = 所围面积 /(最高精度-最低精度)。在演讲现场,黄畅还展示了MAPS评估方式在在ImageNet上的定义与主流芯片测试结果。

上图为MAPS评估方式下主流芯片测试结果,右一折线为地平线最新一代芯片测试结果 “如果我们用MAPS,它是更能真实反映AI性能指标”,黄畅说。如下图所示,这主要由三个要素组成:第一是TOP/Watt、TOPS/$这样的指标,这是传统的方式。等式右边则是由理论峰值计算效能、有效利用率和AI算法效率构成。

“我们希望有更多的软件、算法工作者,在MAPS评估指导体系的启发下,从自己最擅长的能力上持续推动AI芯片能力的发挥”,黄畅最后说。
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11099

    浏览量

    217760
  • 人工智能
    +关注

    关注

    1809

    文章

    49164

    浏览量

    250755
  • 半导体工艺
    +关注

    关注

    19

    文章

    107

    浏览量

    26703
  • AI芯片
    +关注

    关注

    17

    文章

    1990

    浏览量

    35997
  • 算力
    +关注

    关注

    2

    文章

    1222

    浏览量

    15736
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    、请在收到书籍后2个星期内提交不少于2篇试读报告要求300字以上图文并茂。 4、试读报告发表在电子发烧友论坛>>社区活动专版标题名称必须包含 【「AI芯片:科技探索与AGI愿景
    发表于 07-28 13:54

    四大核心要素驱动汽车智能化创新与相关芯片竞争格局

    当下,功能安全、高效高灵活性的算力、产品生命周期,以及软件生态兼容性这“四大核心要素”,已成为衡量智能汽车AI芯片创新力和市场竞争力的核心标准
    的头像 发表于 07-01 14:49 ?252次阅读

    【「零基础开发AI Agent」阅读体验】+读《零基础开发AI Agent》掌握扣子平台开发智能体方法

    /, 在上面注册一个账号,并由快速开始进入开发操作空间,建立开发AI Agent的各开发要素进行定义,从而完成AI Agent的开发过程。 本书的多个例子也可以进行在这个平台进行练习。 本书的缺陷就是由于项目
    发表于 05-14 19:51

    明晚开播 | 开源芯片系列讲座第27期:RISC-V AI指令集的标准化与开源实现

    鹭岛论坛开源芯片系列讲座第27期「RISC-VAI指令集的标准化与开源实现」明晚(26日)21:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目RISC-VAI指令集的标准化与开源实现
    的头像 发表于 03-25 08:12 ?354次阅读
    明晚开播 | 开源<b class='flag-5'>芯片</b>系列讲座第27期:RISC-V <b class='flag-5'>AI</b>指令集的<b class='flag-5'>标准</b>化与开源实现

    直播预约 | 开源芯片系列讲座第27期:RISC-V AI指令集的标准化与开源实现

    鹭岛论坛开源芯片系列讲座第27期「RISC-VAI指令集的标准化与开源实现」3月26日(周三)21:00精彩开播期待与您云相聚,共襄学术盛宴!|直播信息报告题目RISC-VAI指令集的标准化与开源
    的头像 发表于 03-10 17:55 ?721次阅读
    直播预约 | 开源<b class='flag-5'>芯片</b>系列讲座第27期:RISC-V <b class='flag-5'>AI</b>指令集的<b class='flag-5'>标准</b>化与开源实现

    EVASH芯片公司接入DeepSeek:AI驱动的芯片设计革新

    EVASH芯片公司接入DeepSeek:AI驱动的芯片设计革新
    的头像 发表于 03-03 17:45 ?497次阅读

    AI芯片上的应用:革新设计与功能

    AI芯片上的应用正在深刻改变着芯片设计、制造和应用的全过程。未来,随着AI技术的不断进步和应用场景的不断拓展,AI
    的头像 发表于 02-17 16:09 ?628次阅读

    deepseek国产芯片加速 DeepSeek的国产AI芯片天团

    ,从而纷纷继续“卷”起来,效仿DeepSeek的“开源”模式。 对于DeepSeek本身,人们关注其如何在有限算力实现强大性能,更关注其在重重条令围城之下的未来之路。而在最近,全世界的芯片厂商集体出动,纷纷宣布支持DeepSeek。尤其是众多国产AI
    的头像 发表于 02-10 15:07 ?4006次阅读
    deepseek国产<b class='flag-5'>芯片</b>加速 DeepSeek的国产<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>天团

    算智算中心的算力如何衡量

    (ComputationalPower)是指智算中心通过其内部的计算设备(如CPU、GPU、AI芯片等)对数据进行处理和计算的能力。它体现了智算中心在单位时间内能够完成的计算任务量,
    的头像 发表于 01-16 14:03 ?2675次阅读
    算智算中心的算力如何<b class='flag-5'>衡量</b>?

    进迭时空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介绍

    和 2.0TOPS 原生 AI 算力。单核 CPU 算力是 ARM A55 的 130% 以上。应用领域 :适用于需要高性能计算的场景,如工业控制和边缘计算等领域。(二)强大的向量算力技术标准 :支持 RVA22
    发表于 01-06 17:37

    DAC80004的转换速率是不是用setting time这个参数来衡量

    DAC的转换速率是不是用setting time这个参数来衡量?如果建立时间是1us,是不是表示转换速率是1Msps,我看到DAC80004的setting time是5.8us,在产品选型的时候
    发表于 12-31 08:00

    编码器刻线数与精度数的关系

    编码器刻线数与精度数的关系!精度数的衡量标准:精度数的衡量标准通常包括分辨率、重复性和准确性等。分辨率是指编码器能够检测到的最小位置变化;重复性是指在相同条件下多次测量时结果的一致性;准确性则是指
    的头像 发表于 12-18 10:41 ?794次阅读
    编码器刻线数与精度数的关系

    AI芯片的混合精度计算与灵活可扩展

    、NPU、DSP等。 ? 而无论是哪种架构,如何判断其性能优劣都至关重要,而这就涉及到AI芯片的各项性能指标,如算力、能效、时延等。其中AI芯片的算力精度是
    的头像 发表于 08-23 00:08 ?6003次阅读

    衡量运算放大器的速度用的是SR压摆率,衡量比较器的速度在datasheet上一般用什么参数?

    衡量运算放大器的速度用的是SR压摆率,那么衡量比较器的速度在datasheet上一般用什么参数。怎么去看这个参数?
    发表于 08-22 08:26

    功放芯片中说的失真10%在实际应用中怎么衡量

    功放芯片中说的失真10%在实际应用中怎么衡量
    发表于 08-14 06:03