0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

安富利:FPGA加速AI推理加速成功应用案例

454398 ? 来源:安富利 ? 作者:安富利 ? 2020-09-29 10:43 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今,基于深度学习(DL)的人工智能AI)应用越来越广泛,不论是在与个人消费者相关的智能家居智能驾驶等领域,还是在视频监控、智慧城市等公共管理领域,我们都能看到其身影。

众所周知,实施一个完整的AI应用需要经历训练和推理两个过程。所谓“训练”,就是我们要将大量的数据代入到神经网络模型中运算并反复迭代,“教会”算法模型如何正确的工作,训练出一个DL模型。而接下来,我们就可以利用训练出来的模型来在线响应用户的需求,根据输入的新数据做出正确而及时的决策判断,这个过程就是“推理”。

通常来讲,一个AI应用中“训练”只需要做一次——有时这个工作会交给第三方专业的且有充沛算力资源的团队去做,而应用开发工程师要做的则是将训练好的模型部署到特定的硬件平台上,满足目标应用场景中推理过程的需要。由于推理过程会直接联系最终用户,推理的准确性和速度也会直接影响到用户体验的好坏,因此如何有效地为AI推理做加速,也就成了当下开发者普遍关心的一个热门的话题。

AI推理加速,FPGA胜出!

从硬件架构来看,可以支持AI推理加速的有四个可选方案,它们分别是:CPUGPU、FPGA和ASIC,如果对这几类器件的特性进行比较,会发现按照从左到右的顺序,器件的灵活性/适应性是递减的,而处理能力和性能功耗比则是递增的。

CPU是基于冯?诺依曼架构,虽然其很灵活,但由于存储器访问往往要耗费几个时钟周期才能执行一个简单的任务,延迟会很长,应对神经网络(NN)这种计算密集型的任务,功耗也会比较大,显然最不适合做AI推理。

GPU具有强大的数据并行处理能力,在做海量数据训练方面优势明显,而推理计算通常一次只对一个输入项进行处理的应用,GPU并行计算的优势发挥不出来,再加上其功耗相对较大,所以在AI推理方面也不是最优选择。

从高性能和低功耗的角度来看,定制的ASIC似乎是一种理想的解决方案,但其开发周期长、费用高,对于总是处于快速演进和迭代中的DL和NN算法来说,灵活性严重受限,风险太大,在AI推理中人们通常不会考虑它。

所以我们的名单上只剩下FPGA了。这些年来大家对于FPGA快速、灵活和高效的优点认识越来越深入,硬件可编程的特性使其能够针对DL和NN处理的需要做针对性的优化,提供充足的算力,而同时又保持了足够的灵活性。今天基于FPGA的异构计算平台,除了可编程逻辑,还会集成多个Arm处理器内核、DSP、片上存储器等资源,DL所需的处理能力可以很好地映射到这些FPGA资源上,而且所有这些资源都可以并行工作 ,即每个时钟周期可触发多达数百万个同时的操作,这对于AI推理是再合适不过了。

与CPU和GPU相比,FPGA在AI推理应用方面的优势还表现在:

  • 不受数据类型的限制,比如它可以处理非标准的低精度数据,从而提高数据处理的吞吐量。

v功耗更低,针对相同的NN计算,FPGA与CPU/GPU相比平均功耗低5~10倍。

  • 可通过重新编程以适应不同任务的需要,这种灵活性对于适应持续发展中的DL和NN算法尤为关键。
  • 应用范围广,从云端到边缘端的AI推理工作,都可胜任。

总之一句话,在AI推理计算的竞争中,FPGA的胜出没有悬念。

GPU无缝对接,FPGA即插即用

不过,虽然FPGA看上去“真香”,但是很多AI应用的开发者还是对其“敬而远之”,究其原因最重要的一点就是——FPGA上手使用太难了!

难点主要体现在两个方面:

  • 首先,对FPGA进行编程需要特定的技能和知识,要熟悉专门的硬件编程语言,还要熟练使用FPGA的特定工具,才能通过综合、布局和布线等复杂的步骤来编译设计。这对于很多嵌入式工程师来说,完全是一套他们所不熟悉的“语言”。
  • 再有,因为很多DL模型是在GPU等计算架构上训练出来的,这些训练好的模型移植、部署到FPGA上时,很可能会遇到需要重新训练和调整参数等问题,这要求开发者有专门的AI相关的知识和技能。

如何能够降低大家在AI推理中使用FPGA的门槛?在这方面,Mipsology公司给我们带来了一个“惊喜”——该公司开发了一种基于FPGA的深度学习推理引擎Zebra,可以让开发者在“零努力(Zero Effort)”的情况下,对GPU训练的模型代码进行转换,使其能够在FPGA上运行,而无需改写任何代码或者进行重新训练。

这也就意味着,调整NN参数甚至改变神经网络并不需要强制重新编译FPGA,而这些重新编译工作可能需要花费数小时、数天,甚至更长时间。可以说,Zebra让FPGA对于开发者成了“透明”的,他们可以在NN模型训练好之后,无缝地从CPU或GPU切换到FPGA进行推理,而无需花费更多的时间!

目前,Zebra可以支持Caffe、Caffe2、MXNet和TensorFlow等主流NN框架。在硬件方面,Zebra已经可以完美地支持Xilinx的系列加速卡,如Alveo U200、Alveo U250和Alveo U50等。对于开发者来说,“一旦将FPGA板插入PC,只需一个Linux命令”,FPGA就能够代替CPU或GPU立即进行无缝的推断,可以在更低的功耗下将计算速度提高一个数量级。对用户来说,这无疑是一种即插即用的体验。

图1,Zebra可适应由GPU加速器训练的NN,并无缝地在FPGA上部署

强强联手,全生态支持

更好的消息是:为了能够加速更多AI应用的落地,安富利亚洲和 Mipsology 达成了合作协议,将向其亚太区客户推广和销售 Mipsology 这一独特的 FPGA 深度学习推理加速软件 —— Zebra。

这对于合作的双方无疑是一个双赢的局面:对于Mipsology来说,可以让Zebra这个创新的工具以更快的速度覆盖和惠及更多的开发者;对安富利来说,此举也进一步扩展了自身强大的物联网生态系统,为客户带来更大的价值,为希望部署DL的客户提供一整套全面的服务,包括硬件、软件、系统集成、应用开发、设计链和专业技术。

安富利推理加速成功应用案例:智能网络监控平台AI Bluebox

编辑:hfy


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1646

    文章

    22097

    浏览量

    620766
  • 神经网络
    +关注

    关注

    42

    文章

    4814

    浏览量

    104489
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4980

    浏览量

    132120
  • AI
    AI
    +关注

    关注

    88

    文章

    35760

    浏览量

    282538
  • 深度学习
    +关注

    关注

    73

    文章

    5569

    浏览量

    123091
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    入华30周年发展历程回顾

    站在入华三十周年的历史节点回望,时光长河中镶嵌的里程碑熠熠生辉。从1995年入驻香港创办首间办公室,到如今业务网络广泛覆盖中国众多城市,逐步成长为推动中国电子产业生态发展与全球化布局的赋能型伙伴,
    的头像 发表于 08-06 15:51 ?247次阅读

    荣获Bourns三项大奖

    近日,凭借卓越表现荣膺由Bourns公司颁发的三项大奖——“2024年度最佳分销商”、 “2024年度最佳生意增长” 及“2024年度最佳设计奖”。以上荣誉不仅是对
    的头像 发表于 05-17 13:58 ?1132次阅读

    携手Nordic、TDK联合在线直播

    随着AI大模型推动物联网(IoT)向边缘端加速渗透,如何在资源受限的终端设备上高效部署AI成为各个行业的核心挑战。本次直播将深度解析
    的头像 发表于 05-09 14:22 ?587次阅读

    亮相第十八届中国电子信息年会

    此前,2025年4月17日至21日,在成都举办的第十八届中国电子信息年会上,中国区团队携手AMD以及战略合作伙伴共同亮相,带来多款展品,聚焦人工智能、边缘计算、FPGA开发等领域
    的头像 发表于 05-08 16:51 ?845次阅读
    <b class='flag-5'>安</b><b class='flag-5'>富</b><b class='flag-5'>利</b>亮相第十八届中国电子信息年会

    【米尔MYC-YM90X路飞龙DR1开发板】路科技 SALDRAGON开发板介绍

    。 Demo程序:预置工业相机图像采集Demo、机器人运动控制Demo及边缘AI推理Demo,加速项目启动。 SALDRAGON系列是路科技在高端
    发表于 04-28 17:57

    英伟达GTC2025亮点:Oracle与NVIDIA合作助力企业加速代理式AI推理

    Oracle 数据库与 NVIDIA AI 相集成,使企业能够更轻松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA 加速计算和推理软件与 Oracle 的
    的头像 发表于 03-21 12:01 ?817次阅读
    英伟达GTC2025亮点:Oracle与NVIDIA合作助力企业<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英伟达GTC25亮点:NVIDIA Dynamo开源库加速并扩展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展 AI 工厂中的 AI
    的头像 发表于 03-20 15:03 ?734次阅读

    Oracle 与 NVIDIA 合作助力企业加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速计算和推理软件与 Oracle 的 AI 基础设施以及生成式 AI 服务首次实现集成,以帮助全球企业组织
    发表于 03-19 15:24 ?396次阅读
    Oracle 与 NVIDIA 合作助力企业<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    最新研究解读AI应用的核心趋势与挑战,助力中国工程师把握AI机遇

    最新发布的年度研究报告显示 ,包括中国工程师在内的全球工程师普遍认为AI具有广泛的应用潜力,但目前难以确定AI将对哪个具体领域产生最大
    发表于 03-03 17:42 ?215次阅读
    <b class='flag-5'>安</b><b class='flag-5'>富</b><b class='flag-5'>利</b>最新研究解读<b class='flag-5'>AI</b>应用的核心趋势与挑战,助力中国工程师把握<b class='flag-5'>AI</b>机遇

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    。? AI加速器的开发:FPGA被广泛用于开发专为AI算法优化的加速器,例如深度学习推理
    发表于 03-03 11:21

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    资源浪费。例如,在深度学习模型推理阶段,FPGA可以针对特定的神经网络结构进行硬件加速,提高推理速度。 3.支持边缘计算与实时应用 ? 边缘计算:随着物联网的发展,越来越多的
    发表于 02-19 13:55

    存储需要Passion!德明PCIe Gen5 SSD加速AI应用落地

    存储需要Passion!德明PCIe Gen5 SSD加速AI应用落地
    的头像 发表于 01-21 16:33 ?760次阅读
    存储需要Passion!德明<b class='flag-5'>利</b>PCIe Gen5 SSD<b class='flag-5'>加速</b><b class='flag-5'>AI</b>应用落地

    FPGA和ASIC在大模型推理加速中的应用

    随着现在AI的快速发展,使用FPGA和ASIC进行推理加速的研究也越来越多,从目前的市场来说,有些公司已经有了专门做推理的ASIC,像Gro
    的头像 发表于 10-29 14:12 ?2190次阅读
    <b class='flag-5'>FPGA</b>和ASIC在大模型<b class='flag-5'>推理</b><b class='flag-5'>加速</b>中的应用

    NVIDIA助力丽蟾科技打造AI训练与推理加速解决方案

    丽蟾科技通过 Leaper 资源管理平台集成 NVIDIA AI Enterprise,为企业和科研机构提供了一套高效、灵活的 AI 训练与推理加速解决方案。无论是在复杂的
    的头像 发表于 10-27 10:03 ?938次阅读
    NVIDIA助力丽蟾科技打造<b class='flag-5'>AI</b>训练与<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解决方案

    推出新品牌Tria?以整合嵌入式计算选项

    宣布推出新品牌Tria ” 宣布推出新品牌Tria和名为Tria Technolog
    的头像 发表于 09-03 18:45 ?1094次阅读