0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

FPGA、eFPGA、加速卡,全面应对多样化的边缘AI

21克888 ? 来源:电子发烧友网 ? 作者:黄晶晶 ? 2022-07-13 16:41 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

与将数据处理集中在云计算设施或数据中心进行云端训练和推理的模式不同,边缘AI在本地就能给终端设备提供智能化功能,并且具有低延迟、隐私保护等优势。据市场咨询公司ABI Research的数据显示,预计到2025年,边缘AI芯片市场的收入将达到122亿美元,云AI芯片市场的收入将达到119亿美元,边缘AI芯片市场将超过云AI芯片组市场。边缘AI芯片当前主要用于AI推理,未来可实现边缘AI训练乃至自主学习,从而使得边缘AI更加智能。由于边缘AI的兴起,不同于云端AI的GPU占据主流,FPGAASIC等芯片在边缘AI的价值得到更多体现。

最近,电子发烧友采访到Achronix中国区总经理郭道正,郭总分享了作为一家FPGA厂商怎么看到边缘AI,以及Achronix有哪些先进的解决方案等话题。

边缘AI对FPGA和eFPGA的需求


郭道正表示,边缘AI将在智能化时代发挥巨大的作用,但是边缘AI的应用场景数量众多,这意味着它们需要不同的计算器件和算力等级。这也意味着边缘的计算架构应该有很高的灵活性,而这正是FPGA技术在提供并行计算的同时还能提供的。在工业应用中还有一些特殊的要求,如工业通信协议转换或者时常更新等,而FPGA是满足这些要求的最好技术。

Achronix中国区总经理郭道正



他进一步指出,实际上,边缘AI也不得不面临许多云端推理/机器学习不会面对的制约因素,如系统的大小、功耗和成本等;同时,边缘AI的计算设备不得不面临来自于各种各样的传感器等数据源的数据;此外,这些数据可能还是通过不同的专用通信协议传输过来的,这在许多垂直行业中非常常见。因此,边缘AI的计算架构必须拥有足够的灵活性和可编程性,这也就是我们认为FPGA是边缘AI最好技术之一。

不过正因为边缘AI面对的复杂性,因此独立FPGA似乎并不能完全满足所需。因此,Achronix为解决方案提供商提供了eFPGA IP。郭道正说道:“在他们自己面向边缘AI推出的ASIC或SoC等芯片上,他们可以在其特有的计算器件旁边引入我们的Speedcore eFPGA IP来作为硬件加速器,从而为整个边缘AI解决方案带来非常高的性价比和能效,并同时为新的应用场景、新的算法、新的协议甚至新的传感器保持足够的灵活性。”

全面FPGA技术和三大产品组合


Achronix为边缘AI提供了全面的FPGA技术和产品组合。Achronix的解决方案包括Speedster7t系列独立FPGA芯片、Speedcore eFPGA IP和VectorPath加速卡,所有这些都由Achronix ACE工具链提供支持。

Speedster7t系列独立FPGA芯片

据介绍,Speedster7t FPGA的特点是在其高性能、高密度逻辑阵列之外,还具有二维片上网络(2D NoC)和机器学习处理器(MLP),该器件采用7nm工艺打造。这样,开发人员就不必担心数据在流进流出以及芯片内部流动的带宽。

具体来看,Speedster7t FPGA架构的各个方面都经过了优化,以便为AI/ML应用创建一个优化的、平衡的、大规模并行的计算引擎。每个Speedster7t FPGA都具有一个大规模并行的可编程计算单元阵列,并被整合成全新的机器学习处理器(MLP)模块。每个MLP都是一个高度可配置的、计算密集型的单元模块,具有多达32个乘法器,支持4到24位的整数格式和各种浮点格式,包括直接支持Tensorflow的bfloat16格式和块浮点(BFP)格式。同时,Speedster7t系列FPGA芯片中集成的2D NoC可以全面消除芯片内外部的数据传输瓶颈。

嵌入式FPGA(eFPGA)

异构计算是边缘AI发展中非常确信的趋势之一,因此许多边缘计算解决方案采用的高集成度系统级芯片(SoC)或专用集成电路(ASIC)都集成了嵌入式FPGA(eFPGA),从而可以帮助解决方案提供商为垂直行业开发边缘AI解决方案,并为特定的边缘应用场所打造专门的解决方案。在部署的规模不断提升之际,一个SoC或者ASIC解决方案的规模经济效应将更加明显。

Speedcore嵌入式FPGA(eFPGA)IP为ASIC和SoC带来了强大的和灵活的可编程逻辑。客户可以将Speedcore eFPGA集成到ASIC或SoC中,可用于高性能、计算密集型和实时处理应用,诸如人工智能(AI)、机器学习(ML)、5G无线、网络、存储和汽车。当然,它也可以用于这些领域中的大量边缘AI应用。

郭道正表示,与独立FPGA芯片的设计过程不同,eFPGA设计人员可以针对客户应用,选择所需逻辑、DSP(或MLP)、2D NoC和存储资源的确切数量。当需要灵活性时,业界也可以使用eFPGA,同时通过消除独立FPGA的多余功能来降低系统成本、功耗和电路板面积,诸如高速I/O这些功能在以SoC或者ASIC形态进入大批量生产时是不需要的。

VectorPath S7t-VG6加速卡

VectorPath S7t-VG6加速卡旨在为人工智能(AI)、机器学习(ML)、网络和数据中心应用开发高性能计算和加速功能时,缩短产品上市时间。该加速卡采用了Achronix的高性能Speedster7t AC7t1500 FPGA。VectorPath S7t-VG6是Achronix与领先的企业级FPGA加速器产品供应商BittWare联合开发,可提供400G和200G以太网接口、GDDR6总存储带宽高达4 Tbps以及一整套软件和工具,可以立即开始使用。

凭借这一独特的产品组合,解决方案提供商能够使用VectorPath加速卡为制造领域快速开发边缘AI/ML解决方案,可适用于不同的垂直市场。此外,解决方案提供商可以将其硬件解决方案集成到带有Speedcore eFPGA的SoC或ASIC之中,并将FPGA开发移植到芯片中,为制造领域的边缘AI提供最高的成本效益和功耗效率。

发展规划


边缘AI不仅得到了FPGA、ASIC厂商的重视,我们看到现在一些厂商在MCU当中集成AI加速器使得MCU更加智能。对于这样的边缘AI趋势,郭道正认为,MCU只是在边缘使用的处理器品类之一。由于边缘应用的多样性,在不同垂直领域或者应用场景中可能需要MCU、通用处理器、应用处理器甚至诸如PLC等技术领域中的特定处理器,而且它们已经在不同的应用场景中构筑了自己相应的优势和生态系统。而当智能化时代到来之后,所有这些处理器都有一个共同的需求:它们都需要硬件加速器来高效地处理AI/ML算法,这也是边缘计算领域中非常清晰的异构计算大趋势。

他说道,与仅用传统处理器来运行AI/ML算法的模式相比,FPGA是最高效的硬件数据处理加速器之一。FPGA技术在边缘计算方面的应用包括板级、芯片级和eFPGA等形式,但是Achronix是唯一一家提供独立FPGA芯片、eFPGA IP和加速卡的供应商,并提供了完整的ACE开发工具来支持所有种类的应用。据此,边缘AI解决方案提供商可以为其应用和其他要求选择最好的解决方案,并高效地重复使用他们的开发成果和IP。

面对如今规模高达100亿美元并且还在不断扩展的硬件加速器市场。Achronix也部署了多项举措。郭道正谈到,其一是Achronix一直在不断扩大自己的团队,这既包括不断扩大的高层管理人员团队,他们为Achronix带来了在不用领域内丰富的经验或者技术特长,而且还包括我们一直在延聘的开发、工程、运营和客户支持团队成员。在中国,我们也在进一步扩大中国团队,以确保客户的成功。

其二,除了组织架构性扩展,Achronix也在不断将FPGA技术推向更远的新领域。例如,先进的封装可以支持Achronix基于chiplet技术构建模块化产品。通过利用先进的封装,Achronix可以更快地进行创新以满足多个市场的需求,而不必为每一代新产品重新设计整个单片FPGA器件。展望未来,云和边缘计算、网络设备、人工智能和机器学习、5G/6G无线网络设备、金融科技、工业和汽车等领域都是Achronix在未来5年内主要的市场机遇。
通过前面对挑战和解决方案的分析,我们可以发现FPGA技术是边缘AI硬件平台的最佳选择,以应对来自技术、经济规模和面向未来的解决方案等挑战。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1646

    文章

    22097

    浏览量

    620711
  • IP
    IP
    +关注

    关注

    5

    文章

    1825

    浏览量

    153165
  • Achronix
    +关注

    关注

    1

    文章

    76

    浏览量

    22817
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    智算加速卡是什么东西?它真能在AI战场上干掉GPU和TPU!

    随着AI技术火得一塌糊涂,大家都在谈"大模型"、"AI加速"、"智能计算",可真到了落地环节,算力才是硬通货。你有没有发现,现在越来越多的AI企业不光用GPU,也不怎么迷信TPU了?他
    的头像 发表于 06-05 13:39 ?696次阅读
    智算<b class='flag-5'>加速卡</b>是什么东西?它真能在<b class='flag-5'>AI</b>战场上干掉GPU和TPU!

    边缘AI运算革新 DeepX DX-M1 AI加速卡结合Rockchip RK3588多路物体检测解决方案

    DeepX 推出了一款革命性的产品 DeepX DX-M1 AI 推理加速卡 采用 PCIe Gen3 M.2 M-Key 接口,具备高达 25 TOPS 的卓越运算性能,以及高准确度、低功耗、低温
    的头像 发表于 05-06 14:15 ?813次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>运算革新 DeepX DX-M1 <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>结合Rockchip RK3588多路物体检测解决方案

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    Agilex(高端)、Stratix(高性能)、Arria(中端)、Cyclone(低成本)等系列,满足从数据中心到工业自动多样化需求。技术特点:可重构性:支持“现场编程”,灵活适配AI、5G
    发表于 04-25 10:19

    寒武纪基于思元370芯片的MLU370-X8 智能加速卡产品手册详解

    MLU370-X8智能加速卡全面升级的数据中心训推一体AI加速卡,基于寒武纪全新一代思元370芯片,接口为PCIe 4.0 X16,是全高全长双宽(FHFL-Dual-Slot)的标
    的头像 发表于 04-24 17:57 ?1960次阅读
    寒武纪基于思元370芯片的MLU370-X8 智能<b class='flag-5'>加速卡</b>产品手册详解

    边缘AI新突破:MemryX AI加速卡与RK3588打造高效多路物体检测方案

    本方案特别结合了 Orange Pi 5 Plus (Rockchip RK3588) 与 MemryX AI 加速卡,构建出一套高性价比的智能解决方案。凭借 MemryX 提供的丰富软件资源
    的头像 发表于 03-06 10:45 ?770次阅读
    <b class='flag-5'>边缘</b><b class='flag-5'>AI</b>新突破:MemryX <b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>与RK3588打造高效多路物体检测方案

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    的三重革命1) 硬件架构革命:英特尔IPU路线图显示,到2026年将推出FPGA+Xeon的异构加速卡;AMD计划2023年集成Xilinx AI Engine的CPU芯片...... 2) 系统集成革命
    发表于 03-03 11:21

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    ,开发人员可以根据具体应用需求重新配置硬件逻辑。这种灵活性使得FPGA能够适应不断变化的AI算法和应用场景,而无需更换硬件。 ? 定制加速FPG
    发表于 02-19 13:55

    Achronix Speedcore eFPGA的特性和功能

    Speedcore嵌入式FPGA(embedded FPGAeFPGA)知识产权(IP)产品是Achronix公司于2016年推出的颠覆性技术,并于当年开始向最终客户交付,目前出货量已经超过2500万。
    的头像 发表于 11-15 14:28 ?1183次阅读
    Achronix Speedcore <b class='flag-5'>eFPGA</b>的特性和功能

    S7t-VG6 VectorPath加速卡的特性和功能

    S7t-VG6 VectorPath加速卡是Achronix公司联合BittWare公司(Molex旗下的领先企业级FPGA加速器产品供应商)推出的一类全新的、面向高性能计算和数据加速
    的头像 发表于 11-14 11:19 ?901次阅读

    PCIe加速卡在数据中心的应用

    随着数据中心的快速发展,对计算能力的需求也在不断增长。PCIe(Peripheral Component Interconnect Express)加速卡作为一种高性能的计算设备,已经在
    的头像 发表于 11-06 09:32 ?1966次阅读

    AMD推出新款纤薄尺寸电子交易加速卡

    AMD(超威,纳斯达克股票代码:AMD)今日宣布推出 AMD Alveo UL3422 加速卡 ,这是其创纪录的加速卡系列1的最新成员,专为超低时延电子交易应用而设计。AMD Alveo
    的头像 发表于 10-16 09:14 ?878次阅读

    Primemas选择Achronix eFPGA技术用于Chiplet平台

    高性能 FPGA 和嵌入式FPGAeFPGA) IP 的领导者 Achronix Semiconductor Corporation 和使用Chiplet 技术开发创新 SoC Hub
    的头像 发表于 09-18 16:16 ?1025次阅读

    大模型向边端侧部署,AI加速卡朝高算力、小体积发展

    电子发烧友网报道(文/李弯弯)AI加速卡是专门用于处理人工智能应用中的大量计算任务的模块。它集成了高性能的计算核心和大量的内存,旨在加速机器学习、深度学习等算法的计算过程。当前,AI
    的头像 发表于 09-17 00:18 ?5295次阅读

    EPSON差分晶振SG3225VEN频点312.5mhz应用于AI加速卡

    AI加速卡,通常也被称为AI算力,是一种专为加速人工智能(AI)应用和算法而设计的硬件设备。
    发表于 09-10 14:56 ?0次下载

    基于菲数科技FA728Q加速卡实现低时延LLT应用

    菲数科技使用Stratix 10 FPGA和开源的开放式FPGA堆栈(OFS)基础设施开发高性能FPGA加速卡
    的头像 发表于 08-30 17:13 ?1077次阅读
    基于菲数科技FA728Q<b class='flag-5'>加速卡</b>实现低时延LLT应用