0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI狂飙, FPGA会掉队吗? (上)

中科亿海微 ? 2025-08-07 09:03 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

摩尔定律说,集成电路上的晶体管数量大约每两年翻一番。随着晶体管尺寸接近物理极限,摩尔定律的原始含义已不再适用,但计算能力的提升并没有停止。英伟达的SOC在过去几年的发展中,AI算力大致为每两年翻一番,这与摩尔定律的速度高度相似,而通用GPU的算力增长更是惊人,达到了八年1000倍。

4daae65a-732a-11f0-9080-92fbcf53809c.png

「GPU算力八年1000倍增长」

过去我做FAE的时候,客户经常会问,“你们芯片多少万门?”。而现在他们经常会问,“你们芯片算力多少T?”,其实有的人连算力的概念和单位都没搞清楚。可见技术日新月异,人们的话术也在努力跟上。

FPGA就是可编程逻辑门阵列,这个名字很形象。数字电路可以认为是一个个逻辑门构成的,而FPGA就是可编程逻辑门集合体,内部的逻辑功能和互连都可以通过编程改变,主流的编程语言是硬件描述语言Verilog和VHDL。

对年轻人来说,FPGA是一种有点冷门但好像又少不了的技术。过去十年,全球FPGA市场呈稳步增长态势。2014年市场规模约为45亿美元,到2018年,这一数字增至63亿美元。2023年,全球市场规模达到97亿美元,尽管2024年这一数值陡降至大约75亿美元,但是未来总体的趋势依然是稳步增长。

在AI浪潮下,我们为什么对FPGA有这样的信心,这就需要了解FPGA的四大特点,以及这四大特点给它带来什么样的需求基本面。

需要说明一下的是,军工市场的信号处理,图像处理,高性能运算等领域是FPGA的重要市场,但是国内的军工市场不是完全市场经济,不便展开讨论。另外,像脑机接口、量子计算等领域虽然也有FPGA的使用,但是基本都处于早期科研阶段,距离我们想要的Business还差得太远,也不会涉及。

我们不想只讲一些大词汇,比如数据中心人工智能5G通信自动驾驶、边缘计算之类,而是根据实际的应用情况,分门别类阐述一下FPGA的主要应用场景,都有迹可循,并非纸上谈兵。但因客户信息需要保密,因此文中尽量不出现具体客户名字。

FPGA四大特点与生存机会

特点一:硬件可编程

硬件可编程是什么意思?这是相对软件可编程而言的,CPU的硬件电路固定不变,对CPU进行编程就是通过指令调用CPU硬件资源如ALU等去实现需要的计算。而FPGA不同,本身的硬件电路就是可编程的,它理论上可以做出任何数字电路,甚至可以通过FPGA的逻辑搭建一个CPU并对其进行编程。硬件可编程是FPGA的基础特性,也可以在线更改电路功能,实现动态功能重构(DFX)。

4dc58168-732a-11f0-9080-92fbcf53809c.png

「CPU与FPGA数据处理方式不同」

FPGA产生的背景,是硬件的灵活性和定制化需求。早期的FPGA被称为胶水逻辑(glue logic),像胶水一样把一些无法直接相连的芯片连接在一起,实现定制的功能。输入输出基本单元叫I/O块,接口种类要丰富,数量多,灵活配置。内部也要有足够多的逻辑来实现自己需要的功能,里面的基本单元被称为逻辑块(Logic Block)。逻辑块和逻辑块及I/O块之间需要有足够多的可编程互连开关来实现各种连接的需要。

4dd25104-732a-11f0-9080-92fbcf53809c.png

「FPGA内部结构」

下面,我们看看可编程能带来哪些机会。

通信与网络

早期通信技术可谓一日千里,协议迭代迅速,对快速、高效、可定制、可升级的硬件需求,使得FPGA成为理想选择,通信带着FPGA一路狂奔。在相当长的时间内,通信都是FPGA最大的单一市场。

从电路交换到包交换,从以太网,OTN到无线LTE/5G NR通信协议,都成了FPGA的重度依赖者。国内通信市场的顶峰时期,华为和中兴的FPGA需求占了国内总需求的90%以上。现今由于各种原因交织,他们已经大量弃用FPGA,使得其在通信市场风光不再,令人唏嘘

无线网优市场逐渐萎缩,5G市场也基本被做残,仅部分5G RRU上面会有FPGA的存在,其他通信领域的FPGA的大规模应用已经看不到了。

4de6564a-732a-11f0-9080-92fbcf53809c.png

「5G系统」

芯片仿真,原型验证

很多客户喜欢自己开ASIC芯片,ASIC的一次流片费用很高,经不起折腾,最好一次投片成功,否则损失巨大,因为投片以后电路就固定了无法修改,有bug通常会非常麻烦。因此在投片之前,需要大量的仿真和验证。仿真用EDA工具就好了,验证就必须有原型,而FPGA就是最好的原型,可以不断的修改,试错成本为零。

FPGA和ASIC在前端设计功能验证阶段是高度重叠的。芯片验证是个刚需,毫无疑问,在芯片验证市场FPGA越大越好,能塞下的功能越多越好。很多时候,一个大的ASIC需要分拆成多个FPGA或者分功能模块来进行验证。

4df25ca6-732a-11f0-9080-92fbcf53809c.png

「FPGA原型验证平台」

FaaS (FPGA as a Service),FPGA即服务

超大型FPGA比较贵,本地综合布线时间很长,对用户不友好。FaaS,FPGA即服务,是一种将FPGA硬件算力作为云服务提供给用户的概念。

自从亚马逊EC2 F1实例批量部署以后,FaaS蔚然成风。F1实例使得用户能够在云中使用 FPGA进行硬件加速,而无需自己购买和维护FPGA硬件。F1实例提供了强大的FPGA加速计算能力,尤其适合于需要大量并行计算的工作负载,如数据加密、机器学习推理、视频处理、基因组分析等。平台允许开发者通过HDL(如VHDL、Verilog)编写自定义硬件加速器,也有限支持OpenCL和C/C++等高级语言编程。国内公司腾讯阿里迅速跟进,成为当时的热点应用。

特点二:并行及实时

逻辑阵列数据可以经由I/O块从四面进来,也可以从四面出去,天生是个并行处理器。输入到输出的延时取决于硬件逻辑单元和走线,没有软件参与,不会受到操作系统任务调度、上下文切换等因素的影响,延时低且相对固定。这对于实时系统非常重要,尤其是在控制系统或时间敏感型任务中,确定性的响应时间是必须保证的。并行与实时是FPGA的另一项特点,也给FPGA带来了非常多的应用机会,让我们一一道来。

视频图像处理

对于定点整形数据,FPGA有天然的优势。视频和图像数据结构简单,涉及大量的数据流和复杂的计算(如像素处理、滤波、转码等),而FPGA可以将这些计算任务分解成多个并行操作,同时处理多个像素或视频帧,提高了数据吞吐量和实时处理能力,非常适合视频图像处理。

ISP(图像信号处理)是非常重要的功能,常用FPGA实现,包括去噪,色彩增强,动态白平衡,宽动态,缩放等。且ISP在不同的领域的需求大相径庭,比如安防摄像头、医疗内窥镜、车用后视镜(CMS)这些应用对ISP的要求都不一样,因此给了FPGA很大的发挥空间。

家用投影包括车用投影的畸变矫正(Warp)功能,也是一个引人注目的FPGA应用场景。但是随着投影主芯片厂家的改款,也可能面临机会的丢失。

视频处理五花八门,如视频拼接,就是把多个视频源做拼接,开窗,漫游,缩放,叠加,画中画等,投射到一个大屏中显示,大屏可以是LCD、LED或投影。再比如抠图,FPGA 可以加速视频中的背景减除算法,并实时配上新的背景。在实时切换和推流领域,FPGA 可以实现多个视频源的实时合成与切换,广泛应用于视频监控、专业音视频、广播等领域。在车载环视刚出现的那几年,很多客户把几个摄像头的数据先做畸变矫正,再进行缝合,做成一幅完整的鸟瞰图,也获得了部分市场份额。

需要重点强调的是,在专业音视频和广播市场,Video-Over-IP是一个大趋势,涉及的主要协议有NDI,Dante AV, IPMX等。NDI更适合便捷的视频制作,Dante AV注重音视频同步,而IPMX主要基于SMPTE2110 标准,更倾向于无压缩或轻压缩的音视频传输,适合高质量、标准化传输的广播和专业场景。Video-Over-IP的潮流中蕴含着FPGA/SOC的大量机会。

LED大屏驱动,LED动态背光,LCD屏TCON

LED大屏的驱动起源于2000年代初期,由于没有标准,只能用FPGA根据自己的需要定义管脚和扫描格式,逐渐形成了一个专业市场。在发送卡和接收卡上都需要FPGA,现在单独的发送卡越来越少,取而代之的视频主控I/O板上面也都会用FPGA实现。

在接收卡上FPGA的并行处理能力使其能够高效地管理每个LED灯珠的驱动信号,确保显示效果的准确和实时性,并根据需要调整扫描模式、亮度调节、颜色校正等。最近几年,随着LED灯珠点间距越来越小,LED屏分辨率越来越高,FPGA功能也在不停的迭代。发送与接收之间的传输媒介从GE PHY也逐渐进化到2.5G/5GE PHY,有的也用光纤传,有的用压缩后的视频传输以减小带宽。

除此之外,LED多区动态背光控制,早期高清电视屏TCON(时序控制),各种返修屏TCON,各种非标屏适配,专业监视器如医疗屏,都是用FPGA来驱动的。

信号加解密,实时包解析

FPGA天生适合实时加解密,它能够在硬件层面直接实现AES/RSA等加密、解密、认证和校验功能,减少CPU的负担,提高整个IPSec协议栈的效率。FPGA可以在硬件中实现高效的深度包解析和高速转发,无需CPU参与。另外,当年的灰产,破解Nintendo游戏卡,也是有用小规模FPGA来实现。

数字信号处理DSP

用FPGA做DSP是2000年代初兴起的一种热点技术,FPGA具备高度的并行处理能力,内部有固化的乘加运算电路(DSP Block),能够灵活实现多种信号处理算法,因此在许多高性能应用场景中,开始扮演重要角色,主要算法有FFT, FIR/IIR,卷积,调制解调,波束成形等等。FPGA着实抢了很多TIADI的DSP处理器的市场,让DSP处理器逐渐退守嵌入式系统(如音频处理)和一些固定算法(如简单滤波器、语音处理)场景中。至今,FPGA实现DSP仍然方兴未艾,有着较强的生命力。FPGA内部集成AIE又进一步增强了其DSP运算能力。

数据预处理,传感器融合

数据预处理是个比较宽泛的概念,很多场合都需要。在医疗超声设备中,通常数据预处理包括采样率转换,去噪,增益控制,再进行波束成形(Beam-forming)。

而在车载激光雷达中,经过预处理的数据通常被送到传感器融合部分做进一步处理。传感器融合通常需要对来自不同类型传感器的数据进行大量的并行计算和处理。FPGA可以同时处理多个数据流,实现快速的数据融合。例如,摄像头和激光雷达、超声波传感器、惯性测量单元(IMU)等传感器的数据,可以并行处理并在同一时刻输出融合后的信息,减少延迟。

能够确保数据融合过程中的实时性,处理速度和响应时间是基于硬件的,通常远远快于基于软件的处理方法。这种低延迟特性对于需要快速响应的应用场景(如自动驾驶、机器人控制等)至关重要。

机器视觉

FPGA在机器视觉中具有广泛的应用,尤其在实时性要求高、数据处理量大、并行计算能力要求强的场景中,FPGA能够发挥独特的优势。无论是在传统的计算机视觉任务(图像处理、特征提取、目标检测)还是深度学习推理方面,FPGA都能提供显著的性能提升,并在工业自动化、安防监控、辅助驾驶等领域中得到广泛应用。

AI推理加速

与CPU和GPU相比,FPGA能够实现针对特定神经网络架构的硬件加速,提供更高的吞吐量和更低的功耗。特别是在边缘计算或嵌入式AI应用中,FPGA是进行深度学习推理的理想选择。

早几年比较典型的是在辅助驾驶ADAS中实现双预警和AEB,有的客户用FPGA实现二值化神经网络BNN,能够把ZYNQ7020的算力优化到1.5T。其他有趣的应用包括智能座舱内的DMS,智能相机的目标识别,瑕疵品识别,智能医疗内窥镜的超分显示和AI去雾等算法。

斯巴鲁汽车用赛灵思的7nm Versal AI Edge芯片实现双目视觉自动驾驶方案,这个也是公开的新闻了。另外,在数据中心推理加速中,FPGA的加速卡也有一定的应用。

4e1b07f0-732a-11f0-9080-92fbcf53809c.png

「AI Edge在双目视觉自动驾驶中的应用」

尽管面临算力SOC和英伟达Jetson产品的严峻挑战,但FPGA在一些定制性和硬件加速方面依然有其独特优势。FPGA可以针对特定的神经网络架构进行高度优化,提供更为精确的加速,这对于某些特定应用,尤其是在功耗极为敏感的场合仍然是FPGA的强项。

智能网卡,高频交易

在智能网卡(Smart NIC)中,FPGA能够在硬件层面加速网络协议栈的处理,减少CPU负担,直接处理网络流量中的常见任务(如TCP/IP协议栈、加密、解密、流量分析等)。通过将这些任务卸载到 FPGA,能显著提高数据包处理速度和网络性能。

金融高频交易要求极低的延迟,FPGA可以直接对市场数据(如股票、期货报价)进行高速处理和过滤,相比传统CPU,FPGA可以在几微秒内完成复杂的运算任务,确保交易策略实时生效。

伺服驱动Servo Control

伺服驱动是FPGA切入工业控制的第一个阵地,在伺服驱动系统中,FPGA可以通过固定时钟周期完成电流、位置、速度环控制,确保闭环控制的超低延迟。FPGA具备同时处理多个编码器、PWM 信号、反馈信号的能力,使其特别适合多轴伺服系统和驱控一体机。

工业以太网,1588 PTP/TSN,和GOOSE

FPGA的实时和低延时也在工业通信领域大放异彩,工业通信讲究高带宽,实时性,延时可预测,时间同步以及服务质量(QOS)。

FPGA在IEEE1588PTP和TSN中的优势主要体现在其低延迟、高精度时钟同步、并行计算、硬件加速和高吞吐量的能力上。FPGA能够实时过滤和优先处理TSN和工业以太网中的数据流,确保关键数据优先传输,避免网络阻塞。通过硬件实现这些协议,FPGA能够提供比传统基于CPU的软件实现更高效、实时的性能,特别适合工业自动化、汽车、高铁、医疗、视频监控等领域。

GOOSE是用于电力系统中的实时事件通信协议,利用以太网链路层传输,强调毫秒级甚至微秒级的延迟来响应断路器跳闸、保护动作等关键事件。FPGA的固定时钟周期和并行处理能保证信号处理和数据传输的确定性延迟,满足GOOSE对高实时性的要求。FPGASOC中的ARM处理器则负责控制和协调保护动作。实时处理的性能是继电保护系统成功的关键,FPGA逻辑部分和ARM部分软硬件协同工作能够保证这一点。

测试与测量设备

在高端示波器中,FPGA的并行大带宽特性可以实时捕获高速信号(如100Gbps),在射频测试仪中,FPGA可以用来生成与分析5G NR信号。

FPGA可以用延时链产生精准的脉冲,能够通过硬件加速执行各种数学运算(如傅里叶变换、卷积、统计分析等),从而加速数据分析过程,实时显示测量结果。这在频谱分析、时域分析和其他复杂测试中非常有用。在基因测序行业中,FPGA可以用来加速数据比对,提高测序效率。

高速工业相机

2D/3D高速工业相机通常需要捕捉和传输大量的图像数据,尤其是高分辨率、高帧率的图像。有的可达每秒几千帧,FPGA 能够提供极高的数据带宽,直接与图像传感器进行高速数据传输,避免了CPU或GPU可能存在的带宽瓶颈。

FPGA还可以支持多种高速接口(如 GigE Vision、Camera Link、CoaXPress、PCIe等),能够高效地与工业相机的传感器和外部设备进行连接,确保数据的快速传输。

小结

此系列文章,我们分为上中下三篇连载。本文是上篇,内容主要介绍了FPGA的四大特点中的前面两个:硬件可编程、并行及实时,以及这些特点带来的主要市场机会。

在中篇里,我们将会继续阐述FPGA另外两大特点:高集成度、新工艺新接口。而在下篇中,我们会集中说一说FPGA的五大硬伤以及破局之道。

未完待续…

声明:本文内容全部来自业界资讯和个人理解,未涉及任何公司机密和客户信息,仅供大家交流参考。

2025年3月

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1646

    文章

    22096

    浏览量

    620638
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4979

    浏览量

    132075
  • AI
    AI
    +关注

    关注

    88

    文章

    35748

    浏览量

    282377
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI狂飙, FPGA会掉队吗? (下)

    上篇和中篇,我们介绍了FPGA的四大特点,以及这些特点所带来的市场和应用机会,概述如下:硬件可编程:通信网络,芯片验证等;并行和实时:视频图像处理,AI推理等;高集成度:工业机器人,激光雷达等
    的头像 发表于 08-11 09:25 ?433次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>狂飙</b>, <b class='flag-5'>FPGA</b><b class='flag-5'>会掉队</b>吗? (下)

    AI狂飙, FPGA会掉队吗? (中)

    在上篇中,我们介绍了FPGA的前面两个特点:硬件可编程、并行与实时,也列举了这两个特点带来的诸多机会。在本文中,我们将继续介绍另外两个特点,以集齐FPGA的四大特点和生存机会。FPGA四大特点与生存
    的头像 发表于 08-08 09:36 ?327次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>狂飙</b>, <b class='flag-5'>FPGA</b><b class='flag-5'>会掉队</b>吗? (中)

    让太阳能逆变器“狂飙”的秘诀-耐达讯CAN转EtherCAT网关

    新系统,省下30%-50%成本;智能管家:自定义数据映射、远程固件升级,甚至联动AI运维。 某项目曾因通信卡顿,发电效率仅80%。工程师用耐达讯通信技术CAN转EtherCAT网关“牵红线”:配置
    发表于 07-18 15:22

    智多晶FPGA设计工具HqFpga接入DeepSeek大模型

    AI 赋能工程设计的时代浪潮中,智多晶率先迈出关键一步——智多晶正式宣布旗下 FPGA 设计工具 HqFpga 接入 DeepSeek 大模型,并推出 FPGA 设计专属
    的头像 发表于 06-06 17:06 ?659次阅读

    马斯克回归“7×24硬核模式”,FSD与Optimus双线狂飙

    这场 "马斯克式狂飙" 能否冲破技术瓶颈与市场质疑?2025 年的得州街头,或许会给出第一个答案。
    的头像 发表于 05-27 16:18 ?200次阅读

    拆解小米 CyberGear 微电机!ams AS5047P 磁编凭何让性能狂飙

    《拆解小米 CyberGear 微电机!ams AS5047P 磁编凭何让性能狂飙?》
    的头像 发表于 05-14 10:45 ?542次阅读
    拆解小米 CyberGear 微电机!ams AS5047P 磁编凭何让性能<b class='flag-5'>狂飙</b>?

    充电桩狂飙时代:跳出价格战泥潭的突围路径

    这场狂飙,或许才刚刚进入弯道。这个行业的真正价值,从来不在枪头接触的瞬间,而在电流涌动时激发的无限可能。
    的头像 发表于 04-11 17:01 ?702次阅读
    充电桩<b class='flag-5'>狂飙</b>时代:跳出价格战泥潭的突围路径

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    和并行计算能力,将AI模型(如CNN、LSTM、Transformer等)部署到FPGA,实现高效的数据预处理、实时推理和后处理。? 定制化解决方案:根据具体应用场景(如自动驾驶、机器视觉、边缘计算等
    发表于 03-03 11:21

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    资源浪费。例如,在深度学习模型推理阶段,FPGA可以针对特定的神经网络结构进行硬件加速,提高推理速度。 3.支持边缘计算与实时应用 ? 边缘计算:随着物联网的发展,越来越多的AI任务需要在边缘设备完成
    发表于 02-19 13:55

    AI在芯片的应用:革新设计与功能

    AI在芯片的应用正在深刻改变着芯片设计、制造和应用的全过程。未来,随着AI技术的不断进步和应用场景的不断拓展,AI芯片将成为推动科技发展的重要力量。
    的头像 发表于 02-17 16:09 ?669次阅读

    FPGAAI方面有哪些应用

    提供了强有力的支持。 一、FPGA 在深度学习中的应用 深度学习是 AI 的重要分支,涉及海量的数据运算。FPGA 能够针对深度学习算法中的卷积、池化等核心运算进行硬件加速优化。例如,在图像识别任务中,将卷积神经网络部署到
    的头像 发表于 01-06 17:37 ?1520次阅读

    助力AIoT应用:在米尔FPGA开发板实现Tiny YOLO V4

    7nm 制程与 AI 限制在全球半导体制程限制和高端 GPU 受限的大环境下,FPGA 成为了中国企业发展的重要路径之一。它可支持灵活的 AIoT 应用,其灵活性与可编程性使其可以在国内成熟的 28nm
    发表于 12-06 17:18

    基于Achronix Speedster7t FPGA器件的AI基准测试

    Achronix半导体公司推出了为AI优化的Speedster7t系列FPGA芯片,该系列包含专门针对AI工作负载的强化计算引擎。随着AI在各个领域变得普遍,在
    的头像 发表于 09-18 16:10 ?1136次阅读
    基于Achronix Speedster7t <b class='flag-5'>FPGA</b>器件的<b class='flag-5'>AI</b>基准测试

    【招聘】verilog vhdl FPGA

    1.熟悉FPGA架构及应用,熟悉图像算法的FPGA实现。 2.熟悉verilog vhdl,熟悉Xilinx或Intel等开发工具。 3.有AI算法 fpga实现经验优先。 4.本科及
    发表于 09-02 15:50

    AI 更迅捷,TE LGA4710 处理器插槽来助力

    AI 赛道的极速狂飙来自强大算力的支持,在这背后的基础设施是一个庞大的高速链路网络,并且不断在规模、效率、连接性能等方面迭代升级,TE Connectivity(以下简称“TE”)也一直积极助力其中
    的头像 发表于 08-25 23:30 ?547次阅读