目的
本文介绍广州星嵌DSPC6657+Xilinx Zynq7035平台下Xilinx Zynq7035算力指标。
基本概念
FLOPs/FLOPS
FLOPs,Floating Point Operations,浮点运算次数,每一个加、减、乘、除操作都算1FLOPs操作,常用来衡量模型计算复杂度。
注意下FLOPS,注意全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度。是一个衡量硬件性能的指标,两者别弄混。
MACs
Multiply–Accumulate Operations,乘加累积操作数,常常被人们与FLOPs概念混淆。实际上1MACs包含一个乘法操作与一个加法操作,大约包含2FLOPs。通常MACs与FLOPs存在一个2倍的关系。
关系
为什么使用乘加运算指标(MACs)呢?因为神经网络运算中内积、乘加运算无处不在:
对于一个3*3滤波器在特征图上的一次运算可以表示为:
y = w 0?x 0 + w 1?x 1 + w 2?x 2 + w 3?x 3 + w 4?x 4 + w 5?x 5 + w 6?x 6 + w 7?x 7 + w 8?x 8
对于上式,记w 0?x 0 +…为一次乘加,即1MACs。所以对于上式而言共有9次乘加,即9MACs(实际上,9次相乘、9-1次相加,但为了方便统计,将计算量近似记为9MACs,就像算法复杂度通常把O(N+b)表示成O(N)一样,都只是一种近似)。
对于上式而言,可以认为执行了9次乘法、9-1次加法,所以一共是9+(9-1)次FLOPs。所以近似来看1FLOPs ≈ 2MACs。
ZYNQ PL端算力指标
参考Xilinx官方文档Zynq-7000 SoC Data Sheet: Overview (DS190),可找到Zynq7035PL端的MACs指标值为1334GMACs,约为2668GFLOPs,如下图所示:
FPGA PS端性能指标
参考Xilinx官方资料Zynq-7000 SoC Data Sheet: Overview (DS190),可获得Zynq7035PS端CPU的性能参数,如下图红框标出的地方所示:
Zynq7035PS端双ARM总运算能力:2.5DMIPS/MHz Per CPU x 1000 MHz x 2 CPU = 5000 DMIPS。
审核编辑:汤梓红
-
dsp
+关注
关注
558文章
8166浏览量
359255 -
滤波器
+关注
关注
162文章
8166浏览量
182638 -
Xilinx
+关注
关注
73文章
2185浏览量
127097 -
算力
+关注
关注
2文章
1231浏览量
15806
发布评论请先 登录
[XILINX] 正点原子ZYNQ7035/7045/7100开发板发布、ZYNQ 7000系列、双核ARM、PCIe2.0、SFPX2!

zynq XC7Z100板卡学习资料:基于zynq XC7Z100 FMC接口通用计算平台
Xilinx Zynq7035 PL SFP光口通信例程
Xilinx Zynq7035 PL Cameralink回环实现
Xilinx客户分享Zynq SoC设计成功经验
如何使用Xilinx SDK创建Zynq引导映像
ZYNQ7000开发平台的AX7Z035开发板用户手册免费下载

Xilinx Zynq上FreeRTOS的Tracealyzer

评论