0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD Versal SoC刷新边缘AI性能,单芯片方案驱动嵌入式系统

花茶晶晶 ? 来源:电子发烧友 ? 作者:黄晶晶 ? 2024-04-11 09:06 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/黄晶晶)边缘AI应用需要更多的高性能计算和算力的支持,AMD的Versal和Zynq系列产品一直支持医疗、交通、智能零售、智能工厂、智能城市等领域的边缘AI落地。最近,AMD宣布扩展 AMD Versal? 自适应片上系统( SoC )产品组合,推出全新第二代 Versal AI Edge 系列和第二代 Versal Prime 系列自适应 SoC,其将预处理、AI 推理与后处理集成于单器件中,能够为 AI 驱动型嵌入式系统提供端到端加速。

AI驱动型嵌入式系统的三个阶段

在嵌入式系统中,预处理、AI推理、后处理是AI驱动型嵌入式系统的三个重要阶段。

在预处理器部分,主要是各类传感器包括毫米波雷达、激光雷达、摄像头等进行处理与融合、数据调节等等。可编程逻辑能够非常灵活,实时地支持各类传感器接口,保证低延时、稳定运算,并且在现场部署之后还能够升级。

0b170d5e2f0347818343dbbac067c7c6~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=202404110906140DF0EF2C42400575F283&x-expires=2147483647&x-signature=gNCAHbd62ifdhvMvaB1Dy5endas%3D

在推理过程当中一般使用矢量处理器,市场上已有很多类型。在后处理阶段,通常使用高性能的嵌入式CPU

另外,也可以通过第一代Versal AI Edge系列产品当中的可编程逻辑来做预处理,用矢量处理或者人工智能引擎来做推理。但是在后处理过程需要加上外部的处理器。无论如何,此前还没有哪一类处理器能够针对这三个阶段进行优化。

AMD自适应与嵌入式计算事业部( AECG ) Versal产品营销总监Manuel Uhm分析,采用多颗芯片会给整个嵌入式系统带来诸多限制。例如更高的功率、供电复杂性、更高的占板面积和终端系统尺寸,以及更高的内存要求,芯片间通信带来的时延,更多安全漏洞和故障点,还有板卡设计的工作量等。

此次,AMD嵌入式系统的单芯片智能性方案推出两个系列的产品,第二代Versal AI Edge系列,面向AI驱动型嵌入式系统;以及第二代Versal Prime系列,面向经典嵌入式系统。较上一代产品,采用下一代AI引擎带来高达3倍的每瓦TOPS,采用全新高性能集成CPU带来高达10标的标量计算。通过AMD可编程逻辑实现世界领先的自适应计算。

3ddbc094d4f049a3bddad7fb2759b949~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=202404110906140DF0EF2C42400575F283&x-expires=2147483647&x-signature=q06rW%2FHAEVj%2F1oYyHh0i7XOb8Vw%3D

第二代Versal自适应SoC——单芯片智能性

第二代Versal自适应SoC单芯片就能实现三个阶段的加速。具体来看,预处理阶段,AMD可编程逻辑进行传感器融合和数据调节。此外还加入新的硬图像和视频处理,无需可编程逻辑进行处理。

下一代AI引擎AIE-ML v2可以实现高达3倍的每瓦TOPS,实现高效AI推理。基于AMD的Vitis AI开发环境进行快速部署,开发者可以使用他们原本非常熟悉的开源工具,比如说PyTorch、TensorFlow等等在Vitis中进行优化、推理。

有了AI引擎的加持,可以支持更多的数据类型,支持不同的精度和吞吐量,比如支持共享指数数据类型,可以在提高吞吐量的情况下不减损它的精准度。

AMD自适应与嵌入式计算事业部 Versal AI Edge系列高级产品线经理Steph Gauthie分析,二代Versal AI Edge系列器件中的Dense TOPS,以数据类型MX6来看,算力最高达到370 TFLOPS。如果采用稀疏度计算,性能可以翻番,同时它还可以达到370 TFLOPS。以INT8来看最高端可以做到184 TOPS。另外,采用AIE-ML v2,还能够做一些数据信号的处理,比如说FIR、FFT等等。

CPU性能大幅提升,实现高达10倍的标量计算。集成2-8个Cortex A78AE内核,每核心最高频率高达2.2GHz,以及高达200.3K的DMIPS算力。10个Arm Cortex-R52实时处理器。每核心最高频率高达1.05 GHz,高达28.5K的DMIPS算力。

3be3184151524e999d2a5af284c2c145~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=202404110906140DF0EF2C42400575F283&x-expires=2147483647&x-signature=JzOQgvbO6fXs8R0acQanIxJ1Nf4%3D

考虑到边缘计算对于信息安全和功能安全的要求,还能够支持ASIL D、SIL 3等级规格,可应用于自动驾驶和工业领域。

Steph Gauthie举例,在高级自动驾驶辅助系统L2和L3中,作为单芯片域控制器与前一代AI Edge相比在相近的功率资源下图像处理能力增加4倍。

49f4d7ea1a4f4fd69e4ad754e04f19b5~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=202404110906140DF0EF2C42400575F283&x-expires=2147483647&x-signature=8RYEoq0GEufm7DIWDW2AdqFl%2Bpo%3D

此外,智慧城市的摄像头系统中,与前一代AI Edge相比每路视频流占板面板缩小65%。应用于专业的音视频和广播的视频流,与Zyng MPSoC相比,能够提供2倍的视频处理能力,每路视频流占板面积缩小35%。

总之,第二代Versal系列产品面向AI驱动型及经典嵌入式系统的中央计算。

已应用于汽车视觉系统等

在基于摄像头的3D感知视觉案例中,我们可以看到数据预处理完成后被传输到AI引擎,利用3D模型比如BEVFormer俯瞰视觉模型进行处理,再到应用处理单元进行行为模式的规划或实时传感。

目前第二代Versal AI Edge系列产品已经应用于汽车厂商斯巴鲁的EyeSight视觉系统,可以支持碰撞前制动、车道偏离预警、自适应巡航控制和车道保持辅助。

第二代Versal AI Edge系列产品能够支持先进的数据类型、确保处理的低时延、高吞吐量以及高精度,还支持ISO26262功能安全等。利用可编程逻辑的灵活性,斯巴鲁的下一代EyeSight系统可以实时修改摄像头的传感器参数,从而助力斯巴鲁强化车辆的安全性,并力争实现2030年没有致命道路事故的安全目标。

9e93a331ce464a9288c659ac25b947a1~tplv-tt-shrink:640:0.image?lk3s=06827d14&traceid=202404110906140DF0EF2C42400575F283&x-expires=2147483647&x-signature=RYiB%2Fu1KjzW2VKm2%2BPsw92xU9qA%3D

据悉,客户现在就可以采用第一代评估板和设计工具展开设计。第二代Versal AI Edge系列和第二代Versal Prime系列产品的芯片样片将于2025年上半年发布,评估套件和系统模块将于2025年年中推出,量产芯片将于2025年末面世。

小结:

以汽车领域来看,汽车电子电气架构的演进突显了中央计算平台的重要性。当前业内不少企业也推出了车载中央计算芯片,不过相比之下,AMD第二代Versal AI Edge系列产品,是一颗芯片覆盖了预处理、AI推理以及后处理这三个阶段,AMD也是全球少数几家拥有预处理可编程逻辑能力的公司,从而能够把可编程逻辑的优势去融合到一个芯片当中。

Manuel Uhm表示,AMD第二代Versal自适应SoC平台的设计考虑到未来五年的需求恐将飞速变化,具有较好的灵活性和伸缩性,提供广泛的性能和算力支持,如此才能应对不断变化的市场应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5594

    浏览量

    136578
  • 嵌入式系统
    +关注

    关注

    41

    文章

    3686

    浏览量

    131599
  • 单芯片
    +关注

    关注

    3

    文章

    462

    浏览量

    35369
  • soc
    soc
    +关注

    关注

    38

    文章

    4406

    浏览量

    223192
  • 边缘AI
    +关注

    关注

    0

    文章

    169

    浏览量

    5493
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AMD第二代Versal AI Edge和Versal Prime系列加速量产 为嵌入式系统实现芯片智能

    我们推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,这两款产品是对 Versal 产品组
    的头像 发表于 06-11 09:59 ?987次阅读

    飞凌嵌入式2025嵌入式边缘AI技术论坛圆满结束

    飞凌嵌入式「2025嵌入式边缘AI技术论坛」在深圳深铁皇冠假日酒店盛大举行,此次活动邀请到了200余位嵌入式技术领域的技术专家、企业代表和
    的头像 发表于 04-28 13:57 ?3412次阅读
    飞凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>技术论坛圆满结束

    飞凌嵌入式2025嵌入式边缘AI技术论坛圆满结束

    4月22日下午,备受瞩目的飞凌嵌入式「2025嵌入式边缘AI技术论坛」在深圳深铁皇冠假日酒店盛大举行,此次活动邀请到了200余位嵌入式技术
    的头像 发表于 04-27 11:55 ?314次阅读
    飞凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>技术论坛圆满结束

    面向AI与机器学习应用的开发平台 AMD/Xilinx Versal? AI Edge VEK280

    解读: *附件:VEK280_用户指南 开发手册.pdf 一、核心配置与架构 ? 自适应SoC芯片 基于AMD Versal? AI Edg
    的头像 发表于 04-11 18:33 ?1400次阅读
    面向<b class='flag-5'>AI</b>与机器学习应用的开发平台 <b class='flag-5'>AMD</b>/Xilinx <b class='flag-5'>Versal</b>? <b class='flag-5'>AI</b> Edge VEK280

    飞凌嵌入式「2025嵌入式边缘AI技术论坛」议程公布

    4月22日,飞凌嵌入式“2025嵌入式边缘AI技术论坛”将在深圳举行,论坛以“新生态,智未来”为主题,旨在汇聚行业智慧,探讨嵌入式技术与
    的头像 发表于 04-02 15:12 ?676次阅读
    飞凌<b class='flag-5'>嵌入式</b>「2025<b class='flag-5'>嵌入式</b>及<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>技术论坛」议程公布

    瑞芯微嵌入式方案概述

    应用及开发资源的总结:一、瑞芯微嵌入式处理器系列瑞芯微的芯片基于ARM架构,覆盖从低功耗物联网设备到高性能边缘计算的多种场景:高性能系列(
    的头像 发表于 03-28 12:11 ?570次阅读
    瑞芯微<b class='flag-5'>嵌入式</b><b class='flag-5'>方案</b>概述

    服务器级芯片进军嵌入式市场,AMD这颗处理器驾驭AI洪流

    市场进行了优化,在计算能力与专门设计的嵌入式特性之间实现平衡,增强产品寿命、系统弹性和嵌入式应用开发的便利性。 ? ? 该处理器采用成熟的Zen 5架构,提供领先的性能和能效,使网络、
    的头像 发表于 03-28 09:18 ?3364次阅读
    服务器级<b class='flag-5'>芯片</b>进军<b class='flag-5'>嵌入式</b>市场,<b class='flag-5'>AMD</b>这颗处理器驾驭<b class='flag-5'>AI</b>洪流

    新生态 智未来「飞凌嵌入式2025嵌入式边缘AI技术论坛」开启报名!

    在这个技术日新月异的时代,每一场思想的碰撞都可能成为推动行业前行的力量,每一次深度对话都可能迸发出改变时代的强光——2025年4月22日,飞凌嵌入式将在深圳举办“2025嵌入式边缘AI
    的头像 发表于 03-28 08:05 ?657次阅读
    新生态 智未来「飞凌<b class='flag-5'>嵌入式</b>2025<b class='flag-5'>嵌入式</b>及<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>技术论坛」开启报名!

    AMD Versal自适应SoC器件Advanced Flow概览(下)

    AMD Vivado Design Suite 2024.2 版本中,Advanced Flow 自动为所有 AMD Versal 自适应 SoC 器件启用。请注意,Advance
    的头像 发表于 01-23 09:33 ?776次阅读
    <b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b>自适应<b class='flag-5'>SoC</b>器件Advanced Flow概览(下)

    使用AMD Vitis进行嵌入式设计开发用户指南

    Zynq MPSoC 和 AMD Alveo 数据中心加速器卡)为目标的异构嵌入式应用。 Vitis 工具包括: C++ 编译器、库和本征函数,适用于 AI 引擎和可编程逻辑( PL ) 适用于 Arm
    的头像 发表于 01-08 09:33 ?1506次阅读
    使用<b class='flag-5'>AMD</b> Vitis进行<b class='flag-5'>嵌入式</b>设计开发用户指南

    使用AMD Versal AI引擎加速高性能DSP应用

    AMD Versal AI 引擎使您能够扩展数字信号处理( DSP )算力与面向未来的设计,从而适应当前和下一代计算密集型 DSP 应用。借助 Versal
    的头像 发表于 11-20 16:35 ?973次阅读

    AMD 面向嵌入式系统推出高能效 EPYC 嵌入式 8004 系列

    领先地位。 ? AMD EPYC 嵌入式 8004 系列处理器专为计算密集型嵌入式系统所设计,可为高需求工作负载提供卓越性能,同时以紧凑的尺
    发表于 10-11 13:58 ?1118次阅读

    AMD第二代Versal自适应SoC的主要特色

    AMD 第二代 AMD Versal AI Edge 和 Versal Prime 系列助力 AI
    的头像 发表于 09-18 10:14 ?1081次阅读

    AMD Versal自适应SoC CPM5 QDMA的Tandem PCIe启动流程介绍

    本文将从硬件设计和驱动使用两个方面介绍基于 CPM5 QDMA 的 AMD Versal 自适应 SoC 的 Tandem 设计和启动流程。
    的头像 发表于 09-18 10:07 ?1748次阅读
    <b class='flag-5'>AMD</b> <b class='flag-5'>Versal</b>自适应<b class='flag-5'>SoC</b> CPM5 QDMA的Tandem PCIe启动流程介绍

    AMD分析嵌入式边缘AI的发展

    随着人工智能( AI )技术广泛应用于各行各业,从云到边缘的解决方案逐渐成为信息技术领域新的热点。嵌入式边缘
    的头像 发表于 09-18 09:30 ?652次阅读
    <b class='flag-5'>AMD</b>分析<b class='flag-5'>嵌入式</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b>的发展