0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

FPGA取代AI加速器中的GPU

eeDesigner ? 2020-07-21 15:14 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AI软件初创公司Mipsology正在与Xilinx合作,以使FPGA能够仅使用一个附加命令即可替换AI加速器应用程序中的GPUMipsology的“零努力”软件Zebra将GPU代码转换为可在FPGA上的Mipsology的AI计算引擎上运行,而无需进行任何代码更改或重新培训。

赛灵思今天宣布,将为数据中心向Zebra交付最新版本的Alveo U50卡。Zebra已经在其他Xilinx板上支持推理加速,包括Alveo U200和Alveo U250。

Xilinx Alveo U50卡,旨在取代AI Acceleration中的GPU
赛灵思最新版本的Alveo U50数据中心加速卡现在带有Mipsology的Zebra软件,用于转换GPU AI代码以在FPGA上运行(图片:Xilinx)

Xilinx营销副总裁Ramine Roane表示:“ Zebra带给我们的Alveo卡的加速水平使CPU和GPU加速器感到羞愧。”“与Zebra结合使用,Alveo U50满足了AI工作负载的灵活性和性能需求,并为任何部署提供了高吞吐量和低延迟性能优势。”


过去,即插即用的FPGA对于非专业人士来说很难编程,但是Mipsology希望将FPGA变成即插即用的解决方案,就像CPU或GPU一样容易使用。这样做的想法是使从其他类型的加速切换到FPGA尽可能容易。

Mipsology首席执行官Ludovic Larzul说:“最好的方式是[Mipsology],我们使用FPGA之上的软件来使它们透明化,就像Nvidia用Cuda CuDNN来使GPU对AI用户完全透明一样。“在接受EE Times采访时

至关重要的是,这可以由非专家完成,而无需具备深厚的AI专业知识或FPGA技能,因为无需进行模型再培训即可过渡。

“易用性非常重要,因为当您查看人们的AI项目时,他们通常无法访问设计神经网络的AI团队,” Larzul说。“通常,如果有人安装了一个机器人系统或一个视频监视系统……他们会让其他团队或其他团体开发神经网络并对其进行培训。一旦获得了[训练有素的模型],他们就不会更改它,因为他们没有专业知识。”

Mipsology Zebra软件堆栈。 Zebra使FPGA能够取代GPU
斑马的堆栈。该技术适用于数据中心,边缘和嵌入式应用程序(图片:Mipsology)

与Xilinx对比当Xilinx
已经拥有自己的神经网络加速器引擎(XDNN)时,为什么会支持第三方软件?

“一句话的重点是:我们做得更好,”拉尔祖尔说。“另一句话是:我们的作品。”

Mipsology在Zebra中拥有自己的计算引擎,该引擎支持客户现有的卷积神经网络(CNN)模型,与XDNN不同,Larzul表示XDNN支持大量演示,但不太适合定制神经网络。他说,这使使用XDNN建立和运行自定义网络“痛苦”。尽管XDNN可以在不受GPU威胁的应用程序中竞争,但Zebra旨在使FPGA根据性能,成本和易用性直接采用GPU。

Mipsology Zebra堆栈详细-帮助FPGA取代GPU
斑马的堆栈详细。目的是通过尽可能多地隐藏硬件来使FPGA成为从GPU或CPU到AI加速的更简单的切换(图片:Mipsology)

Larzul说,大多数客户改变GPU解决方案的动机是成本。

他说:“他们想降低硬件成本,但又不想重新设计神经网络。”“(避免了)一笔非经常性的费用,因为我们能够透明地替换GPU,并且无需重新训练或修改神经网络。”

FPGA还具有可靠性,部分原因是因为它们在芯片领域不那么积极,并且通常比包括GPU在内的其他加速器类型运行温度更低。这在需要长期维护成本的数据中心中尤其重要。

拉尔祖尔说:“总拥有成本不仅仅是董事会的价格。”“确保系统正常运行还需要付出代价。”

Zebra还旨在使FPGA在性能上竞争。Larzul说,尽管FPGA通常提供比其他加速器更少的TOPS(每秒Tera操作),但由于Zebra精心设计的计算引擎,它们能够更有效地使用TOPS。

Ludovic Larzul(图片:Mipsology)
Ludovic Larzul(图片:Mipsology)

“这是大多数加速AI的ASIC初创企业都忘记了的-他们在做很大的一块硅片,试图包装更多的TOPS,但是他们没有考虑如何在网络上映射它以提高效率”,他说,并指出Zebra的基于FPGA的引擎比TOPS量为6倍的GPU每秒能够处理更多图像。

如何实现的?尽管Larzul没有提供确切的细节,但他确实表示它们不依赖修剪,因为精度降低太大,以至于不进行重新培训就无法接受。由于相同的原因,它们不使用极限量化(低于8位)。

Zebra的引擎加快了CNN的速度,而CNN如今已广泛用于图像和视频处理应用程序,但Zebra也可以应用于使用类似数学概念的BERT(Google的自然语言处理模型)。Zebra的未来迭代可能会覆盖其他类型的神经网络,包括LSTM(长期短期记忆)和RNN(递归神经网络),但这很难实现,因为RNN在数学上更加多样化。

EVE
Mipsology的团队成立于2015年,在法国约有30人从事研发工作,在加利福尼亚有一个小团队,主要负责业务发展。该公司已获得总计700万美元的资金,其中200万美元是2019年法国政府创新竞赛的奖金。

Mipsology的核心团队来自EVE,这一家ASIC仿真器公司,于2012年被Synopsys收购,用于其ZeBu(零错误)硬件辅助验证产品,当时是Cadence钯金验证平台的竞争对手。Larzul认为,几乎所有主要的ASIC公司都使用EVE技术在设计周期内验证ASIC。该技术依赖于连接在一起的数千个FPGA来重现ASIC行为。

Mipsology拥有12项正在申请的专利,并且与Xilinx密切合作,并且与第三方加速器卡兼容,例如Western Digital小型(SFF U.2)卡和Vega-4001等研华卡。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1646

    文章

    22097

    浏览量

    620686
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4980

    浏览量

    132089
  • AI
    AI
    +关注

    关注

    88

    文章

    35757

    浏览量

    282422
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,移动设备上实现PC级别的AI图形性能

    Arm 神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,首次在移动设备上实现 PC 级别的 AI 图形性能,为未来的端侧 AI 创新奠定基础 神经超级采样是 Arm
    的头像 发表于 08-14 17:59 ?534次阅读

    粒子加速器?——?科技前沿的核心装置

    粒子加速器全称“荷电粒子加速器”,是一种利用电磁场在高真空环境对带电粒子(如电子、质子、离子)进行加速和控制,使其获得高能量的特种装置。粒子加速器
    的头像 发表于 06-19 12:05 ?975次阅读
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心装置

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理GPU)和AI加速器产品系列。包括全新英特尔锐炫? Pro B系列GPU
    的头像 发表于 05-20 12:27 ?4645次阅读
    直击Computex2025:英特尔重磅发布新一代<b class='flag-5'>GPU</b>,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPUAI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔? Gaudi 3 AI加速器机架级和PCIe部署方案 ? 2025 年 5 月 19 日,北京 ——今日
    发表于 05-20 11:03 ?1544次阅读

    嵌入式AI加速器DRP-AI 详细介绍

    的嵌入式设备。此外,人工智能正在不断发展,新的算法不时被开发出来。 在人工智能快速发展的过程,瑞萨开发了人工智能加速器(DRP-AI)和软件(DRP-AI翻译
    的头像 发表于 03-15 16:13 ?1109次阅读
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 详细介绍

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    。? AI加速器的开发:FPGA被广泛用于开发专为AI算法优化的加速器,例如深度学习推理加速器
    发表于 03-03 11:21

    从图形处理到AI加速,一文看懂Imagination D系列GPU

    Imagination的D系列于2022年首次发布,见证了生成式AI从云端到智能手机等消费设备普及。在云端,由于GPU的可编程性、可扩展性和快速处理AI工作负载的能力,
    的头像 发表于 02-27 08:33 ?584次阅读
    从图形处理到<b class='flag-5'>AI</b><b class='flag-5'>加速</b>,一文看懂Imagination D系列<b class='flag-5'>GPU</b>

    当我问DeepSeek AI爆发时代的FPGA是否重要?答案是......

    ,这为AI的持续创新提供了有力支持。 6.数据中心与云计算加速 ? 在云计算和数据中心中,FPGA被用作AI计算加速器,尤其是针对深度学习工
    发表于 02-19 13:55

    消息称AMD Instinct MI400 AI加速器将配备8个计算芯片

    近日,据外媒 videocardz 报道,参考 AMD 最新推出的 AMD - GFX 补丁程序,其中暗示 AMD 旗下的 Instinct MI400 AI 加速器设计将有重大变革,其将配备 8
    的头像 发表于 02-05 15:07 ?1038次阅读

    GPU加速云服务怎么用的

    GPU加速云服务是将GPU硬件与云计算服务相结合,通过云服务提供商的平台,用户可以根据需求灵活租用带有GPU资源的虚拟机实例。那么,
    的头像 发表于 12-26 11:58 ?517次阅读

    英伟达AI加速器新蓝图:集成硅光子I/O,3D垂直堆叠 DRAM 内存

    冷板。 在英伟达给出的模型,每个 AI 加速器复合体包含 4 个 GPU 模块,每个 GPU 模块与 6 个小型 DRAM 内存
    的头像 发表于 12-13 11:37 ?769次阅读
    英伟达<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>新蓝图:集成硅光子I/O,3D垂直堆叠 DRAM 内存

    从版本控制到全流程支持:揭秘Helix Core如何成为您的创意加速器

    加速器
    龙智DevSecOps
    发布于 :2024年11月26日 13:42:47

    《算力芯片 高性能 CPUGPUNPU 微架构分析》第3篇阅读心得:GPU革命:从图形引擎到AI加速器的蜕变

    场景精确投射到2D平面;最后在像素着色阶段完成材质渲染和光照明细处理。DirectX API的迭代推动了可编程着色的发展,解放了GPU的通用计算潜能。特别是像素着色的设计,启发了我在深度学习任务
    发表于 11-24 17:12

    最强服务CPU来了!AI性能直接翻倍

    以及AI服务AI数据中心场景的CPU产品。它不仅能支持广泛的第三方GPUAI加速器,与它们
    的头像 发表于 09-29 11:00 ?1101次阅读
    最强服务<b class='flag-5'>器</b>CPU来了!<b class='flag-5'>AI</b>性能直接翻倍

    英特尔发布Gaudi3 AI加速器,押注低成本优势挑战市场

    英特尔近期震撼发布了专为AI工作负载设计的Gaudi3加速器,这款新芯片虽在速度上不及英伟达热门型号H100与H200 GPU,但英特尔巧妙地将竞争优势聚焦于其更为亲民的价格与总拥有成本(TCO)上。
    的头像 发表于 09-26 16:16 ?1283次阅读