0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔发布Gaudi3 AI加速器,押注低成本优势挑战市场

要长高 ? 2024-09-26 16:16 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

英特尔近期震撼发布了专为AI工作负载设计的Gaudi3加速器,这款新芯片虽在速度上不及英伟达热门型号H100与H200 GPU,但英特尔巧妙地将竞争优势聚焦于其更为亲民的价格与总拥有成本(TCO)上。

Gaudi3处理器采用双芯片设计,内置强大的计算单元,包括64个张量处理器核心(TPC,配备256x256 MAC结构并集成FP32累加器)、8个高效的矩阵乘法引擎(MME,支持256位宽矢量处理)以及高达96MB的片上SRAM缓存,提供惊人的19.2TB/s带宽。此外,它还集成了24个200GbE网络接口和14个媒体引擎,后者能够高效处理多种视频编解码格式,如H.265、H.264、JPEG和VP9,为视觉处理应用增添强大助力。内存方面,Gaudi3搭载了128GB HBM2E内存,通过八个内存堆栈实现高达3.67TB/s的带宽,确保数据处理的高效流畅。

相较于前代产品Gaudi2,Gaudi3在架构上进行了显著优化,尽管在TPC和MME数量上有所精简,但它专注于提升特定精度下的计算能力,仅支持FP8矩阵运算及BFloat16矩阵和矢量运算,这一调整旨在更好地满足当前AI工作负载的需求。

在性能表现上,Gaudi3提供了高达1856 TFLOPS的BF16/FP8矩阵运算能力,以及28.7 TFLOPS的BF16矢量运算能力,同时其热设计功耗(TDP)约为600W。尽管在某些指标上略逊于英伟达H100,但英特尔强调,Gaudi3在实际应用中的性价比优势将尤为突出。

英特尔为Gaudi3制定了明确的市场定位,旨在与AMD的Instinct MI300系列及英伟达的H100、B100/B200等高端芯片展开竞争。据英特尔透露,基于8个Gaudi3芯片的加速器套件定价为125,000美元,单芯片成本约为15,625美元,相较于英伟达H100的30,678美元售价,展现了显著的价格优势。然而,面对可能具备更强性能的英伟达Blackwell架构GPU(如B100/B200),英特尔能否持续保持其竞争优势,仍需市场进一步验证。

英特尔执行副总裁Justin Hotard表示:“AI需求的激增正驱动数据中心领域的深刻变革,行业迫切需要更多元化的硬件、软件及开发工具选择。通过推出搭载P核与Gaudi3 AI加速器的Xeon 6,英特尔正积极构建一个开放的生态系统,助力客户以更高的性能、效率和安全性应对各种工作负载。”

目前,Gaudi3 AI加速器已通过IBM Cloud及英特尔Tiber开发者云平台提供服务,并计划于今年第四季度通过戴尔、慧与(HPE)和Supermicro等合作伙伴全面上市,其中戴尔和Supermicro的部分系统将于10月开始出货,而Supermicro的设备则将于12月抵达市场。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10205

    浏览量

    175075
  • 加速器
    +关注

    关注

    2

    文章

    828

    浏览量

    39200
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281298
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款
    的头像 发表于 06-27 11:44 ?226次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品—英特尔Gaudi 3
    的头像 发表于 05-21 00:57 ?6099次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅<b class='flag-5'>发布</b>新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理(GPU)和AI加速器产品系列。包括全新
    的头像 发表于 05-20 12:27 ?4559次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅<b class='flag-5'>发布</b>新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔? Gaudi
    发表于 05-20 11:03 ?1529次阅读

    Intel-Altera FPGA:通信行业的加速引擎,开启高速互联新时代

    。三、市场地位与挑战行业格局:FPGA市场长期由AMD(Xilinx)和英特尔(Altera)主导,但收购后Altera市场份额从40%降至
    发表于 04-25 10:19

    英特尔Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司发布了备受瞩目的Janus Pro模型,其凭借超强性能和高精度在业界引发了广泛关注。为了进一步提升该模型的应用效能,英特尔宣布其Gaudi 2D AI
    的头像 发表于 02-10 11:10 ?653次阅读

    DeepSeek发布Janus Pro模型,英特尔Gaudi 2D AI加速器优化支持

    Gaudi 2D AI加速器现已针对该模型进行了全面优化。这一优化举措使得AI开发者能够更轻松地实现复杂任务的部署与优化,从而有效满足行业应用对于推理算力的迫切需求。
    的头像 发表于 02-08 14:35 ?656次阅读

    英特尔发布全新企业AI一体化方案

    近日,英特尔正式推出了全新的企业AI一体化方案。该方案以英特尔至强处理英特尔Gaudi 2D
    的头像 发表于 12-03 11:20 ?625次阅读

    英特尔发布全新企业AI一体化解决方案

    加速器等先进硬件。此外,它还结合了OPEA开放软件平台,确保了方案的灵活性和兼容性。 作为该方案的首个落地实践,英特尔携手新华三共同发布了新华三AIGC灵犀一体机。这款一体机充分利用了英特尔
    的头像 发表于 12-02 10:48 ?945次阅读

    英特尔至强品牌新战略发布

    品牌是企业使命和发展的象征,也承载着产品特质和市场认可。在英特尔GTC科技体验中心的英特尔 至强 6 能效核处理发布会上,
    的头像 发表于 10-12 10:13 ?895次阅读

    Inflection AI转向英特尔Gaudi 3,放弃英伟达GPU

    近日,人工智能技术公司Inflection AI宣布了一项重要决策,其最新的企业平台将放弃采用英伟达(Nvidia)的GPU,转而选择英特尔Gaudi 3
    的头像 发表于 10-10 17:21 ?795次阅读

    Inflection AI携手英特尔推出企业级AI系统

    近日,AI初创企业Inflection AI英特尔联合宣布了一项重大合作——推出基于英特尔Gaudi
    的头像 发表于 10-09 16:40 ?794次阅读

    英特尔调降明年AI服务芯片出货目标

    近日,有消息称英特尔为应对内部策略调整及终端需求变化,已对其旗下AI服务芯片Gaudi 3的明年出货目标进行了大幅调整。
    的头像 发表于 10-08 15:38 ?591次阅读

    RISC-V拥有巨大市场潜力的原因

    AI技术深度融合,例如Meta基于RISC-V架构推出AI推理加速器,高通与谷歌合作推出基于RISC-V架构的智能穿戴芯片等。 3、多元化应用:RISC-V正在
    发表于 09-30 14:20

    IBM Cloud将部署英特尔Gaudi 3 AI芯片

    近日,科技巨头IBM与英特尔宣布了一项重大合作计划,双方将共同在IBM Cloud平台上部署英特尔最新的Gaudi 3 AI芯片,预计该服务
    的头像 发表于 09-03 15:52 ?692次阅读