0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm如何助力AI基础设施变革

Arm社区 ? 来源:Arm社区 ? 2025-07-03 14:29 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

众所周知,人工智能 (AI) 有望革新人类活动的方方面面。然而,要充分释放这一潜力,就必须面对一个基本事实:支撑传统计算的基础设施已无法满足未来 AI 发展的需求。

当前,产业已经见证了这场变革所呈现出的惊人规模:

训练 ChatGPT-4 使用了超过 1PB 的数据,相当于两亿首歌曲连续播放长达 1,000 年。

OpenAI 每月为 10 亿活跃用户提供服务,每位用户消耗的数据量是传统应用的一万倍。

到 2030 年,这场 AI 革新将带动超过一万亿美元的基础设施投资。

这一爆炸性增长正在推动数据中心的能耗从兆瓦级跃升至吉瓦级,由此带来的限制无法仅靠增加更多通用服务器来解决。整个行业必须从根本上重新思考计算基础设施的架构设计、构建方式和部署策略。那些能够成功驾驭这场转型的企业,将充分释放 AI 的潜力;而未能及时跟进的企业,则极有可能面临被市场淘汰的风险。

在近日于旧金山举办的第 62 届设计自动化大会 (DAC) 的 SKYTalk 演讲中,Arm 高级副总裁兼基础设施事业部总经理 Mohamed Awad 分享了如何拥抱基础设施变革,抓住 AI 的万亿美元机遇的经验与洞察。

过往技术变革的经验启示

应对如此巨大的技术变革其实已有“蓝图”可循。在过去的 30 年里,从移动计算到汽车变革,再到物联网部署,历次成功的技术革命都遵循着相似的发展路径。而那些最终脱颖而出成为领军者的企业,普遍具备以下三个共同特征:

追求技术领先

具备系统级思维

培育强大的生态系统

这一发展模式为 AI 转型提供了重要借鉴。回顾移动革命,它不仅仅是处理器速度的提升,更涉及对能效优化、软件栈乃至制造合作伙伴关系的全面革新。同样,汽车行业向自动驾驶和电动化转型的过程中,也需要在芯片设计、系统架构以及生态协作等层面采取一体化的推进策略。

Awad 表示,要让 AI 真正实现我们为其设定的宏伟目标,所需的其实还是同样的路径:技术领先、从底层开始设计的系统,以及强大的生态系统。

基础设施演进的迫切性

数据中心的演进过程充分展现了行业快速适应 AI 需求的能力。2020 年之前,企业主要依赖通用服务器,并通过 PCI 插槽添加加速器。到了 2020 年,重点转向了具备 GPU 之间直连能力的集成服务器。2023 年,我们见证了 CPU 与 GPU 的高度耦合集成。而如今,行业正向完整的“AI 工厂”迈进,从芯片层面开始,为特定负载场景打造整个服务器机柜。

领先的科技公司正在摒弃“一刀切”的通用架构思路。NVIDIA 的 Vera Rubin AI 集群、亚马逊云科技 (AWS) 的 AI UltraCluster、Google 的 Cloud TPU 机柜,以及微软的 Azure AI 机柜,都是针对自身独特需求而专门打造的定制化系统,而非通用解决方案。

Awad 解释道,所有领先的超大规模云服务商都在做同样的事情。他们从芯片层开始构建高度集成的系统,根据自身的系统需求反向驱动芯片层的创新。

这一转变反映出整个行业达成的广泛共识:AI 的计算需求必须依赖专为 AI 工作负载设计的基础设施,而非在通用系统基础上改造的解决方案。

经大规模验证的性能表现

AWS 报告称,过去两年新部署的 CPU 算力中,有超过 50% 来自其搭载 Arm 架构的 Graviton 处理器。此外,包括 Amazon Redshift、Prime Day、Google 搜索和 Microsoft Teams 在内的关键工作负载,如今都运行在基于 Arm Neoverse 等先进技术构建的基础设施上,实现了显著的性能提升与能效优化。

Awad 进一步解释说,这些举措并非出于成本削减的考量,而是为了追求性能。企业打造定制芯片,并不是因为它成本更低,而是因为它能在特定数据中心环境下,实现通用解决方案所无法达到的性能与能效水平。

通过协作加速创新

打造定制芯片面临着诸多挑战,包括高昂的成本、复杂的设计以及漫长的开发周期。解决之道在于通过协作生态系统来降低门槛、加速创新。像 Arm CSS (Compute Subsystems) 此类的预集成的计算子系统、共享的设计资源以及经过验证的工具流程,都能显著缩短开发周期。

已有行业实例展现了生态协作的潜力。部分合作项目通过在设计中使用预配置、预验证的 CSS,使合作伙伴节省了 80 人/年的工程师投入,将开发周期从数年缩短至数月。

Awad 表示,其中一个项目从启动到制造出能够在 128 个核心上运行 Linux 的芯片,仅用了 13 个月,对于顶尖的芯片开发而言,这一速度堪称惊人。

正在兴起的芯粒 (Chiplet) 生态系统,代表了行业协作的又一重大突破。像Arm 芯粒系统架构 (Arm Chiplet System Architecture, CSA)这样的行业倡议正在定义通用接口与协议,诸多亚太地区的合作伙伴已经参与其中,共同开发标准化的计算模块,并可按需组合应用于不同场景,从而构建更加灵活且更具成本效益的开发路径。此外,通过Arm 全面设计 (Arm Total Design) 等生态项目,这类协作框架将晶圆代工厂、设计服务商、IP 供应商以及固件合作伙伴紧密连接起来,以简化整个开发流程。

软硬件协同释放 AI 潜力

仅靠硬件创新无法真正释放 AI 的潜力。实现成功还需要强大的软件生态系统作支撑,这背后凝聚了长达 15 年的持续投入,包括数百万开发者的参与、广泛的开源项目支持,以及成千上万家供应商共同打造兼容的解决方案。

当今领先的 AI 基础设施部署依托于成熟的软件栈,涵盖 Linux 发行版、云原生技术、企业级 SaaS 应用以及 AI/ML 框架等。这种软件的成熟度使得企业能够放心地部署新的硬件架构,确信其整个技术堆栈可以无缝运行。

Awad 表示,如果没有软件,硬件就没有意义。这一点至关重要。因为当我们谈论为 AI 而打造的加速器、设备和芯片时,人们常常会问我软件方面的情况。常有初创公司来找我说,‘嘿,我开发了这个很棒的硬件产品。’但当我问他们,‘有多少人专门为它开发软件?’时,答案往往就没那么有说服力了。

拥抱基础设施变革

随着 AI 持续呈指数级增长,基础设施面临的挑战也将愈发严峻。企业无法仅靠增加传统服务器来实现扩展,他们需要的是专为 AI 工作负载优化的定制化系统,同时还必须具备在前所未有的规模下高效运行的能力。

能够成功应对这一转型的企业和技术,往往具备共同的特征:它们通过技术领先追求突破性性能表现,采用系统级的整体思维而非组件级思维,并构建协作型生态系统,在加速创新的同时降低个体风险。

这场基础设施变革既是挑战,也是机遇。那些正在着手准备,通过理解这些核心原则并构建合适的技术基础的企业,将更有机会抓住 AI 所带来的万亿美元级市场机遇。而仍然固守旧有模式的企业,则有可能错失当代最大的技术机遇。

Awad 总结,未来属于那些已经准备好去创造它的人。基础设施的变革已经启程。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    9826

    浏览量

    88224
  • 数据中心
    +关注

    关注

    16

    文章

    5256

    浏览量

    73633
  • AI
    AI
    +关注

    关注

    88

    文章

    35476

    浏览量

    281285

原文标题:拥抱基础设施变革,抓住 AI 的万亿美元机遇

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    WAIC 直击|Arm 邹挺:突破基础设施、数据安全与人才三重挑战,释放 AI 发展新潜能

    WAIC 直击|Arm 邹挺:突破基础设施、数据安全与人才三重挑战,释放 AI 发展新潜能
    的头像 发表于 07-28 11:33 ?425次阅读
    WAIC 直击|<b class='flag-5'>Arm</b> 邹挺:突破<b class='flag-5'>基础设施</b>、数据安全与人才三重挑战,释放 <b class='flag-5'>AI</b> 发展新潜能

    欧洲联手NVIDIA打造AI基础设施

    NVIDIA 于近日宣布,其正在携手欧洲各国、科技和行业领导者,共同建造 NVIDIA Blackwell AI 基础设施,以强化数字主权、支撑经济增长,并推动欧洲大陆成为 AI 工业革命的领导者。
    的头像 发表于 06-16 14:25 ?621次阅读

    爱立信携手英伟达建设瑞典AI基础设施

    日前,包括爱立信、阿斯利康、萨博、瑞典北欧斯安银行(SEB)和瓦伦堡投资公司(Wallenberg Investment AB)在内的瑞典联盟合作伙伴,将共同构建由一家合资公司运营的AI基础设施,为行业合作伙伴提供安全、主权计算接入服务。
    的头像 发表于 05-30 10:40 ?6354次阅读

    曙光AI解决方案助力光大银行数字化基础设施升级

    作为国有股份制商业银行,光大银行以全力做好“五篇大文章”为目标,结合曙光AI解决方案推进数字化基础设施升级,创新金融服务,深化科技赋能,走出了一条具有光大特色的AI之路。 近年来,光大银行主动顺应
    的头像 发表于 05-12 10:46 ?443次阅读

    PoE交换机如何助力智慧城市基础设施建设?

    随着全球城市化的加速发展,智慧城市的概念正逐步成为现实。通过技术手段提升居民生活质量、优化城市运营并促进可持续发展已成为趋势。弹性且高效的网络是智慧城市基础设施的关键支撑,而以太网供电(PoE
    发表于 03-25 10:20

    英伟达与xAI签AI基建协议 加入全球人工智能基础设施投资合作伙伴联盟

    全球人工智能基础设施投资合作伙伴联盟“Global AI Infrastructure Investment”联盟是由贝莱德及其旗下的全球基础设施合伙公司(GIP)、微软与阿联酋投资机构MGX于去年
    的头像 发表于 03-20 13:58 ?658次阅读

    NVIDIA 与行业领先的存储企业共同推出面向 AI 时代的新型企业基础设施

    存储提供商构建搭载 AI 查询智能体的基础设施,利用 NVIDIA 计算、网络和软件,针对复杂查询进行推理并快速生成准确响应 ? 美国加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2025 年
    发表于 03-19 10:11 ?261次阅读
    NVIDIA 与行业领先的存储企业共同推出面向 <b class='flag-5'>AI</b> 时代的新型企业<b class='flag-5'>基础设施</b>

    华为打造移动AI时代领先电信基础设施

    使能平台,助力运营商电信基础设施从架构、自动化、绿色、AI等方面全面升级,从容应对复杂网络挑战,使能AI业务创新,打造移动AI时代领先电信
    的头像 发表于 03-08 11:39 ?778次阅读

    美国投资5000亿美元建设AI基础设施

    美国总统特朗普近期宣布了一项重大投资决策,由日本软银集团、美国OpenAI和甲骨文三家顶尖企业联手,共同投资5000亿美元,用于在美国大规模建设支持人工智能(AI)发展的基础设施。这一前所未有的投资规模,标志着AI领域的又一里程
    的头像 发表于 01-22 15:31 ?702次阅读

    英伟达与软银携手共建日本AI基础设施

    近日,英伟达创始人兼CEO黄仁勋宣布,英伟达将与软银集团合作,在日本共同建设AI基础设施,其中包括日本最大的AI工厂。这一合作标志着英伟达和软银在人工智能领域的深度合作迈出了重要一步。
    的头像 发表于 11-13 14:41 ?776次阅读

    NVIDIA助力印度打造AI基础设施

    在孟买举办的 NVIDIA AI Summit 上,黄仁勋和穆克什·安巴尼(Mukesh Ambani)探讨了关于 AI 基础设施的投资,这些投资有望为各行各业带来变革
    的头像 发表于 10-27 09:44 ?613次阅读

    智能驾驶所需的基础设施

    智能驾驶所需的基础设施主要包括以下几个方面: 一、通信网络基础设施 5G/6G网络 :高速、低延迟的通信网络是实现智能驾驶的重要基础。5G网络已经能够提供足够的带宽和低延迟,支持车辆与云端、其他车辆
    的头像 发表于 10-23 16:05 ?1755次阅读

    微软贝莱德成立AI基础设施投资基金

    微软与全球顶尖资产管理公司贝莱德携手,共同发起了一项名为“全球人工智能基础设施投资伙伴关系”的宏伟计划。该基金旨在汇聚超过300亿美元的私募股权力量,以撬动高达1000亿美元的巨额投资,专注于构建支撑人工智能发展的基础设施
    的头像 发表于 09-19 16:55 ?612次阅读

    Sam Altman的全球AI基础设施建设计划加速推进

    Altman正密锣紧鼓地筹备一项雄心勃勃的计划,旨在吸引全球投资者的目光与资金,共同推动人工智能基础设施的全面建设。这一计划的轮廓日益清晰,预示着AI时代的新篇章即将开启。
    的头像 发表于 09-04 16:13 ?939次阅读

    OpenAI硬件负责人热议AI基础设施扩展与节能方案

    在近日于斯坦福大学举办的Hot Chips 2024大会上,OpenAI的硬件设施负责人Trevor Cai发表了一场深入人心的演讲,其核心聚焦于“构建可扩展的AI基础设施”。Trevor Cai
    的头像 发表于 09-02 16:20 ?924次阅读