0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探索AI工厂的创收潜力

NVIDIA英伟达企业解决方案 ? 来源:NVIDIA英伟达企业解决方案 ? 2025-05-29 14:21 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“首次价值实现时间”是 AI 开发领域最重要的指标之一。

AI 正在为所有人创造价值,从药物发现领域的研究人员到应对金融市场变化的量化分析师均受益匪浅。

AI 系统生成“token”(用于串联输出结果的数据单元)的速度越快,其影响力就越大。这正是 AI 工厂的关键所在,它提供了从“首 token 时延”到“首次价值实现时间”的最高效路径。

AI 工厂正在重新定义现代基础设施的经济学。它们通过大规模地将数据转化为有价值的输出内容(无论是 token、预测、图像、蛋白质还是其他形式的内容)来生产智能

AI 工厂有助于提升 AI 应用流程中的三个关键环节:数据摄取、模型训练和高吞吐量推理。通过三大核心技术栈(AI 模型、加速计算基础设施和企业级软件),AI 工厂能够更快、更精准地生成 token。

下面将介绍 AI 工厂是如何帮助全球各地的企业把最宝贵的数字商品——数据转化为创收潜力的。

从推理经济学到价值创造

在构建 AI 工厂之前,理解推理经济学至关重要,推理经济学意味着如何平衡成本、能效和日益增长的 AI 需求。

吞吐量指模型可生成的 token 总量。延迟是模型在特定时间内输出的 token 数量,通常以首 token 时延(用户输入提示后,模型生成第一个输出 token 所需的时间)和“首 token 后,每个输出 token 的时延”(生成每个额外 token 所需的时间)来衡量。有效吞吐量(Goodput)是一个较新的指标,用于衡量一个系统在满足延迟目标的同时可交付的有用输出量。

用户体验是所有软件应用的关键所在,AI 工厂也不例外。高吞吐量意味着更智能的 AI,低延迟则确保了及时的响应。当这两项指标实现合理平衡时,AI 工厂就可通过快速提供有用的输出,带来卓越的用户体验。

例如,响应时间为 0.5 秒的 AI 客服比 5 秒响应的 AI 客服更具吸引力和价值,即使两者最终生成的 token 数量相同。

企业可借此机会为其推理输出设定具有竞争力的价格,从而提升每个 token 的创收潜力。

衡量和可视化这种平衡颇具挑战,而这正是“帕累托”前沿概念的用武之地。

AI 工厂输出:高效 Token 的价值

在规模化部署 AI 时,帕累托前沿有助于直观地表明如何在冲突的目标(如快速响应与同时服务更多用户)之间达到最优的平衡。

纵轴代表给定能耗下的吞吐效率(单位为 TPS,也就是每秒 token 数)。该数值越高,AI 工厂可同时处理的请求就越多。

横轴表示单个用户的 TPS,代表模型响应用户给出首个提示的用时。该数值越高,预期的用户体验就越好。对于聊天机器人和实时分析工具等交互式应用,更低的延迟和快速的响应尤为重要。

帕累托前沿的最大值(显示为曲线顶点)代表了特定运行配置下的最佳输出。目标是为不同的 AI 工作负载和应用找到吞吐量与用户体验之间的最优平衡。

顶尖的 AI 工厂通过加速计算来提升“每瓦 token 数”,即在优化 AI 性能的同时大幅提高 AI 工厂和应用的能效。

以上展示的动画对比了在NVIDIA Hopper GPU(配置为每用户每秒 32 个 token)与NVIDIA Blackwell Ultra GPU(配置为每用户每秒 344 个 token)上运行时的用户体验。在上述用户体验设置下,Blackwell Ultra 实现了 10 倍以上的体验提升和近 5 倍的更高吞吐量,实现了最高达 50 倍的创收潜力。

AI 工厂的实际运行

AI 工厂是一个系统,它包含了一套将数据转化为智能的组件。它不一定是高端的本地数据中心,也可能是在加速计算基础设施上运行的 AI 专用云或混合模型,甚至可能是同时优化网络并执行边缘推理的电信基础设施。

任何配备了软件的加速计算基础设施,只要能通过 AI 将数据转化为智能,本质上均可视为 AI 工厂。

AI 工厂的组件包括了加速计算、网络、软件、存储、系统以及工具和服务。

当用户向 AI 系统输入提示时,AI 工厂的全栈系统就开始工作。它将提示 token 化,也就是将数据转化为图像、声音、文字片段等语义单元。

每个 token 被输入到 GPU 驱动的 AI 模型中,随之在模型上进行计算密集型推理,以生成最佳响应。每个 GPU 通过高速网络和互连技术执行并行处理,从而同时处理海量数据。

对于来自全球用户的各种提示,AI 工厂都会运行上述流程。这种实时推理能够以工业级规模来生产智能。

由于 AI 工厂整合了整个 AI 生命周期,该系统能够持续改进:记录推理过程,标记边缘案例以进行再训练,优化循环随时间逐渐收敛。这一切均无需人工干预,这就是“有效吞吐量”的实际体现。

面向 AI 工厂的 NVIDIA 全栈技术

AI 工厂将 AI 从一系列零散的实验转化为可扩展、可重复且可靠的创新与商业价值生成引擎。

NVIDIA 提供构建 AI 工厂所需的所有组件,包括加速计算、高性能 GPU、高带宽网络和优化的软件。

例如,NVIDIA Blackwell GPU可以通过网络连接,采用液冷技术提升能效,并由 AI 软件统一编排。

开源推理平台NVIDIA Dynamo为 AI 工厂提供了一种操作系统,该系统旨在以最高的效率和最低的成本加速并扩展 AI。通过智能地路由、调度和优化推理请求,Dynamo 确保每个 GPU 周期都能得到充分利用,从而以峰值性能生产 token。

NVIDIA Blackwell GB200 NVL72系统和NVIDIA InfiniBand网络专为最大化“每瓦 token 吞吐量”而设计,使 AI 工厂在总吞吐量和低延迟方面均实现高效运行。

通过验证优化后的全栈解决方案,企业可以高效地构建和维护前沿 AI 系统。全栈 AI 工厂助力企业实现卓越运营,使他们能更快、更自信地驾驭 AI 的潜力。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5348

    浏览量

    106849
  • 数据中心
    +关注

    关注

    16

    文章

    5287

    浏览量

    73724
  • AI
    AI
    +关注

    关注

    88

    文章

    35760

    浏览量

    282482

原文标题:探索 AI 工厂的创收潜力

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【书籍评测活动NO.64】AI芯片,从过去走向未来:《AI芯片:科技探索与AGI愿景》

    、请在收到书籍后2个星期内提交不少于2篇试读报告要求300字以上图文并茂。 4、试读报告发表在电子发烧友论坛>>社区活动专版标题名称必须包含 【「AI芯片:科技探索与AGI愿景
    发表于 07-28 13:54

    摩尔线程“AI工厂”:五大核心技术支撑,打造大模型训练超级工厂

    2025年7月25日,上海——在世界人工智能大会(WAIC 2025)开幕前夕,摩尔线程以“算力进化,精度革命”为主题举办技术分享会,并创新性提出“AI工厂”理念。摩尔线程创始人兼CEO张建中在主题
    的头像 发表于 07-28 11:28 ?661次阅读
    摩尔线程“<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>”:五大核心技术支撑,打造大模型训练超级<b class='flag-5'>工厂</b>

    摩尔线程“AI工厂”:以系统级创新定义新一代AI基础设施

    2025年7月25日,上海——在世界人工智能大会(WAIC 2025)开幕前夕,摩尔线程以“算力进化,精度革命”为主题举办技术分享会,并创新性提出“AI工厂”理念。摩尔线程创始人兼CEO张建中在主题
    发表于 07-28 10:34 ?1507次阅读
    摩尔线程“<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>”:以系统级创新定义新一代<b class='flag-5'>AI</b>基础设施

    【「DeepSeek 核心技术揭秘」阅读体验】第三章:探索 DeepSeek - V3 技术架构的奥秘

    ,全方位感受到 AI 大模型研发的复杂与精妙,每一项技术点都凝聚着智慧,也让我对人工智能技术的深度与广度有了新认知,期待后续探索能挖掘更多技术宝藏,见证 AI 发展的更多可能。
    发表于 07-20 15:07

    NVIDIA扩展适用于AI工厂数字孪生的Omniverse Blueprint

    NVIDIA 宣布大幅扩展适用于 AI 工厂数字孪生的 Omniverse Blueprint,为工程团队提供更多 AI 工厂构建工具,目前已作为预览版推出。
    的头像 发表于 05-22 09:48 ?423次阅读

    关于AI工厂三阶段模型

    在今天(2025年5月20日)的Computex大会上,富士康董事长刘扬伟发表了以“AI工厂三阶段模型”及“Genesis”为核心的Keynote演讲,提到鸿海集团在AI转型中的战略布局。这一
    的头像 发表于 05-20 23:26 ?694次阅读
    关于<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>三阶段模型

    工厂园区AI行为识别系统作用

    工厂园区AI行为识别系统作用 工厂园区AI行为识别系统是什么? 工厂园区AI行为识别系统是基于人
    的头像 发表于 05-06 17:49 ?318次阅读

    NVIDIA驱动的AI工厂正在重新定义数据中心

    NVIDIA 及其生态系统合作伙伴正在为 AI 推理时代构建大规模 AI 工厂,而每家企业都将需要一个这样的工厂
    的头像 发表于 04-11 11:27 ?543次阅读
    NVIDIA驱动的<b class='flag-5'>AI</b><b class='flag-5'>工厂</b>正在重新定义数据中心

    东软载波工厂AI智慧照明方案解析

    东软载波工厂AI智慧照明方案主要基于PLC电力线载波通信技术及自研智慧管控平台,对工厂各区域的照明设备进行集中化、自动化、智能化管控,满足现代工厂生产经营所需的照明要求。
    的头像 发表于 11-30 09:09 ?1071次阅读

    丽台科技推出WS3008 AI一体机

    随着 AI 技术的不断进步和商业应用的深入探索AI 一体机作为企业智能化转型的重要载体,正逐步展现出其独特的价值和潜力。为适用于更多企业转型需求以及更灵活的场景化要求,丽台科技现推出
    的头像 发表于 11-27 11:11 ?980次阅读

    一文了解AI网络互联的市场潜力

    AI网络多层次的互联彰显市场潜力 NVIDIA作为全球领先的视觉计算和人工智能公司,其市值突破万亿元的背后,除了强大的GPU产品线,互联技术扮演了不可或缺的支柱角色。NVIDIA于2019年收
    的头像 发表于 11-27 10:08 ?1132次阅读
    一文了解<b class='flag-5'>AI</b>网络互联的市场<b class='flag-5'>潜力</b>

    AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    ,无疑为读者铺设了一条探索人工智能(AI)如何深刻影响并推动科学创新的道路。在阅读这一章后,我深刻感受到了人工智能技术在科学领域的广泛应用潜力以及其带来的革命性变化,以下是我个人的学习心得: 1.
    发表于 10-14 09:12

    万界星空科技AI低代码MES的具体功能及工厂应用效果

    万界星空科技AI低代码MES的具体功能及工厂应用效果,万界星空科技AI低代码MES的具体功能及工厂应用效果
    的头像 发表于 09-18 14:56 ?771次阅读
    万界星空科技<b class='flag-5'>AI</b>低代码MES的具体功能及<b class='flag-5'>工厂</b>应用效果

    NVIDIA和Meta CEO探讨AI与仿真模拟技术的潜力

    NVIDIA 和 Meta 的首席执行官将在一次难得的公开活动中共同探讨 AI 与仿真模拟技术的潜力
    的头像 发表于 09-09 09:14 ?820次阅读

    新思科技探索AI+EDA的更多可能性

    芯片设计复杂性的快速指数级增长给开发者带来了巨大的挑战,整个行业不仅要向埃米级发展、Muiti-Die系统和工艺节点迁移所带来的挑战,还需要应对愈加紧迫的上市时间目标、不断增加的制造测试成本以及人才短缺等问题。早在AI大热之前,芯片设计行业就把目光放到了AI
    的头像 发表于 08-29 11:19 ?953次阅读