0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

iCooling,数据中心AI系统级节能专家

华为数字能源 ? 来源:未知 ? 2023-10-28 16:25 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着5G云计算AIGC大模型等新技术蓬勃兴起,数据中心作为我国数字经济飞速发展的基石和算力底座,兼具高能耗属性,肩负着节能减碳的社会责任及适应算力需求的持续增长。

国家工信部数据显示,截至2022年底中国算力总规模超过150EFlops(每秒浮点运算次数),数据中心机架总规模超过650万。根据Uptime Institute的数据,截至2022年的全球中大型数据中心平均PUE(Power Usage Effectiveness电源利用效率)为1.55,其中温控制冷系统能耗占比为25%以上。

数据中心节能审查及能耗监察趋向严格化wKgaomU8xo2ARoMRAAAS4Ptbys4469.gif

我国数据中心市场供需地域分布不均,东部数据算力供不应求,西部地区算力供大于求,数据中心布局向西转移,同时数据中心绿色节能发展已成趋势。“双碳”和“东数西算”的双重政策下,全国新建大型、超大型数据中心平均PUE降到1.3以下,集群内PUE要求东部≤1.25、西部≤1.2,先进示范工程≤1.15。国家强制标准GB 40879-2021《数据中心能效限定值及能效等级》正式发布,数据中心能效等级指标分别为1级(PUE≤1.2)、2级(PUE≤1.3)和3级(PUE≤1.5)

与此同时,一线发达城市反而实行电费奖惩措施,对低效数据中心加强升级改造,力争PUE不高于1.4,推进淘汰数据中心关停并转。

降本增效,
传统人工调优需要进一步解放

wKgaomU8xo2ARoMRAAAS4Ptbys4469.gif

数据中心PUE是数据中心总耗电量(PDC, Power of Data Center)与IT设备耗电量PIT, Power of IT)的比值,比值越趋近于1,表示一个数据中心的绿色化程度越高。数据中心总耗电量包含IT设备耗电量、温控制冷系统设备耗电量、供配电设备耗电量及辅助系统的耗能。其中,温控制冷系统作为数据中心能耗最大的辅助设备,电费支出成本在运营运行期间占30%~40%。

基于冷冻水系统的传统BA群控系统,依赖专家经验和人工手动操作调优,根据变容量的冷量需求分析和响应控制以及室外温度变化,实现基于供需平衡的能效优化。

传统BA群控系统在运维阶段能效优化难度大,一方面制冷系统原理复杂,制冷设备种类及数量多,不同设备控制变量庞大且存在响应延迟,单纯依靠运维人员的专家经验依据室外的环境温度和实时IT功率来动态调节响应已经无法满足能耗进一步降低的要求。另一方面,由于制冷系统内部和外部环境的动态特性(考虑天气),一个系统运行的定制模型和规则并不能保证另一个系统的适用,且每个制冷设备的实际运行效率也存在差异。传统BA群控系统的人工调节参数少,调节慢,效果不明显,实时性低。

AI加持使能,更深层次的软实力wKgaomU8xo2ARoMRAAAS4Ptbys4469.gif

数据中心开始应用多种节能创新技术,推进数据中心绿色节能,降低单位运行成本。比如,将传统低温冷冻水改为采用中高温冷冻水,充分引入间接蒸发冷却设备代替传统冷冻水,服务器液冷技术更是使数据中心PUE降低到了极致。同时,随着大数据分析及AI技术的成熟应用,基于服务器级负载响应和温度控制的iCooling@AI算法软件调优加持,使能传统冷机群控系统和末端空调群控系统能够实时调节,更频繁更高效的寻找最佳PUE,助力运行PUE接近设计PUE。

相比硬件设备的创新,华为iCooling软件调优节省投资,易交付,PUE节能见效快,投资回收期普遍<2年。

华为iCooling首先通过融合深度学习算法+能源大模型,利用华为自有数据中心大批量高质量的运行数据,基于昇腾底座的超大规模模型建模及训练调优的能力,根据系统运行的历史数据积累,结合专家知识,利用DNN方法,拟合PUE、制冷能耗、设备单机效率的数学预测模型。

基于PUE的预测模型,获取实际场景与PUE敏感的特征值,利用模型中的特征如大气条件、IT负载等参数进行负荷的数据建立本地模型。整个过程中,iCooling通过海量数据采集、数据处理(脱敏、去杂、归一等)、PUE模型训练&推理、最佳PUE决策建议下发给BA冷机群控系统和末端空调群控系统,从而实时驱动底层设备运行状态调整,周而复始的保持最佳PUE状态。另外,在负载率变化≥5%或室外温差≥3℃,iCooling重新构建PUE训练模型,自动寻优。

华为iCooling从数据安全、控制安全、运行安全三个层次解决实际应用问题,基于联邦学习和迁移学习算法,本地部署保障AI模型训练数据无需出局,同时具备双层逻辑控制的AI优化控制主动、被动退出机制,满足运维SLA要求,调测更省心。目前华为iCooling已在金融、运营商、大企业和智算中心行业应用60+案例,使能运行PUE降幅可达:水冷冷冻水8%~15%、风冷冷冻水5~8%、华为EHU 3%~5%。华为iCooling帮助数据中心运行PUE接近设计PUE的同时,也有利于客户申报零碳、绿色数据中心优秀案例。

wKgaomU8xo6AOvDrAATfz5ySC3s379.png? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?wKgaomU8xo6AGr66AABigSCHGwM366.jpg? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?wKgaomU8xo6AG_rQAABd6w_bXAo538.jpg? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?点击“阅读原文”,了解更多华为数字能源资讯!


原文标题:iCooling,数据中心AI系统级节能专家

文章出处:【微信公众号:华为数字能源】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    216

    文章

    35293

    浏览量

    256985
  • 数字能源
    +关注

    关注

    0

    文章

    257

    浏览量

    14297

原文标题:iCooling,数据中心AI系统级节能专家

文章出处:【微信号:HWDigitalPower,微信公众号:华为数字能源】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构向AI工厂与AI云的转型。
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    在人工智能算力需求呈指数增长的2025年,数据传输效率已成为制约AI发展的关键瓶颈。作为全球AI光模块领域的标杆企业,深圳市睿海光电凭借技术领先的800G OSFP光模块解决方案,正
    发表于 08-13 16:38

    PCIe协议分析仪在数据中心中有何作用?

    调度不合理、硬件限制),指导优化拓扑结构或升级硬件(如从Gen4升至Gen5)。 流量调度与QoS优化 场景:多租户数据中心中,不同业务(如HPC、AI、存储)共享PCIe资源,需避免低优先
    发表于 07-29 15:02

    中型数据中心应用平台与差分晶体振荡器参数对照中型数据中心应用平台与差分晶体振荡器参数对照

    中型数据中心对高频、低抖动、宽温与多电压晶振的需求日益提升,FCO系列差分晶体振荡器凭借丰富封装、输出逻辑选择与优异相位抖动性能,为网络、存储、服务器与边缘系统提供稳定的时钟解决方案。FCO-2L 到 FCO-7L 系列,已成为新一代
    发表于 07-10 14:11

    简单认识安森美AI数据中心电源解决方案

    面对AI算力需求爆发式增长,数据中心电力系统正面临前所未有的挑战。安森美(onsemi)推出的AI数据中心电源解决方案,直击能效、尺寸等痛点,助力客户把握
    的头像 发表于 07-05 13:03 ?2609次阅读
    简单认识安森美<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>电源解决方案

    中型数据中心中的差分晶体振荡器应用与匹配方案

    中型数据中心的定义与特点 中型数据中心通常服务于中大型企业、科研机构或地方行业节点,具备50至200个机柜,部署多台服务器、交换设备、存储系统与光通信链路等,强调高带宽、低延迟与高可用性。关键设备
    发表于 07-01 16:33

    是德科技推出用于大规模AI数据中心的系列解决方案

    ·?为AI基础设施提供商提供从物理层到应用层数据中心模拟和优化解决方案 ·?验证和优化系统性能,确保AI
    的头像 发表于 04-10 08:51 ?312次阅读
    是德科技推出用于大规模<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>的系列解决方案

    是德科技推出AI数据中心构建器

    是德科技(NYSE:KEYS)推出Keysight AI (KAI)数据中心构建器,这是一款先进的软件套件,通过模拟真实工作负载来评估新算法、组件和协议对AI训练性能的影响。KAI数据中心
    的头像 发表于 04-07 11:06 ?578次阅读

    适用于数据中心AI时代的800G网络

    随着人工智能(AI)技术的迅猛发展,数据中心面临着前所未有的计算和网络压力。从大语言模型(LLM)训练到生成式AI应用,海量数据处理需求推动了网络带宽的快速增长。在此背景下,800G网
    发表于 03-25 17:35

    华为全新升级星河AI数据中心网络

    在华为中国合作伙伴大会2025期间,以 “星河AI数据中心网络,赋AI时代新动能”为主题的数据中心网络分论坛圆满落幕。本次论坛汇聚了来自全国的300多位客户和伙伴,共同探讨
    的头像 发表于 03-24 14:46 ?572次阅读

    Cadence颠覆AI数据中心设计

    日前举办的英伟达 GTC 2025 开发者大会汇聚了众多行业精英,共同探讨人工智能的未来。而人工智能正在重塑全球数据中心的格局。据预测,未来将有 1 万亿美元用于 AI 驱动的数据中心升级。然而
    的头像 发表于 03-21 15:43 ?516次阅读

    韩国将建全球最大AI数据中心

    据最新报道,韩国即将启动一项雄心勃勃的计划——建设全球最大的人工智能(AI)数据中心。该数据中心不仅在规模上令人瞩目,更在技术和投资上展现了韩国的强大实力。 据悉,该数据中心的电力容量
    的头像 发表于 02-20 09:24 ?630次阅读

    亚马逊云科技发布全新数据中心组件

    设计等多个方面进行深度优化和创新,成功构建了一个更加高效节能数据中心。这些创新不仅提升了数据中心的运行效率,更为客户在AI等领域的进一步创新提供了坚实的基础。 据悉,亚马逊云科技将在
    的头像 发表于 12-24 15:05 ?595次阅读

    Meta AI数据中心网络用了哪家的芯片

    ? 在Meta,我们相信开放的硬件会推动创新。在当今世界,越来越多的数据中心基础设施致力于支持新兴的AI技术,开放硬件在协助分解方面发挥着重要作用。通过将传统数据中心技术分解为其核心组件,我们可以
    的头像 发表于 11-25 10:05 ?1472次阅读
    Meta <b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>网络用了哪家的芯片

    怎样保障数据中心不间断电源不断电 提供可靠安全的供配电#数据中心

    数据中心配电系统
    安科瑞王金晶
    发布于 :2024年08月29日 14:51:36