0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云、字节、浪潮信息、英特尔、电标院: OpenBMC是服务器固件大势所趋

全球TMT ? 来源:全球TMT ? 作者:全球TMT ? 2024-09-05 16:14 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

北京2024年9月5日/美通社/ -- 近年来随着云计算、大数据特别是大模型的快速发展,数据中心规模不断扩张,产生了更多的服务器管理需求。传统BMC虽然可以实现部分管理,但是在快速迭代的当今尤其是在AI技术的驱动下,存在开发周期长、交付困难、应用单一等难题,并且由于其代码闭源也会导致隐藏的安全漏洞无法及时识别,限制了用户定制开发。OpenBMC凭借领先的开源理念、可扩展的软件架构,被大型互联网厂商广泛应用,并带动了产业连上下游共同探索,逐步成为服务器固件发展的"事实标准"。

在日前召开的2024开放计算中国峰会上,来自阿里云、字节跳动、浪潮信息、英特尔以及电子标准院的专家,从自身探索和实践的角度,现身说法各家在OpenBMC方面的最新进展及未来规划。

OpenBMC大幅降低采购成本 阿里云新增修改10万+行自研代码库

随着云计算、大数据、AI等技术的发展,阿里云服务器规模已经达到数百万台,如何有效管理是摆在阿里云面前的现实问题。

而传统的BMC无法满足新兴运维需求,首先是庞大的服务器数量涵盖了多个品牌不同厂家,各厂家都基于某个IBV建立基础BMC能力再在上层定制开发,因此日常问题的解决需要拉通多方BMC软件规格和能力,带来时间和资源的大量浪费,效率低下;其次,不同品牌的服务器BMC代码也不尽相同,存在巨大的适配成本;第三是应用成本问题,传统BMC基础软件源代码和授权license都需要购买,后续还需要软件维护升级费用,成本较高。

OpenBMC迎合了当下软件质量发展和行业趋势,2020年左右OpenBMC软件逐步走向成熟,在北美一些CSP率先采用。阿里云服务器研发固件团队负责人李羿介绍,阿里云自2020年逐步采用OpenBMC产品,经过4年时间的探索与实践,已经形成行业一支领先的专业OpenBMC技术开发和交付团队,不仅可以在完成交付任务的同时结合云业务自身特点,还不断的回馈社区、贡献伙伴,在多个层面实现了行业领先。

如今,阿里云已经成功在x86、ARM等主流平台中实现了OpenBMC的替代,未来也将探索基于RISC-V等多元芯片平台的可能性。得益于OpenBMC的平台化优势,不同架构下的代码绝大部分都是相同的,只是针对不同平台略有微调。李羿表示,阿里云已经在实现代码的归一化,目前已经提交超过10万行代码,未来有望针对不同产品形态实现全面支持。

字节跳动打造OpenBMC应用新范式 问题分析定位效率大幅提升

从抖音到新晋AI工具"豆包",随着应用覆盖范围的进一步扩大、用户群体的持续增多,字节跳动需要维护的服务器数量已达百万级别,并且仍有不断增长的态势。如何高效、稳定且安全的管理服务器,成为运维团队面临的首要问题。

字节跳动固件架构师郏春辉介绍,传统BMC在解决固件运维难题上存在局限性,难以在服务器需求多样化的情况下满足快速交付的需求。开源OpenBMC能够吸纳先进理念和应用,提供了架构灵活、兼容性强的新选择,非常适合当下互联网与数字化的应用需求。

为了更好地解决固件运维的问题,字节跳动在OpenBMC固件运维能力基础上,不断进行技术创新,致力于提升OpenBMC固件的可观测性,对固件的运行状态、性能表现及内部各种活动进行全方位的监控和解析。通过加强对固件运行时软硬件状态的深入观察和理解,能够更快速地捕捉问题发生时的细节,从而实现高效精准的问题定位和处理。这种深入的可观测性不仅有助于提升系统的稳定性与可靠性,也为业务优化提供了宝贵的数据支持。

事实证明,这种方法非常有效。在引入了Perfetto和Kernel trace以后,问题定位分析时间,由原有的数小时乃至数天,降低至平均1小时以下;问题一次定位分析准确率,由40%提升至80%以上,效率提升非常明显。未来字节还计划在问题分析定位层面更进一步,借助AI技术和大数据分析,细化不同场景下的问题定位,充分发挥自动化优势,让故障无处遁形。

浪潮信息提供差异化方案满足不同需求下一代产品全面切换OpenBMC

当然,并非所有的企业都有阿里云、字节这样的技术积淀,对于中国市场来说,绝大部分企业用户并没有自研的能力,更倾向于选择表现稳定、安全的商业版本。对于这些企业来说,浪潮信息就是不错的合作伙伴。

去年,浪潮信息就发布了基于OpenBMC的InBry管理固件平台,采用更先进、更高效、更开放的创新架构和开发模式,快速适配各种算力场景,为用户提供开放、稳定、可靠的BMC管理固件,支撑多元算力时代的各类创新应用。"如果说前两年OpenBMC还只是一个趋势,现在则已经是大行其道了",浪潮信息服务器固件研发负责人王兴隆表示。

除了功能更丰富、应用更高效之外,开源版本的优势还在于开放性以及由此产生的安全性,后者也是当下企业关注的重点。对此,王兴隆表示,首先,开源社区采用的是最先进的Linux版本,相比传统BMC应用来说在代码上更完善,成熟性更高。其次,开源社区的代码上传需要多为行业专家的联合评审,接受更多社区参与者随时的监督与审查,所以质量更高。第三,基于开源和可扩展的软件架构,用户也可以将自身使用的安全模型、软件库移植到OpenBMC,这样就能打造符合自身需求的业务安全模型,所以更安全。

如今,浪潮信息更提出了"分层解耦"的理念,在技术上通过硬件层、中间层、应用层的划分实现自动适配、自动识别,达到技术赋能的多元化。此外,浪潮信息也正在与英特尔、英伟达AMD等业界领军企业合作,实现多元化平台的适配,为产业界提供更低成本、更高效的选择。

"在技术上,我们要基于OpenBMC实现创新,让更多企业享受开源应用的技术红利;产品上,我们将逐步在下一代平台全面切换到OpenBMC,打造更好的商业化版本;社区层面,我们也要建设更好的生态环境,让更多伙伴参与其中达成贡献,打造多元化的服务",王兴隆表示。

英特尔社区贡献名列前茅 持续推动OpenBMC技术创新

作为平台公司,英特尔也在推动OpenBMC发展中扮演了重要角色。每一代英特尔处理器平台的升级对于BMC固件适配来说都是不小的变革,而这些变革都朝着更便捷、更优化的方向来发展。从最初创立OpenBMC到今天,英特尔对于组织的贡献一直排在前列,每一代产品都会经历一年甚至更长时间的测试,以保证在性能、可靠性、稳定性等多方面的品质。

针对不同的应用场景,英特尔也会为客户提供接口实现功能上的定制化需求,这样可以通过代码或者软件的微调更适配于客户业务。同时,英特尔也提供了PFR固件保护功能(Platform Firmware Resilience),为保护企业服务器固件提供了一种全新的方法,可全面防止对服务器所有固件的攻击。

除了安全性的优化之外,如何有效降低服务器能耗也是OpenBMC固件优化的重点。从传统BMC到OpenBMC,其实服务器节能会变得更精准、更低碳。对此,英特尔在节点管理中就提供了能耗管理,并可以根据不同部件进行精细化运维。

从OpenBMC的投入上可以看出,这不仅仅是硬件层面的创新,更多需要融合软件、AI、生态等多个维度,而英特尔也需要扮演行业引领者的角色,为更多生态伙伴提供平台化、系统化的支持。

AI为OpenBMC发展注入活力 正在成为服务器固件"事实标准"

AI技术的出现带来了计算架构的变化,而BMC就势必需要针对这些多元异构的应用变化进行调整。与此同时,AI技术的出现也让大量传统的数据监测、分析变得更加高效,配合数据模型的构建,可以为未来的智能化管理提供技术支持,这也是AI对于OpenBMC带来的全新改变。

"事实上,OpenBMC正在解决传统BMC的瓶颈问题,包括兼容性问题、存在隐藏的代码故障、定制化需求等,已逐步成为了服务器固件的'事实标准'。" 中国电子技术标准化研究院技术总监、固件产业技术创新联盟标测组组长钟伟军表示。

如今,OpenBMC在国内的应用生产已经初具雏形。在相关社区中,已经形成了比较完备和稳定的基础代码,包括阿里云、浪潮信息等30多家公司也在不断提交代码贡献。

未来,希望能够有更多的产业界的伙伴参与到社区建设当中,把自身的优势、经验贡献到社区,让社区拥有更加完备的基础代码,让产业界上下游共享社区成果,有助于产业链生态的繁荣,形成合作共赢的局面。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10205

    浏览量

    175117
  • 服务器
    +关注

    关注

    13

    文章

    9829

    浏览量

    88245
  • 浪潮
    +关注

    关注

    1

    文章

    475

    浏览量

    24792
  • 字节
    +关注

    关注

    0

    文章

    42

    浏览量

    14164
  • 阿里云
    +关注

    关注

    3

    文章

    1014

    浏览量

    44309
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    看点:AMD服务器CPU市场份额追上英特尔 华为Mate80主动散热专利曝光

    给大家带来一些业界资讯: AMD服务器CPU市场份额追上英特尔 根据市场研究机构PassMark的统计分析数据显示,AMD 公司在服务器CPU 市场取得重大进展,市占率首次达到50%,与竞争对手
    的头像 发表于 07-25 14:41 ?225次阅读
    看点:AMD<b class='flag-5'>服务器</b>CPU市场份额追上<b class='flag-5'>英特尔</b> 华为Mate80主动散热专利曝光

    HPE携手英特尔至强6,打造新一代服务器性能巅峰

    近日,慧与科技(HPE)推出了八款全新HPE ProLiant Compute Gen12服务器,标志着新一代企业级服务器领域的新标杆正式诞生。这一系列服务器全面搭载了英特尔至强6处理
    的头像 发表于 02-18 10:38 ?482次阅读

    浪潮信息发布元脑R1推理服务器

    近日,浪潮信息正式推出了其创新的元脑R1推理服务器。这款服务器通过系统的创新与软硬件的协同优化,实现了对DeepSeek R1 671B模型的单机部署与运行,为客户在智能应用部署方面带来了显著的突破
    的头像 发表于 02-17 10:32 ?762次阅读

    浪潮信息升级数据中心服务器故障智能诊断AIOps技术

    近日,浪潮信息对其数据中心服务器故障智能诊断AIOps技术进行了全面升级。该技术旨在解决数据中心服务器日常巡检中故障人工识别效率低、难以精准定位的问题。 基于数百万台服务器的运维管理经
    的头像 发表于 12-31 13:38 ?634次阅读

    浪潮信息与智源研究携手共建大模型多元算力生态

    近日,浪潮信息与北京智源人工智能研究正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛,推动
    的头像 发表于 12-31 11:49 ?645次阅读

    浪潮信息与智源研究达成战略合作协议

    近日,浪潮信息与智源研究达成战略合作协议,双方将紧密协作共建大模型多元算力开源创新生态,提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛。目前,智源Triton算子库FlagGems已
    的头像 发表于 12-26 10:25 ?633次阅读

    英特尔带您解锁上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理的第四代服务器实例,以打造弹性算力底座的产品化实践。同时,
    的头像 发表于 12-23 14:05 ?1000次阅读

    英特尔成都基地扩容,强化服务器芯片产能

    近日,在今日举行的英特尔新质生产力技术生态大会上,英特尔高级副总裁、中国区董事长王锐透露了英特尔成都封装测试基地的扩容计划。 据王锐介绍,此次扩容将有两个重点方向。一是新增服务器芯片产
    的头像 发表于 11-27 11:10 ?663次阅读

    中国边缘服务器市场持续两位数增长,浪潮信息蝉联第一

    近日,IDC正式发布《中国半年度边缘服务器市场(2024上半年)跟踪报告》(以下简称:报告)。数据显示,2024上半年中国边缘计算服务器市场保持高速增长,出货量同比增长40.6%。其中浪潮信息边缘
    的头像 发表于 11-17 10:30 ?615次阅读
    中国边缘<b class='flag-5'>服务器</b>市场持续两位数增长,<b class='flag-5'>浪潮信息</b>蝉联第一

    英特尔宣布扩容成都封装测试基地

    英特尔宣布扩容英特尔成都封装测试基地。在现有的客户端产品封装测试的基础上,增加为服务器芯片提供封装测试服务,并设立一个客户解决方案中心,以提高本土供应链的效率,加大对中国客户支持的力度
    的头像 发表于 10-29 13:58 ?602次阅读

    英特尔调降明年AI服务器芯片出货目标

    近日,有消息称英特尔为应对内部策略调整及终端需求变化,已对其旗下AI服务器芯片Gaudi 3的明年出货目标进行了大幅调整。
    的头像 发表于 10-08 15:38 ?593次阅读

    英特尔发布至强6处理产品

    工作负载带来性能与能效的双重提升,同时携手金山浪潮信息、南大通用,以及记忆科技等多家生态合作伙伴,分享基于该处理的端到端创新解决方案,及其在诸多领域的实践成果与应用价值。
    的头像 发表于 09-23 15:48 ?727次阅读

    英特尔阿里携手共创数智新纪元

    在2024年云栖大会的璀璨舞台上,英特尔携手阿里及众多行业精英,共绘AI时代计算的宏伟蓝图,探索前沿技术与多元解决方案的无限潜力。此次盛会,英特
    的头像 发表于 09-23 12:53 ?986次阅读

    开箱即用,AISBench测试展示英特尔至强处理的卓越推理性能

    近期,第五代英特尔?至强?可扩展处理通过了中国电子技术标准化研究组织的人工智能服务器系统性能测试(AISBench)。英特尔成为首批通过
    的头像 发表于 09-06 15:33 ?894次阅读
    开箱即用,AISBench测试展示<b class='flag-5'>英特尔</b>至强处理<b class='flag-5'>器</b>的卓越推理性能

    服务器开机远离飞机起飞!浪潮信息首创3秒智能控温技术,降噪30.4%

    ?而且,伴随着风扇的呼啸声,服务器启动"龟速",开机时间要3、5分钟甚至更久,严重影响了服务器运维部署效率。 ? 通过BMC Linux/RTOS异构双系统并行管理技术,浪潮信息首创「开机3秒智能控温技术」,能够在
    的头像 发表于 08-15 16:05 ?962次阅读
    让<b class='flag-5'>服务器</b>开机远离飞机起飞!<b class='flag-5'>浪潮信息</b>首创3秒智能控温技术,降噪30.4%