0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

广发证券数据中心网络智能运维实践

华为数据通信 ? 来源:华为数据通信 ? 2025-08-11 10:53 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

广发证券以“成为具有国际竞争力、品牌影响力和系统重要性的现代投资银行”为战略愿景,秉承“以价值创造成就金融报国之梦”的使命,致力于通过科技创新与国际化布局,打造综合金融服务平台,服务国家战略与实体经济高质量发展。在此战略框架下,数据中心网络作为支撑全球业务高效运转的基石,其重要性愈发凸显。数据中心网络不仅是践行“稳健经营,持续创新”理念的技术载体,更是其实现“科技-金融-产业”良性循环、赋能新质生产力培育的战略性支点,为推进行业创新实践、构建数字化金融生态奠定了坚实基础。

网络运维挑战

广发证券经过多年的持续建设,形成了同城双活、异地灾备体系架构,并逐渐构建分布式多地云化数据中心,有力地支撑生产、办公和管理业务的运行,但同时,数据中心网络设备不断增加,架构复杂化给网络运维带来诸多挑战,传统网络运维无法满足日益增长的网络需求。

01 数据孤岛,检测不精细

在日常监测中,传统多个运维系统的数据相互孤立,数据之间缺乏关联性,依赖人工整合分析,另外,传统SNMP协议采集精度差(通常5分钟粒度),难以主动感知网络微突发类异常(亚秒级粒度)。目前数据中心包括传统业务网络、组播业务网络、GPU业务网络等多种组网,而之前多套传统运维系统及多个视图,存在数据孤岛,无法统一分析和监测,无疑给复杂的运维工作带来更大的困难。

02 隐患难寻,风险缺预防

目前数据中心网络既有传统业务,又有组播业务,大模型相关的智算业务也在建设中,业务扩缩容和网络变更频繁,随之网络中可能存在一些潜在风险,例如,数据中心网络中会采用大量的光模块,光模块器件的可靠性远低于网络设备硬件本身,运维需要系统性地排查网络中的风险,从根源上减少故障的发生。

03 路径不明,镜像成本高

网络流量与业务路径黑盒化,传统NPM镜像部署成本高昂却难以解决数据割裂问题。例如,为了业务平稳运行,数据中心网络普遍采用高可用架构设计,如MLAG和路由ECMP负载等技术,却造成业务流量路径不再唯一。运维人员因此只能在所有业务流量可能经过的设备上进行流量统计,人工逐段定位丢包位置,并且这些动作都必须等待排障窗口期。

数据中心网络智能运维实践

广发证券坚持以科技金融为重大战略之一,持续推进数字化转型。为了更好保障用户体验,广发证券携手华为,基于iMaster NCE-FabricInsight建设统一的数据中心网络智能运维平台,以提升数据中心网络运维效率。智能运维平台重点围绕统一可视化、网络风险预防、智能化故障定界三个方向展开实践。

打造统一数据底座,多Fabric统一监测

针对多系统数据孤岛、检测粒度不精细等问题,网络智能运维平台构建了统一的数据底座,目前已纳管交易区、非交易区、互联网区、大数据区、组播私网区、测试区等Fabric网络,数据对象包含网络设备、全网TCP业务流的特征报文、关键业务流的全包、组播业务流等。通过Telemetry技术实现多种不同架构网络指标的主动订阅与亚秒级数据上报,监测维度更加丰富,包含接口链路、队列缓存、光模块、配置、表项、丢包检测等,实时监测全网资源、故障、性能质量情况,并通过对接微信平台统一告警通知。

从被动到主动,网络风险预测

防火胜于救火,如何系统性排查网络风险也是重点课题之一。目前,广发证券正在构建统一的网络主动预防体系,基于知识图谱的数据底座,进行整网风险建模与特征智能识别,从组网、路由、设备板卡、电源、风扇、链路、光器件等多个维度系统全面地分析网络潜在风险,识别风险原因并提供处理建议,转变传统被动救火的运维模式,降低故障发生概率,支撑网络健康运营。

5829d178-739c-11f0-a18e-92fbcf53809c.jpg

图1 网络健康巡检大屏

三维立体的流镜像,应用异常智能化定界

广发证券正在大力推进网络基础设施的智能化建设。然而,应用质量与网络流量分析割裂、网络路径呈现黑盒状态,网络看不清业务流量路径,故障定位困难。若在所有网络节点部署传统NPM流量镜像,整体建设成本高昂,而且依旧无法解决应用-网络-设备一体化的数据整合与分析,数据割裂导致定位时间长、运维效率低。

为解决上述问题,广发证券通过在网络智能运维平台基础上叠加了xFlow智能全流和xFlow按需抓流技术,网络智能运维平台基于ERSPAN技术轻量级镜像整网全部业务流的TCP建链状态,还原业务流在网络中的真实转发路径,并关联网络设备信息,感知微突发、丢包等KPI指标,实现“网络路况”可视化,就像地图导航感知每条道路的通行质量一样。继而,再在网络最复杂、业务容易出问题的关键位置(例如防火墙、负载均衡、关键路由交换设备前后)部署xFlow全流分析探针,1:1采集业务流的全包数据,检测业务流传输过程中的丢包、时延等关键网络性能,实现分段定界。针对网络指标有异常的分段,结合路况信息,可按需在沿途的网络设备上远程镜像,进一步缩小分段定界的范围,分钟级定位故障点。此方案特点在于:以低成本方案“广撒网”,在重点区域“深挖壕”,再结合设备协同完成“按需补位”,构建立体化、多层次的流分析体系。

58365448-739c-11f0-a18e-92fbcf53809c.png

图2 业务质差问题排障逻辑

下一步发展展望

当前,网络智能运维平台以“数据+算法”为驱动,实现了数据一体化分析,显著提升了网络运维的效率。后续,广发证券一方面将在智能计算、证券组播行情交易、大模型等网络建设运维领域持续探索,另一方面将聚焦应用体验保障,推动运维模式从以网络设备为中心向以应用体验为中心转变,构建应用质量主动保障体系,以新质生产力赋能智能运维,提升金融业务服务体验,为金融创新做出新的贡献。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    216

    文章

    35280

    浏览量

    256844
  • 数据中心
    +关注

    关注

    16

    文章

    5280

    浏览量

    73696
  • 金融网络
    +关注

    关注

    0

    文章

    8

    浏览量

    6879

原文标题:数通金拍档 | 金融网络运维如何“智”变?广发证券数据中心网络智能运维实践

文章出处:【微信号:Huawei_Fixed,微信公众号:华为数据通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    苏州DCIM数据中心基础设施管理维系统简介

    数据中心基础设施管理)系统正是在这样的背景下应运而生,为各类规模的数据中心提供智能化管理解决方案。 传统数据中心
    的头像 发表于 08-01 09:40 ?159次阅读
    苏州DCIM<b class='flag-5'>数据中心</b>基础设施管理<b class='flag-5'>运</b>维系统简介

    开放生态+极简:多租户园区网络的云原生管理实践

    新一代云化园区网解决方案,创新性地将数据中心级的Spine/Leaf架构以及“全三层”、“云架构”、“超堆叠”、“云漫游”等设计理念应用于园区场景,显著提升网络服务质量和水平。面对
    的头像 发表于 06-16 16:28 ?515次阅读
    开放生态+极简<b class='flag-5'>运</b><b class='flag-5'>维</b>:多租户园区<b class='flag-5'>网络</b>的云原生管理<b class='flag-5'>实践</b>

    曙光数创SLiquid智能维系统解决数据中心难题

    面对数字时代的海量需求,传统数据中心正遭遇系统性挑战:告警风暴引发的故障定位迟滞、能效困局导致的PUE优化瓶颈、资产迷雾造成的资源错配、容量盲区引发的规划失焦。这些问题严重阻碍了数据中心从成本中心向价值
    的头像 发表于 06-03 10:21 ?535次阅读

    华为荣获数据中心自智网络基础能力解决方案检测证书

    2025年云网智联大会首日,中国信息通信研究院(简称“信通院”)向华为技术有限公司(以下简称“华为”)等首批获得《数据中心自智网络基础能力解决方案检测证书》的企业正式颁发证书。此项认证的获得充分验证了华为等公司在
    的头像 发表于 04-25 16:00 ?434次阅读

    适用于数据中心和AI时代的800G网络

    随着人工智能(AI)技术的迅猛发展,数据中心面临着前所未有的计算和网络压力。从大语言模型(LLM)训练到生成式AI应用,海量数据处理需求推动了网络
    发表于 03-25 17:35

    华为携手中控技术打造全国数据中心网络创新示范项目

    华为中国合作伙伴大会2025期间,华为与中控技术股份有限公司(以下简称“中控技术”)联合发布星河AI数据中心网络优秀实践样板点。此次合作旨在打造全国数据中心
    的头像 发表于 03-24 14:51 ?567次阅读

    华为全新升级星河AI数据中心网络

    在华为中国合作伙伴大会2025期间,以 “星河AI数据中心网络,赋AI时代新动能”为主题的数据中心网络分论坛圆满落幕。本次论坛汇聚了来自全国的300多位客户和伙伴,共同探讨
    的头像 发表于 03-24 14:46 ?554次阅读

    数据中心成本高?智能方案为您省钱!

    随着“双碳”目标的推进,数据中心的绿色化、智能化转型已成必然趋势。安科瑞将持续研发AIoT、数字孪生等新技术,推动能效管理从“被动响应”向“主动优化”演进,助力企业实现可持续发展。
    的头像 发表于 02-25 16:53 ?464次阅读
    <b class='flag-5'>数据中心</b><b class='flag-5'>运</b><b class='flag-5'>维</b>成本高?<b class='flag-5'>智能</b><b class='flag-5'>运</b><b class='flag-5'>维</b>方案为您省钱!

    AKH-0.66/TD 电流互感器在数据中心和电力的运用

    一、引言 随着信息技术的飞速发展,数据中心作为信息存储与处理的核心枢纽,其规模和重要性日益凸显。同时,电力工作关乎整个电力系统的稳定与安全,保障电力的可靠供应是各行各业正常运转的基础。在这
    的头像 发表于 01-22 18:10 ?455次阅读
    AKH-0.66/TD 电流互感器在<b class='flag-5'>数据中心</b>和电力<b class='flag-5'>运</b><b class='flag-5'>维</b>的运用

    福禄克仪表在数据中心中的应用

    数据中心日常中,万用表、绝缘表和热像仪是工程师较常用的工具,它可以帮助技术人员检测和诊断各种电气及设备问题。下面介绍福禄克仪表在数据中心对于电力系统、设备温度及接地系统的检测。
    的头像 发表于 12-25 16:34 ?603次阅读

    施耐德电气助力数据中心管理

    上至企业配备的大型、超大型数据中心,下至街边的路灯、地铁的运营、便利店的24小时服务,数据中心已与我们每个人的生活深刻交织,成为社会与生活正常运转背后不可获取的重要组成。
    的头像 发表于 12-13 15:01 ?615次阅读

    AI智能管理平台助力指挥中心,实现高效智能管理!

    AI智能管理平台,作为新型智能管理解决方
    的头像 发表于 11-18 16:55 ?870次阅读
    讯<b class='flag-5'>维</b>AI<b class='flag-5'>智能</b><b class='flag-5'>运</b><b class='flag-5'>维</b>管理平台助力指挥<b class='flag-5'>中心</b>,实现高效<b class='flag-5'>智能</b><b class='flag-5'>运</b><b class='flag-5'>维</b>管理!

    这4个工作能让数据中心保持长期稳定运行

    数据中心的工作主要是对数据中心各项管理对象进行系统的计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称,具体包括对机房环境基础设施部分的维护,系统与
    的头像 发表于 11-13 09:58 ?547次阅读

    简述数据中心网络架构的演变

    随着全球对人工智能(AI)的需求不断增长,数据中心作为AI计算的重要基础设施,其网络架构与连接技术的发展变得尤为关键。
    的头像 发表于 10-22 16:23 ?958次阅读

    数据中心可视化管理系统功能特点

    数据中心可视化管理系统是当今数据中心管理领域中一项引人注目的创新技术。这一系统以实时监控、设备管理、资源优化和故障预警为核心功能,通过三可视化展示
    的头像 发表于 09-23 14:09 ?564次阅读