0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

广东电信发生历史性故障,波及全省电信用户,容灾机制不起作用?

Felix分析 ? 来源:电子发烧友网 ? 作者:吴子鹏 ? 2023-06-10 00:11 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)6月8日,广东电信发生重大故障,导致广东电信全省本地及漫游用户通话异常。当天16时左右,陆续有网友在社交媒体上发文指出,使用电信卡的手机无法通话和通信。“故障发生后,自己尝试了拔卡重启、检查手机硬件、充话费等不同方法,依然无法解决问题。”

随后不久,中国电信广东客服回应称,“因网络异常,影响部分移动用户接听电话,我们正在进行抢修,由此给您带来的不便,我们深表歉意,感谢您的理解和支持。”而后在8日18时左右,中国电信广东客服又补充发文表示,“经紧急抢修,自16:30起,受影响的用户正逐步恢复,对在此期间受到影响的客户表示真诚的歉意。”

到了19时左右,此官微又发布了一条消息称,“截至目前,受影响的移动用户接听语音业务已全面恢复,给您带来的不便我们再次深表歉意。”

wKgaomSC-v2AOkPXAAGc2MttXkA970.png
图源:中国电信广东客服官微


对于此次故障的具体原因,中国电信官方还没有公布。不过,针对这起历史性的电信事故,8日晚,广东省通信管理局召集广东电信、广东移动、广东联通、广东广电、广东铁塔相关负责人召开网络运行安全紧急调度会。

跳出事件本身来看,电信系统到底是如何运营的呢?容灾系统不起作用原因有哪些呢?


解密电信网络系统

对于电信网络的运转,其上方有两套系统,分别是上层IT软件和底层基础硬件。

其中IT系统又可以分为BSS、OSS、MSS和EDW。BSS(Business Support System,业务支撑系统)和OSS(Operation Support System,运营支撑系统)合称为BOSS系统,也就是电信业务运营支撑系统。BOSS系统以客户服务、业务运营和管理为核心,支持客户服务和计费等关键事物的运转。

在BOSS系统中,BSS实际上是具有主动式管理能力的。这种能力让运维人员在故障发生之前就能够提前介入处理,消除系统故障带来的潜在风险,是运营商系统层面提升客户满意度的关键功能。不过很显然,在此次广东电信故障事故中,BSS系统并没能起到主动式管理的作用,从这个层面来看,这次的事故突发性很强。

MSS(Management Supporting System,管理支撑系统)负责IT系统的规划和窗口展现,帮助电信运营商实现业务和市场需求更好地结合,并提升企业管理和IT系统升级的效率,也对企业运营效率提升有帮助。

EDW(Enterprise Data Warehouse,企业数据仓库)主要负责数据存储和信息化管理。

IT系统是电信运营商业务的神经枢纽,当然其运转还需要部署在底层的硬件设备上。在介绍底层硬件结构之前,我们先结合下图看一下电信业务是如何运转的。如下图所示,无论是电话业务,还是移动手机业务,最终都需要连接到核心网。

wKgZomSC-0WAKTCAAADAlNCv1Ew772.png
电信业务服务架构示意图,图源:华为培训


再看一下另一张图,宽带业务实际上也是如此,全部业务支撑最终都要回归到核心网层面。

wKgaomSC-1-AAC6fAACTiq1CfBA829.jpg
宽带业务示意图,图源:华为培训


所以,这就是为什么运营商很多时候被称为“管道商”。实际上,所有的电信运营业务都像是水管一样,网络流量由核心网分化而来,每一项业务都是基于管道里的流量,从骨干网分流,如下图所示。

wKgZomSC-2qAADijAAQloGJlo1o863.png
电信网络分流示意图,图源:中国电信


当然,网络是一个相对虚化的概念,具体还是要靠设备来支撑。在整个网络架构中,三种设备最为常见和关键,分别是路由器、交换机和核心交换机。如下图所示,无论网络在核心网、IP传输网还是业务网上传输,依靠的都是交换机来中转。

wKgaomSC-3aAEo_JAAlLlihg17Q604.png
图源:广州移动培训资料


运营商在建设网络时,一般会选择使用多台核心交换器来构建超级节点,超级节点基本只存在北上广等重要节点城市部署,负责国际和省际之间的网络传输,也构成了核心网传输的第一平面。这个平面包括超级节点及其链路,以及各省第一出口链路。当然,骨干网络还有第二层,由普通核心节点到超级节点的链路和各省第二出口链路组成,负责跨大区域间的流量转发,大约全国2/3的流量都在这个网络上跑。如下图所示,为了增加网络接入的效率,在节点上将流量进一步分流,也就到了基站和普通交换机/路由器一端,方便用户的接入。

wKgaomSC-7KATgerAASklQxDEfo455.png
网络接入和传输示意图,图源:华为培训


那么,很显然一个普通的路由器和交换机是很难让一个省的网络全部出现问题的,很可能就是核心交换机出现了问题,影响骨干网的传输,导致一个省没有网络流量入口。

虽然二层网络已经推出很多年,不过目前依然是电信运营商主要采用的骨干网架构。虽然二层网络的扩展性不好,不过其跨域传输的性能很出色。当然,这也造成了一个问题,那就是看似互联互通的网络,会存在一些重要的节点,这些节点是不容有失的。

电信网络的容灾机制

电信网络是一个关系到国计民生的领域,因此在构建的过程中,是需要具有容灾机制的,面对一些突发的挑战。

我们上面已经提到,电信网络基本靠两套系统在运作,一个是IT系统,另外一个是底层设备。由于用户信息和业务高度集中,因此每一个电信业务开始部署时都有一套“plan B”,也被称为容灾措施,主要是为了应对突发的火灾、洪水、飓风和其他突发因素等。

据介绍,除了在BSS系统中加入故障预判的机制以外,电信系统在硬件层面具有多层容灾措施,包括单板主备容灾、设备主备容灾、网元主备容灾、同城异域容灾以及异城异地容灾。通过多维度丰富的容灾措施,一般在重大故障之后,电信运营商都能够很快地恢复网络。

上一次发生地域性大规模断网是在郑州大洪水期间。由于数十年难得一见的洪水,导致郑州骨干核心机房和主备机房全部被水淹。最终,为了让郑州市民能够尽快使用网络,启动了异城异地的容灾机制。

不过,一般而言,异城异地容灾已经是最高规格的电信网络容灾机制了,一旦遇到全省范围内的突发事件,实际上也很难起到作用。

写在最后

此次广东电信的故障是一次历史性的事件,也给国内的主要运营商提了醒。在当前的骨干网络架构里,一些关键节点的重要性与日俱增,一旦出现问题,就会带来大面积的影响。当然,此次广东电信故障还没有公布真正的原因,上述也只是从电信运营商软硬件体系结构下推断出来的。具体原因如何,相信广东电信会给大家一个解释。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电信
    +关注

    关注

    2

    文章

    752

    浏览量

    62754
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    wiced_hal_sflash_write在CYW20721B2上不起作用是怎么回事?

    时,写入不起作用。 逻辑分析仪上没有保存命令。 我记得在 CYW20706 中必须通过 *((unsigned char*)(0x00201a14)) = 1 解锁写入能力;
    发表于 06-30 06:22

    rt-thread-studio添加任何的软件包都失败,更改github或者gitee源都不起作用,有什么解决方案吗?

    如图,添加任何的软件包都失败,更改github或者gitee源都不起作用,有什么解决方案吗?
    发表于 06-13 08:17

    PFC在250W LED驱动器中不起作用是怎么回事?

    PFC 在 250W LED 驱动器中不起作用。 请在下面找到详细信息。 PFCVS 时的 Volt. -1.50 BO-1.80 VCC-18V
    发表于 05-29 06:12

    板载UART在S32K388中不起作用怎么解决?

    使用 Trace32 调试相同的项目时,我的串行终端中没有收到打印消息(我为此目的使用 Tera Term)。板载 UART 在 S32K388 中不起作用,因此我对连接到电路板 J695引脚组的 TX
    发表于 03-28 08:13

    外部构建器在S32DS 3.6.0中不起作用怎么解决?

    您好 NXP, 安装 S32DS 3.6.0 后,外部构建器(用于 makefile 项目)似乎不起作用,IDE 没有调用我的 *.bat 文件。相同的设置在 3.5.0 中可以正常工作。 我尝试
    发表于 03-20 07:06

    广东电信莅临海康威视参观交流

    近日,中国电信股份有限公司广东分公司(以下简称“广东电信”)党委书记、总经理张涛,广东电信副总经理王湘江、政企客户事业部总经理刘志斌,广东亿
    的头像 发表于 12-20 15:40 ?1605次阅读

    AFE5816的TR_EN为什么不起作用呢?

    相关寄存器为默认,REG230的BIT4为0代表由TR_EN[X]引脚决定是否断开LNA的HPF连接, 但我的TR_EN为什么不起作用呢??如下图所示
    发表于 12-09 06:11

    广东电信与华为发布“云网预知”联合创新系统

    近日,中国电信广东公司(以下简称“广东电信”)联合华为举行“云网预知”联合创新系统上线仪式暨L4自动驾驶网络联合创新启动会,标志着双方在IP自智网络领域的合作迈上新的台阶。双方将共同努力,深入探索网络创新,稳步推动IP网络向高阶
    的头像 发表于 11-18 11:33 ?736次阅读

    使用ADS1299进行脑电信号采集时采集不到脑电信号,怎么解决?

    您好!我这边在使用ADS1299进行脑电信号采集时采集不到脑电信号,用信号发生器进行测试,能采集到0.5uV左右的正弦波,文档中是该芯片的原理图和电极连接方式说明,请问是否有问题?还麻烦指教,谢谢!
    发表于 11-13 06:52

    调试PCM3070的时候,进行通道切换时不起作用,为什么?

    当前在调试PCM3070的时候,进行通道切换时不起作用,加载的EQ 数据在IN1也都已工作正常。 我的电路工作方式为三个模拟输入(IN1,IN2,IN3),一个模拟输出(LOL/R),采用DSP做为EQ处理。
    发表于 11-06 07:16

    什么是负载箱?

    负载箱是用于模拟电网中感性负载的装置,通常由电容器、电抗器等元件组成。在电力系统中,负载箱被广泛应用于测试和评估各种电气设备的性能,如变压器、发电机、开关设备等。负载箱的主要
    发表于 09-25 10:51

    TPA3112D1为什么不起作用了?

    您好,我有一块TPA3112D1模块之前用着一直是好的,但是突然就不起作用了,我想知道友们有办法测试一下我的芯片是好是坏,是否工作正常??谢谢
    发表于 09-06 07:45

    漏电保护器对什么情况不起作用

    漏电保护器是一种用于检测和保护电气线路中漏电现象的电气安全装置。它能够及时切断电源,防止电气火灾、触电事故等安全问题的发生。然而,漏电保护器并非万能的,它在某些特定情况下可能无法起到应有的保护作用
    的头像 发表于 08-26 09:16 ?6193次阅读

    秒送LBS场景下的C端SOA服务建设之-数据备份篇

    ,采用主从复制和异地多活架构,可以确保在某个数据中心发生故障时,其他数据中心能够迅速接管业务,避免服务中断。此外,定期进行灾难恢复演练和系统压力测试,也是提高能力的关键措施。通过这
    的头像 发表于 08-15 14:24 ?616次阅读
    秒送LBS场景下的C端SOA服务<b class='flag-5'>容</b><b class='flag-5'>灾</b>建设之-数据备份篇

    示波器的探头衰减只对什么起作用

    信号的准确和安全性具有重要意义。 一、示波器探头衰减的作用 保护示波器 示波器的输入端通常具有一定的电压范围,如果输入信号的幅度超过了这个范围,就可能对示波器的输入端造成损坏。通过使用衰减探头,可以将输入信号
    的头像 发表于 08-09 14:39 ?1234次阅读