0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮存储基于对亚健康状态的研究

浪潮存储 ? 来源:浪潮存储 ? 作者:浪潮存储 ? 2022-05-09 15:06 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“亚健康”这个词不仅在生活中被熟知,而且大家经常使用的信息系统中也会经常遇到;亚健康状态,顾名思义,是存储系统介于健康状态和故障状态之间的一种状态,系统仍在运行且功能正常但处于降级模式的一种情况,它的存在会造成系统性能严重低于预期。

浪潮存储基于对亚健康状态的研究,在分布式存储平台进行技术创新,研发了亚健康状态监控功能,对硬件、系统、网络等进行实时监测,当系统发现运行过程中存在亚健康状态时,可快速定位原因、上报、并对处于亚健康的部件进行必要的处理,降低亚健康状态对存储系统的影响,保障用户数据服务的可靠、高效。

过去因大部分应用系统规模较小,一般会将亚健康状态划归到故障进行处理,系统在这种情况下虽处于亚健康状态,但仍可以对外提供服务,处于亚健康的部件却被当成故障处理扩大了亚健康状态的影响范围,有时甚至会导致系统不可提供服务,也造成了资源浪费。近十年,随着新技术的快速发展,以及分布式系统部署规模的增加,亚健康状态对于存储系统的破坏已经越来越显著,之前亚健康状态处理方式已经不适合现在的大规模系统。亟待更加智能、高效的机制来保障存储系统健康运行。

亚健康状态是隐形的系统杀手

以网络亚健康为例,网卡故障、驱动程序故障、设备故障、接线松动、温度过高过低等都可能引起网络亚健康状态,尽管产生网络亚健康状态的原因众多,但其对外表现的现象相对简单,主要是网络时延的增加和网络丢包率的增加。如下为网络丢包率和时延对分布式存储系统性能的影响。

efb6e722-cf5f-11ec-bce3-dac502259ad0.png

efe0a63e-cf5f-11ec-bce3-dac502259ad0.png

在一个分布式存储系统中,单个节点网络丢包率或网络时延增加时,存储系统的性能会极快速的下降,5%的丢包率或50ms时延,就足以使存储系统性能下降一半左右。

从网络亚健康实例中可以看出,亚健康状态对系统的危害,微小的一个亚健康状态,对系统性能的影响都是巨大的。此外CPU、内存、硬盘模块、网卡等硬件部件、操作系统以及软件运行均有可能进入亚健康状态。

浪潮存储基于大量来自企业、大学、实验室等案例的亚健康状态的研究,进行了故障分类和根因分析,可以看出,硬件亚健康状态占比33%,网络亚健康状态占比38%,这两类故障占比超过整体的70%。

effc8552-cf5f-11ec-bce3-dac502259ad0.png

△亚健康状态案例比例

亚健康状态监控

让分布式存储运行更稳定

基于对亚健康状态的表象根因等分析与研究,浪潮在分布式存储上实现了亚健康状态监控功能,对硬件亚健康状态、系统亚健康状态以及网络亚健康状态的实时监控,当系统发现运行过程中存在亚健康状态时,可快速定位亚健康状态的原因、上报故障、并对亚健康的部件进行必要的处理(如尝试恢复、隔离部件等),最大限度的降低亚健康状态对存储系统的影响。

浪潮分布式存储AS13000配置了亚健康状态监控之后可以进行亚健康状态监控告警服务的同时还具有如下优势:

01精准定位

亚健康状态的场景复杂,症状、根因众多,检测难度大。亚健康状态监控系统通过建立硬件亚健康检测、网络亚健康检测以及系统亚健康检测的机制,有效的覆盖了亚健康状态的各种检测场景,再加上检测信息的精准分析,能更精准的定位亚健康状态。

02快速处理

存储系统长期以亚健康状态的状态运行,会影响整体性能,监控功能可以在短期内发现亚健康状态,并及时做出必要的处理。以往为了确保系统运行的稳定性,运维人员预计需要每周执行一次巡检脚本,对整个集群进行健康巡检。这种方式一方面时效性差,平均3-4天才可以发现问题;另一方面是巡检脚本检测并不全面。亚健康状态监控可以150秒内发现网络亚健康状态并进行网口隔离处理、30分钟内发现系统亚健康状态并告警、60分钟内发现磁盘温度异常并告警等;平均发现系统亚健康状态并处理的时间缩短了四分之三,并且检测的项目更全面、结果更准确。

f01a31f6-cf5f-11ec-bce3-dac502259ad0.png

具备亚健康状态监控功能的分布式存储AS13000,已经在金融、通信、教科研、医疗等行业规模部署,在运行过程中亚健康状态监控功能快速响应机制,降低了亚健康状态对存储系统的影响与运维成本,保障了客户业务,让企业轻松应对数字经济时代的海量数据挑战。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4557

    浏览量

    87752
  • 浪潮
    +关注

    关注

    1

    文章

    475

    浏览量

    24862
  • 存储系统
    +关注

    关注

    2

    文章

    424

    浏览量

    41454

原文标题:“亚健康”智能监测,浪潮分布式存储让数据更可靠

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    绕线电机启动状态到双馈状态过渡过程的研究

    状态到双馈状态过渡过程的研究.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 06-12 13:40

    精准监测,健康无忧--XC3576H工控主板赋能亚健康检测仪

    在快节奏的现代生活中,亚健康问题逐渐成为困扰人们健康的隐形杀手。疲劳、失眠、免疫力下降等问题频发,却往往因难以察觉而延误调理。智能亚健康检测仪通过高科技手段,帮助用户实时了解身体状况,提前预警潜在
    的头像 发表于 05-28 17:56 ?293次阅读
    精准监测,<b class='flag-5'>健康</b>无忧--XC3576H工控主板赋能<b class='flag-5'>亚健康</b>检测仪

    浪潮信息存储SATA SSD:技术创新引领数据存储新时代

    在智慧时代,数据存储需求日益增长,对存储产品的性能和稳定性提出了更高要求。浪潮信息存储,作为行业内的佼佼者,积极响应市场需求,通过自主研发,不断积累技术优势,致力于为用户提供高性能、高
    的头像 发表于 02-07 13:41 ?731次阅读

    浪潮信息存储SATA SSD:以技术创新,开启数据存储新篇章

    计算平台以及个人用户的数字化需求,迫切需要高效、可靠的存储解决方案。 浪潮信息存储积极响应市场需求,通过自主研发不断积累技术优势,推出了SATA、NVMe、双端口、ZNS等全系列存储
    的头像 发表于 01-24 10:02 ?515次阅读

    浪潮信息SATA SSD推动数据存储技术发展

    在全球数字化转型的浪潮中,数据已成为驱动社会进步和创新的核心动力。随着互联网、人工智能、大数据等技术的飞速发展,全球数据量呈现爆炸式增长。企业数据中心、云计算平台以及个人用户的数字化需求,迫切需要高效、可靠的存储解决方案。
    的头像 发表于 01-22 18:02 ?846次阅读

    浪潮信息存储中标运营商备份一体机项目

    近日,在数字化浪潮席卷全球的今天,运营商作为信息通信的关键节点,承担着海量数据的传输与交互任务,其系统及数据的安全性和稳定性对于维护网络环境的健康至关重要。然而,随着网络威胁环境的日益复杂,传统
    的头像 发表于 01-08 11:17 ?885次阅读

    浪潮信息与智源研究院携手共建大模型多元算力生态

    近日,浪潮信息与北京智源人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛,推动
    的头像 发表于 12-31 11:49 ?683次阅读

    浪潮信息剖析智能时代数据存储领域面临的挑战与机遇

    在当今数字化时代,算力与存力的协同增长已成为驱动各行各业发展的关键力量。特别是在人工智能(AI)这一前沿领域,随着数据量的爆炸式增长,对存储系统的需求日益复杂和多样。近期,在首届CCF中国存储大会上,浪潮信息
    的头像 发表于 12-30 09:43 ?851次阅读

    浪潮信息与智源研究院达成战略合作协议

    近日,浪潮信息与智源研究院达成战略合作协议,双方将紧密协作共建大模型多元算力开源创新生态,提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛。目前,智源Triton算子库FlagGems已
    的头像 发表于 12-26 10:25 ?671次阅读

    鲁东大学:研究高灵敏度、快速响应的湿度传感器,用于人体健康监测

    研究背景 呼吸疾病如COVID - 19、甲型流感、病毒性流感和哮喘等持续对人们的生活构成挑战,是必须解决的重要健康问题。可穿戴湿度传感器可监测呼吸状态和体表湿度,湿度作为一种生理信号,在反映人体
    的头像 发表于 12-04 09:07 ?1508次阅读
    鲁东大学:<b class='flag-5'>研究</b>高灵敏度、快速响应的湿度传感器,用于人体<b class='flag-5'>健康</b>监测

    浪潮信息AI存储性能测试的领先之道

    MLCommons,一个致力于推动全球 AI系统发展的顶级工程联盟,汇聚了包括谷歌、斯坦福大学在内的众多顶尖企业和研究机构。作为该联盟的创始成员之一,浪潮信息自2020年起便积极参与其中,共同探索
    的头像 发表于 10-29 16:30 ?751次阅读
    <b class='flag-5'>浪潮</b>信息AI<b class='flag-5'>存储</b>性能测试的领先之道

    FPGA中有状态表项的存储与管理

    一篇2014年的论文:《CACHE FOR FLOW CONTENT: SOLUTION TODEPENDENT PACKET PROCESSING IN FPGA》,主要讲述在FPGA中有状态表项的存储与管理。感兴趣的可以阅读原文。
    的头像 发表于 10-27 16:06 ?729次阅读
    FPGA中有<b class='flag-5'>状态</b>表项的<b class='flag-5'>存储</b>与管理

    在MATLAB中开发状态监控算法

    状态监控是采集和分析设备传感器数据的过程,目的是评估设备在运行期间的健康状态。准确识别设备的当前健康状态对于开发预测性维护和基于
    的头像 发表于 10-24 13:51 ?780次阅读
    在MATLAB中开发<b class='flag-5'>状态</b>监控算法

    如何通过地物光谱仪监测植物健康?让你的研究更加精准

    。通过分析植物反射的光谱数据,研究人员可以获取植物的生长状态、营养状况以及潜在的病害信息,从而进行精准管理和科学决策。本篇文章将深入探讨地物光谱仪如何帮助我们监测植物健康,并提供相关的应用指南,为您的
    的头像 发表于 08-22 16:30 ?671次阅读
    如何通过地物光谱仪监测植物<b class='flag-5'>健康</b>?让你的<b class='flag-5'>研究</b>更加精准

    基本rs触发器有几种状态?

    基本RS触发器,全称为基本Reset-Set触发器,是一种最基本的存储单元,用于存储一位二进制信息(0或1)。基本RS触发器有两种状态:置位状态(Set State)和复位
    的头像 发表于 08-22 09:54 ?2834次阅读