0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Ceph分布式存储简介&Ceph数据恢复流程

Frombyte ? 来源:Frombyte ? 作者:Frombyte ? 2023-09-26 15:41 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Ceph存储基本架构:
Ceph存储可分为块存储,对象存储和文件存储。Ceph基于对象存储,对外提供三种存储接口,故称为统一存储。
Ceph的底层是RADOS(分布式对象存储系统),RADOS由两部分组成:OSD和MON。
MON负责监控整个集群,维护集群的健康状态,维护展示集群状态的各种图表,如OSDMap、MonitorMap、PGMap和CRUSHMap。
OSD负责存储数据、复制数据、平衡数据、恢复数据,与其它OSD间进行心跳检查等。通常情况下一块硬盘对应一个OSD。

Ceph数据的存储过程:
无论使用哪种存储方式(对象、块、文件),存储的数据都会被切分成对象(Objects)。

存储池:
不同用户因为不同的目的把对象存储在不同的存储池里,这些对象分布于OSD上。
对象保存在不同的存储池(Pool)中,是对象存储的逻辑组,对应不同的用户。存储池管理着归置组数量、副本数量、和存储池规则集。

归置组:
归置组(PGPlacementGroup)是对象池的片段,Ceph根据对象的Oid和一些其他信息做计算操作,映射到归置组,无数的对象被划分到不同的归置组。PG是一个逻辑概念,它在数据寻址时类似于数据库中的索引
每个对象都会固定映射进一个PG中,所以当我们要寻找一个对象时,只需要先找到对象所属的PG,然后遍历这个PG就可以了,无需遍历所有对象。而且在数据迁移时,也是以PG作为基本单位进行迁移。

OSD:
最后PG会根据管理员设置的副本数量进行复制,然后通过crush算法存储到不同的OSD节点上,最终把PG中的所有对象存储到OSD节点上。

BlueStore:
新版本中,Ceph默认以Bluestore存储引擎,作为RADOS中OSD的ObjectStore存储底层实现BlueStore整体架构。

存储空间:
BlueStore将整个存储空间分为3个部分:WAL,DB,SLOW
慢速(Slow)空间:主要用于存储对象数据,由BlueStore管理。
高速(DB)空间:存储blufs和rocksdb产生的数据,由BlueFS直接管理,如果不存在或者DB设备空间不足,则选择Slow类型设备空间。
超高速(WAL)空间:主要存储RocksDB的WAL(即.log)文件,由BlueFS直接管理,如果不存在或者WAL设备空间不足,则逐级降级选择DB、SLOW分区。

Rocksdb:
BlueStore使用Rocksdb作为自己元数据存储的底层实现,将各种元数据以kv型记录的方式存在数据库中。
写入机制:任何元数据的写入都会先写到WAL,然后再写入MemoryTable(Memtable)。
当一个Memtable写满了之后,就会变成immutable的Memtable,RocksDB在后台会通过一个flush线程将这个Memtableflush到磁盘,生成一个SortedStringTable(SST)文件。

BlueFS:
BlueFS与通用文件系统不同,是Bluestore专为Rocksdb所设计的精简文件系统。
BlueFS的文件和目录的元数据以日志事务的形式保存在日志文件中,在上电过程中,replay日志文件中的事务,就可以加载所有的元数据到内存中。

北亚企安针对Ceph的数据恢复流程:
1、制作磁盘镜像,用于数据提取和备份。
2、提取BlueFS中数据库文件。从磁盘镜像的分区获取超级块,得到日志的节点信息。回放整个日志中的事务,得到目录结构和数据库文件节点信息,根据数据库文件节点信息提取数据库文件。提取从每个OSD提取出来的数据库中的object记录。
3、对于损坏的数据库,根据文件格式提取数据库完好文件中的object记录。
4、解析object记录,从各镜像上提取对应的object数据。
5、根据object的id按序组合卷文件的所有object数据块,还原整个卷数据。
6、修复卷的文件系统和其中文件。
对于损坏缺失程度不高的卷文件系统,尝试修复损坏的卷,得到卷中的文件。
对于有固定格式的文件,尝试修复损坏文件。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据恢复
    +关注

    关注

    10

    文章

    654

    浏览量

    18202
  • 分布式存储
    +关注

    关注

    4

    文章

    181

    浏览量

    19908
  • Ceph
    +关注

    关注

    1

    文章

    25

    浏览量

    9562
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于DPU的Ceph存储解决方案

    1. 方案背景和挑战 Ceph是一个高度可扩展、高性能的开源分布式存储系统,设计用于提供优秀的对象存储、块存储和文件
    的头像 发表于 07-15 13:44 ?1792次阅读
    基于DPU的<b class='flag-5'>Ceph</b><b class='flag-5'>存储</b>解决方案

    基于全HDD aarch64服务器的Ceph性能调优实践总结

    1 简介作为一个统一的分布式存储系统,Ceph为应用程序提供了对象,块和文件系统接口。考虑到TCO,我们搭建了一个全HDD的Ceph集群(每
    发表于 07-05 14:26

    Ceph是什么?Ceph的统一存储方案简析

    色:更低的TCO(总体拥有成本),Ceph可以部署在普通的商用服务器上,比专有存储系统的预算更低。Ceph的每一个组件都是可靠的并支持高可用。分布式
    发表于 10-08 15:40

    Ceph分布式存储中遇到的问题和解决办法

    首先,原作者分析Ceph运维中遇到的问题是真实存在的,甚至在实际的运维过程中还出现过其他更复杂的问题。因为最初的Ceph只是社区提供的一套开源版,因而想要实现产品化需要趟过很多次“坑”,就像最早的安卓系统一样。
    发表于 10-20 10:17 ?4515次阅读

    还在用Ceph吗?不如试试性能更好的碧海存储

    对于分布式存储产品,朋友们第一反应总是:基于Ceph的吗? Ceph、HDFS、Glusterfs、Lustre、BeeGFS都是优秀的分布式
    发表于 03-27 07:25 ?805次阅读

    元核云如何解决Ceph分布式存储中的问题

    Ceph本身基于Crush算法,具备了多种数据复制策略,可以选择在磁盘、主机、机柜等等位置附着。
    发表于 06-18 10:43 ?794次阅读

    盘点分布式存储系统的主流框架

    整个大数据处理的体系,按我的理解可以分为两个部分,一个是分布式存储系统、另一个是分布式计算框架。分布式
    发表于 08-06 09:07 ?2865次阅读

    存储中的Ceph分布式文件系统及节点选择

    存储中的¢eph分布式文件系统以其开原性和提供统一存储能力的特点在企业和科研领域得到广泛关注和应用。 CRUSH算法是eph分布式文件系统中的伪随机
    发表于 03-31 10:46 ?13次下载
    云<b class='flag-5'>存储</b>中的<b class='flag-5'>Ceph</b><b class='flag-5'>分布式</b>文件系统及节点选择

    Ceph分布式存储系统性能优化研究综述

    Ceph是一个统一的分布式存储系统,可同时提供块、文件和对象3种接口的存储服务。与传统的分布式存储
    发表于 04-13 13:58 ?5次下载
    <b class='flag-5'>Ceph</b><b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统性能优化研究综述

    ceph-zabbix监控Ceph集群文件系统

    ceph-zabbix.zip
    发表于 04-26 09:48 ?2次下载
    <b class='flag-5'>ceph</b>-zabbix监控<b class='flag-5'>Ceph</b>集群文件系统

    autobuild-ceph远程部署Ceph及自动构建Ceph

    autobuild-ceph.zip
    发表于 05-05 11:09 ?2次下载
    autobuild-<b class='flag-5'>ceph</b>远程部署<b class='flag-5'>Ceph</b>及自动构建<b class='flag-5'>Ceph</b>

    一个去中心化的分布式存储系统Ceph概述

    Ceph 是一个去中心化的分布式存储系统, 提供较好的性能、可靠性和可扩展性。
    发表于 09-02 10:11 ?2076次阅读

    一文参透分布式存储系统Ceph的架构设计、集群搭建

    Ceph 是一个去中心化的分布式存储系统, 提供较好的性能、可靠性和可扩展性。Ceph 项目最早起源于 Sage 就读博士期间的工作(最早的成果于 2004 年发表),并随后贡献给开源
    的头像 发表于 01-07 13:44 ?1571次阅读

    SDNLAB技术分享:Ceph在云英的实践

    Ceph是最近开源系统中很火的一个项目,基于Sage Weil的一片博士论文发展而来的一个分布式文件系统,可提供PB级,动态可扩展,数据安全可靠的存储服务。
    发表于 06-16 09:32 ?565次阅读
    SDNLAB技术分享:<b class='flag-5'>Ceph</b>在云英的实践

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式
    的头像 发表于 07-14 11:15 ?288次阅读