博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
ceph - 故障测试 [目标: 延时自动执行 RECOVERY]
阅读量:4079 次
发布时间:2019-05-25

本文共 734 字,大约阅读时间需要 2 分钟。

前提:

由于磁盘故障原因,  可能会导致  ceph osd 在晚上故障,  并自动完成数据迁移并自动修复功能当早上执行更换硬盘操作后,  数据会重新再次迁移一次,由于出现数据自动恢复功能,  会导致数恢复期间可能与用户使用数据高峰期重叠,  会导致用户 IO 抢夺

解决目的

避免 ceph 在故障时候自动执行 RECOVERY 功能需要人工介入执行 RECOVERY 周期

ceph 故障恢复条件说明

1 ceph osd down2 mon 无法获得 ceph osd heartbeat 信息标注 warning 信息,  并显示3 五分钟后,  mon 标记该 ceph osd 为 out 状态4 当标记 out 状态后,  ceph 执行自动 recovery 操作

日志记录收集

osd down, 从 mon 中, 我们可以马上对应获得信息 但不会标注为 out 状态, 因此没有执行相应的 recovery 操作

2017-08-15 17:22:30.299262 7fd537f8b700  1 mon.ceph-node81@0(leader).osd e535 e535: 14 osds: 11 up, 14 in

ceph -s 会获得对应报警信息

health HEALTH_WARN 209 pgs degraded; 75 pgs stuck unclean; 209 pgs undersized; recovery 38/165 objects degraded (23.030%); 3/14 in osds are down

当 mon 对对应的 osd 标注为 out 之后, 系统会自动执行 recovery 操作</

转载地址:http://shnni.baihongyu.com/

你可能感兴趣的文章
[转]打印质数的各种算法
查看>>
[转]javascript with延伸的作用域是只读的吗?
查看>>
php的autoload与global
查看>>
IE不支持option的display:none属性
查看>>
[分享]mysql内置用于字符串型ip地址和整数型ip地址转换函数
查看>>
TableDnd(JQuery表格拖拽控件)应用进阶
查看>>
[转]开源中最好的Web开发的资源
查看>>
java接口不能实例化原因浅谈
查看>>
Https加密及攻防
查看>>
Java生成随机不重复推广码邀请码
查看>>
Java8 Lambda表达式介绍
查看>>
【JAVA数据结构】双向链表
查看>>
【JAVA数据结构】先进先出队列
查看>>
String类的intern方法随笔
查看>>
【泛型】一个简易的对象间转换的工具类(DO转VO)
查看>>
1.随机函数,计算机运行的基石
查看>>
MouseEvent的e.stageX是Number型,可见as3作者的考虑
查看>>
在mc中直接加aswing组件,该组件还需最后用validate()方法
查看>>
移植Vim配色方案到Eclipse
查看>>
从超链接调用ActionScript
查看>>