Rook-Ceph OSD Down格式化osd硬盘重新挂载-CFANZ编程社区

Rook-Ceph OSD Down格式化osd硬盘重新挂载

基于主机的集群

如果您使用useAllDevices: true，则不需要对CR进行任何更改。

// 重新格式化硬盘准备
# yum -y install gdisk
# kubectl -n rook-ceph scale deployment rook-ceph-operator --replicas=0
deployment.apps/rook-ceph-operator scaled
// 查询osd的状态，找到要移除的osd id
# ceph osd status
// ID为2的移出集群
# ceph osd out osd.2
# ceph osd purge 2 --yes-i-really-mean-it
// 删除ID为2的OSD
# ceph auth del osd.2
entity osd.2 does not exist
// 删除相关osd节点的deployment
# kubectl delete deploy -n rook-ceph rook-ceph-osd-2
deployment.apps "rook-ceph-osd-2" deleted
// 删除硬盘分区信息
# sgdisk --zap-all /dev/sdb
Creating new GPT entries.
GPT data structures destroyed! You may now partition the disk using fdisk or
other utilities.
// 清理硬盘数据（hdd硬盘使用dd，ssd硬盘使用blkdiscard，二选一）
# dd if=/dev/zero of="/dev/sdb" bs=1M count=500000 oflag=direct,dsync
500000+0 records in
500000+0 records out
524288000000 bytes (524 GB) copied, 258.146 s, 2.0 GB/s
// ssd硬盘选择此命令
# blkdiscard /dev/sdb
// 删除原osd的lvm信息（如果单个节点有多个osd，那么就不能用*拼配模糊删除，而根据lsblk -f查询出明确的lv映射信息再具体删除）
ls /dev/mapper/ceph-* | xargs -I% -- dmsetup remove %
rm -rf /dev/ceph-*
lsblk -f
// 恢复rook的operator，使检测到格式化后的osd硬盘，osd启动后ceph集群会自动平衡数据
kubectl -n rook-ceph scale deployment rook-ceph-operator --replicas=1
deployment.apps/rook-ceph-operator scaled

0 条评论