1自动执行过程
当系统检测到硬盘故障时,会将其标记为 degraded 状态。默然情况下,系统会自动发起 servicemag start 进程,将坏盘的数据重构到热备空间。在重构过程中,使用 showpd -s 可以看到正在 relocating,重构结束后,硬盘被标记为failed。此时换上新的硬盘,系统自动发起 servicemag resume 进程,将坏盘的数据回迁到新的硬盘。
2手动执行
当系统没有自动执行 servicemag start 或者状态显示正常,但有存在风险的硬盘需要替换时,需要手动执行。过程如下:
- 使用 showpd -s 命令验证磁盘状态
- 使用 servicemag status -d 验证系统是否自动发起 servicemag start 进程及数据是否迁移完成,如果没有发起start进程,手动执行
- 更换硬盘
- 使用 servicemag status -d 验证系统是否自动发起 servicemag resume 进程及数据是否回迁完成,如果没有,手动执行
- 数据回迁结束后,使用 dismisspd <pdid> 清除坏盘的 pdid
1更换准备
执行 showsys 命令确认维修设备序列号
% showsys
---------------(MiB)---------------
ID -Name-- ----Model---- --Serial-- Nodes Master ClusterLED TotalCap AllocCap FreeCap FailedCap
0x1A130 ss8400c HPE_3PAR 8440 SGHxxxxx3J 4 0 Off 35162112 24610816 9992192 559104
通过以下命令确定故障硬盘的位置:
% showpd -c -failed -degraded
------- Normal Chunklets -------- ---- Spare Chunklets ----
- Used - -------- Unused -------- - Used - ---- Unused ----
Id CagePos Type State Total OK Fail Free Uninit Unavail Fail OK Fail Free Uninit Fail
28 2:15:0 FC failed 546 0 0 493 0 0 1 0 0 52 0 0
----------------------------------------------------------------------------------------
1 total 546 0 0 493 0 0 1 0 0 52 0 0
通过命令输出记录下故障硬盘所在的位置(showpd输出中的CagePos字段第一段对应值)。如上示例中PD 28的盘柜编号为2,磁盘槽位为15。
警告:如果硬盘仍处于降级状态(degraded)而不是故障状态(failed),请不要尝试从盘柜中卸下硬盘,因为硬盘仍在腾空数
据。如果您移除硬盘处于降级状态(degraded),可能会丢失数据。等待硬盘进入故障状态(failed),表示数据已腾空,硬盘可 以安全更换。此过程可能需要几个小时。
定位故障磁盘物理位置
对于故障硬盘,故障指示灯会呈琥珀色常亮。
还可以根据之前记录的故障磁盘位置信息来点亮磁盘。
执行 showcage 命令将之前记录的盘笼编号与盘笼名字对应:
Id Name LoopA Pos.A LoopB Pos.B Drives Temp RevA RevB Model FormFactor
0 cage0 0:1:1 0 1:1:1 0 24 29-31 409b 409b DCN2 SFF
1 cage1 0:1:2 0 1:1:2 0 24 35-39 409b 409b DCS7 LFF
2 cage2 2:1:1 0 3:1:1 0 24 28-30 409b 409b DCN2 SFF
3 cage3 2:1:2 0 3:1:2 0 24 31-33 409b 409b DCS7 LFF
执行命令定位硬盘参数-t表示指示灯点亮时长。例如:
locatecage -t 90 cage2 disk 15 //cage2槽位15硬盘故障指示灯闪烁90秒
以下为SFF和LFF盘柜的磁盘位置编号:
2更换硬盘
移除前面板
- 解锁挡板(1)
- 按下释放按钮(2)
- 从盘柜左侧按箭头方向旋转挡板(3)
- 从盘柜右侧拉出挡板(4)
移除硬盘
- 要将手柄释放到打开位置,请捏住图中1号位置到开启状态(1)
- 拉开手柄(2)
- 将硬盘滑出托架(3)并放置在安全的位置
安装磁盘
- 在硬盘上,按释放按钮打开手柄。
- 在硬盘手柄完全展开的情况下,对齐硬盘并将其滑入托架,直到手柄开始接合 (1)。
- 合上手柄将硬盘插入硬盘托架(2)。
3更换完毕
数据迁移检查
观察新安装的硬盘,磁盘由新安装到可用需要几分钟时间,之后指示灯会发生变化,服务/UID 指示灯熄灭,状态/活动指示灯变为稳定的绿色。
servicemag resume 流程会在五分钟内自动开始。
若 servicemag resume 没有自动开始,可以使用以下命令手动开始数据迁移
servicemag resume <cage_ID> <magazine>
在命令行界面使用以下命令确认 servicemag resume 状态以及进度
servicemag status
若自动发起的 servicemag resume 提示失败,可以首先尝试手工重新启动 servicemag resume
servicemag unmark <cage_ID> <magazine>
servicemag clearstatus <cage_ID> <magazine>
servicemag resume <cage_ID> <magazine>
检查存储运行情况
数据迁移完成后执行以下命令检查存储
checkhealth -detail
若存在更换硬盘后旧盘数据残留的问题,请手工清理无效的pdid
dismisspd <PD_ID> //dismisspd命令需等待servicemag resume完成之后才能执行成功
安装前面板
- 将挡板插入盘柜右侧(1)。
- 按下释放按钮(2)。
- 将挡板插入盘柜左侧(3)。
- 锁定挡板(4)(可选)。