0
点赞
收藏
分享

微信扫一扫

HPE 3PAR 替换故障硬盘过程

1自动执行过程

当系统检测到硬盘故障时,会将其标记为 degraded 状态。默然情况下,系统会自动发起 servicemag start 进程,将坏盘的数据重构到热备空间。在重构过程中,使用 showpd -s 可以看到正在 relocating,重构结束后,硬盘被标记为failed。此时换上新的硬盘,系统自动发起 servicemag resume 进程,将坏盘的数据回迁到新的硬盘。

2手动执行

当系统没有自动执行 servicemag start 或者状态显示正常,但有存在风险的硬盘需要替换时,需要手动执行。过程如下:

  1. 使用 showpd -s 命令验证磁盘状态
  2. 使用 servicemag status -d 验证系统是否自动发起 servicemag start 进程及数据是否迁移完成,如果没有发起start进程,手动执行
  3. 更换硬盘
  4. 使用 servicemag status -d 验证系统是否自动发起 servicemag resume 进程及数据是否回迁完成,如果没有,手动执行
  5. 数据回迁结束后,使用 dismisspd <pdid> 清除坏盘的 pdid

1更换准备

执行 showsys 命令确认维修设备序列号

% showsys
---------------(MiB)---------------
ID -Name-- ----Model---- --Serial-- Nodes Master ClusterLED TotalCap AllocCap FreeCap FailedCap
0x1A130 ss8400c HPE_3PAR 8440 SGHxxxxx3J 4 0 Off 35162112 24610816 9992192 559104

通过以下命令确定故障硬盘的位置:

% showpd -c -failed -degraded
------- Normal Chunklets -------- ---- Spare Chunklets ----
- Used - -------- Unused -------- - Used - ---- Unused ----
Id CagePos Type State  Total OK Fail Free Uninit Unavail Fail OK Fail Free Uninit Fail
28 2:15:0  FC   failed 546   0   0   493  0      0       1    0   0   52   0      0
----------------------------------------------------------------------------------------
1 total                546   0   0   493  0      0       1    0   0   52   0      0

通过命令输出记录下故障硬盘所在的位置(showpd输出中的CagePos字段第一段对应值)。如上示例中PD 28的盘柜编号为2,磁盘槽位为15。

警告:如果硬盘仍处于降级状态(degraded)而不是故障状态(failed),请不要尝试从盘柜中卸下硬盘,因为硬盘仍在腾空数

据。如果您移除硬盘处于降级状态(degraded),可能会丢失数据。等待硬盘进入故障状态(failed),表示数据已腾空,硬盘可 以安全更换。此过程可能需要几个小时。

定位故障磁盘物理位置

对于故障硬盘,故障指示灯会呈琥珀色常亮。

HPE 3PAR 替换故障硬盘过程_数据

还可以根据之前记录的故障磁盘位置信息来点亮磁盘。

执行 showcage 命令将之前记录的盘笼编号与盘笼名字对应:

Id Name LoopA Pos.A LoopB Pos.B Drives Temp RevA RevB Model FormFactor
0 cage0 0:1:1 0 1:1:1 0 24 29-31 409b 409b DCN2 SFF
1 cage1 0:1:2 0 1:1:2 0 24 35-39 409b 409b DCS7 LFF
2 cage2 2:1:1 0 3:1:1 0 24 28-30 409b 409b DCN2 SFF
3 cage3 2:1:2 0 3:1:2 0 24 31-33 409b 409b DCS7 LFF

执行命令定位硬盘参数-t表示指示灯点亮时长。例如:

locatecage -t 90 cage2 disk 15 //cage2槽位15硬盘故障指示灯闪烁90秒

以下为SFF和LFF盘柜的磁盘位置编号:

HPE 3PAR 替换故障硬盘过程_数据_02

2更换硬盘

移除前面板

  1. 解锁挡板(1)
  2. 按下释放按钮(2)
  3. 从盘柜左侧按箭头方向旋转挡板(3)
  4. 从盘柜右侧拉出挡板(4)

HPE 3PAR 替换故障硬盘过程_数据_03

移除硬盘

  1. 要将手柄释放到打开位置,请捏住图中1号位置到开启状态(1)
  2. 拉开手柄(2)
  3. 将硬盘滑出托架(3)并放置在安全的位置

HPE 3PAR 替换故障硬盘过程_数据_04

HPE 3PAR 替换故障硬盘过程_数据迁移_05

安装磁盘

  1. 在硬盘上,按释放按钮打开手柄。
  2. 在硬盘手柄完全展开的情况下,对齐硬盘并将其滑入托架,直到手柄开始接合 (1)。
  3. 合上手柄将硬盘插入硬盘托架(2)。

HPE 3PAR 替换故障硬盘过程_更换硬盘_06

HPE 3PAR 替换故障硬盘过程_FRU_07

3更换完毕

数据迁移检查

观察新安装的硬盘,磁盘由新安装到可用需要几分钟时间,之后指示灯会发生变化,服务/UID 指示灯熄灭,状态/活动指示灯变为稳定的绿色。

servicemag resume 流程会在五分钟内自动开始。

若 servicemag resume 没有自动开始,可以使用以下命令手动开始数据迁移

 servicemag resume <cage_ID> <magazine>

在命令行界面使用以下命令确认 servicemag resume 状态以及进度

servicemag status

若自动发起的 servicemag resume 提示失败,可以首先尝试手工重新启动 servicemag resume

servicemag unmark <cage_ID> <magazine>
servicemag clearstatus <cage_ID> <magazine>
servicemag resume <cage_ID> <magazine>

检查存储运行情况

数据迁移完成后执行以下命令检查存储

checkhealth -detail

若存在更换硬盘后旧盘数据残留的问题,请手工清理无效的pdid

dismisspd <PD_ID> //dismisspd命令需等待servicemag resume完成之后才能执行成功

安装前面板

  1. 将挡板插入盘柜右侧(1)。
  2. 按下释放按钮(2)。
  3. 将挡板插入盘柜左侧(3)。
  4. 锁定挡板(4)(可选)。

HPE 3PAR 替换故障硬盘过程_数据迁移_08


举报

相关推荐

0 条评论