如何处理MD storage Pieces FAILED 问题.
1. 什么是Piece?
MD 存储的磁盘组里创建多个虚拟磁盘, 虚拟磁盘在每个硬盘上占用的区块是相同的.(是相同的Offset 和Length) . 我们把每个硬盘上的区块称为一个Piece.
2 查看日志里MD 存储硬盘所有的状态. (一个硬盘根据不同的配置,可以包含多个Piece. 一个物理硬盘的状态是Optimal .但里面所有的Piece 并不一定是Optimal .需要通过日志文件确认.)
3. 如何处理MD storage 多个Piece 失败的问题. (以具体实例说明)
故障现象:一个MD的某个VD 状态是fail ,其他VD 都正常,所有的硬盘状态都是OPTIMAL .
主要处理步骤:
MDSM取消热备
查看failed piece SSID vdmShowRAIDVolList
degrade
查看piece failed时间和piece# vdmShowRVOosPieces SSID
按时间顺序上线piece vdmRevivePiece <ssid>, <piece>
重启对方控制器altCtlReset 2
通过 日志文件可以通过查关键字” piece”.VD5 有几个Piece failed.
远程telnet/串口,输入命令vdmShowRAIDVolList 或在 里查这个命令,就可以看到SSID 的信息如下.
Total RAIDVolumes: 16
Curr Prim
RVAddr Ssid State Pcs Owner Owner VG# PI ExclOp
===========================================================
0x04278878 000000 RV_OPTIMAL 22 This Alt    1 0 NONE
0x0427d9d8 000001 RV_FAILED 22 Alt Alt    1 0 MEDIA SCAN
0x0427ebb8 000002 RV_FAILED 22 Alt Alt    1 0 NONE
0x0427e2c8 000003 RV_FAILED 22 This This    1 0 NONE
0x042bfbd0 000004 RV_OPTIMAL 22 This This    1 0 NONE
0x042c0950 000005 RV_DEGRADED 22 Alt Alt    1 0 NONE
0x042d3fa0 000006 RV_OPTIMAL 22 Alt Alt    1 0 NONE
0x04349a68 000007 RV_OPTIMAL 22 Alt Alt    1 0 NONE
0x0434c138 000008 RV_OPTIMAL 22 Alt Alt    1 0 NONE
0x0434e808 000009 RV_OPTIMAL 22 Alt Alt    1 0 NONE
0x042d4890 000010 RV_OPTIMAL 22 Alt Alt    1 0 NONE
0x0434a358 000011 RV_OPTIMAL 22 Alt Alt    1 0 NONE
0x0434ca28 000012 RV_OPTIMAL 22 Alt Alt    1 0 NONE
0x04376078 000013 RV_FAILED 22 Alt Alt    1 0 NONE
0x04376968 000014 RV_OPTIMAL 22 Alt Alt    1 0 NONE
0x04377258 000015 RV_FAILED 22 Alt Alt    1 0 NONE
通过Majorevent LOG 工具
或者可以串口/Telnet 的命令vdmShowRVOosPieces <ssid>查看Piece 掉线顺序
确认好硬盘掉线顺序, SSID 号和Piece 后,就可以根据命令
vdmRevivePiece <ssid>, <piece>强制上线piece
把所有failed 的piece上线,留下最后一个(最早掉线的)就可以了
如何查看<piece>号是多少
命令vdmShowRVOosPieces <ssid>可以看到
0rd:0x000X,
0rd:0x000X,这个“X”是16进制
参考表格把这个16进制的X转换为10进制N
N-1才是我们要输的<piece>号
所以上图的0rd:0x0014 即piece 19
上线命令就是vdmRevivePiece 3,19
重启对方控制器
altCtlReset    2
raid变成degrade,让用户去确认数据是否可以正常(备份数据等)
正常情况下,控制器重启后,另一个FAILED的piece会自动做一个rebuild,等rebuild好以后,把热备盘配置回去

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。