- 论坛徽章:
- 1
|
我的lustre(这里挂了个swfs的壳)版本是1.8.3。有32个oss, 每个oss上挂载4个ost,每两个oss之间做failover。
现在的问题是:oss17的4个ost物理坏了,换了新盘后,格式化后无法正确加载。
具体现象如下:
在mds上,看到oss17对应的4个ost是inactive。
# cat /proc/fs/swgfs/lov/swgfs1-mdtlov/target_obd | grep -i inactive
64: swgfs1-OST0040_UUID INACTIVE
65: swgfs1-OST0041_UUID INACTIVE
66: swgfs1-OST0042_UUID INACTIVE
67: swgfs1-OST0043_UUID INACTIVE
在oss17上格式化新盘。
# mkfs.swgfs --reformat --fsname=swgfs1 --ost --mgsnode=18.0.4.1@o2ib --mgsnode=18.0.4.2@o2ib --param=failover.mode=failout --
mountfsoptions=errors=remount-ro,mballoc,extents --failnode=18.0.3.18@o2ib --index=64 /dev/mapper/lun1p1
在oss17上挂载该盘,出错,信息如下:
# mount -t swgfs -o abort_recovery /dev/mapper/lun1p1 /mnt/ost1
mount.swgfs: mount /dev/mapper/lun1p1 at /mnt/ost1 failed: Address already in use
The target service's index is already in use. (/dev/mapper/lun1p1)
在oss17上/var/log/message上显示的信息如下:
Oct 1 17:53:33 SWIO17 kernel: Swgfs: server umount swgfs1-OST0040 complete
Oct 1 17:53:33 SWIO17 kernel: SwgfsError: 23724:0 obd_mount.c:2045:swgfs_fill_super()) Unable to mount (-9
请问此问题如何解决?
|
|