请教当LV出现IO错误如何处理
# vgscan/dev/lk1b02vp19q66k/backup-b73abv5vcvw5im: read failed after 0 of 4096 at 10737352704: Input/output error
/dev/lk1b02vp19q66k/backup-b73abv5vcvw5im: read failed after 0 of 4096 at 10737410048: Input/output error
/dev/k1b02vp19q66k/backup-b73abv5vcvw5im: read failed after 0 of 4096 at 0: Input/output error
/dev/lk1b02vp19q66k/backup-b73abv5vcvw5im: read failed after 0 of 4096 at 4096: Input/output error
其实这个并不影响继续其他操作,但是这个错误的出现会导致一些读取的错误,或者造成无法创建新的LV,有人遇到过吗? 本帖最后由 -scofield- 于 2012-09-07 11:35 编辑
对于磁盘和块的错误已经进行扫描过,确认没有坏盘和raid的错误, 你这个应该是在linux节点上吧,越到这种IO错误的,我一般情况下都是reboot。。。。。。。 回复 3# taotao1240
感谢您的回复,这情况确实是发生在客户端这个层面,虽然reboot有时是可以排除这个问题,但是服务器上不能随意重启的,iscsi服务也是不能随意重启的。
我认为出现这个问题的可能是多个客户端之间的数据同步问题,导致每个客户端获取到的lv数据有误差导致,但是到底是什么原因导致还希望各位大神能帮忙找找原因,因为这个会导致很多问题。
回复 4# -scofield-
你之前环境没描述清楚,从你的回复中提到的“iscsi服务”,“多个客户端”,你是不是将存储上的一个lun通过iscsi给多个客户端一起使用??如果你真是这么做的话,那出现IO错误也就不足为奇了。 同意楼上说的 回复 5# taotao1240
是的,确实是将个别的LUN,连接了N多的客户端,既然这种情况会出现问题,那么不知道各位有遇到过如何避免或者减少这类情况发生的办法吗? 回复 7# -scofield-
在主机端安装集群文件系统吧。。。 回复 8# taotao1240
请这位大哥说个方向,你的意思是在服务端装什么样文件系统呢,还是客户端也需要呢,因为我需要连接的存储是LVM的类型,必须要在客户端能够对服务端的存储进行LVM的各种操作,并且优先选用iscsi的连接方式,还有HBA卡,和其他的连接方式,并且要考虑最基本的普通电口可以连接。 这种错误属于底层IO错误,与是否映射给了多个server一般没有直接关系,请注意“一般”,那么特殊是什么? 如果你的服务器集群上已经装有一些集群FS之类,需要共享底层Lun,那么其上必定会有一些共享访问措施,比如scsi 3 persistent reservation,如果某个server被从PR组里剔除了,那么就会遇到访问错误,就会报错,那么这个可能就是这台server与其他server通讯故障了,为了防止脑裂,被其他人踢出来了,所以自然报错。具体还得看看现场才能决定。
页:
[1]
2