-scofield- 发表于 2012-09-07 11:00

请教当LV出现IO错误如何处理

# vgscan
/dev/lk1b02vp19q66k/backup-b73abv5vcvw5im: read failed after 0 of 4096 at 10737352704: Input/output error

/dev/lk1b02vp19q66k/backup-b73abv5vcvw5im: read failed after 0 of 4096 at 10737410048: Input/output error

/dev/k1b02vp19q66k/backup-b73abv5vcvw5im: read failed after 0 of 4096 at 0: Input/output error

/dev/lk1b02vp19q66k/backup-b73abv5vcvw5im: read failed after 0 of 4096 at 4096: Input/output error
其实这个并不影响继续其他操作,但是这个错误的出现会导致一些读取的错误,或者造成无法创建新的LV,有人遇到过吗?

-scofield- 发表于 2012-09-07 11:21

本帖最后由 -scofield- 于 2012-09-07 11:35 编辑

对于磁盘和块的错误已经进行扫描过,确认没有坏盘和raid的错误,

taotao1240 发表于 2012-09-10 09:31

你这个应该是在linux节点上吧,越到这种IO错误的,我一般情况下都是reboot。。。。。。。

-scofield- 发表于 2012-09-18 09:38

回复 3# taotao1240
感谢您的回复,这情况确实是发生在客户端这个层面,虽然reboot有时是可以排除这个问题,但是服务器上不能随意重启的,iscsi服务也是不能随意重启的。

我认为出现这个问题的可能是多个客户端之间的数据同步问题,导致每个客户端获取到的lv数据有误差导致,但是到底是什么原因导致还希望各位大神能帮忙找找原因,因为这个会导致很多问题。


   

taotao1240 发表于 2012-09-18 11:11

回复 4# -scofield-


    你之前环境没描述清楚,从你的回复中提到的“iscsi服务”,“多个客户端”,你是不是将存储上的一个lun通过iscsi给多个客户端一起使用??如果你真是这么做的话,那出现IO错误也就不足为奇了。

AIX深入敌后 发表于 2012-09-18 11:46

同意楼上说的

-scofield- 发表于 2012-09-24 09:33

回复 5# taotao1240


    是的,确实是将个别的LUN,连接了N多的客户端,既然这种情况会出现问题,那么不知道各位有遇到过如何避免或者减少这类情况发生的办法吗?

taotao1240 发表于 2012-09-24 14:39

回复 7# -scofield-


    在主机端安装集群文件系统吧。。。

-scofield- 发表于 2012-09-25 11:38

回复 8# taotao1240


    请这位大哥说个方向,你的意思是在服务端装什么样文件系统呢,还是客户端也需要呢,因为我需要连接的存储是LVM的类型,必须要在客户端能够对服务端的存储进行LVM的各种操作,并且优先选用iscsi的连接方式,还有HBA卡,和其他的连接方式,并且要考虑最基本的普通电口可以连接。

冬瓜头 发表于 2013-01-29 16:31

这种错误属于底层IO错误,与是否映射给了多个server一般没有直接关系,请注意“一般”,那么特殊是什么? 如果你的服务器集群上已经装有一些集群FS之类,需要共享底层Lun,那么其上必定会有一些共享访问措施,比如scsi 3 persistent reservation,如果某个server被从PR组里剔除了,那么就会遇到访问错误,就会报错,那么这个可能就是这台server与其他server通讯故障了,为了防止脑裂,被其他人踢出来了,所以自然报错。具体还得看看现场才能决定。   
页: [1] 2
查看完整版本: 请教当LV出现IO错误如何处理