- 论坛徽章:
- 0
|
本帖最后由 kengliren 于 2011-07-03 21:06 编辑
诸位大侠好!
目前小弟遇到一个奇怪的问题,咨询过操作系统和存储的人,都还没有答案,已经拖了不少时间了,还没办法,请诸位大侠救命呀。
我是做呼叫中心的,使用两台HP DL380G6服务器做文件服务器双机,操作系统是SuseLinux10Sp2,使用VCS5.0做双机存储管理,磁盘阵列是HP的MSA2312SA,有3个从框,一共48块SAS 300G硬盘,做RAID1+0。使用LVM管理磁盘。这两台文件服务器的主要用途就是存储录音文件。录音设备通过NFS与文件服务器连接,写录音文件最多有240个线程,每个线程每两秒写16K。
现在的问题是录音设备会发现有与文件服务器NFS断链的现象,大约每天1至2次,同时会出现录音文件丢失和破损的现象。
现在已经排除网络故障,基本定位在文件服务器和磁盘阵列上,通过从iostate –x信息中看,出现问题的时间点,
IO等待await(ms)的时间很长,另外,平均服务svctm(ms)的时间也很长,一般情况下这个值不应该很大,
此外,util经常长时间达到100%,这个就表明IO已经达到了瓶颈。
Time: 16:13:59
avg-cpu: %user %nice %system %iowait %steal %idle
0.06 0.00 0.87 12.37 0.00 86.70
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util
cciss/c0d0 0.00 1.50 0.00 1.00 0.00 20.00 20.00 0.00 0.00 0.00 0.00
cciss/c0d1 0.00 4.50 0.00 4.50 0.00 72.00 16.00 0.00 0.00 0.00 0.00
sda 0.00 0.00 0.00 0.50 0.00 16.00 32.00 13.97 3040.00 2000.00 100.00
sdb 0.00 0.00 0.00 1.50 0.00 36.00 24.00 32.90 2373.33 666.67 100.00
sdc 0.00 0.00 0.00 0.00 0.00 0.00 0.00 3.00 0.00 0.00 100.00
sdd 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sde 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
sdf 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
dm-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 11.00 0.00 0.00 100.00
dm-1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 165.71 0.00 0.00 100.00
dm-2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 40.87 0.00 0.00 100.00
dm-3 0.00 0.00 0.00 0.00 0.00 0.00 0.00 217.58 0.00 0.00 100.00
这个问题咨询了HP,他们也说不出明确原因,只是说让升级驱动,别的等升级完再说。
请诸位达人,根据自己的经验帮小弟分析一下吧,谢谢了啊 |
|