免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3866 | 回复: 9
打印 上一主题 下一主题

[RAID与磁盘阵列] 诸位大侠看看能否救小弟的命呀,文件服务器丢录音文件 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-07-03 20:57 |只看该作者 |倒序浏览
本帖最后由 kengliren 于 2011-07-03 21:06 编辑

诸位大侠好!

  目前小弟遇到一个奇怪的问题,咨询过操作系统和存储的人,都还没有答案,已经拖了不少时间了,还没办法,请诸位大侠救命呀。

  我是做呼叫中心的,使用两台HP DL380G6服务器做文件服务器双机,操作系统是SuseLinux10Sp2,使用VCS5.0做双机存储管理,磁盘阵列是HP的MSA2312SA,有3个从框,一共48块SAS 300G硬盘,做RAID1+0。使用LVM管理磁盘。这两台文件服务器的主要用途就是存储录音文件。录音设备通过NFS与文件服务器连接,写录音文件最多有240个线程,每个线程每两秒写16K。

  现在的问题是录音设备会发现有与文件服务器NFS断链的现象,大约每天1至2次,同时会出现录音文件丢失和破损的现象。

  现在已经排除网络故障,基本定位在文件服务器和磁盘阵列上,通过从iostate –x信息中看,出现问题的时间点,
IO等待await(ms)的时间很长,另外,平均服务svctm(ms)的时间也很长,一般情况下这个值不应该很大,
此外,util经常长时间达到100%,这个就表明IO已经达到了瓶颈。

Time: 16:13:59
avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.06    0.00    0.87   12.37    0.00   86.70

Device:         rrqm/s   wrqm/s     r/s     w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util
cciss/c0d0        0.00     1.50    0.00    1.00     0.00    20.00    20.00     0.00    0.00   0.00   0.00
cciss/c0d1        0.00     4.50    0.00    4.50     0.00    72.00    16.00     0.00    0.00   0.00   0.00
sda               0.00     0.00    0.00    0.50     0.00    16.00    32.00    13.97 3040.00 2000.00 100.00
sdb               0.00     0.00    0.00    1.50     0.00    36.00    24.00    32.90 2373.33 666.67 100.00
sdc               0.00     0.00    0.00    0.00     0.00     0.00     0.00     3.00    0.00   0.00 100.00
sdd               0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
sde               0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
sdf               0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00
dm-0              0.00     0.00    0.00    0.00     0.00     0.00     0.00    11.00    0.00   0.00 100.00
dm-1              0.00     0.00    0.00    0.00     0.00     0.00     0.00   165.71    0.00   0.00 100.00
dm-2              0.00     0.00    0.00    0.00     0.00     0.00     0.00    40.87    0.00   0.00 100.00
dm-3              0.00     0.00    0.00    0.00     0.00     0.00     0.00   217.58    0.00   0.00 100.00


  这个问题咨询了HP,他们也说不出明确原因,只是说让升级驱动,别的等升级完再说。

  请诸位达人,根据自己的经验帮小弟分析一下吧,谢谢了啊

论坛徽章:
0
2 [报告]
发表于 2011-07-03 21:04 |只看该作者
不好意思,VCS是用的4.1的版本

论坛徽章:
0
3 [报告]
发表于 2011-07-04 09:51 |只看该作者
阵列RAID划分:磁盘阵列要分3个vdisk,每个vdisk有8个radid组,每组有2块硬盘,共16块硬盘,不设Spare硬盘。 磁柜1、2互为备份,磁柜3、4互为备份

论坛徽章:
0
4 [报告]
发表于 2011-07-04 18:01 |只看该作者
哎,没人管呀

论坛徽章:
1
操作系统版块每日发帖之星
日期:2016-02-18 06:20:00
5 [报告]
发表于 2011-07-05 13:10 |只看该作者
这个涉及应用层的问题吧,磁盘的资源没有释放造成的,单机运行试试看&……

论坛徽章:
0
6 [报告]
发表于 2011-07-05 15:16 |只看该作者
楼上的哥哥,您的意思是将文件服务器关掉一台?是这两台文件服务器锁定文件造成的?但是用了VCS做存储管理,不会发生这样的惨剧吧?尝试过切换主备文件服务器,现象是一样的

论坛徽章:
1
操作系统版块每日发帖之星
日期:2016-02-18 06:20:00
7 [报告]
发表于 2011-07-08 11:05 |只看该作者
好吧,我的意思是可能是由于 VCS 造成的,但是不太确定,所以说把VCS卸掉单机运行看看是否还存在这种情况。



你不是有2台机器码?重装一台或者搞台机器来试试呗……

论坛徽章:
1
操作系统版块每日发帖之星
日期:2016-02-18 06:20:00
8 [报告]
发表于 2011-07-08 11:09 |只看该作者
好吧,我的意思是可能是由于 VCS 造成的,但是不太确定,所以说把VCS卸掉单机运行看看是否还存在这种情况。



你不是有2台机器码?重装一台或者搞台机器来试试呗……

论坛徽章:
0
9 [报告]
发表于 2011-07-10 21:26 |只看该作者
谢谢楼上的。计划下周进行完全重装,不太可能是VCS造成的,用户要求很严,不允许在现场做测试。我们大家实验环境没有复现。

论坛徽章:
0
10 [报告]
发表于 2011-07-12 19:17 |只看该作者
你都说“util经常长时间达到100%,这个就表明IO已经达到了瓶颈”,这就是问题所在啊!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP