免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: miaohuil
打印 上一主题 下一主题

请高手赶紧帮忙!!!!!!!!!iowait比较高 [复制链接]

论坛徽章:
0
21 [报告]
发表于 2006-05-11 15:05 |只看该作者
没有风险的,你有ICQ吗?还方便些

我看了一下,process共有四个用户的

nmosuser的可疑进程是dbaccess
npmuser的进程是几个perl的程序,有可能有问题
root的进程有vcs还有一些系统进程,先不怀疑

informix的进程只有oninit,而最可疑的是root的进程里也有oninit。

不明白为什么
而且root的oninit进程时间只有0.0几,而informix的进程时间都是上百上千的。


初步怀疑是root的oninit进程的问题

bash-2.03$ cat trouble.log |grep oninit
informix  1829  0.4 27.849146964476368 ?        S   Apr 21 1531:42 oninit
informix  1837  0.4 24.849127443996856 ?        S   Apr 21 1467:54 oninit
root      1958  0.2  0.74914880104360 ?        S   Apr 21 729:05 oninit
informix  1836  0.2 24.949131604000792 ?        S   Apr 21 2040:13 oninit
informix  1838  0.1 24.749122003982368 ?        S   Apr 21 923:42 oninit
informix  1840  0.0 24.449117043930872 ?        S   Apr 21 393:31 oninit
root      1835  0.0  0.94907904134728 ?        S   Apr 21 10:53 oninit
informix  1839  0.0 24.649119923961136 ?        S   Apr 21 582:18 oninit
informix  1841  0.0 24.349113363909816 ?        S   Apr 21 291:03 oninit
root      1842  0.0  0.04907904  928 ?        S   Apr 21  0:02 oninit
root      1843  0.0  0.04907904  888 ?        S   Apr 21  0:03 oninit
root      1844  0.0  0.84907904124448 ?        S   Apr 21 458:13 oninit
root      1845  0.0  0.7490795299680 ?        S   Apr 21  7:02 oninit
root      1872  0.0  0.5490790482472 ?        S   Apr 21  1:00 oninit
root      1876  0.0  0.3490790437632 ?        S   Apr 21  0:09 oninit
root      1877  0.0  0.1490790414688 ?        S   Apr 21  0:04 oninit
root      1878  0.0  0.14907904 6984 ?        S   Apr 21  0:03 oninit
root      1889  0.0  0.14907904 5808 ?        S   Apr 21  0:03 oninit
root      1902  0.0  0.14907904 5288 ?        S   Apr 21  0:03 oninit
root      1912  0.0  0.14907904 5320 ?        S   Apr 21  0:03 oninit
root      1928  0.0  0.14907904 4672 ?        S   Apr 21  0:02 oninit
root      1929  0.0  0.14907904 4584 ?        S   Apr 21  0:02 oninit
root      1930  0.0  0.14907904 4248 ?        S   Apr 21  0:02 oninit
root      1932  0.0  0.14907904 2752 ?        S   Apr 21  0:02 oninit
root      1933  0.0  0.14907904 3376 ?        S   Apr 21  0:02 oninit
root      1934  0.0  0.14907904 3776 ?        S   Apr 21  0:02 oninit
root      1935  0.0  0.04907904 2192 ?        S   Apr 21  0:02 oninit
root      1936  0.0  0.14907904 4000 ?        S   Apr 21  0:02 oninit
root      1937  0.0  0.04907904 1488 ?        S   Apr 21  0:02 oninit
root      1938  0.0  0.04907904 1496 ?        S   Apr 21  0:02 oninit
root      1944  0.0  0.14907904 2520 ?        S   Apr 21  0:02 oninit
root      1945  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1946  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1947  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1948  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1949  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1950  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1951  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1952  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1953  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1954  0.0  0.04907904 1960 ?        S   Apr 21  0:02 oninit
root      1955  0.0  0.04907904  896 ?        S   Apr 21  0:02 oninit
root      1956  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit
root      1957  0.0  0.04907904  920 ?        S   Apr 21  0:02 oninit

论坛徽章:
0
22 [报告]
发表于 2006-05-11 15:07 |只看该作者
你问一下db的管理员,看看这种情况是否是正常的。
如果不正常的话,把下面的输出贴出来
ps -ef |grep oninit
看看这些oninit的进程pid之间的关系,父进程跟子进程

论坛徽章:
0
23 [报告]
发表于 2006-05-11 15:08 |只看该作者
dmesg中有这样的报错,是不是硬盘有一些缺陷?这些缺陷是否也会造成iowait较高呢?

May 10 11:05:51 sc3db1 scsi: [ID 107833 kern.warning] WARNING: /ssm@0,0/pci@19,600000/fibre-channel@1/sd@1,1 (sd100):
May 10 11:05:51 sc3db1  Error for Command: read(10)                Error Level: Retryable
May 10 11:05:51 sc3db1 scsi: [ID 107833 kern.notice]    Requested Block: 255881512                 Error Block: 255881512
May 10 11:05:51 sc3db1 scsi: [ID 107833 kern.notice]    Vendor: DGC                                Serial Number: 030000160ACL
May 10 11:05:51 sc3db1 scsi: [ID 107833 kern.notice]    Sense Key: Unit Attention
May 10 11:05:51 sc3db1 scsi: [ID 107833 kern.notice]    ASC: 0x2a (<vendor unique code 0x2a>), ASCQ: 0x81, FRU: 0x0
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.warning] WARNING: /ssm@0,0/pci@19,700000/lpfc@1/sd@0,1 (sd60):
May 10 11:06:53 sc3db1  Error for Command: read(10)                Error Level: Retryable
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.notice]    Requested Block: 281044020                 Error Block: 281044020
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.notice]    Vendor: DGC                                Serial Number: 030000160ACL
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.notice]    Sense Key: Unit Attention
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.notice]    ASC: 0x2a (<vendor unique code 0x2a>), ASCQ: 0x81, FRU: 0x0
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.warning] WARNING: /ssm@0,0/pci@19,600000/fibre-channel@1/sd@1,1 (sd100):
May 10 11:06:53 sc3db1  Error for Command: read(10)                Error Level: Retryable
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.notice]    Requested Block: 281044048                 Error Block: 281044048
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.notice]    Vendor: DGC                                Serial Number: 030000160ACL
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.notice]    Sense Key: Unit Attention
May 10 11:06:53 sc3db1 scsi: [ID 107833 kern.notice]    ASC: 0x2a (<vendor unique code 0x2a>), ASCQ: 0x81, FRU: 0x0
May 10 15:06:14 sc3db1 scsi: [ID 107833 kern.warning] WARNING: /ssm@0,0/pci@19,600000/fibre-channel@1/sd@0,3 (sd94):
May 10 15:06:14 sc3db1  Error for Command: write                   Error Level: Retryable
May 10 15:06:14 sc3db1 scsi: [ID 107833 kern.notice]    Requested Block: 73741                     Error Block: 73741
May 10 15:06:14 sc3db1 scsi: [ID 107833 kern.notice]    Vendor: DGC                                Serial Number: 0100001381CL
May 10 15:06:14 sc3db1 scsi: [ID 107833 kern.notice]    Sense Key: Unit Attention
May 10 15:06:14 sc3db1 scsi: [ID 107833 kern.notice]    ASC: 0x2a (<vendor unique code 0x2a>), ASCQ: 0x81, FRU: 0x0
May 10 15:06:17 sc3db1 scsi: [ID 107833 kern.warning] WARNING: /ssm@0,0/pci@19,700000/lpfc@1/sd@1,3 (sd70):
May 10 15:06:17 sc3db1  Error for Command: write                   Error Level: Retryable
May 10 15:06:17 sc3db1 scsi: [ID 107833 kern.notice]    Requested Block: 9984                      Error Block: 9984
May 10 15:06:17 sc3db1 scsi: [ID 107833 kern.notice]    Vendor: DGC                                Serial Number: 0100001381CL
May 10 15:06:17 sc3db1 scsi: [ID 107833 kern.notice]    Sense Key: Unit Attention
May 10 15:06:17 sc3db1 scsi: [ID 107833 kern.notice]    ASC: 0x2a (<vendor unique code 0x2a>), ASCQ: 0x81, FRU: 0x0
May 11 11:42:13 sc3db1 explorer: [ID 702911 daemon.notice] Explorer started
May 11 11:45:53 sc3db1 explorer: [ID 702911 daemon.notice] Explorer finished
May 11 12:30:44 sc3db1 explorer: [ID 702911 daem

论坛徽章:
0
24 [报告]
发表于 2006-05-11 15:09 |只看该作者
如果db没有问题,就是怀疑npmuser的还有nrmuser的perl的进程了

论坛徽章:
0
25 [报告]
发表于 2006-05-11 15:14 |只看该作者
有可能是磁盘引起的呢
  Error Level: Retryable
不过最终可以从process那里得到结果。

如果你有相似的server,查一下他们的npmuser的还有nrmuser的process跟这台server的外观是否相似。

truss -fa -p $PID   ($PID表示你想查看的process的pid)
这个命令可以看到process在做什么,注意:这个的输出太多。

把几个可疑的进程都检查一遍

论坛徽章:
0
26 [报告]
发表于 2006-05-11 15:14 |只看该作者
我去下呢ICQ吧

论坛徽章:
0
27 [报告]
发表于 2006-05-11 15:21 |只看该作者
我的ICQ是294994700

论坛徽章:
0
28 [报告]
发表于 2006-05-11 15:22 |只看该作者
ICQ:243-567-007

论坛徽章:
0
29 [报告]
发表于 2006-05-11 15:26 |只看该作者
我看到ICQ上的消息是乱码

论坛徽章:
0
30 [报告]
发表于 2006-05-11 16:02 |只看该作者
"# top
top: /dev/ksyms is not a 32-bit kernel namelist
kvm_open: Error 0

load averages:  0.99,  1.14,  1.00                                                                                         14:23:40
165 processes: 164 sleeping, 1 on cpu
CPU states: 55.8% idle,  5.5% user,  3.8% kernel, 34.9% iowait,  0.0% swap
Memory: 16G real, 9387M free, 16M swap in use, 8177M swap free
内存是否正常呢??"

Your "top" package not for 64-bit kernel, 32-bit only, some messages not true, pls use higher "top" for your 64-bit solaris.

"swap in use" should be include used Physicle Memory, 16M too small, maybe cause by 32-bit "top", it's can not handle >=4g memory.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP