免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3802 | 回复: 8
打印 上一主题 下一主题

Solaris10-SunFire490-CPU问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-03-09 16:59 |只看该作者 |倒序浏览
环境:Sun Frie490\r\nOS:   Solaris 10\r\n\r\n\r\n\r\n\r\n操作步骤及结果:\r\n# prtdiag -v \r\n\r\n\r\n系统配置:  Sun Microsystems  sun4u Sun Fire V490\r\n系统时钟频率:150 MHz\r\n内存大小:8192 兆字节\r\n\r\n========================= CPUs ===============================================\r\n\r\n          运行  E$  CPU     CPU  \r\nBrd  CPU  MHz   MB  Impl.   掩码 \r\n--- ----- ---- ---- ------- ---- \r\n A  0, 16 1500 32.0 US-IV+   2.2\r\n A  2, 18 1500 32.0 US-IV+   2.2\r\n\r\n#mpstat\r\n\r\nCPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl\r\n  0    2   0    7   176   82    8    1    1    1    0    18    0 100   0   0\r\n  2   89   1   48   252  146  108    3   11    4    0   449    1   1   0  98\r\n 16    0   0    2  1305   87   16    5    0    0    0     9    0 100   0   0\r\n 18   79   0   47    21   16  210    1   11    5    0   358    1   1   0  98\r\n\r\n我不明白为啥0号CPU,16号CPU 空闲时间怎么为0,它在忙什么?\r\n\r\n然后察看系统进程:\r\n#ps -eo pid,pcpu,args | sort +1n\r\n\r\n\r\n0  0.0 sched\r\n    1  0.0 /sbin/init\r\n    2  0.0 pageout\r\n    7  0.0 /lib/svc/bin/svc.startd\r\n    9  0.0 /lib/svc/bin/svc.configd\r\n  122  0.0 /usr/lib/sysevent/syseventd\r\n  131  0.0 /usr/lib/picl/picld\r\n  134  0.0 /usr/sbin/nscd\r\n  135  0.0 /usr/lib/crypto/kcfd\r\n  141  0.0 devfsadmd\r\n  181  0.0 /usr/sbin/in.routed\r\n  225  0.0 /usr/sbin/cron\r\n  230  0.0 /usr/sbin/rpcbind\r\n  233  0.0 /usr/lib/nfs/statd\r\n  235  0.0 /usr/lib/saf/sac -t 300\r\n  241  0.0 /usr/lib/utmpd\r\n  242  0.0 /usr/lib/inet/inetd start\r\n  244  0.0 /usr/lib/nfs/lockd\r\n  246  0.0 /usr/lib/saf/ttymon\r\n  247  0.0 /usr/lib/saf/ttymon -g -d /dev/console -l console -T sun -m ldterm,ttcompat -h \r\n  329  0.0 /usr/lib/autofs/automountd\r\n  330  0.0 /usr/lib/autofs/automountd\r\n  345  0.0 /usr/lib/ssh/sshd\r\n  348  0.0 /usr/lib/ssh/sshd\r\n  349  0.0 /usr/sbin/syslogd\r\n  364  0.0 /usr/lib/fm/fmd/fmd\r\n  367  0.0 /usr/sbin/mdmonitord\r\n  378  0.0 /usr/sbin/rpc.metad\r\n  416  0.0 /usr/sadm/lib/smc/bin/smcboot\r\n  417  0.0 /usr/sadm/lib/smc/bin/smcboot\r\n  418  0.0 /usr/sadm/lib/smc/bin/smcboot\r\n  462  0.0 /usr/lib/ssh/sshd\r\n  478  0.0 -ksh\r\n  491  0.0 /usr/dt/bin/dtlogin -daemon\r\n  499  0.0 /usr/openwin/bin/fbconsole -n -d :0\r\n  501  0.0 /usr/lib/snmp/snmpdx -y -c /etc/snmp/conf\r\n  503  0.0 /usr/openwin/bin/Xsun :0 -defdepth 24 -nobanner -auth /var/dt/A:0-zcay9a\r\n  552  0.0 /usr/lib/dmi/dmispd\r\n  586  0.0 /usr/lib/dmi/snmpXdmid -s scada1\r\n  612  0.0 /usr/dt/bin/dtlogin -daemon\r\n  614  0.0 /usr/sfw/sbin/snmpd\r\n  628  0.0 dtgreet -display :0\r\n  629    - <defunct>\r\n  639  0.0 /usr/sbin/vold -f /etc/vold.conf\r\n  928  0.0 /usr/lib/ssh/sshd\r\n  931  0.0 /usr/lib/ssh/sshd\r\n  933  0.0 -ksh\r\n  PID %CPU COMMAND\r\n 1000  0.0 /usr/lib/sendmail -bd -q15m\r\n 1001  0.0 /usr/lib/sendmail -Ac -q15m\r\n 2345  0.0 /usr/sbin/in.rlogind\r\n 2347  0.0 -ksh\r\n 2422  0.0 rlogin maint1\r\n 2423  0.0 rlogin maint1\r\n 2424  0.0 /usr/sbin/in.rlogind\r\n 2426  0.0 -ksh\r\n 3246  0.0 /usr/sbin/in.rlogind\r\n 3248  0.0 -ksh\r\n 3324  0.0 /usr/sbin/in.rlogind\r\n 3326  0.0 -ksh\r\n 3393  0.0 rlogin scada2\r\n 3394  0.0 rlogin scada2\r\n 3395  0.0 /usr/sbin/in.rlogind\r\n 3397  0.0 -ksh\r\n 3755  0.0 -ksh\r\n 3756  0.0 ps -eo pid,pcpu,args\r\n 3757  0.0 sort +1n\r\n    3  0.1 fsflush\r\n\r\n也没有什么异常,为啥好端端的两颗CPU会那么忙,郁闷,请高手指教。

论坛徽章:
0
2 [报告]
发表于 2007-03-09 17:47 |只看该作者
prstat -a 看看什么东西在用,你先排除硬件故障吧, 看看messages  prtdiag -v 还有人家说了用了vmstat 2 30 看看 双核的cpu 有点搞不懂.你vmstat的话 看的就是cpu的使用时间了 不会出来什么16 18了 你看看具体的吧

论坛徽章:
0
3 [报告]
发表于 2007-03-09 17:52 |只看该作者
prstat -a 看看什么东西在用,你先排除硬件故障吧, 看看messages  prtdiag -v 还有人家说了用了vmstat 2 30 看看 双核的cpu 有点搞不懂.你vmstat的话 看的就是cpu的使用时间了 不会出来什么16 18了 你看看具体的吧

论坛徽章:
0
4 [报告]
发表于 2007-03-13 08:44 |只看该作者
首先感谢以上各位的回帖。\r\n2楼:\r\nvmstat 显示CPU空闲idl为50%,也就是和我上边贴出的mpstat结果相吻合。\r\n\r\n#mpstat\r\n\r\nCPU minf mjf xcal  intr ithr  csw icsw migr smtx  srw syscl  usr sys  wt idl\r\n  0    2   0    7   176   82    8    1    1    1    0    18    0 100   0   0\r\n  2   89   1   48   252  146  108    3   11    4    0   449    1   1   0  98\r\n16    0   0    2  1305   87   16    5    0    0    0     9    0 100   0   0\r\n18   79   0   47    21   16  210    1   11    5    0   358    1   1   0  98\r\n\r\n\r\n3楼,4楼的兄弟:\r\n用你说的prstat -a 查看系统进程和用户进程发现CPU总的占用率还不到3%,观察半小时。\r\n\r\n\r\n\r\n问题,无论mpstat, vmstat查看CPU的空闲率为50%,肯定不知道什么地方出问题了。我一批490机器,别的机器都没有问题,只有它。

论坛徽章:
0
5 [报告]
发表于 2007-03-13 10:00 |只看该作者
执行pbind 看一下能不能把进程绑定到idle=0的cpu上运行。

论坛徽章:
0
6 [报告]
发表于 2007-03-14 07:51 |只看该作者
在所有几块CPU上执行pbind都能绑定进程,仍然找寻答案中……

论坛徽章:
0
7 [报告]
发表于 2007-03-14 08:24 |只看该作者
可以先用top或者prstat -a找找你的那个进程占用CPU最多。然后,在决定.有的时候,CPU占用率高.很有可能是应用的问题.

论坛徽章:
0
8 [报告]
发表于 2007-03-14 11:45 |只看该作者
用别的相同机器的硬盘没事,把本机硬盘放到别的机器上也没事,回来就坏事。。。。。。。。\r\n\r\n这种问题简直是要命,,,,,重装个系统看看吧,,幸好系统还没有验收,处在测试阶段。。。。。。。

论坛徽章:
0
9 [报告]
发表于 2007-03-18 15:01 |只看该作者
10楼,对啊,我做raid了\r\n\r\n重新安装操作系统后,问题解决.....\r\n\r\n但今早发现,可能与操作系统无关,我将490两块PCI光纤网卡起用(plumb,配好ip,重启),发现两块光纤网卡灯不亮,再查mpstat,问题重现.\r\n\r\n\r\n可以肯定的是,我的光纤网卡为ce0,ce1 ,  主板上的网卡为ce2,ce3 ,一共四块. 用 ifconfig -a 查看,发现4块卡的MAC地址变成一样,不知何原因,按照网上的做法,将PROM中的auto-local-address? 的值由false改为true,重启,这次,所有的网卡MAC地址都不一样了,但仍然光线网卡灯不亮.(光纤收发没问题,交换机头光线也亮,惟独此机器光纤网卡和死了一样.)\r\n\r\n注意:多台490,同样配置, 这台机器实在是太怪了.\r\n\r\n估计网卡搞定了, ,, CPU的问题也就迎刃而解了.......\r\n\r\n关注中.......
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP