- 论坛徽章:
- 0
|
各位大神好,
小弟碰到一棘手的问题。
我们到产品环境,是一个集群20台blade机器,用的是Sun Grid Engine (也称 OGE)。目前每天晚上有很多任务在每一个blade上运行。每台blade上是24个逻辑cpu。其中一个信息如下:
analyzing CPU 23:
driver: pcc-cpufreq
CPUs which need to switch frequency at the same time: 23
hardware limits: 1.60 GHz - 2.80 GHz
available cpufreq governors: conservative, userspace, powersave, ondemand, pee
current policy: frequency should be within 1.60 GHz and 2.80 GHz.
The governor "ondemand" may decide which speed to use
within this range.
current CPU frequency is 2.80 GHz.
我们到应用在blade上,同时需要访问local的MySQL。MySQL里存的是一些binary压缩数据,每次访问后,均需要解压。发现CPU load高的时候,解压花很长时间。平时大约1秒钟到活,可能要花3分钟左右。
过去都一直很好,最近每天早上6点后突然变得很慢。1分钟平均 Load达到 15-22 之多。此时大约只有10个到14个我们的应用程序在运行。
查过OS的patch最近没有变化,网络部分没有变化,似乎OS的其他问题也都正常。
各位大侠有什么方向指导一下吗?简直现在没有一点方向了,压力山大啊!
叩谢!!!
Edge
|
|