- 论坛徽章:
- 0
|
楼主,关于你所反映的情况我们觉得有些内容描述得不够具体,不够详细。
因此我们需要你们 ...
xiaocongwjb123 发表于 2010-03-02 09:57
楼主,关于你所反映的情况我们觉得有些内容描述得不够具体,不够详细。
因此我们需要你们方便的话提供更加详细的相关信息:
(1)一个目录下面放了大概12万个文件。首先我们需要了解的是你们所说的目录
下面放了12万个文件指的是不是下面的哪种情况呢?
--------〉是一个目录下12万,不包括子目录
1)假设存放文件的目录是/data,而/data目录下面就存放了大概12万个文件(
包括/data下面的子目录,/data下面的每个子目录也算是一个文件);
2)假设存放文件的目录是/data,而/data目录下面有分别建立了1,2,3.......等
子目录,也就是说/data/1,/data/2,/data/3.......。/data目录下面的这些子目
录里面所存放的文件数(包括里面的二级子目录和三级子目录)大概在12万个左右。
(2)操作系统版本是RHAS 5点几的,是32位的还是64位的呢?这个命令可以查到
# cat /etc/redhat-release
# uname -a
[root@ ~]# uname -a
Linux 2.6.9-78.0.8.ELlargesmp #1 SMP Wed Nov 5 07:25:07 EST 2008 x86_64 x86_64 x86_64 GNU/Linux
(3)操作系统上面开机启动了哪些服务?这个命令可以查到
# ntsysv ##打上星号的就是随操作系统启动的服务
(4)集群上面所用的硬件服务器CPU的详细信息是什么?这个命令可以查到
# cat /etc/cpuinfo
cat /proc/cpuinfo
8个
processor : 7
vendor_id : GenuineIntel
cpu family : 6
model : 15
model name : Intel(R) Xeon(R) CPU E7330 @ 2.40GHz
stepping : 11
cpu MHz : 2400.090
cache size : 3072 KB
(5)操作系统启动的时候内核到底加载了哪些模块?这个命令可以看到
# lsmod
Module Size Used by
mptctl 43977 1
mptbase 81825 1 mptctl
sg 50041 0
ipmi_si 51928 2
ipmi_devintf 18192 4
ipmi_msghandler 41992 2 ipmi_si,ipmi_devintf
parport_pc 36737 0
lp 22513 0
parport 51789 2 parport_pc,lp
autofs4 35273 0
i2c_dev 21057 0
i2c_core 36289 1 i2c_dev
lock_dlm 55412 4
gfs 341004 4
lock_harness 14512 2 lock_dlm,gfs
dlm 142340 11 lock_dlm
cman 147360 26 lock_dlm,gfs,dlm
sunrpc 184505 1
md5 13121 1
ipv6 314401 1178
dm_round_robin 12353 1
dm_emc 14913 1
joydev 19393 0
dm_multipath 30673 3 dm_round_robin,dm_emc
button 16481 0
battery 18633 0
ac 14153 0
ehci_hcd 42441 0
uhci_hcd 42473 0
hw_random 14561 0
tg3 127301 0
bnx2 155101 0
bonding 80060 0
ext3 146129 4
jbd 76657 1 ext3
dm_mod 84137 39 dm_multipath
qla2400 239809 0
qla2xxx 203169 85 qla2400
scsi_transport_fc 19265 1 qla2xxx
cciss 83385 6
sd_mod 26561 42
scsi_mod 152593 5 sg,qla2xxx,scsi_transport_fc,cciss,sd_mod
(6) 检查操作系统中运行的时候各个设备IO是否已经启用了irqbalance(其应用就
是设备负载均衡调度)?这个命令可以看到
# cat /proc/interrupts
输出结果类似下面的信息:
CPU0 CPU1 CPU2 CPU3
0: 441733344 441704798 441804679 441725019 IO-APIC-edge timer
1: 0 1 2 0 IO-APIC-edge i8042
8: 1 0 1 1 IO-APIC-edge rtc
9: 0 0 0 0 IO-APIC-level acpi
12: 1 1 2 0 IO-APIC-edge i8042
14: 3962749 3990999 3891110 3970770 IO-APIC-edge ide0
98: 0 0 0 0 IO-APIC-level uhci_hcd:usb4
106: 22 23 26 27 IO-APIC-level uhci_hcd:usb5
130: 7786510 0 0 0 PCI-MSI-X cciss0
146: 6652580 0 0 0 PCI-MSI eth0
154: 1257030 0 0 0 PCI-MSI eth1
169: 0 0 2 0 IO-APIC-level uhci_hcd:usb1, ehci_hcd:usb6
177: 0 0 0 0 IO-APIC-level uhci_hcd:usb2
185: 13 10 10 15 IO-APIC-level uhci_hcd:usb3
NMI: 0 0 0 0
LOC: 1766973093 1766973092 1766973170 1766973169
从上面的输出内容可以看出,网卡1(eth0)和网卡2(eth1)的IO并没有工作在负载均衡调度
模式下面,所有的数据传输都加到CPU的了第一个核里面去了,而其它核则处于空闲状态(显然
这是一种系统资源的浪费形象)。当然了,并不是所有的硬件设备都完全支持irqbalance。不过
我们可以通过修改启动参数尝试让硬件设备都工作在irqbalance模式下面,从而提高系统资源的
利用效率,降低由于系统资源使用不充分造成系统响应缓慢,某些资源负载过高而某些资源
却闲着“没事干”的情况发生。
CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7
0: 16311190 18580896 18580973 18580388 18580029 18570996 18571034 18571168 IO-APIC-edge timer
1: 1 1 1 1 2 1 2 0 IO-APIC-edge i8042
8: 60 51 65 56 71 63 64 58 IO-APIC-edge rtc
9: 0 0 0 0 0 0 0 0 IO-APIC-level acpi
74: 6267 58955 940992 489883 350848 247755 466400 162974 PCI-MSI-X cciss0
90: 54200856 0 0 0 0 0 0 0 PCI-MSI eth0
98: 208908 0 0 0 0 0 0 0 PCI-MSI eth1
169: 0 0 0 0 0 0 0 0 IO-APIC-level uhci_hcd, ehci_hcd
177: 0 0 0 0 0 0 0 0 IO-APIC-level uhci_hcd
185: 0 0 0 0 0 0 0 0 IO-APIC-level uhci_hcd
193: 0 0 0 0 0 0 0 0 IO-APIC-level uhci_hcd
201: 102 95484 422491 596213 550760 334029 379426 356253 IO-APIC-level qla2400
209: 195 84032 558889 575326 410641 361174 424796 345578 IO-APIC-level qla2400
225: 467 865889 110729 340509 45602 681804 460924 416985 IO-APIC-level ipmi_si
233: 12 8 12 13 11 7 14 4 IO-APIC-level uhci_hcd
NMI: 146345828 146345749 146345766 146345752 146345782 146345742 146345770 146345750
LOC: 146332694 146340815 146333679 146340716 146338828 146338238 146338749 146337007
ERR: 0
MIS: 0
如果楼主方便的话可以通过邮件联系我们,我们的邮箱是:andy_xiaocong@126.com
顺便补充一下:我们不是Redhat技术团队,但是我们对楼主反映的情况很感兴趣。 |
|