免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1357 | 回复: 0
打印 上一主题 下一主题

[系统管理] IBM P小型机巡检内容及操作指导 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-04-21 11:16 |只看该作者 |倒序浏览
1. IBM P小型机机房要求:
1. 机房的卫生状况,要求清洁,键盘、显示器、机柜上没有灰尘。
2. 温度(摄氏 ℃)
10 ℃-40℃
湿度(%)
8% -80%
2. 设备故障灯分类:
主机故障灯
告警灯为黄色表示有故障
磁带机故障灯
告警灯为黄色说明有故障或磁带机太脏,须清洗。
3. 系统错误报告(Error Log)的检查: 
硬件故障检测命令:# errpt -d H -T PERM
显示如下:
# errpt -d H -T PERM
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
B9735AF4   0418205606 P H hdisk2         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0417215006 P H hdisk3         SUBSYSTEM COMPONENT FAILURE
若有故障执行命令# errpt -a -d H -T PERM>/tmp/harderror.log保存,分析结果报告给客户
软件故障检测命令:# errpt -d S -T PERM
显示如下:
# errpt -d S -T PERM
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
A63BEB70   0418210306 P S SYSPROC        SOFTWARE PROGRAM ABNORMALLY TERMINATED
A63BEB70   0418210106 P S SYSPROC        SOFTWARE PROGRAM ABNORMALLY TERMINATED
若有故障执行命令# errpt -a -d S -T PERM>/tmp/softerror.log保存,分析结果报告给客户
4. 有否发给root用户的错误报告(mail):     
#mail
Mail [5.2 UCB] [AIX 5.X]  Type ? for help.
"/var/spool/mail/root": 2 messages 2 new
>N  1 root              Tue Apr 18 17:27  14/527
N  2 root              Tue Apr 18 17:27  14/527
1. 观察所有未读消息,注意有关diagela的消息。
2. 常用命令:
h []        Display headings of group containing message  
t []     Display messages in  or current message.
n            Display next message.
q            Quit 
3. 对发现的问题详细分析,结果报告给客户
5. 件系统的检查:
命令:
# df –k
%Used为文件系统的使用率。所有文件系统的使用率不能大于80%
# df -k
Filesystem    1024-blocks      Free %Used    Iused %Iused Mounted on
/dev/hd4          1048576   1027864    2%     2449     2% /
/dev/hd2          3145728   1789584   44%    34963     9% /usr
/dev/hd9var       1048576   1009400    4%      632     1% /var
/dev/hd3           131072    123980    6%       46     1% /tmp
/dev/fwdump        393216    392828    1%        4     1% /var/adm/ras/platform
/dev/hd1          5242880   5240860    1%        8     1% /home
/proc                   -         -    -         -     -  /proc
/dev/hd10opt      2097152   2011360    5%     2522     1% /opt
/dev/lv00          131072    126912    4%       18     1% /var/adm/csd
/dev/instlv      10485760  10424864    1%       46     1% /inst
/dev/lv_sysbase     4194304   1847392   56%    13302     4% /sybase
6.磁带机清洁的检查:
命令:
#/usr/lpp/diagnostics/bin/utape -cd rmt0 –n
显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗。
6. 网络系统的检测:
1. 网卡的状态
命令:
#ifconfig –a
输出判断:
# ifconfig -a
en0:
flags=5e080863,c0
FFLOAD,PSEG,CHAIN>
        inet 10.0.0.5 netmask 0xffffff00 broadcast 10.0.0.255
        inet 192.168.100.2 netmask 0xffffff00 broadcast 10.193.211.255
en2:
flags=5e080863,c0
FFLOAD,PSEG,CHAIN>
        inet 10.0.1.5 netmask 0xffffff00 broadcast 10.0.1.255
lo0: flags=e08084b
        inet 127.0.0.1 netmask 0xff000000 broadcast 127.255.255.255
        inet6 ::1/0
         tcp_sendspace 131072 tcp_recvspace 131072 rfc1323 1  
主备网卡的flag为UP属正常。同时检查ip地址和netmask是否正确。
2. 路由的检测
命令:
# lsattr -El inet0
authm         65536                               Authentication Methods              True
bootup_option no                                  Use BSD-style Network Configuration True
gateway                                           Gateway                             True
hostname      wfsybase1                           Host Name                           True
rout6                                             IPv6 Route                          True
route         net,-hopcount,0,,,,,,0,192.168.100.1 Route  
3. 网络的检测
命令:
#ping [ip address]
输出判断:
用ping命令对/etc/hosts文件中的IP地址进行操作,检测网络是否联通。
8.系统DUMP设置的检查
命令:
#sysdumdev –l
输出判断:
结果应为
primary              /dev/lg_dumplv
secondary            /dev/sysdumpnull
copy directory       /var/adm/ras
forced copy flag     TRUE
always allow dump    FALSE
dump compression     ON
若不正确请用下列命令修改:
#sysdumdev –P –p /dev/hd6 –s /dev/sysdumpnull
9.HACMP 配置检测: Cluster Verification:
命令:
# /usr/sbin/cluster/diag/clconfig -v '-tr'
输出判断:
结果无Fail项输出。
# /usr/sbin/cluster/diag/clconfig -v '-tr'
10.系统硬件诊断:
  命令顺序为:
  1.#diag
2.Enter
3.Diagnostic Routines
4.System Verification
5.All Resources
6.F7
输出判断:
结果应为No trouble was found.
11.补丁程序(PTF)的检查  
1. 系统维护补丁,检查命令为:
#instfix –i |grep ML
    All filesets for 5.3.0.0_AIX_ML were found.
    All filesets for 5300-01_AIX_ML were found.
    All filesets for 5300-02_AIX_ML were found.
    All filesets for 5300-03_AIX_ML were found.
    All filesets for 5300-04_AIX_ML were found.
12.系统参数的检查
1.HIGH water mark for pending write I/Os
# lsattr -El sys0 |grep maxpout
输出判断:
结果应为
maxpout   33   HIGH water mark for pending write I/Os per file  True
2.LOW water mark for pending write I/Os
# lsattr -El sys0|grep minpout
输出判断:
结果应为
minpout   24   LOW water mark for pending write I/Os per file  True
更改命令为:
#chdev -l sys0 -a maxpout='33' -a minpout='24'
3.Syncd参数
# grep syncd /sbin/rc.boot
输出判断:
结果应为
nohup /usr/sbin/syncd 10 > /dev/null 2>&1 &
更改命令为:
#vi /sbin/rc.boot
4.aio参数
# lsdev -Cc aio
输出判断:
结果应为
aio0 Available  Asynchronous I/O (Legacy)
# lsattr -El aio0
输出判断:
结果应为
autoconfig available STATE to be configured at system restart True
fastpath   enable    State of fast path                       True
kprocprio  39        Server PRIORITY                          True
maxreqs    4096      Maximum number of REQUESTS               True
maxservers 10        MAXIMUM number of servers per cpu        True
minservers 1         MINIMUM number of servers                True
更改命令为:
#smitty aio
5.Limits文件的设置:
#ulimit –a
输出判断:
结果应为
time(seconds)        unlimited
file(blocks)         unlimited
data(kbytes)         unlimited
stack(kbytes)        4194304
memory(kbytes)       32768
coredump(blocks)     unlimited
nofiles(descriptors) 2000
基本的日常维护:
1. 文件系统是否满
方法: df –k 可以以K为单位检查文件系统的使用率。(90%以上,需要调整)
2. 检查系统出错日志 使用errpt |more来检查
清除现有的log: Errclear 0
3. 检查系统合法/非法登陆情况
使用Last命令来检查来自登陆的地方。
4. 检查系统是否有巨大的Core文件生成
使用 find / -name core –print来检查。对Core文件,一般直接删除就可以了。
5. 系统性能检查:
a) CPU性能:使用Vmstat, topas来检查
b) 内存使用情况:也是使用topas, vmstat来检查
c) 检查IO平衡使用情况:使用iostat来检查
d) 交换空间使用情况:使用lsps –a来检查
6. Mail检查
7. Diag 一个月一次


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/17749/showart_102919.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP