- 论坛徽章:
- 1
|
将以前网上down的资料整理了一下
1、检查系统硬件情况
设备故障灯是否有亮
包括硬盘,阵列,光纤交换机,系统故障灯,磁带机等
是否有其它异常情况
2、系统错误报告(ERROR LOG),
errpt
是否有硬件故障
是否有软件故障
3、有否发给ROOT用户的错误报告(MAIL)
root用户下执行
mail
4、关键文件系统的使用率不大于80%
df –k
5、逻辑卷:有否“STALE”状态的逻辑卷
lsvg –l rootvg
6、页面空间使用率是否超过70%
lsps –a
7、内存交换区的大小是否为物理内存的2倍
此项根据物理内存大小区别对待
如果内存4g,则大小为2倍
如果内存>4g,则大小与内存一样即可
8、系统备份:
是否有符合要求的系统备份:
最后一次系统备份的时间:
是否符合要求的用户数据备份:
9、通信:网卡的状态、IP地址、路由表等
网卡通信(ping)
/etc/hosts 或DNS
ifconfig –a
netstat –in
lsattr –El inet0
netstat –rn
nslookup
10、是否有数据保护方式如raid10/raid5,是否有hot spare
主要是磁盘阵列,或根卷组磁盘镜像
磁盘阵列的raid与hotspare为硬件级别,可通过软件查看
根卷组磁盘镜像可以通过 lsvg –l rootvg查看lp与pp对比
11、机房环境
电源电压____
零地电压_____
温度、湿度_____
12、机器清洁(根据需要清洁机器各部件)
主要是磁带机以及外面板灰尘
13、补丁程序(PTF)
系统补丁级别:oslevel –r 、instfix –i | grep ML
最新补丁级别:
微代码(MICROCODE)
系统微代码:lscfg -vp | grep alt
最新微代码:
网卡、控制卡、硬盘微码是否需要升级 lscfg -vp
请与客户沟通是否需要升级系统补丁和微码
14、系统硬件诊断
主要通过查看 errpt,diag执行
系统板、CPU、内存、I/O板
网卡、SCSI卡、SSA卡
系统其它扩展卡
硬盘、磁盘阵列
磁带机、磁带库
15、检查hacmp.out smit.log bootlog,wtmp等日志文件
tail –100 hacmp.out
tail -100 smit.log
alog –t boot –o
last
16、系统性能
内存:svmon、lsps -a
Cpu :sar
硬盘:iostat
文件系统:filemon
其他命令: vmstat、topas、lvmstat
17、DUMP设备的检查
sysdumdev -l
18、磁带机是否需要清洗
/usr/lpp/diagnostics/bin/utape -cd rmt0 –n
显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗
19、系统参数的检查
1).HIGH water mark for pending write I/Os
# lsattr -El sys0 |grep maxpout
输出判断:
结果应为
maxpout 33 HIGH water mark for pending write I/Os per file True
2).LOW water mark for pending write I/Os
# lsattr -El sys0|grep minpout
输出判断:
结果应为
minpout 24 LOW water mark for pending write I/Os per file True
更改命令为:
#chdev -l sys0 -a maxpout='33' -a minpout='24'
3).Syncd参数
# grep syncd /sbin/rc.boot
输出判断:
结果应为
nohup /usr/sbin/syncd 10 > /dev/null 2>&1 &
更改命令为:
#vi /sbin/rc.boot
4).aio参数
# lsdev -Cc aio
输出判断:
结果应为
aio0 Available Asynchronous I/O
# lsattr -El aio0
输出判断:
结果应为
minservers 1 MINIMUM number of servers True
maxservers 10 MAXIMUM number of servers True
maxreqs 4096 Maximum number of REQUESTS True
kprocprio 39 Server PRIORITY True
autoconfig available STATE to be configured at system restart True
fastpath enable State of fast path True
更改命令为:
#smitty aio
5) /etc/environment文件中TZ不应有夏时制
20、检查errdemon, srcmstr是否正常运行
lssrc –s errdemon
lssrc –s srcmstr
ps –ef | grep erred
ps –ef | grep srcm
21、收集系统信息
运行#snap –ac
在/tmp/ibmsupt目录下生成压缩文件snap.pax.Z
zcat snap.pax.Z | pax -rv 解压到当前目录
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/16252/showart_102501.html |
|