- 论坛徽章:
- 0
|
好郁闷啊,两个月没摸AIX了,完全生疏了,出了问题也奇怪了。看来AIX这东西是:不打不直溜,不敲哏揪揪;不学不明白,不能乱忽悠。
问题描述及疑惑:
在做一个5204-5207的ML升级过程当中,从04-05 update all时,出个报错,说devices.chrp.base.rte.升级失败。(并不是提示说缺少基础包的错误),提示,说 platform dump fs 无法执行devices.chrp.base.rte.post_u.sh这个脚本。
用lslpp -l|grep devices.chrp.base.rte 显示两行
devices.chrp.base.rte 5.2.0.52 COMMITTED RISC PC Base System Device
devices.chrp.base.rte 5.2.0.50 COMMITTED RISC PC Base System Device
其中50是基础版本,52是打完ML05之后的版本。这就说明其实这个包还是打上去了。
那问题是:为什么会出现两行同样的显示?为什么只能有其中一个发生了改变?
分析过程:
看升级补丁过程中,查看错误
mount: /dev/fwdump on /var/adm/ras/platform: Invalid argument
update: Failed while executing the devices.chrp.base.rte.post_u script.
installp: The installation has FAILED for the "root" part
of the following filesets:
devices.chrp.base.rte 5.2.0.52
分析点一:无法挂起/dev/fwdump,下边是通过他的提示找到devices.chrp.base.rte.post_u.sh这个脚本。其中的关键内容
# supported, create platform dump fs.
fstype=`/usr/sbin/lsfs -c /var | /usr/bin/egrep '^/var' | /usr/bin/cut -d':' -f3`
[ $? -ne 0 -o -z "$fstype" ] && exit 1
# Run platform_dump, it's ok if it's already set up.
# This will refresh error notification also.
/usr/sbin/platform_dump -f$fstype $testparm
[ $? -ne 0 ] && exit 1
exit 0
这个脚本就是在判断这个系统是否支持PLATFORM_DUMP系统,也就是在说,是否是CHRP系统。这个绝对问题啊,P5的机器肯定是了。怎么会提示这个呢
分析点二:说安装软件的root部分失败。我们都知道一个软件包分ROOT部分、USR部分、SHARE部分组成,它提示说ROOT部分损坏,是不是就会说补丁本身就有问题呢?
解决步骤:
1、既然说软件的root部分损坏,就重新下这个包吧,下完了打上去。无效!
2、那就说明不是软件的问题。再接着返回去研究这个脚本
我分布执行他脚本中的命令。发现lsfs -c 发现输出结果
是啊, 用lsfs看
/var/adm/ras/platform:/dev/fwdump:jfs:::0:rw:no:no
而好的机器是
/var/adm/ras/platform:/dev/fwdump:jfs:::765423:rw:no:no
才恍然大悟,原来/dev/fsdump,空间不足,所以才会提示无法挂起。
最终解决方法:
后来采用直接增加空间大小,不成功。删除之,在重新mklv \crfs \mount 建的跟原来一样。再重新打补丁。成功。
原因分析:
原来虽然存在/dev/fwdump这个文件系统,但是它的空间大小为0,回想一下,也许跟倒磁带的时候,没有倒出这个DUMP空间造成的吧(只有安装的机器正常,其他倒磁带的4台机器都此故障)。因为/dev/fwdump是在系统安装的时候,根据内存大小自动生成的一个留给系统DUMP时所做的一个转储空间。而倒带的时候,没倒上去所致。
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/3154/showart_141151.html |
|