penguinstorm 发表于 2007-11-02 19:57

E3500故障处理:机器重启时好时坏

   上次提到客户那儿一台E3500机器出现故障,故障经过是客户通过远程控制台对机器reboot之后发现机器启不来了,观察之后发现机器停留在ok提示符下,不过任何操作均告失败。无奈之下,只好把机器做断电处理然后重新开机,这样才重新进入到系统。
   在观察机器的启动过程中发现有报时钟板和IO板不匹配的问题,但这并不是阻碍机器启动的主要原因,通过命令“copy-clock-tod-to-io-boards“在ok提示符下同步时钟板和IO板后,机器开机自检时显示时钟板与IO板状态均为“normal”,启动系统时也不再报之前的问题,但实际隐患仍然存在。
   通过eeprom命令观察系统里设置的启动列表,如下:
bootdevice=/sbus@2,0/SUNW,socal@d,10000/sf@0,0/ssd@w22000004cf2f40aa,0:a
/sbus@2,0/SUNW,socal@d,10000/sf@0,0/ssd@w2100002037c85499,0
nvramrc=devalias disk /sbus@2,0/SUNW,socal@d,10000/sf@0,0/ssd@w*
   可见在nvramrc里别名disk对应的物理路径并没有确定到具体设备,而boot device里出现两个物理路径,也没有使用别名方式来启动系统,而是通过直接指定物理路径的方式。查找这两条物理路径,一条正是启动盘c0t0d0正确路径,而另一条路径却遍寻不到。根据常规,boot device中设定的物理路径应该有先后顺序,也就是说系统默认按物理路径的先后顺序来启动系统,也就是每次启动应该都是从系统盘c0t0d0启动,但是否有时候也莫名其妙的从第二条物理路径/sbus@2,0/SUNW,socal@d,10000/sf@0,0/ssd@w2100002037c85499,0启动,这个不得而知。
   基于这种情况,所考虑的操作便是除去多余的物理路径,并通过别名的方式指定唯一的启动路径,操作如下:
1,# eeprom "
nvramrc=devalias mydisk /sbus@2,0/SUNW,socal@d,10000/sf@0,0/ssd@w22000004cf2f40aa,0:a
"
2,# eeprom boot device=mydisk
通过远程控制台“reboot”测试,成功。

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/6589/showart_413450.html
页: [1]
查看完整版本: E3500故障处理:机器重启时好时坏