免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 9076 | 回复: 8

【故障处理】solaris10 /nfs/status服务absent [复制链接]

论坛徽章:
0
发表于 2011-07-26 10:57 |显示全部楼层
故障现象:富士通M5000主机重启后无法开启nfs服务,该主机无法作为nfs server提供服务,检查SMF服务后,发现svc:/network/nfs/status:default服务absent(服务丢失,在系统中无法发现):

bash-3.00# svcs -xv        <---------------查看系统未能正常启动的服务
svc:/network/nfs/nlockmgr:default (NFS lock manager)
State: offline since Fri Jul 22 12:58:00 2011
Reason: Dependency svc:/network/nfs/status is absent.
   See: http://sun.com/msg/SMF-8000-E2
   See: man -M /usr/share/man -s 1M lockd
Impact: 2 dependent services are not running:
        svc:/network/nfs/client:default
        svc:/network/nfs/server:default
bash-3.00# svcs -l svc:/network/nfs/nlockmgr:default                  <-----------------列出该服务的详细信息
fmri         svc:/network/nfs/nlockmgr:default
name         NFS lock manager
enabled      true
state        offline
next_state   none
state_time   Fri Jul 22 12:58:00 2011
restarter    svc:/system/svc/restarter:default
dependency   require_any/none svc:/milestone/network (online)
dependency   require_all/none svc:/network/rpc/bind (online)
dependency   require_all/none svc:/network/nfs/status (absent)
dependency   require_all/none svc:/system/filesystem/minimal (online)
bash-3.00# svcs -D svc:/network/nfs/nlockmgr:default                    <----------------------列出该服务的被依赖关系
STATE          STIME    FMRI
offline        12:58:00 svc:/network/nfs/client:default
offline        12:58:01 svc:/network/nfs/server:default
bash-3.00# svcs -a|grep nfs                            <-------------------显示所有跟nfs相关的服务,status服务并没有启动,已经丢失(absent)
online         12:58:08 svc:/network/nfs/mapid:default
online         12:58:08 svc:/network/nfs/cbd:default
online         12:58:11 svc:/network/nfs/rquota:default
offline        12:58:00 svc:/network/nfs/nlockmgr:default
offline        12:58:00 svc:/network/nfs/client:default
offline        12:58:01 svc:/network/nfs/server:default
由上面的关系可以看出,由于status服务缺失(absent),导致了nlockmgr服务无法正常启动,从而引起了被nlockmgr依赖的两个服务server和client也未能启动

故障恢复:由于服务缺失了,因此考虑用svccfg import service_manifest.xml方法来尝试status的配置文件手工导入,配置文件存放地点为/var/svc/manifest/network/nfs

bash-3.00# pwd
/var/svc/manifest/network/nfs
bash-3.00# svccfg import status.xml                 <------------------手工导入配置文件到repository库中
bash-3.00# svcs -a|grep nfs
online         12:58:08 svc:/network/nfs/cbd:default
online         12:58:11 svc:/network/nfs/rquota:default
online         14:05:45 svc:/network/nfs/mapid:default
online         21:39:32 svc:/network/nfs/nlockmgr:default
online         21:39:33 svc:/network/nfs/client:default
online         21:39:33 svc:/network/nfs/server:default
maintenance    21:40:55 svc:/network/nfs/status:default
bash-3.00# svcs -xv svc:/network/nfs/status:default                <---------------------status状态详细列表
svc:/network/nfs/status:default (NFS status monitor)
State: maintenance since Fri Jul 22 21:39:33 2011
Reason: Restarting too quickly.
   See: http://sun.com/msg/SMF-8000-L5
   See: man -M /usr/share/man -s 1M statd
   See: /var/svc/log/network-nfs-status:default.log
Impact: This service is not running.
bash-3.00# cat /var/svc/log/network-nfs-status:default.log             <-----------------------查看日志信息
[ Jul 22 21:39:08 Disabled. ]
[ Jul 22 21:39:08 Rereading configuration. ]
[ Jul 22 21:39:32 Enabled. ]
[ Jul 22 21:39:32 Executing start method ("/usr/lib/nfs/statd" ]
[ Jul 22 21:39:32 Method "start" exited with status 0 ]
[ Jul 22 21:39:32 Stopping because all processes in service exited. ]
[ Jul 22 21:39:32 Executing stop method (:kill) ]
[ Jul 22 21:39:32 Executing start method ("/usr/lib/nfs/statd" ]
[ Jul 22 21:39:32 Method "start" exited with status 0 ]
[ Jul 22 21:39:33 Stopping because all processes in service exited. ]
[ Jul 22 21:39:33 Executing stop method (:kill) ]
[ Jul 22 21:39:33 Executing start method ("/usr/lib/nfs/statd" ]
[ Jul 22 21:39:33 Method "start" exited with status 0 ]
[ Jul 22 21:39:33 Stopping because all processes in service exited. ]
[ Jul 22 21:39:33 Executing stop method (:kill) ]
[ Jul 22 21:39:33 Restarting too quickly, changing state to maintenance
突然想起之前我手工执行了启动 /nfs/status服务的method"/usr/lib/nfs/statd",可能是这个原因导致这里一直报错,无法online
bash-3.00# ps -ef |grep nfs
  daemon   815     1   0 12:58:09 ?           0:00 /usr/lib/nfs/nfs4cbd
  daemon   802     1   0 12:58:09 ?           0:00 /usr/lib/nfs/nfsmapid
    root  2435  1729   0 21:46:49 pts/2       0:00 grep nfs
    root  1997     1   0 21:39:34 ?           0:00 /usr/lib/nfs/mountd
  daemon  8022     1   0 14:00:25 ?           0:00 /usr/lib/nfs/lockd
  daemon  1999     1   0 21:39:34 ?           0:00 /usr/lib/nfs/nfsd
  daemon  7748     1   0 13:57:43 ?           0:00 /usr/lib/nfs/statd
bash-3.00# kill -9 7748                   <----------------------将之前手工执行方法后产生的后台进程杀掉
bash-3.00# ps -ef |grep nfs
  daemon   815     1   0 12:58:09 ?           0:00 /usr/lib/nfs/nfs4cbd
  daemon   802     1   0 12:58:09 ?           0:00 /usr/lib/nfs/nfsmapid
    root  1997     1   0 21:39:34 ?           0:00 /usr/lib/nfs/mountd
  daemon  8022     1   0 14:00:25 ?           0:00 /usr/lib/nfs/lockd
    root  2469  1729   0 21:47:33 pts/2       0:00 grep nfs
  daemon  1999     1   0 21:39:34 ?           0:00 /usr/lib/nfs/nfsd
bash-3.00# svcadm refresh svc:/network/nfs/status:default                    <-------------------刷新
bash-3.00# svcadm clear svc:/network/nfs/status:default                       <------------------修复后,重启
bash-3.00# svcs -a|grep nfs
online         12:58:08 svc:/network/nfs/cbd:default
online         12:58:11 svc:/network/nfs/rquota:default
online         14:05:45 svc:/network/nfs/mapid:default
online         21:39:32 svc:/network/nfs/nlockmgr:default
online         21:39:33 svc:/network/nfs/client:default
online         21:39:33 svc:/network/nfs/server:default
online         21:47:59 svc:/network/nfs/status:default
看着服务online了,眼泪花儿都包起了
故障解除。。。。。。
-------------------------------------------------------------------------------------------------------------------------------------------------------------
详细命令和smf相关信息参考solarisSMF.pdf    smf-workshop-ganesh.pdf
在此特别感谢asx_liu的顶力相助,
给他的相关帖子打个广告:一次Solaris 10 SMF服务管理恢复案例 :http://bbs.chinaunix.net/thread-1696016-1-1.html\"\"
第一次发帖,还请大家多多包涵:]

请大家不吝赐教,共同进步。。。。。。。。

smf-workshop-ganesh.pdf

415.61 KB, 下载次数: 161

SolarisSMF.pdf

121.62 KB, 下载次数: 170

论坛徽章:
0
发表于 2011-07-26 10:58 |显示全部楼层
顶一把,对不起,您两次发表间隔少于 30 秒,请不要灌水!

论坛徽章:
0
发表于 2011-07-26 11:10 |显示全部楼层
呵呵 ,多谢多谢,收藏了!

论坛徽章:
0
发表于 2011-07-26 12:10 |显示全部楼层
实战经验,收藏

论坛徽章:
1
2015年亚洲杯之沙特阿拉伯
日期:2015-04-10 13:59:00
发表于 2011-07-26 16:07 |显示全部楼层
好帖!~

论坛徽章:
0
发表于 2011-08-17 12:52 |显示全部楼层
顶一个,不错的学习案例。

论坛徽章:
0
发表于 2011-08-17 16:20 |显示全部楼层
谢谢liu sir

论坛徽章:
0
发表于 2013-11-19 15:13 |显示全部楼层
多谢楼主分享~

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:15操作系统版块每日发帖之星
日期:2016-01-21 06:20:00操作系统版块每日发帖之星
日期:2016-08-11 06:20:00
发表于 2013-11-20 12:15 |显示全部楼层
好东西,干货啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP