Chinaunix

标题: [help]请教一个关于双机/etc/hosts的问题 [打印本页]

作者: chenjiesheng    时间: 2006-02-10 09:10
标题: [help]请教一个关于双机/etc/hosts的问题
双机的/etc/hosts配置文件是否要一致,如果不一致会长生什么问题.

我利用syslogd进程收集AIX上的告警,在clscp2(主机)上发现下面两条告警:
Message forwarded from clscp2: sendmail[680024]: unable to qualify my own domain name (loopback) -- using short name
Message forwarded from clscp2: sendmail[680024]: My unqualified host name (loopback) unknown; sleeping for retry
我怀疑是/etc/hosts配置文件的问题,但是用errpt却查不到任何东东.

请大家帮帮忙,谢谢
作者: chenjiesheng    时间: 2006-02-10 09:11
我的双机的/etc/hosts文件有一行是不一样的:
A机
0.0.0.0 A
B机
0.0.0.0 B
作者: kvxie    时间: 2006-02-10 09:30
这是sendmail的提示信息,跟双机没有关系,可以忽略
或者你配置好sendmail.cf的有关域名的设置
作者: chenjiesheng    时间: 2006-02-10 10:05
但是上面那两条告警是在我修改完其中一个IP地址之后产生的
我将ent1原来192.168.1.10改为0.0.0.0
这样子改不知道会带来什么影响啊
作者: Jens    时间: 2006-02-10 15:33
ha 是standby模式吗?

不懂的话,不要随便更改生产环境中的机器设置。这事可大可小的。

把Ha的定义信息,和 两台机的 hosts 文件贴出来,,,

再将两台的机  nestat -in 信息贴出来。。。
作者: ddmmdd    时间: 2006-02-10 16:52
/etc/hosts配置文件是不能用errpt 去找错的。
作者: chenjiesheng    时间: 2006-02-15 09:53
多谢老大门,这几天上不了网啊?
我原来clscp2的/etc/hosts文件
127.0.0.1                loopback localhost clscp2

168.1.1.201     clscp1_stb
212.184.2.201   clscp1_boot clscp1
168.1.1.202     clscp2_stb
212.184.2.202   clscp2_boot clscp2
212.184.2.133   clscp

168.1.1.204  clscp2
# netstat -in
Name  Mtu   Network     Address            Ipkts Ierrs    Opkts Oerrs  Coll
en0   1500  link#2      0.d.60.b.ae.24    402787124     0 12094132     0     0
en0   1500  168.1       168.1.1.202       402787124     0 12094132     0     0
en1   1500  link#3      0.2.55.cf.5b.b6     143969     0 11758612     0     0
en1   1500  168.1       168.1.1.204             143969     0 11758612     0     0
en2   1500  link#4      0.d.60.b.ae.39    909957799     0 515937570     0     0
en2   1500  212.184.0   212.184.2.133     909957799     0 515937570     0     0
lo0   16896 link#1                        265885232     0 265944150     0     0
lo0   16896 127         127.0.0.1         265885232     0 265944150     0     0
lo0   16896 ::1                           265885232     0 265944150     0     0

原来clscp1的/etc/hosts文件

127.0.0.1                loopback localhost clscp1

168.1.1.201     clscp1_stb
212.184.2.201   clscp1_boot clscp1
168.1.1.202     clscp2_stb
212.184.2.202   clscp2_boot clscp2
212.184.2.133   clscp

168.1.1.203   clscp1

[ 本帖最后由 chenjiesheng 于 2006-2-15 10:10 编辑 ]
作者: chenjiesheng    时间: 2006-02-15 10:01
这样的配置明显不对(主备机的standby网卡通信有问题,大概有60-70%的丢包),所以导致了小型机上每天都有告警,咨询了厂家后,最后确认/etc/hosts最后一行是多余的,修改成0.0.0.0(通过smitty tcpip修改)
双机的/etc/hosts都变成下面

clscp2的/etc/hosts文件

127.0.0.1                loopback localhost clscp2

168.1.1.201     clscp1_stb
212.184.2.201   clscp1_boot clscp1
168.1.1.202     clscp2_stb
212.184.2.202   clscp2_boot clscp2
212.184.2.133   clscp

0.0.0.0  clscp2

clscp1的/etc/hosts文件

127.0.0.1                loopback localhost clscp1

168.1.1.201     clscp1_stb
212.184.2.201   clscp1_boot clscp1
168.1.1.202     clscp2_stb
212.184.2.202   clscp2_boot clscp2
212.184.2.133   clscp

0.0.0.0   clscp1

[ 本帖最后由 chenjiesheng 于 2006-2-15 16:36 编辑 ]
作者: chenjiesheng    时间: 2006-02-15 10:03
但是我不明白为何修改成0.0.0.0,问了厂家,说这样就是删除网卡的IP,是这样吗?
作者: chenjiesheng    时间: 2006-02-15 10:05
我目前的网络状态是这样的
# netstat -in
Name  Mtu   Network     Address            Ipkts Ierrs    Opkts Oerrs  Coll
en0   1500  link#2      0.d.60.b.ae.24    402787124     0 12094132     0     0
en0   1500  168.1       168.1.1.202       402787124     0 12094132     0     0
en1   1500  link#3      0.2.55.cf.5b.b6     143969     0 11758612     0     0
en1   1500  0           0.0.0.0             143969     0 11758612     0     0
en2   1500  link#4      0.d.60.b.ae.39    909957799     0 515937570     0     0
en2   1500  212.184.0   212.184.2.133     909957799     0 515937570     0     0
lo0   16896 link#1                        265885232     0 265944150     0     0
lo0   16896 127         127.0.0.1         265885232     0 265944150     0     0
lo0   16896 ::1                           265885232     0 265944150     0     0

其中en1已经确定是没有用的,所以删除
作者: chenjiesheng    时间: 2006-02-15 10:13
我越来越糊涂了,好象下面两条告警和双机没有关系了
Message forwarded from clscp2: sendmail[680024]: unable to qualify my own domain name (loopback) -- using short name
Message forwarded from clscp2: sendmail[680024]: My unqualified host name (loopback) unknown; sleeping for retry
什么原因啊
作者: uncertificated    时间: 2006-02-15 11:18
127.0.0.1                loopback localhost clscp2

clscp2为什么要加在这一行上呢,目的是什么?
作者: chenjiesheng    时间: 2006-02-15 11:26
这个是本机地址啊 后面那个是主机名啊

[ 本帖最后由 chenjiesheng 于 2006-2-17 15:07 编辑 ]
作者: rain4321    时间: 2006-02-15 13:31
原帖由 chenjiesheng 于 2006-2-15 10:05 发表
我目前的网络状态是这样的
# netstat -in
Name  Mtu   Network     Address            Ipkts Ierrs    Opkts Oerrs  Coll
en0   1500  link#2      0.d.60.b.ae.24    402787124     0 12094132     0     0
...


我上次学到一个命令:#ifconfig ent1 detach即可以使ent1不可用,这样对应的IP即没有了,如果想恢复回去应可以用#ifconfig ent1.参考资料,可以查具体的命令使用说明。
作者: chenjiesheng    时间: 2006-02-15 16:18
明白您的意思,从网络列表中删除一个接口,对吗?

[ 本帖最后由 chenjiesheng 于 2006-2-15 16:34 编辑 ]
作者: chenjiesheng    时间: 2006-02-15 16:33
谢谢,大家啦!

现在已经确定小型机上面的告警已经确定和双机没有关系了.
最近利用syslogd进程收集小型机告警,东西太多了,呵呵,自己搞得糊涂啊!
具体收集告警的方法是
编辑/etc/syslog.conf文件,在该文件里增加下面信息:
*.err;kern.notice;daemon.notice;mail.crit;auth.notice /home/test/syslog.log
*.err;kern.notice;daemon.notice;mail.crit;auth.notice @IP --在远程弄个接受软件就OK啦
然后
stopsrc -s syslogd
startsrc -s syslogd
然后就OK啦
只要有任何消息都会往/home/test/syslog.log和一台主机发送了

不过详细的告警类别还在摸索中,如果有人知道,请帮帮忙,谢谢大家了.
作者: 新手上路samson    时间: 2006-02-16 09:56
楼住明显的瞎改服务地址,马上改回来吧,仔细学习一下 /etc/hosts文件的用法,只是简单的解析一下机器名和地址,你这样改同步的时候肯定出错
作者: uncertificated    时间: 2006-02-16 11:03
原帖由 chenjiesheng 于 2006-2-15 11:26 发表
这个是环回地址啊 后面那个是主机名啊

如果只是为了解析主机名的话,没有必要修改这一行……
作者: chenjiesheng    时间: 2006-02-17 15:13
如果只是为了解析主机名的话,没有必要修改这一行……



uncertificated  说的是啊!最后的主机名是多余的,我这边几套系统都加了主机名啊


作者: chenjiesheng    时间: 2006-02-17 15:14
关于我那个SENDMAIL错误消息IBM是这样解释的:
请您编辑文件/etc/hosts 举例如下(p630是机器的hostname)
127.0.0.1 loopback localhost
172.16.18.13 p630
修改后为
127.0.0.1 loopback localhost
172.16.18.13 p630 p630.
问题是由于原来hostname没有域名,所以报"unable to qualify my own domain name"及"My unqualified host name (loopback) unknown",修改后多加了个有"."的记录,sendmail就不会告警了.
这只是个警告信息,对系统没有什么特别影响.
作者: chenjiesheng    时间: 2006-02-17 15:18
原帖由 新手上路samson 于 2006-2-16 09:56 发表
楼住明显的瞎改服务地址,马上改回来吧,仔细学习一下 /etc/hosts文件的用法,只是简单的解析一下机器名和地址,你这样改同步的时候肯定出错


我想请教 samson :修改/etc/hosts文件后如何"同步"啊,(同步是指主备机之间的同步还是本机的"同步"啊)?我想多了解一些,请多赐教啊!




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2