Chinaunix

标题: 【求助诊断】solaris运行半年后无法telnet,能ping通。 [打印本页]

作者: seu07201213    时间: 2011-03-01 13:49
标题: 【求助诊断】solaris运行半年后无法telnet,能ping通。
[主机型号]Sun-Fire-V890
[系统版本] Solaris 10 10/08 s10s_u6wos_07b SPARC

  主机系统运行半年后,telnet 连不上,上面跑的应用服务也无法连接。但是能ping通主机。无奈只好去机房强行重启了主机后,恢复正常。

刚开始怀疑是否有网络攻击,或者是系统连接用完。但是从系统日志里也看不出名堂,担心下次还会再发生此类故障。

不知道有其他达人处理过类似的故障么。或者说用什么命令查看系统运行的最大连接,和监控目前用了多少连接。

作者: yoyosys    时间: 2011-03-01 14:12
你看下系统日志,是否telnet服务挂掉了
作者: seu07201213    时间: 2011-03-01 14:20
发生故障时的系统日志:
Feb 28 08:50:50 sun890fbdb ip: [ID 995438 kern.warning] WARNING: High TCP connect timeout rate! System (port 7001) may be under a SYN flood attack!
Feb 28 15:37:21 sun890fbdb in.mpathd[163]: [ID 168056 daemon.error] All Interfaces in group ipmp1 have failed
Feb 28 15:37:21 sun890fbdb Cluster.PNM: [ID 890413 daemon.notice] ipmp1: state transition from OK to DOWN.

没有出现telnet服务挂掉的现象,发生故障时其他任何连接都连不上。
作者: seu07201213    时间: 2011-03-01 17:40
急盼解答。
作者: 82518541    时间: 2011-03-01 18:44
是否telnet服务挂掉了
作者: jcr240    时间: 2011-03-02 10:07
IPMP问题。。。
作者: yuhuohu    时间: 2011-03-02 10:22
发生故障时的系统日志:
Feb 28 08:50:50 sun890fbdb ip:  WARNING: High TCP connect timeout rate! Syst ...
seu07201213 发表于 2011-03-01 14:20



    第一行,提示说有大量的tcp连接请求超时,提示可能有tcp的泛洪攻击

然后就出故障了
作者: seu07201213    时间: 2011-03-06 21:49
WARNING: High TCP connect timeout rate!

这个几年前就这样了,每几天有一次,应该不是这个问题。

我用netstat -an 查看网络连接资源,貌似每天都在上升,怎样才能释放这些连接呢?

192.168.20.35.4100   192.168.20.15.39526  49152      0 49152      0 ESTABLISHED
192.168.20.15.45333  192.168.20.36.5100   49640      0 49640      0 ESTABLISHED
192.168.20.35.4100   192.168.20.16.37315  49640      0 49640      0 ESTABLISHED
192.168.20.15.42074  192.168.20.36.5100   49640      0 49640      0 ESTABLISHED
192.168.20.15.39527  192.168.20.35.4100   49152      0 49152      0 ESTABLISHED
192.168.20.15.42075  192.168.20.35.4100   49152      0 49152      0 ESTABLISHED
192.168.20.35.4100   192.168.20.15.39527  49152      0 49763      0 ESTABLISHED
192.168.20.35.4100   192.168.20.15.42075  49152      0 49763      0 ESTABLISHED
192.168.20.15.42076  192.168.20.35.4100   49152      0 49152      0 ESTABLISHED
192.168.20.15.39528  192.168.20.35.4100   49152      0 49152      0 ESTABLISHED
192.168.20.15.48496  192.168.20.35.4100   49152      0 49152      0 ESTABLISHED
192.168.20.35.4100   192.168.20.15.42076  49152      0 49763      0 ESTABLISHED
作者: seu07201213    时间: 2011-03-06 21:51
IPMP问题。。。
jcr240 发表于 2011-03-02 10:07



    这个是何解?求详细。。。
作者: yulemi    时间: 2011-03-06 23:17
Feb 28 15:37:21 sun890fbdb in.mpathd[163]: [ID 168056 daemon.error] All Interfaces in group ipmp1 have failed
Feb 28 15:37:21 sun890fbdb Cluster.PNM: [ID 890413 daemon.notice] ipmp1: state transition from OK to DOWN.


仔细检查你的IPMP
作者: seagull76    时间: 2011-03-08 16:47
估计是网络风暴引起的,让网络工程师查查,看有没有环路之类的问题。
作者: seu07201213    时间: 2011-11-15 13:09
时隔大半年,再次出现这个问题,能ping通,但是无法telnet,所有网络应用连不上。

因没有串口线连SUN小机,还是进行了硬重启后,恢复正常。

检查系统日志,在出现异常时,应用没有内存溢出,也没有产生无法连接数据库的日志(应用和数据库在同一个机主机上)。 怀疑可能还是网络连接资源耗尽了。网络风暴应该不太可能。

不知道solaris是否有监控网络连接情况及修改最大连接数的命令?
作者: seu07201213    时间: 2012-12-02 09:41
问题已解决,结帖。以上猜测都不对。 原因为:当时的网关有问题,偶尔不通,双机判断到网关不通时,ipmp停止工作。解决办法,多增加几个路由,保证不受网关影响。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2