免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: 痴迷
打印 上一主题 下一主题

[SCO UNIX] SCO超难问题,盼高手帮忙 (已解决) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2003-11-28 10:21 |显示全部楼层 |倒序浏览
我单位因业务需要,建立了一套双机热备加磁盘阵列柜系统,IP地址分别是192.168.1.1和192.168.1.2。1为主机,2为备机。安装的是SCO OpenServer 5.0.5系统、热备软件、业务应用数据库。

后来因要对远程开始业务,另做了一台双网卡服务器,同样安装SCO 5.0.5,不同的是安装的是业务应用软件的Web服务器端。连通Internet,内网IP为192.168.1.11(以下简称11号机),外网也为固定IP。远程用户通过访问这台服务器,再通过业务应用软件的特殊IP指向内网的数据服务器192.168.1.1提取交换数据。

我单位购买了二套正版SCO,分别安装在双机热备的二台服务器中,序列号许可各不相同。但那台后启用的双网卡服务器的SCO的序列号与双机热备的二台服务器中的一台相同(好象是1号主机)。二年前开始运行时,双网卡服务器的SCO及1号机的SCO总是提示在网络中发现同一序列号的机器,后来不知何时不再出现提示。

这样正常运行了近二年,昨日,突然出现故障:11号机与1号主机突然失去联系,PING都PING不通。重启11号机后,在5分钟内能PING通1号主机,5分钟后自动中断。多次重启情况都是一样。
但11号机与其他内网计算机(包括2号备机)联系均正常。而1号主机与其他内网计算机联系也正常。也就是说,只1号主机与11号主机之间在每次重启五分钟后就不通了,其他都一切正常。

不得已,关掉1号主机,2号备机自动替换成1号机,一切恢复正常。

正常运行一天后,2号备机与11号主机之间联系再次中断。

怀疑热备软件出问题,连夜重做一台单机挂阵列,与其他机器通讯正常,但与Web机仍是开机后几分钟就失去联系。又重做Web机,Web机与 数据单机采用完全不同的系列号,

测试在内网使用无论是模拟远程还是客户端操作均正常,但上班时间到后真正的远程通讯一开始,Web机与数据机又失去联系,重启也只好使二三分钟就中断。

拔去Web机的外网网线,重启后与数据机联系一直正常。

将WEB服务器的外网网线与二台使用外网IP的机器安装在另外一台交换机上,交换机与其他交换设备及网线隔离,成为一套隔离真正外网的小局域网,用这二台机器通过外网IP测试远程通讯,仍然正常。

现远程业务已经因此中断五天之久,造成很坏影响。

分析:

可能的原因:

1、UNIX病毒造成,因二台服务器都重新做过,只业务应用的原数据在阵列中直接利用,可能阵列中的文件有病毒做怪,造成网络不通等现象。(但为什么只这二台之间不通?)

2、业务系统文件(可能是几个加载服务程序)出错,造成web机与数据机联系中断。(但为什么连PING都不通?)

3、针对UNIX系统的DDoS攻击或其他攻击造成TCP/IP堆栈崩溃。(但为什么只内网中的这二台服务器之间不通?)

可排除的原因:

1、服务器硬件原因,因更换过几台机器,故障依旧,所以不可能是服务器硬件原因。

2、SCO序列号冲突,因最后二台机器重做装了二个正版序列号,故障依旧,所以不可能是序列号冲突造成。

3、网络问题,因网线与交换机都更换过,故障依旧,所以不可能是网络问题。


请帮忙分析一下,盼回复。




拜托高手帮忙!万分感谢!

论坛徽章:
0
2 [报告]
发表于 2003-11-28 10:38 |显示全部楼层

SCO超难问题,盼高手帮忙 (已解决)

没人知道吗?

顶一下,要不就沉底了。

论坛徽章:
0
3 [报告]
发表于 2003-11-28 11:20 |显示全部楼层

SCO超难问题,盼高手帮忙 (已解决)

我只有这二个正版序列号。
换哪个都是冲突。

而且现在并不再有序列号冲突的提示了,不知为何?

另外如果是序列号冲突引起的网络故障,为什么会在正常运行了二年之后才出现呢?

论坛徽章:
0
4 [报告]
发表于 2003-11-28 12:13 |显示全部楼层

SCO超难问题,盼高手帮忙 (已解决)

谢谢大家,我试试先。大不了我重做套。

论坛徽章:
0
5 [报告]
发表于 2003-11-30 11:06 |显示全部楼层

SCO超难问题,盼高手帮忙 (已解决)

奇怪!

各种方法都试了还是不行!

我甚至把双机热备的二台数据服务器都换掉了,重做了一个SCO的服务器,单机挂阵列,故障依旧。
再把Web服务器换掉,也重做了一套SCO,与数据服务器完全不同的系列号(二套均正版),故障仍依旧。
拔掉Web服务器外网网线,只用内网就没有问题。

这到底是什么原因呀?

有人说可能是UNIX病毒做怪,也有人说是外网有类似DDoS的大量数据攻击造成的,还有人说是我们的业务应用软件出问题了。

到底是什么原因呢?怎么办才好呢?

论坛徽章:
0
6 [报告]
发表于 2003-12-01 14:08 |显示全部楼层

SCO超难问题,盼高手帮忙 (已解决)

内容已更改,顶一下,盼大家帮忙,如能解决,必有重谢!

论坛徽章:
0
7 [报告]
发表于 2003-12-01 16:15 |显示全部楼层

SCO超难问题,盼高手帮忙 (已解决)

[quote]原帖由 "saintdragon"]你的web服务器上外网吗??[/quote 发表:


上了呀,就是外网一连后十分钟不到二台机器就不通了呀。
如果拔掉外网网线就正常。

论坛徽章:
0
8 [报告]
发表于 2003-12-01 17:46 |显示全部楼层

SCO超难问题,盼高手帮忙 (已解决)

原帖由 "saintdragon" 发表:
外网是一个固定的internet的地址吗?
操作系统注册了吗?


外网是静态IP
操作系统是二套正版,花了十万¥

论坛徽章:
0
9 [报告]
发表于 2003-12-02 17:59 |显示全部楼层

SCO超难问题,盼高手帮忙 (已解决)

问题已解决.

发现在外网交换机上可以PING通一台IP与内网数据机相同的设备,与外网管理中心联系,得知其在四天前新添加了一块IP为192.168.1.1的无线网桥。让外网管理中心关掉网桥,内网Web数据机与Web机通讯恢复正常。

诊断:我部门外网交换机与单位主交换机是串连在一起的,而又没有VLAN隔断,因内网WEB服务器通过双网卡同时与内外网交换设备相通,而当外网交换设备上出现了一台默认IP为192.168.1.1(广播域为全网)的设备时,内网Web服务器访问这个IP时会因内外网同时存在同样的IP而造成紊乱,WEB服务器对此IP的访问被系统自动中止。

责任:单位外网管理中心不应该在外网因特网IP范围的交换设备中增加一台私网独有IP。

措施:单位外网管理中心修改网桥内网IP为公网IP。在主交换设备中划分VLAN将我部门外网交换机与外网管理中心其他交换机隔离,通过三层交换通讯。

教训:因大部分网络设备的初始IP多为192.168.1.1或254,所以服务器的IP最好不要设为1或254等易产生冲突的IP地址。

论坛徽章:
0
10 [报告]
发表于 2003-12-03 10:12 |显示全部楼层

SCO超难问题,盼高手帮忙 (已解决)

[quote]原帖由 "我爱scounix"]我想请教一下高手,如果同一子网呢 注册号冲突 两台机器同时报错的话大概多长时间主机会down掉呢?[/quote 发表:


原来我的三台SCO服务器中有二台是是同一序列号的,同时报错有很长时间,但一切正常,后来服务器干脆不报错了。这样维持了一年多,直到现在我重做了系统。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP