Chinaunix

标题: 【已解决】大型网络里某个时段同一个VLAN里的PC出现网页无法打开(里面有详细说明) [打印本页]

作者: zhushengxia    时间: 2009-03-07 16:46
标题: 【已解决】大型网络里某个时段同一个VLAN里的PC出现网页无法打开(里面有详细说明)
请教了\r\n   \r\n   有这样一个大型的网络环境,里面存在了很多的小局域网\r\n   3月以前这个网络里所有的电脑打开网页非常的正常,3月一开始到现在,有一个局域网里面都大约100多台PC ,这些PC 都是3月换的新电脑,电脑都装有隔离网卡,一个房间有3台PC,每台PC都接在一个5口的小交换机上面,小交换机上面接的楼层交换机,楼层交换机是H3C3600系列的交换机,楼层久直接接汇聚了,网关在汇聚上面,他们这些PC 都同时出现了网页打不开的现象,但是不在同一个时间段出现,网页只要多刷新几次就可以出来了,接下来打开网页就很正常了,之后过不了多久又会出现同样的情况,汇聚上接的是上网行为管理,里面做了网络访问控制,但是所有的VLAN 的策略都是一样的,其他的VLAN没有出现这样的情况,我自己接了一台笔记本在这个网段也出现在了同样的情况,笔记本换个网段就正常了,下班后我笔记本在接到有问题的这个VLAN 此时打开网站没有任何的问题。\r\n    我自己做了些分析,但是还找不到答案,太奇怪了\r\n\r\n    1.下班后网络流量没有那么大,也许是个原因导致有问题的那个VLAN 出现打不开的情况,但是为什么我接到其他的VLAN 没有问题呢?\r\n    2.如果是多个5口的小交换机接入的原因,为什么下班后久正常了呢?下班后这些5口交换机是没有关电的,很这个是否有关系呢?\r\n    3.电脑隔离卡的问题,下班后电脑基本上都关机了,所以是因为这个原因正常了?难道上班的时候因为他们装有隔离卡会导致网页有时候打不开?那也只会影响自己的电脑啊,怎么会影响其他的电脑呢?\r\n    4.网路出口,我们的出口是负载均衡,出公网一般都会实现智能选路,难道是这个原因造成的?如果是这个原因造成的,为什么其他VLAN的电脑没有这样的问题,我没有对这个VLAN做特别的限制,所有的VLAN 都是同样的策略。\r\n    5.局域网的问题,一共有4台交换机接到汇聚,都是多模光纤接入,接到汇聚4个不同的端口,一直都是正常使用,如果是硬件的问题,不应该会在同一个时刻出现的啊。\r\n    6.病毒的问题,我用ARP检测工具,没有发现有ARP 欺骗,用抓包的工具抓了下包,基本上都是和公网互联的IP和端口。\r\n    7,局域网里面不存在环路,如果存在环路就应该会使网络瘫痪,抓包的时候应该会发现大量不正常的包,但是我们看到。\r\n\r\n   我越分析越不知道从什么地方着手了,还请各位大虾指点一下小弟,谢了先\r\n\r\n  我补充一下\r\n  第一,我的隔离卡是用于内外网隔离的,这个内外网物理隔离的\r\n  第二,当我打不开网页的时候,我的一个同事是可以PING通这个网站的,而且延时不大,也不丢包,但是我打\r\n\r\n不开的时候,是延时很大,也丢包不在网关,也不在我出口里面所有的网络设备,而是在公网的某个地址。我是\r\n\r\ntracert看出来的。当到某个公网地址的时候延时很大。\n\n[ 本帖最后由 zhushengxia 于 2009-3-14 14:32 编辑 ]
作者: zhushengxia    时间: 2009-03-07 17:20
还请各位不吝赐教,我一直在线等
作者: hjp0021    时间: 2009-03-07 22:48
标题: 回复 #1 zhushengxia 的帖子
兄弟,你写太多了,我看的云里雾里。\r\n\r\n判断故障一步一步来嘛。
作者: zhushengxia    时间: 2009-03-08 16:00
我的出口是2条电信的100兆
作者: 双眼皮的猪    时间: 2009-03-08 17:06
文不如表,表不如图.把拓扑发上来,一眼明白...看上去有点乱的说.
作者: nrng_2006    时间: 2009-03-08 20:06
有可能1台机器的两个网卡都接在一个小交换机上
作者: ssffzz1    时间: 2009-03-09 09:05
1、比较2种状态下机器的ARP地址表和路由表。\r\n2、打不开网页的时候能否ping通网关?能否解析域名。
作者: zhushengxia    时间: 2009-03-09 10:28
谢谢你们的提醒\r\n\r\n     忘记说了,上个礼拜我还用科来的的网络分析软件看了,有很多TCP重传的数据包,是80 的端口,在这个时候我是可以PING通网关的。至于是否能够解析到域名,谢谢您的提醒,我下次会注意查看的。\r\n     今天我调整了下负载均衡的策略,让有问题的这个网段都负载比较少的那条链路出去,暂时没有发现故障,TCP重传也少了很多,有问题的时候就一台电脑1分钟就有100 多的重传,我现在做了端口镜像,100多台电脑也就几个重传。\r\n     隔离网卡内外网是否同时插在同一个交换机是还有待查证,当时我们接的时候没有,就是不知道他们使用后自己乱接了没有\n\n[ 本帖最后由 zhushengxia 于 2009-3-9 10:30 编辑 ]
作者: ssffzz1    时间: 2009-03-09 10:34
出现此现象,要多注意交换机的CPU负载,以及流量大小。
作者: mintongwzh    时间: 2009-03-09 10:42
看出口有没有问题,先网关再DNS\r\n\r\n然后再看拓扑哪里有问题
作者: cubzsd    时间: 2009-03-09 11:01
我们的单位的网络,和家里,好几个客户那里也有同样问题,网页要刷新很多次,图片经常是XX,估计电信在调整网络,要么DNS受攻击,或者出问题了是普遍现象,听说清理下IE缓存会暂时好
作者: zhushengxia    时间: 2009-03-09 11:19
DNS解析都是电信,202.103.96.112 ,我设置了2个DNS解析的地址,另外一个也是电信的,刚才我问了下我同事,他打不开网站的时候是可以解析到这个网址的。\r\n楼层交换机的负载我当时看了。数据包不是很大,CPU的使用率很低,一台交换机也就是30多台电脑,是H3C3600的,应该没有什么问题。\r\nIE 的缓存我也清理过了,不是这个问题引起的\r\n\r\n今天观察了一个上午,暂时还没有出现上个礼拜的情况,上面我说了改了下策略,不知道是不是这个原因,还得在观察一下。\r\n   谢谢各位
作者: cubzsd    时间: 2009-03-09 11:44
我单位用的IPTABLES做的透明代理,家里是ADSL直接出去的,都有这种问题,问朋友家里也有这种状况,单位和家里是江苏电信DNS,打不开网页肯定是一瞬间DNS解析失败,PING DNS是100%不丢包的连续PING了30分钟没有LOST一个
作者: zhushengxia    时间: 2009-03-09 12:37
我这里是湖南电信\r\n瞬间打不开不是网络里所有的VLAN 都有这样的情况,而是其中的一个VLAN出现的这样的情况。。。\r\n上午监测还没有出现问题
作者: ssffzz1    时间: 2009-03-09 13:07
现在这个问题又出现了吗?
作者: shenbo7    时间: 2009-03-10 11:50
感觉你的很多重传是由于封包经过的一台路由器把包丢弃了,至于丢弃的原因不清楚;
作者: zhushengxia    时间: 2009-03-10 14:40
从昨天到现在有问题的那个VLAN 网络正常。
作者: ssffzz1    时间: 2009-03-10 15:13
你再切换回来试试就OK了。
作者: zhushengxia    时间: 2009-03-14 14:27
谢谢各位的帮忙\r\n  问题已经解决了。。
作者: ssffzz1    时间: 2009-03-14 20:28
有事钟无艳,无事夏迎春。\r\n\r\n唉。  LEECH
作者: zhushengxia    时间: 2009-03-17 14:32
补充说明一下\r\n  \r\n    由于其中一条上互联网的链路过载,导致了此VLAN里面的用户在打开网页的时候出现偶尔打不开的现象,因为负载均衡里面设置的链路探测策略中,只要这个网段中其中一个地址能够访问百度,那么其他在同一VLAN下的地址打开百度的时候都不会在做链路探测,直接就把包送出去了,负载均衡有个轮询探测的机制,每2分钟探测一次,如果访问百度的人比较的多,那么在它的缓存里一直会出现,那么负载均衡就一直会让数据包走这条线路。。。除非这条线路物理中断,数据包才会走另外一条线路出去,当链路负载过重的时候,就出现了这样的情况,我改变了一下负载均衡的策略,做了链路负载,之前是数据探包测延时的策略。。。不知道我这样是否讲清楚了。。。。。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2