免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2822 | 回复: 5
打印 上一主题 下一主题

【已解决】我也不算菜鸟了,可LVS也不能这样玩儿我吧!NAT模式只能跑4个小时? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-03-05 09:39 |只看该作者 |倒序浏览
本帖最后由 busyant 于 2010-03-07 14:00 编辑

用RHEL 5.4 弄了一套LVS+mail server,router和real server都是双节点。简单测试下来一切正常,也简单做了一下高并发测试,没发现问题。
上线后问题来了:

跑了大概2天后,用户反映外部邮件有较大延迟,上梭子鱼垃圾邮件防火墙一看,乖乖,1.5万多的out队列,原因无一例外是“connect to xxx.xxx.241.96 timeout”,这可就奇了,rs和lvs router的负载都极低,网络连接数ESTABLISHED状态的也不到200。没办法,只好紧急改了realserver的IP,切成单机工作模式。

昨天设置 ipvsadm --set 180 30 100 后,切了一台RS过来收邮件,一开始一切正常,我1分钟内发了600封邮件给邮件防火墙,也能很快发进来。没想到大概4小时后再看防火墙的队列,“connect to xxx.xxx.241.96 timeout”的情况又出来了,队列开始拥堵。

我简直想不通了,是LVS NAT模式下性能很烂? 还是我人品有问题?

今天过来重新跑起来看了一下,发现RS上好多与防火墙间FIN_WAIT1 和FIN_WAIT2 的连接,也就是半关闭,在等待防火墙关闭的连接。而单机模式下,最多的是time_wait。
不知道是不是和修改了ipvsadm --set 180 30 100有关。

难道没有大家用lvs都很正常?

论坛徽章:
0
2 [报告]
发表于 2010-03-05 15:34 |只看该作者
NND,FIN_WAIT 的问题找到了。
因为之前要加connlimit限制并发连接数,在lvs router上加了这个iptables规则:

iptables -A INPUT -p tcp -m conntrack --ctstate INVALID -j DROP

估计是iptables的conntrack和LVS的NAT forward配合有问题,没详细深究。
我脑子也秀逗的,之前做的lvs没有问题的,基本的差别也就在这条规则上了。笨!
去掉这个规则后FIN_WAIT问题就没有了。
现在继续跑着,看看3-4小时后timeout的问题还会不会再出现。

论坛徽章:
0
3 [报告]
发表于 2010-03-07 13:59 |只看该作者
周末跑了一整天,没出现“4小时”的问题了,看来是被iptables给玩了!害得我这个项目延迟了一个星期。郁闷!

论坛徽章:
0
4 [报告]
发表于 2010-03-07 16:35 |只看该作者
能找出区别发现问题,楼主,恭喜你呀。

论坛徽章:
0
5 [报告]
发表于 2010-03-08 09:18 |只看该作者
顶  感谢楼主把自己的问题原因给出来~

论坛徽章:
0
6 [报告]
发表于 2010-03-08 09:19 |只看该作者
顶  感谢楼主分享问题原因~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP