免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: platinum
打印 上一主题 下一主题

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2005-10-18 15:29 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

[quote]原帖由 "jackylau"]不会是负载过大的原因.我们单位做iptv,负荷比你重多了吧,也是e1000[/quote 发表:

你们的 iptv 服务器的 CPU 负载高吗?
我的服务器 CPU 一直很高
或者网络里面有人捣乱的话,用 dos 工具去弄网关这台机器,一样也会 over。。。。

论坛徽章:
0
12 [报告]
发表于 2005-10-18 16:54 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

watchdog是软件狗阿,它是在设备或程序不正常时reboot这设备/程序的,网卡的软狗是监测驱动的情况的,检测到错误为方式tx huang来做的强制reset.软件狗就起动了可见、缓冲区不够大是造成watchdog起动的结果,他在缓冲区满时reboot这设备,你cpu对两网卡的管理明显不对,你的网卡很可能不是厂家的驱动,不过这reboot不象cpu造成的,15:     108463    IO-APIC-edge  ide1, 倒是你IDE占cpu太多了,hdparm -c1 /dev/hda ,再hdparm  -i /dev/hda看下,还有你lsmod把结果列出来把。还有你的驱动是intel下的吗?请更新驱动,应该就ok了。若是linux自带的就快UP到intel的驱动把

论坛徽章:
0
13 [报告]
发表于 2005-10-18 16:59 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

原帖由 "platinum" 发表:

你们的 iptv 服务器的 CPU 负载高吗?
我的服务器 CPU 一直很高
或者网络里面有人捣乱的话,用 dos 工具去弄网关这台机器,一样也会 over。。。。

平常都是50%,都没问题

论坛徽章:
0
14 [报告]
发表于 2005-10-18 20:26 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

wheel 说的应该没错
INTEL的E1000芯片比较好
应该是驱动的问题,下载最新的源代码编驱动吧

论坛徽章:
0
15 [报告]
发表于 2005-10-18 20:34 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

[quote]原帖由 "wheel"]watchdog是软件狗阿,它是在设备或程序不正常时reboot这设备/程序的,网卡的软狗是监测驱动的情况的,检测到错误为方式tx huang来做的强制reset.软件狗就起动了可见、缓冲区不够大是造成watchdog起动的结果,他在缓?.........[/quote 发表:

这个倒是值得尝试的方法
另外你可以到交换机相应的段口看看statistic,有没有什么异常

论坛徽章:
0
16 [报告]
发表于 2005-10-18 22:16 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

BSD版以前讨论过,linux的原理一样

好的解决方案就是
确认机器瓶颈,什么流量堵死了网卡
升级e1000的驱动到最新

论坛徽章:
0
17 [报告]
发表于 2005-10-18 23:08 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

如果检查流量没有什么异常,更新驱动也没有什么效果的话,试试改变一下驱动参数,参考:
http://www.intel.com/support/network/sb/cs-009209.htm
其中有一段:
This value delays the generation of receive interrupts in units of 1.024 microseconds. Receive interrupt reduction can improve CPU efficiency if properly tuned for specific network traffic. Increasing this value adds extra latency to frame reception and can end up decreasing the throughput of TCP traffic. If the system is reporting dropped receives, this value may be set too high, causing the driver to run out of available receive descriptors.
CAUTION: When setting RxIntDelay to a value other than 0, adapters may hang (stop transmitting) under certain network conditions. If this occurs a NETDEV WATCHDOG message is logged in the system event log. In addition, the controller is automatically reset, restoring the network connection. To eliminate the potential for the hang ensure that RxIntDelay is set to zero.

减少RxIntDelay的值会增加cpu负载

论坛徽章:
0
18 [报告]
发表于 2005-10-19 01:34 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

尝试将网卡和交换机都指定为100M 全双工,不要让它们自动协商,以前碰见过类似的问题,指定就好了.

论坛徽章:
0
19 [报告]
发表于 2005-10-19 09:56 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

modprobe e1000 RxDescriptors=80,128
减少RxIntDelay的值会增加cpu负载,是值得的,还有这机器的IDE控制器的驱动好象也不是很好,能去下个厂家的驱动会减少不少CPU复载.
再把这文件
/etc/sysconfig/network-scripts/ifcfg-eth<x>;
加MTU = 9000
还有执行下
echo 7 >; /proc/sys/net/ipv4/tcp_retries2
echo 30 >; /proc/sys/net/ipv4/tcp_fin_timeout
echo 1024 >; /proc/sys/dev/rtc/max-user-freq
echo "99" >;/proc/sys/vm/swappiness
echo "using_tcq:32" >; /proc/ide/hda/setting
优化下TCP的连接时间,

论坛徽章:
0
20 [报告]
发表于 2005-10-19 11:26 |只看该作者

负载过大时,e1000_watchdog 反复 UP、DOWN 的问题

platinum   LZ 有结果了吗?想知道问题的解决方式。
谢谢!!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP