免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: winisky
打印 上一主题 下一主题

cacti监控流量有毛刺 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2011-10-19 17:54 |只看该作者
这个不一定是cacti的问题,也有可能是设备本身的问题。

论坛徽章:
0
12 [报告]
发表于 2011-10-19 17:55 |只看该作者
取流速的原理就是设备上有个计数器,一般是64位的,在64位计数满的时候,就进行反转,所以,如果设备上的计数器有问题的话,可能出来的值就会存在问题。

论坛徽章:
0
13 [报告]
发表于 2011-10-19 17:59 |只看该作者
LZ提到的时间同步也是有可能的,最好cacti的采集设备和你监控的网络设备之间做了NTP同步,cacti是以本机时间来作为计算依据的,如果你改了相关时间,有可能出现相关状况。

论坛徽章:
0
14 [报告]
发表于 2011-10-20 16:16 |只看该作者
回复 12# 天雨无心

首先3Q仁兄,

    能不能详细介绍下 计数器 和反转,或给个资料参阅下呢!  新上的机器上还发现了另外一个问题,首先我的机器是双线的IP,有监控电信和网通节点的设备,我用电信作默认网关的话,加网通的路由,但网通节点的流量还是有继续;用网通作默认网关的话,加电信路由,电信节点流量也是有断续。加了路由我在机器上做路由测试,能够达到电信走电信,网通走网通;但是取流量的时候路由不是跟据系统的路由来走的吗?好生奇怪啊!

如下图:

论坛徽章:
0
15 [报告]
发表于 2011-10-20 16:59 |只看该作者
回复  天雨无心

首先3Q仁兄,

    能不能详细介绍下 计数器 和反转,或给个资料参阅下呢!  新上的机 ...
winisky 发表于 2011-10-20 16:16



计数器目前一般是64位的,早的设备是32位的,现在一般很少了。64位的计数器能统计的流量总量就是2的64次方,达到2的64次方-1后,就开始反转,就是从0开始从新计数,所以在网管软件里面,在发现本次采集的流量值小于上次的时候,会加上2的64次方,然后再减。

所谓的速率其实都是根据流量值除以采集周期获取的这段时间内的平均流速,不是精确的流速,这样讲不知道是不是比较清楚了。

论坛徽章:
0
16 [报告]
发表于 2011-10-20 17:04 |只看该作者
回复  天雨无心

首先3Q仁兄,

    能不能详细介绍下 计数器 和反转,或给个资料参阅下呢!  新上的机 ...
winisky 发表于 2011-10-20 16:16



你走双线的情况,非常建议你通过2台不同的设备去监控各自的设备流量,因为从网通连接出去的时候,会走网通的路由出去,如果这时候到电信去,会绕很大一个圈子,反之亦然。你可以通过TraceRoute跟踪一下,或者看一下TTL,而且因为会走关口局,所以在各个省出口有可能遇到流量打压,同时,考虑到网络设备本身可能比较繁忙,就非常容易出现丢包的情况。

论坛徽章:
0
17 [报告]
发表于 2011-10-21 09:44 |只看该作者
回复 16# 天雨无心


    电信和网通互联我知道的啊。
我的意思是说我有电信和网通双IP,当然也就有电信和网通两个网关。我可以选定一个做默认网关,另一个加静态路由。tracert 路由的时候就不会出现跨网访问的问题。

如下:

[root@cactiserver ~]# route -n
Kernel IP routing table
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface
58.251.*.0     0.0.0.0         255.255.255.128 U     0      0        0 eth1                     ---网通IP
202.104.*.0   0.0.0.0         255.255.255.128 U     0      0        0 eth1                     ---电信ip
60.8.63.0       58.251.*.1     255.255.255.0   UG    0      0        0 eth1
221.238.191.0   58.251.*.1     255.255.255.0   UG    0      0        0 eth1
169.254.0.0     0.0.0.0         255.255.0.0     U     0      0        0 eth1
61.156.0.0      58.251.*.1     255.255.0.0     UG    0      0        0 eth1                   静态路由,网通网关
218.8.0.0       58.251.*.1     255.254.0.0     UG    0      0        0 eth1
125.36.0.0      58.251.*.1     255.252.0.0     UG    0      0        0 eth1
122.136.0.0     58.251.*.1     255.248.0.0     UG    0      0        0 eth1
123.128.0.0     58.251.*.1     255.248.0.0     UG    0      0        0 eth1
112.88.0.0      58.251.*.1     255.248.0.0     UG    0      0        0 eth1
0.0.0.0         202.104.*.1   0.0.0.0         UG    0      0        0 eth1                         默认网关(电信)

论坛徽章:
0
18 [报告]
发表于 2011-10-21 10:54 |只看该作者

  1. 出现异常的时间点是否正好是同步时间的时间点?

  2. 还有,分析一下你的服务器时间是否有异常,比如,每次时间同步的时候,差值都比较大

  3. 还有,你的设备是否也与时间服务器进行同步?

  4. 建议你在设立一个自己的时间服务器,然后你的设备和服务器都与你自己的时间服务器进行同步

  5. 再观察观察,也许就是时间的问题
复制代码

论坛徽章:
0
19 [报告]
发表于 2011-10-21 13:10 |只看该作者
回复  天雨无心


    电信和网通互联我知道的啊。
我的意思是说我有电信和网通双IP,当然也就有电信和 ...
winisky 发表于 2011-10-21 09:44



如果网络路由没有问题的话,主要的就是设备响应和网络开销了,这个和cacti本身的采集超时时长就有关系了,另外,还涉及到cacti一次性读Mib节点的机制,很难精确定位,如果你同时采集CPU、内存、流量信息的时候,可以做一下相同时间段的如图比较,想办法定位一下。

论坛徽章:
0
20 [报告]
发表于 2011-10-21 13:11 |只看该作者
springwind426 发表于 2011-10-21 10:54



    NTP同步的可能性有,不过如果经常出现,就应该不是有没有做NTP同步的问题。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP