jackson198574 发表于 2015-12-10 14:03

回复 20# cgweb


    没关系,就是大家随便聊聊,关键是真实就好,可以回答问题,也可以就别人的回答进行交流和学习就OK,自由讨论,各抒己见~{:qq23:}

jackson198574 发表于 2015-12-10 14:05

回复 10# stay_sun


    最近在研究Zabbix,感觉内容很多,这也说明了这款软件的可玩儿性和可塑性挺高。{:qq23:}

jackson198574 发表于 2015-12-10 14:06

回复 11# jelephant


    葛总,你省略了3万多字的说明和感悟,请尽快补上。{:qq28:}

shenhua19891109 发表于 2015-12-10 14:16

1、工作中用到的是公司自己开发的监控系统,还是有一些不便之处的,比如说展示的时候,不能做到在同一个页面实现不同机器的监控状态;没有提供接口实现监控项的批量启停,监控系统一定要给用户一定的接口,否则只靠页面来操作,很费力的。
2、监控不单单是要过往的数据及趋势,还要有报警的功能,报警又分几种,(1)可以报出错误,(2)可以报出具体错误(这样可以更快定位问题),其中第2个问题是一个难点,根据业务的不同,定位的问题也不同,监控系统不可能面面俱到,所以说监控系统需要给使用者一定的定制化。另外监控系统也应该能够适应要监控对象的变化,比如说,数据库的集群中添加了一个实例,监控系统能够提供响应,或者提供接口调用,或者有模板,减少使用者的操作时间
3、监控系统可以看出过去某一个指标的变化趋势及取值,可以为容量规划提供建议,分析潜在的问题,另外通过报警确实能够报出一些问题(虽然有时不是及时的,或者误报),减少了人力成本。

另外只有一种监控有时也是不够的,可以实现对当前主监控系统补充级别的监控,要充分发挥各种监控系统的优点,如果有能力的话,也可以做对监控系统的监控。
此仅为个人之见,若有错误,请指出交流,谢谢!

stay_sun 发表于 2015-12-10 14:23

回复 22# jackson198574


    恩我们公司的zabbix服务器归我管现在用着感觉不错但是想用好的话还是需要研究下有时间得话可以交流啊

jackson198574 发表于 2015-12-10 14:30

回复 25# stay_sun


    好啊,太好了。{:qq33:} :handshake

jackson198574 发表于 2015-12-10 14:33

回复 24# shenhua19891109


    “对监控系统的监控”,有道理!

cryboy2001 发表于 2015-12-10 14:34

回复 14# jackson198574


    现在在用的是nagios,以前装好了,就没怎样动过,现在也分享不了什么。

stay_sun 发表于 2015-12-10 15:40

回复 26# jackson198574


    求书

jieforest 发表于 2015-12-10 16:30

1、你所用过的监控软件有哪些?感觉有什么优缺点?
我用过的监控工具还挺多的。
小工具有:
1)htop:可以查看服务器进程的实时情况。
2)iotop:可以查看服务器读写方面的实时情况。
3)pidstat:可以监控全部或指定进程占用系统资源的情况,如CPU,内存、设备IO、任务切换、线程等。
4)glances:对服务器整体情况进行查看,包括CPU核、负载、内存、数据交换、网络、磁盘I/O、数据加载、进程等。
5)vmstat:查看给定时间间隔的服务器的状态值,包括服务器的CPU使用率、内存使用情况、虚拟内存交换情况、IO读写情况等。
6)iostat:查看服务器的CPU时间片分配情况统计或硬盘IO统计。
7)其它:如free、top之类的
功能大而全的监控软件:
1)Ganglia:可用来监控系统性能,如CPU、内存、硬盘利用率、I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。
2)Nagios:能有效监控Windows、Linux和Unix的主机状态以及交换机路由器等网络设置,打印机等,能在系统或服务状态异常时发出邮件或短信报警。
3)Zabbix:监控服务器的方方面面,功能大而全。
4)监控宝:商业云监控软件,可监控应用、网站、API、网页性能、服务器、服务、数据库等。
小工具是我们最常用的,基本上经常会用到。功能大而全的监控软件我们相对更喜欢Zabbix。

2、你认为在监控软件的使用过程中,有哪些难点?
把监控软件用好并不容易,最早用过Cacti,这个软件就没用好。
精通监控软件跟运维团队的建设也密切相关,我们这边运维团队比较薄弱,监控工作做得不是很好。
由于很多现实因素和环境因素,我们的监控目前主要是购买监控宝的监控服务来做的,它涵盖了大部分服务器。

3、在监控软件使用过程中,有哪些收获?
我倾向于采用开源监控软件(比如Zabbix),自己实施监控方案。
监控工作很苦闷,在搞定问题时也能获得很多乐趣。
最大的收获还是在于知识和经验方面的收获,干久了积累自然就多了。
页: 1 2 [3] 4 5
查看完整版本: 【有奖讨论】数据中心运维,主要看气质,还要看品质,分享监控软件的点点滴滴。