- 论坛徽章:
- 0
|
本帖最后由 yunas 于 2014-05-25 21:00 编辑
支持好书,支持好话题,点赞。
1.运维工作中肯定少不了监控。那么在选择和部署监控系统时,你是更注重报警和趋势规划还是报表和数据可视化呢?
关于监控方面。更注重即时报警和趋势比较图。这两种比较结合起来比较容易、快速、精准定位问题。
监控软件以cacti+nagois为主,以及zabbix做辅助。其他的例如Smokeping功能还是在ping的监控上,也是它设计的初衷吧。
Zenoss优点是集网络与系统管理软件;Ganglia优点是集群监视项目,体现的是集群节点的监控状态。
上面这些软件的共同特点都是“开源”。只是各应用的监控环境,场景不同,各适用不同场景。都是为了“监控而生”哈哈。
Cacti+Nagios结合使用,是目前的主流。相互结合,互换补充,目前是个非常不错的部署方案。
Cacti的界面非常漂亮。Cacti其实是一套php程序,它运用snmpget采集数据,使用rrdtool绘图,无需明白rrdtool的参数能轻易的绘出漂亮的图形。
Nagios是一款用于系统和网络监控的应用程序并遵循GPL协定。它可以在你设定的条件下对主机和服务进行监控,在状态变差和变好的时候给出告警信息。
Cacti走势图的绘制是它的优点,又是它主要强大功能。Nagios是对服务进行监控和报警,这个是它的优势和功能特点。两者结合是强强组合。
丰富的第三方插件都是两者最大的优点,nagios调用飞信接口估计是最多人用的。因为他免费,又及时。Nagios结合PnP应用更加方便。
cacti在监控方面有良好的绘图,cacti在流量和图型塑造上要强于nagios,但是在故障分析上有些略逊,而且报警机制也有待完善,这时nagios就派上用场了。
nagios :适合监视大量服务器上面的大批服务是否正常, 重点并不在图形化的监控, 其集成的很多功能例如报警,都是 cacti没有或者很弱的。但在绘图以及图型塑造方面精细度比cacti要弱。
因此在网站的监控方面,即时报警和趋势比较图很重要。也是排查问题的重要方法和云雾监控技巧。
2.日志处理是网站运维最重要的工作之一。你偏向自己写脚本处理还是利用现成的框架?
日志处理的处理方法目前都是使用shell脚本,根据实际的需求写shell脚本完成批量操作。
同时网站运维最重要的工作也是重要的方法是自己写脚本处理。
如果是现成的分析工具,通常都是辅助工具。
利用现成的框架,这种框架目前互联网上很少,大多数都是开源软件,然后这些软件通常难以通用。因为实际使用中,日志格式都是自定义的,然后开源分析软件并不统一。
这就产生复用率的问题。因此开源的软件、利用现成的框架复用性比较差。
网站运维中,分析网站状况非常重要的方法其中就是:分析日志
关于Linux平台下的运维人员,还是推荐Shell加Perl的组合,毕竟那么多年过来了。这个组合一直在为各大网站的工程师们稳定的工作着。另外,Python也是一个非常值得推荐利器。这种语言具有非常简捷而清晰的语法特点,适合完成各种高层任务,几乎可以在所有的操作系统中运行。目前,基于这种语言的相关技术正在飞速的发展,用户数量急剧扩大,相关的资源非常多。
说以,网站运往必须都是需要使用shell脚本,根据实际的需求写shell脚本完成批量操作。
3.欢迎大家就网站运维技术各方面问题向 饶琛琳 ID:chenryn 提问。
无。
4.说说读完试读章节后您的感想。
看了目录和试读章节,网站访问监测、日志分析与报警、部署方案部分不错。运维思想和运维方法,是一本很好的参考书。
现在运维方面的书籍越来越多,内容丰富很多了。值得读者好好学习运维中的实践解决方法。很多参考资料和工具软件、开源软件、解决案例是运维最实用的。很多解决方案,技术难点进行分析和解说。
软件的安装是最基础的,这方面的书籍目前很多,对初学者比较有参考用。安装中常见的问题、常遇到的问题,或者解决方法,是运维工作中最常遇到,也是比较实用的。
这是属于运维的基础,扎实的韵味基础非常重要。
|
|