专家坐堂：网站运维技术与实践（获奖名单已公布-2014-5-28） - 第4页 - 监控及自动化运维技术 - Chinaunix

send_linux 发表于 2014-05-15 13:15

reyleon 发表于 2014-05-15 11:28 static/image/common/back.gif
没做过网站运维,悲苦

那您是专职开发？现在不都流行运维开发么？不懂点的运维的开发没有市场哦:mrgreen:

reyleon 发表于 2014-05-15 13:25

send_linux 发表于 2014-05-15 13:15 static/image/common/back.gif
那您是专职开发？现在不都流行运维开发么？不懂点的运维的开发没有市场哦

我是运维呀,不过不是网站运维, 是游戏运维,相比网站运维,可能游戏运维技术含量没那么高呢

ice_ma 发表于 2014-05-15 16:44

看看·~~~:$:sleepy::sleepy:

send_linux 发表于 2014-05-15 18:14

reyleon 发表于 2014-05-15 13:25 static/image/common/back.gif
我是运维呀,不过不是网站运维, 是游戏运维,相比网站运维,可能游戏运维技术含量没那么高呢

没有吧，自动化运维方面的，游戏行业比较先进吧，批量的开服，合服啥的

heritrix 发表于 2014-05-15 20:44

1.运维工作中肯定少不了监控。那么在选择和部署监控系统时，你是更注重报警和趋势规划还是报表和数据可视化呢？
目前公司规模小，主要还是注重注重报警和趋势规划，以便在出问题的时候好及时处理，对问题进行预警和整理规划。例如硬盘存储瓶颈，CPU及内存瓶颈，网络瓶颈。

2.日志处理是网站运维最重要的工作之一。你偏向自己写脚本处理还是利用现成的框架？
目前来说写脚本已经可以满足项目需求，未来随着项目的扩大再进行一些技术上的规划。

4.说说读完试读章节后您的感想。
试读了一些章节，觉得书写的很细致，对日常维护的各个点都介绍的很详细，对一些技术上的难点进行了解读也提供了很多解决方案，对我非常有启发。

持续更新 发表于 2014-05-15 20:45

1.运维工作中肯定少不了监控。那么在选择和部署监控系统时，你是更注重报警和趋势规划还是报表和数据可视化呢？
   我认为问题出现后需要立即响应的，也就是注重报警的，使用nagios。
   收集数据用于日后分析的，注重报表的，使用cacti 和 opentsdb （nagios配合graphite作图其实也很不错）。
   如果监控的间隔低于一分钟，作图数据要精确到秒的，并且还需要立即响应的，数据发给opentsdb，并使用nagios 的被动监控功能。

2.日志处理是网站运维最重要的工作之一。你偏向自己写脚本处理还是利用现成的框架？
   我更喜欢使用现有的流行的东西，相信整个行业的智慧，目前正在研究logstash。
   自己写脚本可以满足自己特殊的需求。

3.欢迎大家就网站运维技术各方面问题向饶琛琳 ID:chenryn 提问。
   对监控成本的把握一直是一个棘手问题。
   举个例子， nagios 用户对内存， cpu的占用率应该被限制到多少？


4.说说读完试读章节后您的感想。
   看了试读章节，例举了监控日志的一系列解决方案，应当是一本好书。

x9x9 发表于 2014-05-16 00:24

顶一下。

作者作为国内知名网站的高级运维，同时对 Perl／Ruby 等语言运用纯熟，具有深厚的开发功力。且从博客内容可见涉猎广博，不吝将所学所悟倾尽其言。对诸运维工具的适用场景、部署排错皆能有深度的解读。推荐运维及运维开发参考研读。

:mrgreen: :mrgreen: :mrgreen:

send_linux 发表于 2014-05-16 01:04

x9x9 发表于 2014-05-16 00:24 static/image/common/back.gif
顶一下。

作者作为国内知名网站的高级运维，同时对 Perl／Ruby 等语言运用纯熟，具有深厚的开发功 ...

楼主貌似很久没有出现了，嘿嘿:em03:
欢迎回归~

x9x9 发表于 2014-05-16 13:23

回复 38# send_linux

还是会经常来的：）

小飞侠xl 发表于 2014-05-16 22:48

问下你们的报警频率是怎么设置的？如果持续出问题会不会报警邮件会很多（这个如何避免？）另外logstash你们都用了哪些功能回复 36# 持续更新

页: 1 2 3 [4] 5 6 7

Chinaunix's Archiver