send_linux
发表于 2014-05-15 13:15
reyleon 发表于 2014-05-15 11:28 static/image/common/back.gif
没做过网站运维,悲苦
那您是专职开发?现在不都流行运维开发么?不懂点的运维的开发没有市场哦:mrgreen:
reyleon
发表于 2014-05-15 13:25
send_linux 发表于 2014-05-15 13:15 static/image/common/back.gif
那您是专职开发?现在不都流行运维开发么?不懂点的运维的开发没有市场哦
我是运维呀,不过不是网站运维, 是游戏运维,相比网站运维,可能游戏运维技术含量没那么高呢
ice_ma
发表于 2014-05-15 16:44
看看·~~~:$:sleepy::sleepy:
send_linux
发表于 2014-05-15 18:14
reyleon 发表于 2014-05-15 13:25 static/image/common/back.gif
我是运维呀,不过不是网站运维, 是游戏运维,相比网站运维,可能游戏运维技术含量没那么高呢
没有吧,自动化运维方面的,游戏行业比较先进吧,批量的开服,合服啥的
heritrix
发表于 2014-05-15 20:44
1.运维工作中肯定少不了监控。那么在选择和部署监控系统时,你是更注重报警和趋势规划还是报表和数据可视化呢?
目前公司规模小,主要还是注重注重报警和趋势规划,以便在出问题的时候好及时处理,对问题进行预警和整理规划。例如硬盘存储瓶颈,CPU及内存瓶颈,网络瓶颈。
2.日志处理是网站运维最重要的工作之一。你偏向自己写脚本处理还是利用现成的框架?
目前来说写脚本已经可以满足项目需求,未来随着项目的扩大再进行一些技术上的规划。
4.说说读完试读章节后您的感想。
试读了一些章节,觉得书写的很细致,对日常维护的各个点都介绍的很详细,对一些技术上的难点进行了解读也提供了很多解决方案,对我非常有启发。
持续更新
发表于 2014-05-15 20:45
1.运维工作中肯定少不了监控。那么在选择和部署监控系统时,你是更注重报警和趋势规划还是报表和数据可视化呢?
我认为问题出现后需要立即响应的,也就是注重报警的,使用nagios。
收集数据用于日后分析的,注重报表的, 使用cacti 和 opentsdb (nagios配合graphite作图其实也很不错)。
如果监控的间隔低于一分钟,作图数据要精确到秒的,并且还需要立即响应的,数据发给opentsdb, 并使用nagios 的被动监控功能。
2.日志处理是网站运维最重要的工作之一。你偏向自己写脚本处理还是利用现成的框架?
我更喜欢使用现有的流行的东西,相信整个行业的智慧,目前正在研究logstash。
自己写脚本可以满足自己特殊的需求。
3.欢迎大家就网站运维技术各方面问题向 饶琛琳 ID:chenryn 提问。
对监控成本的把握一直是一个棘手问题。
举个例子, nagios 用户对内存, cpu的占用率应该被限制到多少?
4.说说读完试读章节后您的感想。
看了试读章节,例举了监控日志的一系列解决方案,应当是一本好书。
x9x9
发表于 2014-05-16 00:24
顶一下。
作者作为国内知名网站的高级运维,同时对 Perl/Ruby 等语言运用纯熟,具有深厚的开发功力。且从博客内容可见涉猎广博,不吝将所学所悟倾尽其言。对诸运维工具的适用场景、部署排错皆能有深度的解读。推荐运维及运维开发参考研读。
:mrgreen: :mrgreen: :mrgreen:
send_linux
发表于 2014-05-16 01:04
x9x9 发表于 2014-05-16 00:24 static/image/common/back.gif
顶一下。
作者作为国内知名网站的高级运维,同时对 Perl/Ruby 等语言运用纯熟,具有深厚的开发功 ...
楼主貌似很久没有出现了,嘿嘿:em03:
欢迎回归~
x9x9
发表于 2014-05-16 13:23
回复 38# send_linux
还是会经常来的 :)
小飞侠xl
发表于 2014-05-16 22:48
问下你们的报警频率是怎么设置的?如果持续出问题会不会报警邮件会很多(这个如何避免?)另外logstash你们都用了哪些功能回复 36# 持续更新