send_linux 发表于 2014-05-15 13:15

reyleon 发表于 2014-05-15 11:28 static/image/common/back.gif
没做过网站运维,悲苦

那您是专职开发?现在不都流行运维开发么?不懂点的运维的开发没有市场哦:mrgreen:

reyleon 发表于 2014-05-15 13:25

send_linux 发表于 2014-05-15 13:15 static/image/common/back.gif
那您是专职开发?现在不都流行运维开发么?不懂点的运维的开发没有市场哦


我是运维呀,不过不是网站运维, 是游戏运维,相比网站运维,可能游戏运维技术含量没那么高呢

ice_ma 发表于 2014-05-15 16:44

看看·~~~:$:sleepy::sleepy:

send_linux 发表于 2014-05-15 18:14

reyleon 发表于 2014-05-15 13:25 static/image/common/back.gif
我是运维呀,不过不是网站运维, 是游戏运维,相比网站运维,可能游戏运维技术含量没那么高呢

没有吧,自动化运维方面的,游戏行业比较先进吧,批量的开服,合服啥的

heritrix 发表于 2014-05-15 20:44

1.运维工作中肯定少不了监控。那么在选择和部署监控系统时,你是更注重报警和趋势规划还是报表和数据可视化呢?
目前公司规模小,主要还是注重注重报警和趋势规划,以便在出问题的时候好及时处理,对问题进行预警和整理规划。例如硬盘存储瓶颈,CPU及内存瓶颈,网络瓶颈。

2.日志处理是网站运维最重要的工作之一。你偏向自己写脚本处理还是利用现成的框架?
目前来说写脚本已经可以满足项目需求,未来随着项目的扩大再进行一些技术上的规划。


4.说说读完试读章节后您的感想。
试读了一些章节,觉得书写的很细致,对日常维护的各个点都介绍的很详细,对一些技术上的难点进行了解读也提供了很多解决方案,对我非常有启发。

持续更新 发表于 2014-05-15 20:45

1.运维工作中肯定少不了监控。那么在选择和部署监控系统时,你是更注重报警和趋势规划还是报表和数据可视化呢?
      我认为问题出现后需要立即响应的,也就是注重报警的,使用nagios。
      收集数据用于日后分析的,注重报表的, 使用cacti 和 opentsdb (nagios配合graphite作图其实也很不错)。
      如果监控的间隔低于一分钟,作图数据要精确到秒的,并且还需要立即响应的,数据发给opentsdb, 并使用nagios 的被动监控功能。

2.日志处理是网站运维最重要的工作之一。你偏向自己写脚本处理还是利用现成的框架?
      我更喜欢使用现有的流行的东西,相信整个行业的智慧,目前正在研究logstash。
      自己写脚本可以满足自己特殊的需求。
      
3.欢迎大家就网站运维技术各方面问题向 饶琛琳 ID:chenryn 提问。
      对监控成本的把握一直是一个棘手问题。
      举个例子, nagios 用户对内存, cpu的占用率应该被限制到多少?
      

4.说说读完试读章节后您的感想。
      看了试读章节,例举了监控日志的一系列解决方案,应当是一本好书。

x9x9 发表于 2014-05-16 00:24

 顶一下。

作者作为国内知名网站的高级运维,同时对 Perl/Ruby 等语言运用纯熟,具有深厚的开发功力。且从博客内容可见涉猎广博,不吝将所学所悟倾尽其言。对诸运维工具的适用场景、部署排错皆能有深度的解读。推荐运维及运维开发参考研读。

:mrgreen: :mrgreen: :mrgreen:

send_linux 发表于 2014-05-16 01:04

x9x9 发表于 2014-05-16 00:24 static/image/common/back.gif
 顶一下。

作者作为国内知名网站的高级运维,同时对 Perl/Ruby 等语言运用纯熟,具有深厚的开发功 ...

楼主貌似很久没有出现了,嘿嘿:em03:
欢迎回归~

x9x9 发表于 2014-05-16 13:23

回复 38# send_linux

还是会经常来的 :)
   

小飞侠xl 发表于 2014-05-16 22:48

问下你们的报警频率是怎么设置的?如果持续出问题会不会报警邮件会很多(这个如何避免?)另外logstash你们都用了哪些功能回复 36# 持续更新


   
页: 1 2 3 [4] 5 6 7
查看完整版本: 专家坐堂:网站运维技术与实践(获奖名单已公布-2014-5-28)