免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: pipihappy8888
打印 上一主题 下一主题

[其他] 拿什么拯救你:苦逼的IT运维工程师! [复制链接]

论坛徽章:
0
1 [报告]
发表于 2014-12-01 14:42 |显示全部楼层
回复 1# pipihappy8888


    1.作为运维工程师的您,是否遇到过很苦逼的经历?
电话24小时开机,放假限制活动范围,周末游带电脑
2.运维工程师究竟在企业中处于什么样的角色?您是否看好运维工程师的职业前景?
3年前感觉就是救火队,最近转变看法,自己尽量提前发现一些问题让应用改掉,摆脱救火队角色。

例如:监控软件在达到警告值才会报警,其实很多时候没达到告警值就可以发现问题了,CPU使用率持续慢慢增高,CPU高点持续时间变长(批处理时,CPU一般都保持较高,持续的时间其实反映了批处理的时间,变长可能是sql随着每天数据量增加越来越慢),备份时间突然变长(可能是磁盘变慢,如果是用NBU可能是备份网络速度问题)。

我目前习惯于看这些指标的小变化,然后我会去找这个时间段的top sql,再还没有对系统有严重影响时就修改掉,很多系统设计时会缺少考虑数据量的增长,上线时很快,半年后可能就是一个查询都慢的要死。

关于前景如果还是只能够处理加盘,加内存,重启应用,重启服务器前景堪忧。方向上以后应更偏向提前预警,有数据分析功能,配合现在越来越多的管理工具管理大量服务器。

3.像双11、春节等重大节日,对阿里、12306的运维工程师而言,可谓是大考,想想看,有哪些可能的挑战?
突发的访问量,部分功能的性能会拖垮整个系统。

4.运维工程师平时都会用到哪些工具?请结合它们的应用场景谈谈它们的主要功能。
用的BMC的patrol,其实监控软件这要能记录那几个常用指标,并能报表展示就够了。
oracle的话,gc很好用啊

5.有木有“万能”的工具可以解救运维人员,脱离苦海呢?

没有,除非哪家公司愿意出人开发软件来做系统性能指标的分析,唉,公司基本是愿意出钱来分析业务,但是没有愿意去分析性能指标的。

论坛徽章:
0
2 [报告]
发表于 2014-12-02 09:17 |显示全部楼层
回复 21# zongg


    我觉得走人才能解决这种问题
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP