send_linux
发表于 2014-09-25 15:17
jackson198574 发表于 2014-09-25 11:38 static/image/common/back.gif
顶~看样介绍和样章就感觉很不错!~~~
欢迎发表更多的读后感:)
qingduo04
发表于 2014-09-25 17:13
回复 28# 南非蚂蚁
非常感谢蚂蚁大哥的指点,我先研究研究,竟然高达1500台服务器都可以监控,呵呵,难以想象啊!
qingduo04
发表于 2014-09-25 17:28
突然在这个页面上捡到了一个徽章,太幸运了! 谢谢CCTV、谢谢CU、谢谢版主、谢谢论坛幕后英雄...............
南非蚂蚁
发表于 2014-09-25 17:47
qingduo04 发表于 2014-09-25 17:28 static/image/common/back.gif
突然在这个页面上捡到了一个徽章,太幸运了! 谢谢CCTV、谢谢CU、谢谢版主、谢谢论坛幕后英雄.............. ...
运气 啊
send_linux
发表于 2014-09-25 18:06
qingduo04 发表于 2014-09-25 17:28 static/image/common/back.gif
突然在这个页面上捡到了一个徽章,太幸运了! 谢谢CCTV、谢谢CU、谢谢版主、谢谢论坛幕后英雄.............. ...
你以前没有捡到过徽章?
qingduo04
发表于 2014-09-25 18:49
回复 35# send_linux
印象中好像没有捡过,或者是在页面上飘过,但是忘记捡了.......................
yestreenstars
发表于 2014-09-25 19:17
回复 36# qingduo04
好像有一个链接可以专门找回那些忘记捡的徽章,但是有时间限制的~
laoadiy
发表于 2014-09-25 23:35
1、说说您在Linux服务器维护工作中遇到哪些困难?
个人认为最多的就是安全方面;接触过游戏运维和平台运维,发现有一个共性就是运维人员换了好几拨,对于能够管理服务器的用户、密码、权限、IP以及HOSTNAME,没有一个很好的文档记录,有些服务器里边甚至有谁都不知道干嘛的用户名,记录文档和实际的IP、HOSTNAME不符,这就导致每次你做业务更改时候甚至还会起错机器,还有Iptables、防火墙,因为机器总是来回的换着用,查看Iptables、防火墙的的时候会发现好多端口,也没有规范的注释,我觉得这是刚接触一个平台最大的问题。
2、谈谈您对运维人员职业发展的看法
个人认为开始做运维的时候还是找一个做游戏的比较好,因为涉猎的知识面比较广,这样会发现自己哪个是强项,然后再换到专一点的运维岗位,比如专注脚本编写、系统调优,觉得自己运维这块的能力上来了,然后再补充一下业余的知识,比如管理、带团队、汇报工作等为管理层的运维岗位做基础,最高级别就是架构吧,靠出卖思想挣钱,呵呵
3、说说您在Linux服务器维护工作中遇到的有启发的案例
运维人员一定要非常**代码,再敲下回车之前一定要认真看看仔细,我之前删除东西从来不加提问是否删除,有一次,rm -rf $ORACLE_HOME,发现完了系统好多命令都用不了了、后来才知道,原来$ORACLE_HOME没有,那么rm -rf就是删除当前目录下的所有东西,然后就是监控方面,接粗nagios zabbix一步一个错,总是不顺利,安装部署什么的,就一个理:别灰心,有错解决,没错当不了大牛
exitgogo
发表于 2014-09-26 11:50
回复 38# laoadiy
说的非常好,最后一段,越出错,越进步,这体验最深!
itTangzeng
发表于 2014-09-26 12:58
1、说说您在Linux服务器维护工作中遇到哪些困难?
在运维过程中,部分环境的基础硬件及OS不一致,导致运维成本急剧增加。我们的运维工作大部分自动化了,并且自动化的过程基本是自主研发的,主要由C+Shell+python的组合完成。由于OS的不一致,导致前期部署这些监控工具时会出现不同的小问题,而工具的编写人员交接工作及文档做的不够,给后期维护这些工具带来了极大的痛苦。我举个例子,在linx中grep -E可以实现正则表示过滤文本,但是版本Linux如果升级到6.5后,这个写法就要改成grep -P,否则不能使用,而这部分代码是Shell编写的,Shell编写的代码调试是比较痛苦的事情。很多痛苦的教训,提醒我们,如果做自己的运维工作,条件允许尽量做成一致的环境,但是往往历史原因,很难实现。这是编写管理脚本时要注意封装一些特殊用法,如果这些用法改变了,只要该封装接口就可以了,不要做太多的修改,否则维护这些管理工具也是很痛苦的。
2、谈谈您对运维人员职业发展的看法
运维人员的职业发展,个人认为必须先从繁杂的运维工作中脱离出来,要想脱离出来就必须学会“偷懒”,编写脚本程序,减轻自己的工作,然后才有时间,这时根据自己的爱好去学习。如果能脱离出来,我相信你总可以找到一条光明的道路,否则天天被这些繁杂的小事给忙坏了。
(1)如果对系统的业务感兴趣,可以找系统故障和应用的关联性,然后研究什么计算机故障,对应联系什么人,会影响什么业务......,你的运维工作慢慢就跟业务走的更近了,哪天就到了老总哪里去了。
(2)如果能接触生产线的代码,可以研究系统代码,熟悉系统如何实现的;
(3)如果爱好数据库,可以去研究Oracle,考个OCM认证,这个方向目前来看还是不错的;
(4)如果......,
还是结合自己的基础和兴趣,有时自己的兴趣是很难知道的,10年前我不可能知道有现在的我,尝试去做了,然后发现兴趣。
3、说说您在Linux服务器维护工作中遇到的有启发的案例
Linux服务器维护工作中,启发最大的就是:如何学会“偷懒”,但是工作的产出物不能打折扣,而往往“偷懒”后报表和效果图更有数据做说服力。
学会了以后,然后从繁杂的工作中脱颖出来,利用时间学习,总结每个故障;需求和故障都能驱动我们进步。
看到前面的朋友提到运维机器比较多,建议换种思路来实现监控,一般我们监控都是在各个Agent端部署Agent程序,将Agent采集的结果发送到Center,如果机器多时,建议学习一下我们成功的经验:在Agent端做好必要的数据分析,将分析后有用的数据再发送到Center,本地存一份完整的采集结果,利于分析复杂问题。
还有一个:如果不做监控产品,尽量统一基础环境,便于维护管理监控的工具。
页:
1
2
3
[4]
5
6
7
8
9
10