Chinaunix

标题: 一个合格的运维人员究竟需要掌握些什么知识和技能呢?(获奖名单已公布-9-24) [打印本页]

作者: arron刘    时间: 2013-09-10 10:01
标题: 一个合格的运维人员究竟需要掌握些什么知识和技能呢?(获奖名单已公布-9-24)
获奖名单已公布,详情请看:http://bbs.chinaunix.net/thread-4099742-1-1.html   

随着IT技术的发展,云计算、移动互联网、物联网是这几年的业界热点,革命性的技术业务模式、全新的用户体验,这些技术为很多企业在带来挑战,也带来了巨大的机遇,同时也对企业的IT架构提出了更高的要求和挑战。IT运维管理已经成为企业发展过程中的支柱之一。那么作为IT运维管理人员,需要掌握哪些技巧呢?首先我们假设你是一个公司的IT运维经理。需要搞定五十台以上的服务器和若干杂七杂八的设备,哪些技术你会用的上?

讨论话题:不一样的运维 一样的精彩,你认为一个运维人员应该具备哪些技能?

讨论时间:2013.9.10--2013.9.21

讨论奖励:活动结束后将会抽取5名会员赠送《IT架构实录一本》。没有来参加SACC大会的同学可以出手了哦!!


作者: tomer    时间: 2013-09-10 10:18
一个合格的运维人员,最重要的是行业道德,再就是丰富的行业,IT知识。良好的沟通能力
作者: fengdoudm    时间: 2013-09-10 10:28
没搞过。。。
作者: expert1    时间: 2013-09-10 13:31
前排就坐,帮顶。
作者: Beshe    时间: 2013-09-10 14:53
本帖最后由 Beshe 于 2013-09-10 14:58 编辑

就本人的体会,除了坚实的基础外,解决问题的能力以及悟性非常重要。
一些基本的自动化工具:
Installation:

Config:

Monitoring:

作者: tomac_cu    时间: 2013-09-10 14:55
一个万用表, 一个网络检测仪,一只装机U盘,一台监控电脑。

能排除电故障,网络故障,系统故障,能检测网络流量

就是运维的全部了。

说起来简单,能用好四样工具,真不简单,尤其是第一个
作者: duolanshizhe    时间: 2013-09-10 15:13
作为运维经理来说,你是一个团队的leader,你应该有前瞻意识,你的主要责任不在于去解决一个个具体的问题,而是通过建立机制、标准化作业流程来规范日常维护、健康检查等技术手段将90%或者更多的问题消灭在萌芽状态,你的主要责任在于治“未病”;同时建立突发事件的应急处理机制和预案,当发生突发事件时将结果降低至最小。

当然团队建设、作业规范、带领团队钻研新技术、新架构也是日常重要工作之一。作为系统运维经理来说不要过分强调“术”,更重要是要掌握“道”。
不然只能疲于奔命,四处救火,永远疲惫不堪。要将系统运维工作由被动变为主动。通过治“未病”的方式,提高系统可用性!


作者: missing-cn    时间: 2013-09-10 16:50
简单的说合适的流程和工具的使用。

流程是规定各项运维工作如何开展以及具体步骤:例如上线更新流程、故障解决及分析和报告流程等等。
工具是指各项自动化工具的运用,例如上面有的兄弟说的kickstart、puppet、cacti等等。

最重要的是流程和工具后面的人,人的眼界和思想深度决定着运维工作的高度和质量。

复杂点说,合格的运维人应该从至少三方面深刻理解和掌握
文化方面:包含公司制度、团队建设、绩效考核等方面,了解公司文化的核心,不仅仅是表面上的文化,而是制度表达的含义。
市场环境:公司行业环境、产品定位、市场前景、竞争对手状况等
技术能力:自学能力最重要,现在it技术发展很快,各种新技术层出不穷,全部掌握已经成为不可能,只能尽量扩展知识面,精通几方面,用到什么再学什么了。
作者: ttt4011    时间: 2013-09-11 08:53
最近在找这方面的工作,看看自己还缺哪方面的知识。
作者: ddd010    时间: 2013-09-11 10:21
不一样的运维 一样的精彩,你认为一个运维人员应该具备哪些技能?

感触最深的应该是 语言沟通吧。


作者: action08    时间: 2013-09-11 10:35
本帖最后由 action08 于 2013-09-11 10:35 编辑

感觉运维的人比开发的人整体要谦虚些有礼貌些
作者: hexilanlan    时间: 2013-09-11 12:11
监控,自动化,演练,资源统计,变更记录,责任人,维保。
作者: MissYMOnce    时间: 2013-09-11 14:40
学习了。。你的建议都非常的好回复 6# tomac_cu


   
作者: MissYMOnce    时间: 2013-09-11 14:42
我也是做运维的
感觉得掌握linux系统知识,oracle数据库知识,学习好负责业务的业务流程, 跟领导开发兄弟打好关系,增强沟通能力,还有一个,就是要学会忽悠客户啊,当然也不是随便忽悠,是在一定的基础上,忽悠
作者: LivePUB    时间: 2013-09-11 16:38
好吧,既然看到这个话题了,就跟大家探讨一下。

作为全局掌控者,就不只是一部分系统专精深的处理维护了。套用假设条件“需要搞定五十台以上的服务器和若干杂七杂八的设备,哪些技术你会用的上?”,基本上包含了很全面的IT运维技能要求。

以一个完整机房、IT运维,基本技能要求如下:

A、机房电力、温湿度的基础条件,以及维护。UPS容灾、负载、性能点检,空调温湿度维护点检。
B、网络基础架构。二层、三层、多层、Firewall。网络流量的透明、管控,设备的性能、冗余和容灾。
C、机柜效能规划、服务器硬件监控点检。机房的整洁、处理事项的效率,跟机房空间规划紧密相关。硬件的监控点检,及时处理硬件故障。
D、IT基础系统架构规划、搭建、运维。这是重点而且是必须具备的基础技能。譬如AD、DNS、Mail、SAP、DB等等,包含复杂具体的各系统高级规划配置,譬如集团不同网域不同Exchange的mail尾码整合、譬如运营十数年的Fileserver文件整理。这些是需要深厚技术功底。也是我们做运维的技术经验积淀。
E、针对各硬件、OS层、各系统层的性能监控。性能的透明是我们的追求,这样才能达到运维的全盘掌控。

粗略的探讨,仅供参考。
作者: wenhq    时间: 2013-09-11 17:01
运维需要知道你该知道的还需要知道你不该知道,算法之类的苦啊
作者: zhgypg    时间: 2013-09-11 21:09
首先,良好的心态,作为一个合格的运维运维人员必须具备良好的心态,细心,耐心和责任心。因为运维的随便一个操作可能决定一个网站一个公司的存亡。
其次,技术方面,运维人员应该知识面要广。
         1) 一定的代码能力;
         2)  对操作系统和网络基本原理要非常的了解;
         3) 全局观,对架构设计的了解;
         4) 对常用,流行的软件,解决方案要熟悉。比如(Web服务,存储,页面缓存,分布式缓存,数据库,负载均衡,容灾备份,邮件,DNS等);
         5) 良好的troubleshoot能力;
作者: qingduo04    时间: 2013-09-11 22:38
不一样的运维 一样的精彩,你认为一个运维人员应该具备哪些技能?
1.熟悉各种服务器、存储、网络交换机、SAN交换机、磁带库的告警以及基本处理。
2.熟悉各种架构的高可用性、稳定性,确保一台宕机,其他可以接替工作。
3.技术雄厚,维护经验丰富,遇到问题能够在最短的时间内,定位问题大概的原因等。
4.平易近人,心态平和,具有平常心,运维是一个苦差事,熬夜是家常便饭,这就需要保持乐观的心态,不急不躁。
5. 具有团队意识,运维工作不可能是一个人连轴转,所以遇到问题,能够多方沟通。
作者: seesea2517    时间: 2013-09-12 10:37
态度决定一切。
然后根据实际的运维项目有不同的技能要求啦。
作者: alyfrisk    时间: 2013-09-12 13:22
抽象概括总结一下:
1. 组件标准化
2. 流程化
3. 自动化
作者: wenhq    时间: 2013-09-12 15:02
比如C的能力,开源代码二次开发的能力。
能加班的能力
监控响应的能力
kernel分析的能力
快速排序O(lgn)的能力
等等等,
(反)爬虫的能力
自动化的能力
现在运维必须的无所不能啊。。。。
作者: action08    时间: 2013-09-12 15:52
回复 10# ddd010


    什么语言沟通??{:3_198:}
作者: ddd010    时间: 2013-09-12 19:39
action08 发表于 2013-09-12 15:52
回复 10# ddd010


我非专业运维,只是附带管理三个服务器。发现我和他们沟通好多时候不到位,产生些莫名其妙的问题。
作者: niao5929    时间: 2013-09-13 11:32
本帖最后由 niao5929 于 2013-09-13 12:31 编辑

个人观点:
1、熟悉掌握一种编程语言
2、熟悉掌握一种操作系统
3、拥有一个CU的帐号
4、熟悉掌握网络基础知识。
5、常用命令界面
6、熟悉了解通讯知识。
7、参与一个自己喜欢的自由研究社区,比如研究如何设计螺丝都可以。
8、多看看好书,什么方面的都可以。
9、多看基础理论的书,加强对基础理论的理解和消化
作者: forgaoqiang    时间: 2013-09-14 02:01
本帖最后由 forgaoqiang 于 2013-09-14 02:03 编辑

合格的运维人员应该了解自己的业务,熟悉自己要管理的系统和设备,现在看来企业都会同时存在windows和Linux系统,因此两种系统都应该了解。
技术方面这些估计都得会,比程序员还苦:
①公司用到的程序服务,用不到的只是了解即可,比如BIND、EMAIL服务就很有可能用不到。
②会一门WEB语言,不一定精通,至少大体了解,最好是公司采用的语言
③会SHELL和DOS批处理,这个比较重要
④会修电脑。。。
⑤会至少一门其他的自然语言(英语是必须的)
⑥基础的网络知识(如果不是维护网络为主)
还需要对一些开源监控等项目的了解

⑦良好的心态和家庭
⑧除了程序员运维其他类型的朋友圈(这个太重要了)

哈哈 大体就想到这些~~
作者: Anxiang1129    时间: 2013-09-14 12:27
一个运维人员应该具备哪些技能

1 基本的开发能力。
   
    不需要懂多么复杂的代码,但是什对自已维护的环境下所需要支撑的主要环境语言你要知道,比方你那里主要是数据库,那你必须得懂基本的SQL语言。

2、操作系统

   主流的操作系统,特别是服务器操作系统,当然了,你维护的环境中的服务器采用的操作系统你必须玩得转。

3、数据库

   DB2、Sybase、Oracle、MySQL你得起码知道这东东,别说MS SQL,这个你当然也得会,不过说实话,玩大数据的估计没人对MS SQL运用感兴趣。

4、网络及网络核心及周边设备‘

   你总得会判断基本的网络故障,基本的网络设备及核心设备你要会配置。不然网络资源划分你都不清楚,更谈不上运维了。

5、信息安全

  忽视这个,你会疲于应付,而且就是天天折腾,这个必须要会的,而且要有操作系统扎实的基础功底。

6、存储

  懂一些,起码是你现在的运维环境中所运用到的存储设备。

7、建站要懂一些吧,起码会一种语言,PHP或是JSP吧。

8、业务知识

  你所在公司的业务流程你要懂、具体来务你要知道,不然你在运维业务系统时,连数据是怎么来的,这数据最终要流向那里,也就是实施系统时说的数据流,资金流,信息流你要清楚。否则说维护那就扯蛋

9、再就是个人头脑要灵光、逻辑思维能力强、为人谦虚稳重、亲和力、乐于助人、有大局观。



作者: jimmy-_-lixw    时间: 2013-09-15 15:08
本帖最后由 jimmy-_-lixw 于 2014-04-06 21:18 编辑

提示: 内容被隐藏或删除 内容自动屏蔽
作者: jimmy-_-lixw    时间: 2013-09-15 15:09
本帖最后由 jimmy-_-lixw 于 2014-04-06 21:19 编辑

提示: 内容被隐藏或删除 内容自动屏蔽
作者: jimmy-_-lixw    时间: 2013-09-15 15:11
本帖最后由 jimmy-_-lixw 于 2014-04-06 21:19 编辑

提示: 内容被隐藏或删除 内容自动屏蔽
作者: expert1    时间: 2013-09-16 12:33
修电脑不是运维的责任吧,不知道楼上众多为什么这么看呢?


作者: hjnln85    时间: 2013-09-16 12:49
架构的了解,丰富的经验,动手的感觉。
作者: alyfrisk    时间: 2013-09-16 14:00
核心技能:解压
作者: GB_juno    时间: 2013-09-16 20:53
感觉做运维很多东西都要知道都要去了解到一定的程度,做个多面手什么的..

作者: jimmy-_-lixw    时间: 2013-09-17 14:16
本帖最后由 jimmy-_-lixw 于 2014-04-06 21:19 编辑

提示: 内容被隐藏或删除 内容自动屏蔽
作者: jimmy-_-lixw    时间: 2013-09-17 14:18
本帖最后由 jimmy-_-lixw 于 2014-04-06 21:20 编辑

提示: 内容被隐藏或删除 内容自动屏蔽
作者: 123zaqwsx123    时间: 2013-09-17 14:52
最基本的职业道德,即责任心+过硬的技术能力+与人沟通能力+广阔的眼界
作者: linblue    时间: 2013-09-18 09:34
本帖最后由 linblue 于 2013-09-18 09:35 编辑

说到IT运维那我不得不说我经理是一个优秀的运维经理。(这没有半点拍马屁的嫌疑,再说我经理也不会知道这是写他)。别不信,公司就我知道的服务器就有10+以上,这还不包括其他的设备。这些机器日常的维护和监控几乎都是由他一人完成。如果说我们部门只能剩下一个人,那待下去的只能是他无疑了。有些跑题了,就我看来一名合格运维经理要具备的技能主要有:多种操作系统、硬件设备、网络、以及沟通。

先说说操作系统,公司这么多台服务器,几乎涵盖主流的操作系统,linux、solaris、windows。每台服务器的功能不同,可想而知每天要监控和维护的工作量有多大。或许不需要很透彻的了解每个系统原理,但基本的维护查看以及排错命令不可缺少。不管哪种系统,运维经理都要信手拈来。当然遇到严重为系统问题是还是要交给专业的顾问公司解决。

在说说硬件设备这块,最常碰见的硬件故障就是硬盘损坏。特别是常年工作的服务器,常常是一停机再开机时硬盘就出错。除了硬盘外我见到的还有内存、磁带机、集线器等等硬件设备损坏。如果你对硬件不了解的话出现非系统错误时那你只有头疼的份。在下就曾经有一台服务器的硬盘有坏损导致系统怎么也起不来,试了好几天最后才在经理的指导找到问题的所在。那叫一个尴尬啊。。。

网络就不用多说大家也该知道有多重要吧。要访问服务器没有网络你只有干瞪眼的份。不过设置好了,其实网络是最稳定的一块。

最后讲讲沟通这块,沟通对于运维人员其实是相当重要的一块。当服务器出现重大问题时,怎样将问题描述的清楚简洁的告诉顾问工程师是很重要的。大部分的时候顾问不可能上门帮你排错,大多是远程帮你处理问题。这时就需要运维人员将错误简洁而明白的表达给顾问了解知道,以便顾问快速解决问题。另外沟通还有另一方面的含义,既运维人员的英语水平要好,几乎所有信息都是英文,日志文件、报错信息等等全是英文。本人英文不好也是造成上面提到尴尬的一个方面。所以英语很重要啊。。。苦逼的我正在努力学习中。。。

新手愚见,不足之处请各位大神谅解。同时也欢迎指出纰漏。
作者: kinfinger    时间: 2013-09-21 22:26
不一样的运维 一样的精彩,你认为一个运维人员应该具备哪些技能?
首先说明一点,我的动机不纯,我是冲着书来的,仰慕已久
第二点,作为一个IDC的一员,在工作3个年头以后,应该思考一下自己的价值之所在
第三点,言归正传
个人感觉一个运维人员具备的技能承担的角色不同,技能也就不同
首先作为一个一般的运维人员:
1自己价值的实现来源技术能力与你所具备的责任
能力是可以弥补的,但是责任则是一个人很难培养的;技术能力3-5年就很成熟,但是责任感则是日渐积累的
2 细心
其实这一点说起来容易,做起来难,运维工作很多都是重复性的劳动,这一点就要求你即使你做了99次,在做100次的
还要像第一次怀着一颗谦卑的心,最好双人复核(如果条件具备)
3 危机感
运维给人整体的感觉就是天天喝喝茶,看看报纸,其实不然,系统运维人员也是承担高压,特别是服务器当掉以后,如何在第一时间
回复,因此要时刻保持危机感,

4 熟悉或是了解业务流程
运维有一部分工作就是调优,不论是系统调优,还是流程调优,有时候在排除问题的时候,了解业务流程能够在很大程度帮助你及时解决
问题
5 由于专业能力限制,对架构或多或少要了解一些。这就是我对这本书《IT架构实录一本通》这么强烈的原因


作为一个leader,
1 要有全局观,大局观,主要工作的主要矛盾与次要矛盾,不要眉毛胡子一把抓,明确工作的重点

如有项目时,必须在保证日常运维的情况下,循序渐进。我们前一段时间就是XX好好大喜功,结果死的很惨~~
2 要重视监控,事前,事中,以及事后的问题归纳,分析与解决,这一点对一个成熟的运维中心来说是比不可以少的
如CPU,磁盘使用率等等,及时监控可以在很大的程度上将问题扼杀在萌芽阶段,这些基本上可以通过自动化脚本完成,难点在于建立一个
完整的监控体系
3 知识的文档化
这一点不知道别的单位是什么情况,我们领导认为很重要,个人认为对流失率比较大的单位更是重中之重。
运维从某种程度上来说,重复性的工作很多,如果过分的依赖某一个人,这对单位来说风险是很大的,尤其是一些小公司。
知识的文档化在一定程度上可以避免这个问题,即依照文档,所有的人都可以进行运维。

至于其他的员工激励,团队合作,企业愿景等等的,这里就不在赘述了,仅就自己认为与其它行业区别比较大的来献丑了
------------------最重要的一点-----------
貌似很多人都没有指出,由于运维的人经常要熬夜,因此要经常的锻炼身体,保持乐观的心态。
身体是革命的本钱~~~~~~
------------------最重要的一点-----------
作者: jimmy-_-lixw    时间: 2013-09-22 14:02
本帖最后由 jimmy-_-lixw 于 2014-04-06 21:20 编辑

提示: 内容被隐藏或删除 内容自动屏蔽
作者: a591244761    时间: 2013-09-25 16:09
回复 38# linblue
10+我还以为是10K+呢


   
作者: liuyuanping    时间: 2013-10-10 08:42
做为运维人员,我个人认为有以下几点:
     1、广博的知识,并能融汇贯通,超强的自学能力
     2、丰富实战经验
     3、不一样的思维,不一样的排错(也就是排错)
     4、坚实的理论基础
     5、良好的沟通协调能力,做事先做人
     6、超强的精力,超强的写作功力

作者: yelei1314    时间: 2014-01-22 12:49
责任心,技能,沟通能力,悟性。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2