南非蚂蚁
发表于 2014-09-25 10:15
lex921 发表于 2014-09-24 17:22 static/image/common/back.gif
回复 6# 南非蚂蚁
嗯,毕竟技术是本行嘛
南非蚂蚁
发表于 2014-09-25 10:17
mnbhy 发表于 2014-09-24 22:52 static/image/common/back.gif
浅薄的回答一下:
1、说说您在Linux服务器维护工作中遇到哪些困难?
以自己来说,开始的时候,安装oracle ...
多做笔记,忘记了再看笔记,这样记忆更牢固些!
yestreenstars
发表于 2014-09-25 11:10
@南非蚂蚁
茂哥,蚂蚁版主,我更新了我8楼的回复,请多多指教~:em02:
jackson198574
发表于 2014-09-25 11:38
顶~看样介绍和样章就感觉很不错!~~~
qingduo04
发表于 2014-09-25 12:01
回复 20# 南非蚂蚁
是的,能否通过SNMP进行监控?有没有这方面的方案?
今年可能又会买100多台X86服务器,总计300多台了。
qingduo04
发表于 2014-09-25 12:06
回复 22# 南非蚂蚁
温故知新........
南非蚂蚁
发表于 2014-09-25 12:08
yestreenstars 发表于 2014-09-24 17:03 static/image/common/back.gif
1、说说您在Linux服务器维护工作中遇到哪些困难?
刚做运维没多久,遇到的困难还不算很多,印象最深刻的一 ...
说的很好,我来回复下你的第一个问题
1:首先,我不是很清楚,为什么研发需要root权限,如果是线上服务器,所有更新操作都应该是运维来处理的,其次,做个跳板机是个不错的方法,如果客户也需要访问线上服务器,那真是比较麻烦的,我们之前的做法就是在跳板机上做ssh登录授权,只有授权的ip或ip段才能登录跳板机,不过这样,如果很多客户都要登录,就变得麻烦,不过不清楚的是,为何还要这么多客户要登录服务器,这样服务器上,研发人员也登录,测试估计也要登录,客户也登录,那么运维是什么角色呢?所以我觉得核心的解决办法就是要制定一个服务器管理或运维规范。
2、zabbix监控放在外部的话,由于网络延时等问题,精确度肯定不高,建议监控系统在服务器网段内有一套,外面一套,这样内外业务都能监控和兼顾。
南非蚂蚁
发表于 2014-09-25 12:13
qingduo04 发表于 2014-09-25 12:01 static/image/common/back.gif
回复 20# 南非蚂蚁
snmp比较消耗资源,机器多的话,性能很差,推荐ganglia,性能非常好,我们监控1500台机器,通过ganglia实现,运行3年多,非常稳定,监控信息也非常准确。
yestreenstars
发表于 2014-09-25 12:22
回复 27# 南非蚂蚁
非常感谢蚂蚁版主的回复!我来解释一下吧~
1.在我来之前,服务器的部署、发布都是由开发来完成的(都不知道以前那个运维是干什么的),所以他们有所有客户平台的ROOT密码,而且最早得到密码的是海外销售人员,他们会优先将账号密码等信息发给开发。在我来之后,才开始有点规范,现在平台的部署和发布都是由我本人把关,对于我司自己的平台,我都是只给开发开放普通用户的权限,并且只允许通过跳板机来连接。至于客户为什么需要登录服务器,那是因为这服务器本来就是他们自己的,我们只是负责提供技术支持,发布而已。我们公司的测试不需要登录服务器,他们只需测试网站即可。因为是客户的服务器,所以不能轻易地修改ROOT密码,需要销售跟客户沟通,所以是挺麻烦的~
2.延迟我也想到了,其实亚马逊和阿里云自己也有监控平台,我们主要是想通过统一的一台服务器来监控。我会先拿一台服务器来进行测试,如果结果能够接受就行了~
yestreenstars
发表于 2014-09-25 12:27
回复 28# 南非蚂蚁
又了解了一种监控~:em02:
页:
1
2
[3]
4
5
6
7
8
9
10