南非蚂蚁 发表于 2014-09-25 10:15

lex921 发表于 2014-09-24 17:22 static/image/common/back.gif
回复 6# 南非蚂蚁




嗯,毕竟技术是本行嘛

南非蚂蚁 发表于 2014-09-25 10:17

mnbhy 发表于 2014-09-24 22:52 static/image/common/back.gif
浅薄的回答一下:
1、说说您在Linux服务器维护工作中遇到哪些困难?
以自己来说,开始的时候,安装oracle ...


多做笔记,忘记了再看笔记,这样记忆更牢固些!

yestreenstars 发表于 2014-09-25 11:10

@南非蚂蚁

茂哥,蚂蚁版主,我更新了我8楼的回复,请多多指教~:em02:

jackson198574 发表于 2014-09-25 11:38

顶~看样介绍和样章就感觉很不错!~~~

qingduo04 发表于 2014-09-25 12:01

回复 20# 南非蚂蚁


    是的,能否通过SNMP进行监控?有没有这方面的方案?

今年可能又会买100多台X86服务器,总计300多台了。

qingduo04 发表于 2014-09-25 12:06

回复 22# 南非蚂蚁


    温故知新........

南非蚂蚁 发表于 2014-09-25 12:08

yestreenstars 发表于 2014-09-24 17:03 static/image/common/back.gif
1、说说您在Linux服务器维护工作中遇到哪些困难?
刚做运维没多久,遇到的困难还不算很多,印象最深刻的一 ...

说的很好,我来回复下你的第一个问题

1:首先,我不是很清楚,为什么研发需要root权限,如果是线上服务器,所有更新操作都应该是运维来处理的,其次,做个跳板机是个不错的方法,如果客户也需要访问线上服务器,那真是比较麻烦的,我们之前的做法就是在跳板机上做ssh登录授权,只有授权的ip或ip段才能登录跳板机,不过这样,如果很多客户都要登录,就变得麻烦,不过不清楚的是,为何还要这么多客户要登录服务器,这样服务器上,研发人员也登录,测试估计也要登录,客户也登录,那么运维是什么角色呢?所以我觉得核心的解决办法就是要制定一个服务器管理或运维规范。

2、zabbix监控放在外部的话,由于网络延时等问题,精确度肯定不高,建议监控系统在服务器网段内有一套,外面一套,这样内外业务都能监控和兼顾。

南非蚂蚁 发表于 2014-09-25 12:13

qingduo04 发表于 2014-09-25 12:01 static/image/common/back.gif
回复 20# 南非蚂蚁





snmp比较消耗资源,机器多的话,性能很差,推荐ganglia,性能非常好,我们监控1500台机器,通过ganglia实现,运行3年多,非常稳定,监控信息也非常准确。

yestreenstars 发表于 2014-09-25 12:22

回复 27# 南非蚂蚁

非常感谢蚂蚁版主的回复!我来解释一下吧~

1.在我来之前,服务器的部署、发布都是由开发来完成的(都不知道以前那个运维是干什么的),所以他们有所有客户平台的ROOT密码,而且最早得到密码的是海外销售人员,他们会优先将账号密码等信息发给开发。在我来之后,才开始有点规范,现在平台的部署和发布都是由我本人把关,对于我司自己的平台,我都是只给开发开放普通用户的权限,并且只允许通过跳板机来连接。至于客户为什么需要登录服务器,那是因为这服务器本来就是他们自己的,我们只是负责提供技术支持,发布而已。我们公司的测试不需要登录服务器,他们只需测试网站即可。因为是客户的服务器,所以不能轻易地修改ROOT密码,需要销售跟客户沟通,所以是挺麻烦的~

2.延迟我也想到了,其实亚马逊和阿里云自己也有监控平台,我们主要是想通过统一的一台服务器来监控。我会先拿一台服务器来进行测试,如果结果能够接受就行了~
   

yestreenstars 发表于 2014-09-25 12:27

回复 28# 南非蚂蚁

又了解了一种监控~:em02:
   
页: 1 2 [3] 4 5 6 7 8 9 10
查看完整版本: IT运维技术讨论之一:如何构建高性能Linux服务器(获奖名单已公布-2014-11-10)