免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: yuhongchun
打印 上一主题 下一主题

[系统安装] [讨论]系统管理员在运维工作中的闹心事儿(获奖名单已公布-2012-6-5) [复制链接]

论坛徽章:
19
CU大牛徽章
日期:2013-03-13 15:32:35CU大牛徽章
日期:2013-09-18 15:15:15CU大牛徽章
日期:2013-05-20 10:46:44CU大牛徽章
日期:2013-05-20 10:46:38CU大牛徽章
日期:2013-05-20 10:46:31CU大牛徽章
日期:2013-05-20 10:46:25CU大牛徽章
日期:2013-05-20 10:46:18CU大牛徽章
日期:2013-04-17 11:19:51CU大牛徽章
日期:2013-04-17 11:19:42CU大牛徽章
日期:2013-04-17 11:19:37CU大牛徽章
日期:2013-04-17 11:19:32CU大牛徽章
日期:2013-04-17 11:19:28
81 [报告]
发表于 2012-05-06 19:05 |只看该作者
回复 1# yuhongchun


   

我有一本和这个很像的书,名字叫“Linux服务器架构指南”,也是清华大学出版的“典藏大系”系列

论坛徽章:
27
CU大牛徽章
日期:2013-03-13 15:15:08CU大牛徽章
日期:2013-05-20 10:46:38CU大牛徽章
日期:2013-05-20 10:46:44CU大牛徽章
日期:2013-09-18 15:24:09CU大牛徽章
日期:2013-09-18 15:24:20CU大牛徽章
日期:2013-09-18 15:24:25CU大牛徽章
日期:2013-09-18 15:24:31CU大牛徽章
日期:2013-09-18 15:24:36CU大牛徽章
日期:2013-09-18 15:24:41CU大牛徽章
日期:2013-09-18 15:24:48CU大牛徽章
日期:2013-09-18 15:24:52处女座
日期:2013-09-27 17:45:43
82 [报告]
发表于 2012-05-06 22:17 |只看该作者
本帖最后由 yifangyou 于 2012-05-06 22:22 编辑

1.罗列系统管理员在工作中遇到的麻烦和问题。
答:1)为20以上机器装软件,前几天公司买了20台云主机,我负责装nginx,redis,php,mysql等等,花了一天时间,新买的云主机只有干净的系统,好多依赖包需要安装,安装一遍不下于安装一个新系统,就安装20台云主机就花了一天时间
2) 搬迁机器到新机房,必须要收到启动机器进去修改ip,重新启动时,由于密码设置得太复杂全是特殊符号而且很长,这样导致没有输入完密码,密码等待时间就到了,输了n遍才能进去
3)系统无缘无故挂了,在系统日志里找不到异常
4)nagios误报很多,短信天天响,都麻木了,当真正有事时,都给忽略掉了。
5)新机房调试电源,下周新机房调试一路电源,新机房需要关闭一路电源几个小时(提供的双路),我公司的机器有的只有一路电源,到时还得半夜去机房把电源线插到另一边。
新机房是新建的,没有用到一半的机柜,因此他们趁客户还少时,经常要调试。

2.如何有效地处理这些麻烦和问题。
答:1)对于超过10台机器的安装,必须使用带有能够批量执行的SSH客户端,执行一条命令能够同时在20台机器上执行,这样对于系统要求一致,环境一致,批量执行时考虑到批量的问题,也就是所有的命令里的路径最好是绝对路径
2)换机房之前,最好把ip改好,其次是把密码尽量不要用特殊符号或者大小写分隔的字符串,应该统一用小写或者大写
3) 系统加有历史的监控,nagios没有历史不方便,最好用ganglia或者cacti等有历史的监控。
4) 把nagios的监控增加尝试次数,减少误报。
5)真的别以为新机房就是好,换机房时,还得考虑机房的满座率,一般满座率超过80%的机房应该运营了很长时间了,而且不敢轻易调试电源或者网络

论坛徽章:
0
83 [报告]
发表于 2012-05-07 10:35 |只看该作者
对版主表示理解与支持!

论坛徽章:
0
84 [报告]
发表于 2012-05-07 12:05 |只看该作者
1.罗列系统管理员在工作中遇到的麻烦和问题。
经常性的充当救火队员,比如由于开发人员在操作上的不规范,比如写了一个比较慢的SQL直接在主库上运行,或者在程序当中写了update 不带 where条件的语句,导致数据直接..........接下来..你们懂得.....运维在公司更多的也是充当背黑锅的角色.
2.如何有效地处理这些麻烦和问题。
一般还是需要有效的沟通,共同制定相关操作规范.在一个应用程序上线前需要多方面配合测试.压力.数据完整性.等等一系列的流程规范制约.

论坛徽章:
0
85 [报告]
发表于 2012-05-07 21:52 |只看该作者
很好的和运营服务上沟通,并保修,建议做成双线互备这样比较合适

论坛徽章:
3
IT运维版块每日发帖之星
日期:2015-07-03 22:20:00IT运维版块每日发帖之星
日期:2015-07-11 22:20:00IT运维版块每日发帖之星
日期:2015-07-13 23:11:05
86 [报告]
发表于 2012-05-08 09:42 |只看该作者
进来感同身受下大家的喜怒哀乐。

论坛徽章:
0
87 [报告]
发表于 2012-05-08 12:45 |只看该作者
看酒歌的头像,总想起黄飞鸿里面的十三姨!

论坛徽章:
0
88 [报告]
发表于 2012-05-08 14:17 |只看该作者
yuhongchun 发表于 2012-05-03 10:58
我这边数据库出问题全是领导写SQL搞死了,每次都要麻烦我们去重启数据库。。

不重视运维的结果就是项目都得重新来过,
   一家公司,网站改版,数据库重构,开发人员能把所有的字段都用类型上的最大值,像bigint,varchar(3000),一个产品表把所有的文字描述的字段都带上,一登录数据库直接当机,   

论坛徽章:
0
89 [报告]
发表于 2012-05-08 15:36 |只看该作者
支持楼上,我也认为做人和做人都很重要

论坛徽章:
6
丑牛
日期:2013-09-17 00:18:40未羊
日期:2013-10-31 12:10:47午马
日期:2013-12-07 01:58:50水瓶座
日期:2013-12-24 22:43:12水瓶座
日期:2014-03-15 21:12:13操作系统版块每日发帖之星
日期:2016-08-07 06:20:00
90 [报告]
发表于 2012-05-08 16:16 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP