jszxcyit
发表于 2014-12-17 14:28
作为服务器管理员,请聊聊您所经历的服务器计划外宕机事件,造成的影响,应对的策略?
这个话题确实亲身经历过了,业务系统宕机当时影响范围太大了,主要的原因还是机房扩建,空调坏了,很多服务器都不叫启动,散热不行么,机房温度达到了50多度了,只开了一两台,
桃江仔
发表于 2014-12-19 10:44
有道理,一语中的!回复 6# qingduo04
h101com
发表于 2015-01-06 17:54
获奖了~~ 感谢CU, 感谢管理员大大~:wink:愿CU越来越好!
pipihappy8888
发表于 2015-01-08 11:14
大家的回答很不错!
pipihappy8888
发表于 2015-01-08 11:17
特别还希望你能针对这次话题做些不错的总结回复 53# h101com
h101com
发表于 2015-01-08 11:50
回复 55# pipihappy8888
不错的总结不敢说~,:wink: 运维属于一线岗位,不论身处哪个行业都要一线待命,应用冗余、数据备份、攻击防范都是必须做好的,总之:吐槽不可少,事情要做好!!:mrgreen:
wang290
发表于 2015-01-08 14:41
话题讨论:
1.作为服务器管理员,请聊聊您所经历的服务器计划外宕机事件,造成的影响,应对的策略。
记得有一次客户的服务器宕机,我们是集成商,搞不定这些,call所有的合作伙伴来现场,什么红帽,oralce,戴尔,妈的,互相扯皮。
其实问题就是SAS盘的IO驱动在特定的条件下,导致Oracle的性能迅速下降,狂占CPU,但是现场一直找不到原因。最后换硬件零时搞定,事后很久才找到问题。
所以说策略就是良好的应急预案才是最重要的,现场找出问题解决问题很多时候都是扯淡。
2.在进行服务器部署、维护、管理的过程中,您遇到过哪些服务器管理的槽点?
每家服务器厂商的产品都是有一些脑子进水的设计,blabla...
后没几个就没有遇到过了,我们这个行业没有双11,但是随时随刻都是双11,遇到问题必须要迅速切换,要不然很多人是要丢乌纱帽的,嘿嘿
jackson198574
发表于 2015-01-08 16:55
讨论的好热烈呀,最近忙疯了,没赶上热烈的讨论...
jackson198574
发表于 2015-01-08 16:55
讨论的好热烈呀,最近忙疯了,没赶上热烈的讨论...
wfqiong
发表于 2015-01-09 18:26
现在大家都关注12306了,不知道春节前还会出什么状况