免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: send_linux
打印 上一主题 下一主题

当“救火队”还是实现灵活管理?系统管理员悲催运维生活大调查!(获奖名单已公布) [复制链接]

论坛徽章:
3
处女座
日期:2014-11-05 11:02:4315-16赛季CBA联赛之四川
日期:2015-12-10 14:37:4015-16赛季CBA联赛之天津
日期:2017-09-08 18:39:34
51 [报告]
发表于 2012-03-09 18:45 |只看该作者
运维要面对那么多复杂的现网问题,用个dell的服务器就能都搞定了?

论坛徽章:
0
52 [报告]
发表于 2012-03-09 19:48 |只看该作者
大年初二,R710硬盘坏~~杯具的喝多了,电话响了4个小时才接到~~杯具的扣工资~~~

论坛徽章:
0
53 [报告]
发表于 2012-03-09 22:48 |只看该作者
怎么办从没用过DELL服务器

论坛徽章:
0
54 [报告]
发表于 2012-03-09 23:03 |只看该作者
本帖最后由 big_power 于 2012-03-09 23:04 编辑

1、碰到过极品的事情
公司服务器托管在IDC,某天某台IDC突然down,请IDC维护人员,帮忙重启下该台服务器,电话里描述得很清楚位置、机器上的IP,悲催的事情发生了,该人员不知为啥原因,把该机器所在的一排机架上的服务器都重启了,然后完了还电话通知我和他的主管,说找不到机器然后把所有的机器都重启了,当时被雷得那个泪流满面。。。据说一个星期后,那个维护人员离职了。。。
2、碰到个郁闷的事情
老式的SUN服务器,就是要接sun自己专用接口显示器、键盘的那种(生产业务)机器,突然某天挂掉,然后到处找键盘、显示器(据公司说原来是有,但是怎么没不清楚。。。郁闷非常),最后通过朋友的朋友请找到sun的工程师,借了个终端线,然后进行故障处理后。当时是刚到公司,后来立即把sun上面的业务转移到X86下的linux下了。。
。。。
以上是比较深刻的事情,时间比较久远了,至于救急。。。救火或者帮其他公司救火,太平常。。。而没有什么深刻影响。。。其实只要平时做好故障演练,就是救火,心里也踏实,一般这种情况,喊小弟干。。。。嘿嘿

论坛徽章:
0
55 [报告]
发表于 2012-03-09 23:36 |只看该作者
据回忆,那是我的第一份工作,那是2004年6月下旬的一天的某电信机房。
休息了2天后8:30正常上班,刚上班就接到电话,客户打来电话问我昨天他们服务器断了为什么不及时通知,然后xxxx一大堆,我就解释了一句:我昨天休息,还没来得及检查。结果就被投诉了,没过几天就被辞退了,悲催的运维工程师,悲催的第一份工作,唉...
现在想起还有些心有不甘,但是算了,这就是悲催的人生啊,知足就好....

论坛徽章:
0
56 [报告]
发表于 2012-03-10 09:14 |只看该作者
你们还好,最多晚上i吵醒, 做运维的都有过这样的时候,问题是 ,TMD  还整我们 运维的 晚上值通宵夜班,第二天还必须要求你正常上班

论坛徽章:
59
2015七夕节徽章
日期:2015-08-24 11:17:25ChinaUnix专家徽章
日期:2015-07-20 09:19:30每周论坛发贴之星
日期:2015-07-20 09:19:42ChinaUnix元老
日期:2015-07-20 11:04:38荣誉版主
日期:2015-07-20 11:05:19巳蛇
日期:2015-07-20 11:05:26CU十二周年纪念徽章
日期:2015-07-20 11:05:27IT运维版块每日发帖之星
日期:2015-07-20 11:05:34操作系统版块每日发帖之星
日期:2015-07-20 11:05:36程序设计版块每日发帖之星
日期:2015-07-20 11:05:40数据库技术版块每日发帖之星
日期:2015-07-20 11:05:432015年辞旧岁徽章
日期:2015-07-20 11:05:44
57 [报告]
发表于 2012-03-10 10:09 |只看该作者
1、        晒晒自己的系统运维生活,阐述自己理想中的系统运维生活。

搞系统维护的,楼主说到的问题肯定是在所难免,关键是我们如何让这些降至最低。做移动项目的时候,天天加班加点的干,就是在为系统运行准备数据,做数据平台的转换工作。从一种服务器平台导入到另一种服务器平台,问题多多,全部基本是手工作业,可想而知其难度。
硬件的问题,软件的问题,只要你是维护人员,在甲方看来这都是理所当然的应该作的事情。而悲催的是你永远不能说“不”。我们怎么样才能改变这样的生活状态呢?
2、        讨论DELL 12G服务器系统管理工具是如何帮助你节省运维时间的?

作为新一代的DELL 12G服务器管理工具,从了它强大的性能外,最好就是如果真的可以达到我在进行数据迁移的时候,只需要把源和目的数据相关配置准备好,同时把数据项设置清楚,这样用这个管理工具来自动完成的话,那么我想在我的工作中,我可以在配置好后就去喝咖啡了,等到它运行完成后我再回来看看结果就OK了,这样就能大量减轻我的工作量,让我轻松起来。尽情的期待着。

论坛徽章:
0
58 [报告]
发表于 2012-03-10 10:14 |只看该作者
1、悲摧的研发经理

a: DB,SYS,HDW  任何一个出了问题,运维部门就过来问,你这个能不能给个HAC的方案,我了个去的,我的岗位职责是带着小弟们coding ……
b: DB ,SYS  速度慢了,TCP回应慢了,业务层经常发现被踢(业务层的攻击,http的), 诶没有DBA的日子啊没法过(postgres)
c: 客服部门的投诉,运维部门的支撑,CD的产品部门的门外需求,……
d: 24小时开机,经常半夜被项目实施弄醒,……

  我承认业务系统扩展性差,孤岛式的容易出问题, 不过不是我设计架构,nnd……

2:
   一般都用R410 ,少量R710 (看中了 2* 6 core 和 SAS RAID6)
   一个快递行业的项目,在我强烈要求下,才个配R710,

------------------------------------------------

有待成长哦


论坛徽章:
0
59 [报告]
发表于 2012-03-10 11:11 |只看该作者
1、        晒晒自己的系统运维生活,阐述自己理想中的系统运维生活。

还好,公司的系统可用性要求不高,也就99.99%可用性,我们这边是x86的Liux服务器和Solaris的小机各占一半吧,总的来说,Solaris的小机还算比较稳定,上面跑的都是业务,这个有商业的维护外包,不过貌似真的问题很少,
x86的Linux服务器是我们部门主要维护,坑爹的很,要是被人搞,而且动不动负载就很高,精彩半夜被电话报警给叫醒。
理想中的运维是,系统有问题能够自己愈合,且能够留下日志,方便与事故之后的分析工作,并加以解决。

2、        讨论DELL 12G服务器系统管理工具是如何帮助你节省运维时间的?
我们的x86都是dell的机器和IBM的机器,dell的性能一般,但是简单,不像IBM的,什么配件都得原装,否则就启动不来,真是气死人了。功能和性能都是一般,要是啥时候x86的和小机性能和稳定性差不多就好了。

论坛徽章:
0
60 [报告]
发表于 2012-03-10 11:13 |只看该作者
本帖最后由 tony0087 于 2012-03-10 11:13 编辑
dengbao2001 发表于 2012-03-08 12:05
大概浏览了下

C600的芯片组,支持最新的至强E5-2600,可以插24条内存(我的R710,18条全插满了), iDRAC 7的 ...


我的也是R710,这个什么G12的机器还有存储设备,这不刚发布么,能有谁用过啊,用R710的估计都不多,很多都是更老的机器。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP