当“救火队”还是实现灵活管理?系统管理员悲催运维生活大调查!(获奖名单已公布)
获奖名单已公布,详情请看:http://bbs.chinaunix.net/thread-3718942-1-1.html
活动背景:
作为系统运维人员,你有没有在半夜三更被急促的电话铃声叫起,冒着严寒赶赴机房的时候?你有没有正跟爱人柔情蜜意,却被搅乱兴致的时候?你有没有正遇到烦心事儿,却屋漏偏逢连阴雨,工作加生活的烦心事儿弄得你火冒三丈?由此看来,系统运维人员可谓是正宗的“IT悲催男”,属于长期受机器压迫的群体。
如今,DELL最新的12G服务器面世了,全新的软件操控界面可以帮助运维人员节省90%的操作时间,原本繁琐的系统维护、日常管理、数据迁移等工作都可以通过软件一键搞定。友好的图形化界面,便捷快速的操作,这一切将是DELL 12G服务器带给我们的最新体验,节省大量的操作时间。后期帖子中也会更新戴尔服务器系统管理培训课程,敬请关注!
http://regmedia.co.uk/2011/10/04/dell_poweredge_12g_servers.jpg
去年,Michael Dell 在 OpenWorld上,提出的对PowerEdge R720 servers的期许,基于intel最新的E5系列处理器,希望这将是 Oracle Exadatakiller!
全文:http://www.theregister.co.uk/201 ... e_12g_rna_networks/
关于Intel最新的E5处理器的技术信息和讨论:Intel新款至强E5来袭 性能提升80%?
相关dell 12G产品及相关功能内容:http://www.it168.com/redian/dellfangan/
硬件参数表
dell Poweredge R720用户手册
SQL sever优化配置指南
如今,你有任何悲催的运维生活,或者你在运维中遇到的问题,包括使用DELL服务器应用软件时的小窍门,都可以与大家一起分享。谈谈你所希望的运维生活,是如何的惬意如何的轻松自在。总之,任何有关系统运维中的故事都可以哦!
活动时间:3月8日-3月28日
讨论话题:
1、 晒晒自己的系统运维生活,阐述自己理想中的系统运维生活。
2、 讨论DELL 12G服务器系统管理工具是如何帮助你节省运维时间的?
活动规则:
1. 请针对上述问题跟贴回复,分享你的观点和看法;
2. 贴子观点鲜明、理由充分、逻辑清晰、有理有据;
3. 要求原创,尽可能结合自身实践来谈,抄袭、转载贴不能评选优秀回复贴;
4. 字数不少于50字。
活动奖励:
1、最悲催管理员奖,选取精彩描述自己的管理员工作生涯,且讨论DELL 12G服务器系统管理工具给自己带来时间节约的用户三名,奖励价值200元的移动电源1个
2、精彩讨论奖,选取10名优秀回复者将获得价值100元的无线鼠标一个
3、参与奖,每个回复者将获得20个CU积分奖励
本帖最后由 blackjack550_cu 于 2012-03-09 12:08 编辑
1、 晒晒自己的系统运维生活,阐述自己理想中的系统运维生活。
很久以前有一次,晚上已经睡下了凌晨12点半老大给我打电话服务器无法访问,测试完后通知IDC机房,IDC机房说服务器遭受攻击,查出是攻击我们的服务器打车火速跑到机房。检测了一下,感觉像分布式DDOS攻击,全都是TearDrop掺合着SynFlood。 无奈临时更换IP地址并且全部改成IP地址连接隐藏真实IP并且机房做了黑洞吸引流量这才好些,回家的时候已经是2点半了,那会儿非常感激麦当劳。打车路上进去买了点宵夜回家还得缓缓才能睡觉。另外给夜晚出勤的同事提供几个地方什么马兰拉面也是不错的,嘿嘿
已经很久没遇到以上类似的事情了,理想的系统运维生活啊?首先肯定所有安排都可以按照计划啦,减少任何有可能的突发事件,准备好所有的应急预案,喝着咖啡只需要按一个键就可以完成上线、更新之类的事情。当然虽然路还有很远,但是方向是不会变的。我不赞成为了什么自动化一定要用什么非常牛的上线工具。大的上线系统你也得考虑维护成本嘛。自己写脚本也可以嘛,够用就行。最最重要的是要能创造出更多的空闲时间,让我做系统的性能、新软件的部署和测试,这才是最重要的,爱好嘛。生产的系统跑起来基本上除了更新和硬件问题也没啥大问题。做系统运维无论你追求性能参数、稳定性、硬件效率,无论什么只要有一样就好~
2、 讨论DELL 12G服务器系统管理工具是如何帮助你节省运维时间的?
这个没用过。不过再好的系统管理工具,推荐管理口单独分配个ip并且独立带宽,要不遇到这种攻击事件,如果带宽塞满,啥好玩意儿也没用。还得乖乖去机房 本帖最后由 big_power 于 2012-03-09 23:04 编辑
1、碰到过极品的事情
公司服务器托管在IDC,某天某台IDC突然down,请IDC维护人员,帮忙重启下该台服务器,电话里描述得很清楚位置、机器上的IP,悲催的事情发生了,该人员不知为啥原因,把该机器所在的一排机架上的服务器都重启了,然后完了还电话通知我和他的主管,说找不到机器然后把所有的机器都重启了,当时被雷得那个泪流满面。。。据说一个星期后,那个维护人员离职了。。。
2、碰到个郁闷的事情
老式的SUN服务器,就是要接sun自己专用接口显示器、键盘的那种(生产业务)机器,突然某天挂掉,然后到处找键盘、显示器(据公司说原来是有,但是怎么没不清楚。。。郁闷非常),最后通过朋友的朋友请找到sun的工程师,借了个终端线,然后进行故障处理后。当时是刚到公司,后来立即把sun上面的业务转移到X86下的linux下了。。
。。。
以上是比较深刻的事情,时间比较久远了,至于救急。。。救火或者帮其他公司救火,太平常。。。而没有什么深刻影响。。。其实只要平时做好故障演练,就是救火,心里也踏实,一般这种情况,喊小弟干。。。。嘿嘿 1、悲摧的研发经理
a: DB,SYS,HDW任何一个出了问题,运维部门就过来问,你这个能不能给个HAC的方案,我了个去的,我的岗位职责是带着小弟们coding ……
b: DB ,SYS速度慢了,TCP回应慢了,业务层经常发现被踢(业务层的攻击,http的), 诶没有DBA的日子啊没法过(postgres)
c: 客服部门的投诉,运维部门的支撑,CD的产品部门的门外需求,……
d: 24小时开机,经常半夜被项目实施弄醒,……
我承认业务系统扩展性差,孤岛式的容易出问题, 不过不是我设计架构,nnd……
2:
一般都用R410 ,少量R710 (看中了 2* 6 core 和 SAS RAID6)
一个快递行业的项目,在我强烈要求下,才个配R710,
------------------------------------------------
有待成长哦
大概是2004年12月份吧,已经准备好去海南出差做项目,什么泳装墨镜都收拾好了,就等第二天直飞海南了。半夜2点接到电话,郑州某客户的DB服务器坏了,要切换到另一台campaq服务器上,立马翻身起床拎包就直奔虹桥机场飞去天寒地冻的郑州。来到客户处一看,发现那个compaq服务器居然是10多年的退休机器,上面的油烟都积了一寸厚,而且更糟的是——raid卡居然是坏的。那边的硬件供应商拖拖拉拉磨到第二天中午差了个小弟来查看raid卡,客户一小弟一看时间正好,非要拉着人家先去吃饭,灌下一瓶黄汤,结果悲摧了——下午那个硬件商小弟酒壮英雄胆,卸不下raid卡就用螺丝刀猛撬,只听得一声巨响,整个服务器主板从当中裂成两块……本想去海南过冬的,结果是背着短裤背心在河南捱了一整星期,直到客户新服务器到手才解脱——从郑州直飞海南,没日没夜地开始赶工,一心想尽快结束可以休息一下,无论如何总要到海边走走吧,这样玩命3天之后,忽然又一个电话——青海西宁又有问题,那边的项目组采购的一IBM存储柜有性能故障,需要紧急调试——得,又背着还没开包的泳装飞了西宁……记得那个冬天,我在整个中国地图上画了一个大大的十字,而最悲摧的是——这已经是我第5次去海南出差,但还是只能在飞机上看看下面的海水了…… 1. 晒晒自己的系统运维生活,阐述自己理想中的系统运维生活。
系统有短信报警,一条线路断了,手机响了一个网上,还不能关机..........
理想的运维生活?当然是sohu运维,一切都可以在远程轻松搞定了.
2.讨论DELL 12G服务器系统管理工具是如何帮助你节省运维时间的?
这个刚推出,估计能用上的人还不是很多吧. 本帖最后由 dengbao2001 于 2012-03-08 11:42 编辑
1、 晒晒自己的系统运维生活,阐述自己理想中的系统运维生活。
我们全球有个Team专门监控公司的服务器,他们也有Groudwork监控的系统,一般的问题他们都可以解决,实在需要Site帮忙的,就Call我们手机,每次一看手机来电显示,马来西亚的,乖乖,又有啥事呢。好在这样的事情不多。我们现在服务器尽量都配置了远程管理卡,这样他们可以远程支持
2、 讨论DELL 12G服务器系统管理工具是如何帮助你节省运维时间的?
太新了吧,我们才用R710. R910呢。 回复 2# chenyx
你是不是随时盯着CU呀,楼主发布才3分钟,你就回复了!:mrgreen:
dengbao2001 发表于 2012-03-08 11:43 static/image/common/back.gif
回复 2# chenyx
兄弟们看看,我又附上了一些这个产品的一些介绍及案例case,欢迎大家讨论:) :mrgreen::mrgreen::mrgreen:
以前经常半夜起来,问题多钟多样
1,链接外站的图片显示不了,外站挂了
2,开发加班和技术总监把新标签发到线上去了,却没有发页面,
3,CDN被攻击了,
4,机房双线突然一条线断了
5,最要命的是有次论坛discuz的缓存失效,整个页面都白脸了,开发都不知道缓存在哪里,
尼玛,干运维最JB命苦,
R720没用过 大概浏览了下
C600的芯片组,支持最新的至强E5-2600,可以插24条内存(我的R710,18条全插满了), iDRAC 7的远程管理卡
ooooldman 发表于 2012-03-08 12:04 static/image/common/back.gif
以前经常半夜起来,问题多钟多样
1,链接外站的图片显示不了,外站挂了 ...
那是,这个型号的是最新的基于 intel的E5系列的处理器,架构啥的都有所变化了 其实我进来之后想说
鼠标看着不错呢 InfoSVC 发表于 2012-03-08 14:41 static/image/common/back.gif
其实我进来之后想说
鼠标看着不错呢
欢迎分享运维中的心得哈:)