免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: dengbao2001
打印 上一主题 下一主题

IT运维技术讨论之三:如何满足运维不间断服务的需求 [复制链接]

论坛徽章:
18
处女座
日期:2014-11-13 15:52:322015亚冠之胡齐斯坦钢铁
日期:2015-08-14 16:09:082015亚冠之北京国安
日期:2015-06-02 18:41:152015亚冠之广州恒大
日期:2015-06-02 18:41:15NBA常规赛纪念章
日期:2015-05-04 22:32:032015年亚洲杯之中国
日期:2015-04-01 16:38:392015小元宵徽章
日期:2015-03-06 15:58:182015年亚洲杯之阿联酋
日期:2015-03-06 09:33:432015年辞旧岁徽章
日期:2015-03-04 13:32:472015年迎新春徽章
日期:2015-03-04 10:01:44拜羊年徽章
日期:2015-03-03 16:15:43洛杉矶快船
日期:2015-03-02 16:05:34
91 [报告]
发表于 2015-01-16 16:17 |只看该作者
回复 90# dengbao2001


    额,,那全网就瘫了,{:3_201:} 杯具

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
92 [报告]
发表于 2015-01-16 16:20 |只看该作者
cu_shell 发表于 2015-01-16 16:17
回复 90# dengbao2001


是啊。

这个问题,好像预防措施也不太做,据说也是比较少见,或者说很难发生的bug, 而且是6509核心交换机,做相关升级也很谨慎的

论坛徽章:
0
93 [报告]
发表于 2015-01-16 17:14 |只看该作者
我们单位现在要求是白天服务需求是不能断的,晚上只有生产环境的数据库是不能断的

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
94 [报告]
发表于 2015-01-16 18:28 |只看该作者
swordxia 发表于 2015-01-16 17:14
我们单位现在要求是白天服务需求是不能断的,晚上只有生产环境的数据库是不能断的


那还是要想一些方案来满足你的需求

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
95 [报告]
发表于 2015-01-17 08:32 |只看该作者
欢迎大家就此话题发表意见,谢谢!踊跃参与话题者,就有机会获得《24小时365天不间断服务:服务器/基础设施核心技术》

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
96 [报告]
发表于 2015-01-18 20:35 |只看该作者
欢迎大家就此话题发表意见,谢谢!踊跃参与话题者,就有机会获得《24小时365天不间断服务:服务器/基础设施核心技术》

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
97 [报告]
发表于 2015-01-20 09:03 |只看该作者

欢迎大家就此话题发表意见,谢谢!踊跃参与话题者,就有机会获得《24小时365天不间断服务:服务器/基础设施核心技术》

论坛徽章:
17
天蝎座
日期:2014-03-10 14:35:04数据库技术版块每日发帖之星
日期:2015-12-13 06:20:00IT运维版块每日发帖之星
日期:2015-12-13 06:20:00数据库技术版块每日发帖之星
日期:2015-10-20 06:20:00数据库技术版块每日发帖之星
日期:2015-08-21 06:20:00数据库技术版块每日发帖之星
日期:2015-06-17 22:20:002015年迎新春徽章
日期:2015-03-04 09:57:092015年辞旧岁徽章
日期:2015-03-03 16:54:15技术图书徽章
日期:2015-01-12 17:05:35亥猪
日期:2014-11-09 13:05:04金牛座
日期:2014-09-25 11:28:54处女座
日期:2014-09-15 19:58:36
98 [报告]
发表于 2015-01-20 11:06 |只看该作者
1.就你工作的的本身,谈谈你是否需要冗余和高可用?
非常需要冗余和高可用,不论是应用服务器还是数据库服务器。

2.如果需要冗余或者高可用,你是如何实现的?使用商业解决方案?还是开源解决方案?
在保障业务稳定性上倾向于商业解决方案。在技术和成本角度上更倾向于开源方案,个人感觉可以做一些小不然的尝试,周边的业务可以尝试开源方案,积累一段时间经验后可以用在更重要的项目上。

3.你的工作环境发生因冗余或者高可用导致的事故吗?你是如何防止该类事故的再次发生?
发生过,主要是加大巡检的力度和频率,并保证规律、可靠的关键数据备份。

论坛徽章:
13
技术图书徽章
日期:2014-04-29 14:15:42IT运维版块每日发帖之星
日期:2015-12-12 06:20:00IT运维版块每日发帖之星
日期:2015-08-30 06:20:00IT运维版块每日发帖之星
日期:2015-08-24 06:20:00IT运维版块每日发帖之星
日期:2015-08-02 06:20:002015年亚洲杯之澳大利亚
日期:2015-04-03 15:03:12申猴
日期:2015-03-20 09:00:292015年迎新春徽章
日期:2015-03-04 09:54:452015年辞旧岁徽章
日期:2015-03-03 16:54:15季节之章:冬
日期:2015-01-20 17:08:47双子座
日期:2014-11-21 16:30:31技术图书徽章
日期:2014-07-11 16:29:08
99 [报告]
发表于 2015-01-20 14:18 |只看该作者
jackson198574 发表于 2015-01-20 11:06
1.就你工作的的本身,谈谈你是否需要冗余和高可用?
非常需要冗余和高可用,不论是应用服务器还是数据库服 ...


感谢你的参与,同时也欢迎你分享你的宝贵的经验,或者也欢迎你点评别人的回复

论坛徽章:
2
技术图书徽章
日期:2013-12-20 07:35:03技术图书徽章
日期:2014-12-16 12:59:42
100 [报告]
发表于 2015-01-20 18:31 |只看该作者
本帖最后由 General_715 于 2015-01-20 18:32 编辑

1.就你工作的的本身,谈谈你是否需要冗余和高可用?
我现在和之前维护的系统,冗余和高可用都是系统的核心所在,必须保证不间断服务。无论任何问题导致的用户无法访问系统,都要算做事故。
2.如果需要冗余或者高可用,你是如何实现的?使用商业解决方案?还是开源解决方案?
2.1 外网采用的是双线。机房里用的UPS电源。内部网络,用到思科交换机做的生成树。网络也都是两条线路。交换机端口使用的两个端口的端口聚合
2.2 服务器硬件方面,都是双千兆网卡,  磁盘做的raid1+0,
2.3 之前维护的系统主要用的是开源结构,lvs+heartbeat来实现负载均衡和高可用性。后台跟着若干台服务器。现在的系统,是2台硬件的负载均衡设备,是IPCOM的一个产品。同样也是多台的应用服务器。数据库用的是oracle的rac。
3.你的工作环境发生因冗余或者高可用导致的事故吗?你是如何防止该类事故的再次发生?
   一次一台oracle服务器因为程序bug,导致大量的复制进程,最后导致服务器hang住,oracle用的是rac做高可用,这时另一台oracle服务器在等待出问题的这台机器的实例关闭之后,才能完成实例再构成,而出问题的oracle一直在hang住了,后来是通过IBM的远程控制IMM重启了服务器,才恢复。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP