免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 998 | 回复: 0
打印 上一主题 下一主题

[集群与高可用] 金品成功方案——双机容错 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-09 10:15 |只看该作者 |倒序浏览
言:
    整个网络系统的连续稳定运行及数据安全至关重要。一旦整个系统中断运行,将给各个部门的运行带来极大的混乱;而数据一旦丢失,则带来的后果(损失)将是灾难性的。因此,如何确保数据的安全,如何保证整个系统的连续稳定运行,就成为电脑主管和系统管理人员非常关切的问题。同时在灾难情况下,如何快捷准确无误地进行恢复,减少或避免灾难发生时的损失,亦是电脑主管和系统维护人员关切的问题。为此,北京金品高端有限责任公司推出了基于3S磁盘阵列、SLHA双机容错软件一体化解决方案,以彻底解除电脑主管和系统维护人员的隐患。
采用3S磁盘阵列产品容错技术的重要性:
    硬盘故障是系统中断运行的重要原因之一。而且硬盘故障往往会导致数据的丢失,从而带来灾难性的后果。因此要解决系统连续运行和数据丢失的问题,必然要解决存储的问题。在今天,"数据与系统分离"观念迅速成为当前IT技术的新潮流。因此建议采用与主机独立的磁盘阵列系统。而且数据的重要性越来越重要,因此存储设备将成为整个系统的中心,而服务器将退居为周边设备。采用开放性的存储系统就越来越重要。
    3S磁盘阵列产品具有完善的安全冗余热插拔设计,整个系统无任何单点故障,采用开放独立式设计,为广大关键用户的关键应用所采用。并在应用中证实具有高度的可靠性、稳定性、安全性。同时3S磁盘阵列高达80/100/160/200MB/S的速度,消除了整个系统在I/O速率上的瓶颈问题。
采用SLHA双机容错软件技术的重要性:
    采用3S磁盘阵列将数据与主机系统分离后,消除了存储部份影响系统连续运行与数据丢失的隐患,但服务器故障将带来系统中断运行。为此采用双机容错软件来实现两台服务器的相互热备援。从而排除服务器故障带来的系统中断运行。
    即两台服务器在正常时相互监控,同时工作相互备援(或一台工作,一台热备援),在某台服务器发生故障时,另一台在很短时间内接管故障机的全部工作。从而保证服务器故障时,系统不中断运行。windows/linux下建议采用的SLHA双机软件。

  
方案简述:
    系统以windows/linux为平台,采用两台相同或不同配置的服务器和一台3S磁盘阵列及SLHA双机软件组成双机容错系统。这种双机容错方案是独立于服务器硬件和操作系统的,无论是硬盘发生故障或是系统发生故障,都不会影响到数据的安全。
  在此系统中,有两种工作模式:一种是双机热备份(hotstandby-热备份方式)模式:正常情况下,一台机器工作, 提供数据库或其它服务,另一台做为备份机,当工作机出现故障时, 备份机可以立即接替故障机的工作,保证系统工作连续,这种工作模式保证了系统的容错和实时功能;另一种是双机互备援(dual active-双工方式)模式:在双工模式下,一台服务器作为数据库或其它应用服务器,提供数据库或其它服务,另一台服务器可做文件服务器或WWW服务器使用,正常情况下,两台机器各自完成自己的工作,当有一台机器出现故障时,另一台机器可以立即接替故障机的工作,保证系统工作连续;双机互备援模式既充分利用了服务器的资源,又保证了系统的容错和实时功能,是大多数用户选择的工作模式。3S磁盘阵列系统提供RAID0-5/10/50的容错和热更换功能,磁盘阵列系统中某个磁盘出现故障,可以在在线情况下拔出来,更换一个好的硬盘,系统会自动进行修复. 整个系统提供了很高的网络及数据的安全性。
系统特点:
A、软硬件结合实现真正意义上的数据与系统分离。
B、对硬件配置要求不高,服务器可采用不同或相差较大的配置。
C、系统切换时间短。
D、切换过程对应用程序无影响,无需重新启动或登录。
E、系统效率高。因为整个系统中数据读写、管理及容错由3S磁盘阵列来完成。而系统从服务器故障纠错处理由SLHA软件来完成,而这两个都是相对独立的子系统。
F、双机容错监控路径为SCSI/FC 线路和RS232线路或10/100M自适应网卡线路,既不占用主机CPU资源也不占用基础网络带宽,因此系统效率高,这一点在实际的应用中得到用户的一致好评。
    根据系统情况,配置方案以3SJ9000-14款磁盘阵列柜为例,容量暂定为100GB左右。磁盘阵列柜根据不同型号,容量可以达到5000GB(5TB)以上。同时根据用户不同要求可以提供多通道、多盘位、机架式组合以及光纤通道等磁盘阵列产品。方案中两台服务器共享一台3S磁盘阵列柜,采取双工的模式,以达到充分利用资源(也可采用双机热备的模式)。通过SLHA双机容错软件实现故障实时切换(可达到应用级、数据库切换),以实现系统不停机。此方案充分保证了系统和数据容错的同时又减轻了服务器的负载、优化了整个网络运行速度和稳定性,达到资源的充分利用。同时将来扩容只需添加硬盘或即连空柜,在线扩容相当方便简单。
系统情况:
服务器: 两台
操作系统: windows/LINUX
数据库: Oracle /SQL
容量要求:100GB左右

方案拓扑结构功能图:


3SJ9000-14系列磁盘阵列
3SJ9000-14外观及主要指标参数

[/url]

最大硬盘数
14
SCSI 接口
Ultra3
传输率
160MB/Sec(LVD)
SCSI 硬盘类型
80 Pin SCA2
背板
Ultra320 SCA-II(LVD)
电源
250W×3
物理规格
标准19''工业机架(3U) D:600mm
[url=http://bj.scsi.cn/"http://www.sky-net.com.cn/photo/3Sj-14_b.jpg/"]

全新的3S J-14系列磁盘阵列是我公司最新推出的磁盘阵列系统。是专门为企业级用户大容量存储而设计的,是服务器和工作站首选的数据存储设备。采用RAID技术和光纤模块可使主机系统具有高速度、大容量和容错性的特征。它是一组结合高可靠性、可扩充性及高效率于一体的磁盘阵列系统。
可靠性
●全面支持0、1、3、5、10、30、50、NRAID和JBOD
●可通过RAID控制器上的LED液晶面板实时监控系统的状态
●可通过控制器面板、RS232串口两种方式设定参数,使维护更为方便
●可选Battery Back-up模组保护高速缓存内的数据在断电的情况下也不会丢失
●采用全新可软启动三冗余热插拔电源使整个系统更稳定
●内建环境控制板实时监控风扇运转速度、内部温度,超出设定值时有声音报警,并可随意地设定参数来适应不同的环境
●全新的3S J-14系列全部采用冗余模块化设计,您可以在系统运行下更换硬盘盒、电源、风扇等模块
先进性
●可选光纤子板使得系统很容易升级到光纤接口
●全新的屏蔽设计使得系统具有更强的抗电磁干扰性
●采用高性能冗余风扇使系统更适合于高密度的硬盘集群环境
●采用导光柱作为电源和硬盘的状态信号指示灯增加了美观效果,减少故障点
●3S J-14系列采用3U高密度模块化设计使系统更易于安装、维护
●3SJ-14系列机柜可以互为塔式或机架式系统更适合您的摆放需求
●支持9.1G、18.2G、36.4G、73G、146G(10000/15000rpm)等SCSI硬盘
高性能
●全新的3S J-14系列采用高性能64位RISC的POWER PC 处理器
●全新的3S J-14系列提升为128M ECC校验高速缓存(最大可达1GB)
●全新的3S J-14系列后背板均采用Ultra320 SCSI技术使得传输速率达到320M/ S,彻底打破硬盘与后背板之间的速度瓶颈
兼容性
●兼容几乎所有的服务器(如:HP、IBM、COMPAQ、联想、浪潮等)
●兼容众多的小型机(如:HP、IBM、ALPHA等)都可以与我们的3S J-14系列进行无缝连接
●支持所有的操作系统(如:UNIX、WINDOWS NT、WINDOWS 2000、SOLARIS、LINUX、HP UNIX、IBM AIX等)
扩充性
●全新的3S J-14系列磁盘阵列系统具有14盘位,标配4个通道均可设定为主机通道或设备通道,每一通道可以支持多达8个LUN,每一个LUN可以规划使用不同的RAID级别并可以在线扩充硬盘容量。最大限度地满足您对容量的要求。
3S磁盘阵列型产品介绍:
3S磁盘阵列
    3S/3SJ磁盘阵列是独立于操作系统的标准存储设备,支持WIN NT/2000 和各种Unix平台和各种HA,Cluster方案,支持各种主机。可实现服务器和操作系统与之进行无缝连接。因3S产品独特的设计, 使数据的安全得到很好的保护而且几乎无须维护。3S/3SJ磁盘阵列磁盘阵列为开放系统提供高性能的企业存储解决方案,适用于对系统存储容量、数据访问速度和数据高可靠有较高要求的场所。磁盘阵列的主要功能是提高主机数据的吞吐速度和可用性以及存储容量。它将数据有选择性地分布在多个硬盘上,从而提高系统的数据吞吐率。避免了因单块硬盘故障对系统的影响,保证数据的高安全性。
1、高可用性
    支持多种RAID级:3S/3SJ磁盘阵列磁盘阵列无需任何软件驱动,在硬件的支持下即可实现RAID 0,1,0+1,3,5,10,30,50,JBOD等RAID模式。同时支持多个RAID集的混用。这样可以使用户在同一个磁盘阵列上实现不同的RAID需求的应用。
支持高可用解决方案
    3S/3SJ磁盘阵列磁盘阵列支持2条独立的Ultra2 Wide SCSI主机通道,2条独立的Ultra2 Wide SCSI磁盘通道,SCSI主机通道可同时连接到2台的主机。通过多主机连接,3S/3SJ磁盘阵列可为两台主机提供数据共享,并支持各种高可用解决方案。
支持多种监控方式
    3S/3SJ磁盘阵列磁盘阵列可通过:阵列的RS232串口在终端/仿真终端上实现管理和维护磁盘阵列的功能,也可以通过SCSI总线进行(服务器通过串口和SCSI总线与磁盘阵列相连)。另外支持远程监控软件。Java Base GUI RAID 管理软件可透过SNMP利用远端浏览器对磁盘阵列进行远端监控。
支持S.M.A.R.T功能。
    S.M.A.R.T功能可侦测出70%的硬盘错误,可以预先发现硬盘的故障,增加了系统的稳定性和可靠性。
支持RAID在线扩容、扩展和迁移功能
    3S/3SJ磁盘阵列磁盘阵列为了保护用户的投资,可以实现RAID在线扩容、扩展和迁移功能。在没有RAID在线扩容、扩展和迁移功能以前,增加RAID系统容量的传统方法是先备份磁盘阵列中的数据,再重建新的大容量的逻辑盘和恢复数据。RAID在线扩容功能允许用户在不关闭系统的情况下,加入新的硬盘,进行RAID扩展容量。用数据迁移和扩展功能可以进行数据拷贝和迁移,将新的硬盘代替原逻辑盘中小容量硬盘,充分保护用户的投资,并且所有的操作都是在线的,不影响用户的数据访问。
故障报警功能
    3S/3SJ磁盘阵列磁盘阵列会监控机箱系统内的各部件(控制器、硬盘、风扇、电源等)和内部环境。一旦出现异常,系统会通过LED显示灯、蜂鸣器以及各种终端(RS-232,SCSI GUI RAID终端,GUI RAID远程终端)进行故障提示。
支持SAF-TE and S.E.S,在线自动侦测功能
    3S/3SJ磁盘阵列磁盘阵列支持SAF-TE and S.E.S在线自动侦测功能,在线侦测控制器、硬盘、SCSI总线的电信号,并能对故障进行报警。
支持控制器热拔插,电源、风扇热拔插。
    3S/3SJ磁盘阵列磁盘阵列不但支持控制器热拔插,电源、风扇均支持在线热拔插,增加了系统的稳定性和可靠性。
2、高安全性
支持热备磁盘,数据自动重建功能。
    3S/3SJ磁盘阵列磁盘阵列支持热备磁盘功能。使得当有硬盘出现故障时,无需人工干预下,在线数据便能自动重建,极大的降低系统的风险并可减轻维护人员的负担。
支持专有备用和全局备用
    专用备份盘仅为某一个特定的逻辑盘提供备份服务。当这个特定的逻辑盘中的某一块硬盘故障时,这块专用的备份盘就会变成这个逻辑盘中的一块工作硬盘,顶替故障盘,并自动进行数据重建工作。
    全局的备份盘并不只是为一个逻辑盘服务,当任何一个逻辑盘中的硬盘损坏时,这个公用备份盘都会去顶替故障盘,并自动进行数据重建工作。
    系统能提供专用备份硬盘和共用备份硬盘两种功能,在不同的场合结合使用这两种功能,会帮助您的系统适应各种不同的需求。
硬盘优先访问功能
    当控制器初始化时可自动动态调节延迟时间,以提高早期生产的低速硬盘的兼容性。
    2+1冗余电源,双散热风扇(支持热插拔)。
    250W 2+1冗余的电源保证了,当一个或两个电源出现故障时,磁盘阵列的可用性。冗余的风扇,使得当一个风扇出现故障时,磁盘阵列的散热依然有效。
采用SCA-Ⅱ背板
    3S/3SJ磁盘阵列磁盘阵列内部磁盘通道采用优质SCA-Ⅱ背板,保证了系统安全和稳定性,使系统更加可靠。
3、高效性
    采用64位RISC芯片Power PC CPU
    采用业界领先的高性能的RISC芯片作为RAID控制器的CPU。 64MB至1GB高速ECC+SDRAM缓存,有提前读和回写的功能,保证了磁盘阵列上的读写操作的高性能。
        支持CACHE 智能预读/回写功能 :Write-through cache 参数可以提高系统的安全性,但Write-through cache 参数使得系统比 write-back cache 参数慢。
    支持控制器I/O操作实现连续方式或随机方式的性能优化。
    当使用磁盘阵列应用于视频或映像领域时,会用到大数据块的连续读写,而用于数据库领域时,会用到小数据块的随机读写。3S/3SJ磁盘阵列磁盘阵列控制器支持大数据块连续的I/O访问和小数据块随机I/O访问的优化操作选项。这样用户可以根据实际情况,在磁盘阵列上选择性能优化方式,以提高系统的性能。
    支持控制器对逻辑盘进行并发或后台初始化:3S/3SJ磁盘阵列磁盘阵列,支持对逻辑盘进行并发或后台初始化,可以提高系统的效率和初始化的速度。此功能在用户做多RAID级系统中可以极大的提高初始化的速度,使用户尽早的使用到磁盘阵列。
    每个设备通道都可设为主机、磁盘通道。最大可建立8个逻辑硬盘,并且每个逻辑盘可使用不同的RAID模式,每个SCSI ID 可支持32个LUN 。每个逻辑盘都可以有8个分区。
    每个逻辑盘都可以指定名称。每一个逻辑盘所包括的硬盘数没有限制。
    Firmware 被写到容易升级的Flash memory芯片上。3S/3SJ磁盘阵列磁盘阵列控制器内的Firmware是置于在EEPROM中,只要透过监控接口即可将升级的Firmware写入到EEPROM中。
3SJ9000-14系列
Ultra3系列
FC系列
RAID处理器
64位POWER PC高性能RAID处理器
64位POWER PC或更高性能RAID处理器
RAID等级
NRAID、JBOD、0、1、3、5、10、30、50
NRAID,JBOD,0,1,3,5,10 ,30,50
缓存
128MB-1GB高速ECC缓存
128MB-1GB高速ECC缓存
主机/阵列接口
Ultra 3 SCSI兼容Ultra2-Wide SCSI
均是光纤接口
每通道传输带宽  
160MB/S
100MB/S(单环) 200MB/S(双环)
通道
4个(可扩)
4个(可扩)
光纤通道
可选
可选
背板
Ultra320 SCA-II(LVD)
Ultra320 SCA-II(LVD)
RS232
2
2
冗余电源
250Wx3 (2+1)
250Wx3 (2+1)
冗余控制器
可选
可选
控制器密码保护


热插拔硬盘盒


热插拔电源


冗余风扇


在线扩充


通道设置
可随意设置
可随意设置
自动报警


坏扇区重分配


硬盘热备用


温备用


后备电池
可选
可选
工作温度
0℃-40℃(32℉-122℉)
0℃-40℃(32℉-122℉)
工作湿度
20%-85%
20%-85%
外型规格
可装14块3'5寸硬盘
可装14块3'5寸硬盘
工作电压
110~240伏
110~240伏
物理规格
标准19''工业机架(3U) D:600mm
标准19''工业机架 (3U)D:600mm
双机容错解决方案(SLHA双机容错软件简介)
SLHA双机容错软件简介:
    为保证数据的高可靠性和可用性, 高级别容错的服务器集群软件必须具备下列要素:
A. -提供备援系统, 当主系统出错时, 能够自动切换接管所有主系统的工作
B. -接管发生后, 系统性能不能有明显降低
C. -切换过程中的数据损失必须降至最低
D. -能够快速方便地恢复主系统
E. -备援系统可同时运行自己的应用系统, 以分担主系统负载
SLHA双机软件工作原理图:


    这些要素正是SLHA的基本准则。
    SLHA是一组高可靠性的软件系统, 它可使联入网络中的两台服务器达到一种近乎无差错的容错级.     适用环境为:
·两台服务器通过SCSI 总线连接到一个外存子系统(例如磁盘阵列子系统)
·服务器通过网卡连接并经由SCSI通道和一个网络上的监视器侦测主服务器故障 (电力, 主机硬件, 网络错误等). 当故障发生时,备援主机接替故障主机管理磁盘阵列、网络通讯,、数据库(如:SQL、SYBASE、ORACLE、NOTES、EXCHANGE等)等, SLHA起的作用是主副机之间容错切换开关.
主要功能:
自动侦测: 用户可通过高速SCSI通道将两台主机共同连接到磁盘阵列柜上, 主机可通过RS-232、共享磁盘阵列以及网线相互自动检测到对方的"宕机"或"硬件错误"
自动切换: 当侦测到任何一种硬件错误或宕机, SLHA立即执行自动切换功能. 在极短时间内, 数据转交到另一台主机,由它执行网络对数据的各种处理. 确认切换后, 故障恢复的过程就开始了,用户很快即会回到正常操作.
自动修复: 故障主机的恢复可选择两种方式, 自动或人工. 两种方式都会很快完成修复工作.
负载平衡: SLHA软件安装后, 它可将网络中心过于繁重的处理工作均衡地分配给两台服务器, 系统效率由此提高.
操作简单: SLHA采用界面友好的交互式菜单, 用户无须记忆复杂的指令.
产品优势:
* 最大的系统利用率
* 系统管理时间大大减少
* 最小停机时间(3-30秒)
* 其易操作的特点使维护费用减至最低
* 简易的交互式菜单
* 对运行状态可建立在线记录文档
* 支持冗余以太网接口
* 自动数据库启动顺序/引擎(Automatic database start-up procedure/Engine)
* 故障快速恢复
* 支持所有流行的数据库系统、支持多种工作模式


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/70914/showart_731466.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP