- 论坛徽章:
- 0
|
我觉得说的都有点片面。
所谓的容灾,英文称做Disaster Rocovery,大体的意思就是“灾难”后恢复。灾难的发生总是不可避免的,因此就需要对关键的数据和设备及业务进行保护。
容灾通常有两个重要的指标,一个叫RPO(Recovery Point Object,恢复点目标发生意外灾难事件时可能丢失的数据量),一个叫RTO(Recovery Time Object,恢复时间目标是指灾难发生后,从I/T系统停机导致业务停顿开始,到IT系统恢复可以支持业务恢复运营之时,所需要的时间)。
通常在电信行业的系统,都不是孤立的,有网络,有主机,有数据库,有存储,还可能有其它的业务系统,设备,或是接口什么的。都需要考虑容灾。
首先应当考虑要容什么灾。之前各位提到的本地备份,异地备份,或是做负载分担以及高可用性集群,都只是容灾的一个部分,且属于低级的部分。
本地容灾的常见方式有:网络设备的冗余(FailOver, VRRP, STP等)。主机的负载分担或主备用机制。数据库和业务的高可用性(如Oracle RAC, A-A,A-S等等),存储,辟如多通道负载分担和故障切换,盘阵的多处理器,磁盘Raid,交换机冗余甚致是盘阵的Mirror。更多的如本地的备份,在盘阵上做BCV等等不一而足。
远程的容灾有远程备份,远程网络,远程主机(这样可以实现本地主机故障后,系统可远程负责所有或部分业务),异地的存储。对存储考虑可能更多。因为涉及到数据的同步,目前用的多的是EMC Symmetrix的DMX系列。
总之容灾是一个比较复杂的系统。要考虑设备,业务,数据的各个层面,需要花费大量的时间来做详细的考虑。 |
|