- 论坛徽章:
- 0
|
一直有这个疑惑,有人说RAID6比RAID5可靠性提高了好几千倍,有人说没有提高多少。我尝试计算一下:
假设一个200块硬盘的存储系统,使用FC硬盘,每个硬盘的MTBF=1500000小时。如果采用RAID5,就做成15+1的形式(生产环境中一般是更小的RAID组);如果是RAID6,就采用14+2的形式。
每个硬盘每小时发生故障的概率为1/1500000=6.6 x 10e (-7)
200块硬盘在1小时内1块硬盘发生故障的概率是:
200 x 6.6 x 10e (-7) x (1-6.6 x 10 e(-7))∧199 = 0.0132%
故障发生后,这块盘所在RAID组中再坏一块盘的概率是(假设数据重构的时间是2小时):
2 x C(15,1) x 6.6 x 10e (-7) x (1-6.6 x 10 e(-7))∧14 = 0.00198% =1.98 x 10e(-5)
同一个RAID组中再坏2块盘的概率是:
2 x C(15,2) x (6.6 x 10e (-7))∧2 x (1-6.6 x 10 e(-7))∧13 = 9.1 x 10e(-11)
如果是SATA盘,MTBF=800000小时,则每小时的故障率为 1/800000=1.25 x 10e(-6)
200块盘在1小时内1块硬盘发生故障的概率为: 0.025%
故障发生后,这块盘所在RAID组中再坏一块盘的概率是(假设数据重构的时间是2小时):
4 x C(15,1) x 1.25 x 10e (-6) x (1-1.25 x 10 e(-6))∧14 =3.7 x 10e(-5)
同一个RAID组中再坏2块盘的概率是:
2 x C(15,2) x (1.25 x 10e (-6))∧2 x (1-1.25 x 10 e(-6))∧13)=3.28 x 10e(-10)
总结一下:
1小时内1块硬盘发生故障的概率
1天内1块硬盘发生故障的概率
同一个RAID组再坏一块硬盘的概率
同一个RAID组再坏2块硬盘的概率
FC硬盘
0.0132%
0.317%
1.98 x 10e(-5)
9.1 x 10e(-11)
SATA硬盘
0.025%
0.6%
3.7 x 10e(-5)
3.28 x 10e(-10)
从上面的计算可以看到:
1. 一块盘坏了后,再坏一块盘的概率确实比再坏2块盘的概率大许多(10万倍),对RAID6来说,再坏一块盘没事,但RAID5就不行了。从这个角度看,RAID6好像比RAID5可靠性提高了不少
2. 但从另外一个角度看,对RAID5,系统的可靠性 =所有硬盘都正常的概率+系统坏1块盘的概率 (实际应该大于这个数,即使坏多个盘,只要不在一个RAID组内,数据都不会丢); 对RAID6,系统的可靠性 =所有硬盘都正常的概率+系统坏1块盘的概率 + 系统坏2块盘的概率。 因为系统在同一个RAID组内同时坏2块硬盘的概率微乎其微(-10次方),所以对整体的可靠性影响不大。
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/73762/showart_1084583.html |
|