- 论坛徽章:
- 0
|
本帖最后由 lerner2002 于 2011-08-06 11:48 编辑
刚买了一套存储用于oracle数据库(11g),总共32块光纤盘,主机通道8Gb速率,磁盘通道4Gb速率。数据库服务器是四路的,配置了200GB的内存。
给SGA分配了80GB,PGA分配了20GB。目前存储主要用于数据入库使用。
(1)存储规划如下:
8块盘做raid10,用户存储数据库实例的控制文件,redo log,undotabs 等实例管理控制文件。
剩余的盘每8块盘做一组raid5,用户存储数据库实例的大表空间数据文件(每个表200GB,共8组)
存储都是用LVM进行管理的,然后通过pv,vg,lv组合,作了系统级条带化打散了raid5中的底层磁盘进行存储。
(2)出现情况如下:
然后实例运行状态,5组redo log(10GB)都变成了active,系统出现了大量log switch wait事件,而且各个redo log组的状态都长时间的为Active,接着出现了丢数据的现象(正常的时候可以保证2万条记录每秒的入库记录,但是现在只能是5000条左右,而且出现很多丢数据的情况)。后来增加到8组redo log,每组10GB才能实现动态平衡,系统也较为稳定。
(3)分析的可能原因:
通过查询发现应该是raid5的磁盘写的太慢了,然后堵塞了LGWR 进程。
其他的信息:监控磁盘阵列,发现raid10的速度可以达到30MB的写速度,但是3组raid5的写速度合起来也才10MB左右,总共的IO也才400左右,远未达到磁盘阵列控制器的瓶颈。
(4)问题如下:
现在不知道通过增加磁盘的数量,多建立一些raid5组是否能获得线性速度增长。
不知道大侠们有没有什么好的建议提升raid5组的写性能。非常感谢 |
|