itpub.com.cn 发表于 2011-12-23 03:02

10.2.0.5 RAC on Linux上的一个Bug

系统表现出来的是:“mmon进程lock住了一些sys的对象,然后这个进程的cpu使用率会到100%”<br>做了debug后,trace文件的内容如下:<br><br>*** ACTION NAME:(Remote-Flush Slave Action) 2011-10-25 20:00:08.996<br>*** MODULE NAME:(MMON_SLAVE) 2011-10-25 20:00:08.996<br>*** SERVICE NAME:(SYS$BACKGROUND) 2011-10-25 20:00:08.996<br>*** SESSION ID:(2553.18657) 2011-10-25 20:00:08.996<br><b>WARNING:io_submit failed due to kernel limitations MAXAIO for process=0 pending aio=0<br>WARNING:asynch I/O kernel limits is set at AIO-MAX-NR=65536 AIO-NR=65483<br>WARNING:1 Oracle process running out of OS kernelI/O resources aiolimit=0 </b><br>ksfdgo()+1488&lt;-ksfdaio1()+9848&lt;-kfkUfsIO()+594&lt;-kfkDoIO()+631&lt;-kfkIOPriv()+616&lt;-kfdIOPriv()+95&lt;-kfioSubmitIO()+503&lt;-kfioRequestPriv()+166&lt;-kfioRequest()+689&lt;-ksfd_osmgo()+1286&lt;-ksfdgo()+1488&lt;-ksfdaio1()+9848&lt;-ksfqwr()+335&lt;-kcflfi()+670&lt;-kcvrsz()+1131&lt;-ktfbfcsz()+657<br>&lt;-ktfbfxtnd()+237&lt;-ktfbtgex1()+2461&lt;-ktsxs_add()+1480&lt;-ktspnr_next()+1206&lt;-ktr***ec()+437&lt;-ktspbmphwm()+1229&lt;-ktspmvhwm()+49&lt;-ktsp_bump_hwm()+191&lt;-ktspgsp_cbk()+983&lt;-kdisnew()+304&lt;-kdisnewle()+125&lt;-kdisle()+4556&lt;-kdiins0()+26993&lt;-kauxsin()+3965&lt;-insidx()+2509<br>&lt;-insflush()+466&lt;-insrow()+933&lt;-insdrv()+589&lt;-inscovexe()+399&lt;-in***ecStmtExecIniEngine()+85&lt;-in***e()+384&lt;-opiexe()+9334&lt;-kpoal8()+2295&lt;-opiodr()+1184&lt;-kpoodrc()+38&lt;-rpiswu2()+409&lt;-kpoodr()+554&lt;-upirtrc()+2101&lt;-kpurcsc()+125&lt;-kpuexecv8()+1705&lt;-kpuexec()+2643<br>&lt;-OCIStmtExecute()+41ssd_unwind_bp: unhandled instruction at 0x14fdbdf instr=6a<br>ssd_unwind_bp: unhandled instruction at 0x14fc333 instr=68<br>&lt;-kewrose_oci_stmt_exec()+62&lt;-kewrgwxf1_gwrsql_exft_1()+284&lt;-kewrgwxf_gwrsql_exft()+451&lt;-kewrews_execute_wr_sql()+52&lt;-kewrftbs_flush_table_by_sql()+188&lt;-kewrft_flush_table()+223&lt;-kewrftec_flush_table_ehdlcx()+805&lt;-kewrfat_flush_all_tables()+1243&lt;-kewrfsr_flush_snapshot_r()+173<br>&lt;-kewrrfs_remote_flush_slave()+1002&lt;-kebm_slave_main()+221&lt;-ksvrdp()+1159&lt;-opirip()+748&lt;-opidrv()+583&lt;-sou2o()+114&lt;-opimai_real()+317&lt;-main()+116&lt;-__libc_start_main()+219&lt;-_start()+42<br>*** 2011-10-25 23:20:17.038<br>ssd_unwind_bp: unhandled instruction at 0x14fdbdf instr=6a<br>ssd_unwind_bp: unhandled instruction at 0x14fc333 instr=68<br>*** 2011-10-26 08:48:54.726<br>Received ORADEBUG command 'dump errorstack 3' from process Unix process pid: 1591, image: <br>*** 2011-10-26 08:48:54.726<br>ksedmp: internal or fatal error<br>Current SQL statement for this session:<br>insert into wrh$_sysstat&nbsp;&nbsp; (snap_id, dbid, instance_number, stat_id, value)&nbsp; select&nbsp;&nbsp;&nbsp; :snap_id, :dbid, :instance_number, stat_id, value&nbsp; from&nbsp;&nbsp;&nbsp; v$sysstat&nbsp; order by&nbsp;&nbsp;&nbsp; stat_id<br>----- Call Stack Trace -----<br>calling&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; call&nbsp;&nbsp;&nbsp;&nbsp; entry&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; argument values in hex&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>location&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; type&nbsp;&nbsp;&nbsp;&nbsp; point&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; (? means dubious value)&nbsp;&nbsp;&nbsp;&nbsp; <br>-------------------- -------- -------------------- ----------------------------<br>ksedst()+31&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; call&nbsp;&nbsp;&nbsp;&nbsp; ksedst1()&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 000000000 ? 000000001 ?<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 7FBFFD6590 ? 7FBFFD65F0 ?<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 7FBFFD6530 ? 000000000 ?<br>ksedmp()+610&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; call&nbsp;&nbsp;&nbsp;&nbsp; ksedst()&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 000000000 ? 000000001 ?<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 7FBFFD6590 ? 7FBFFD65F0 ?<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 7FBFFD6530 ? 000000000 ?<br>ksdxfdmp()+1153&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; call&nbsp;&nbsp;&nbsp;&nbsp; ksedmp()&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 000000003 ? 000000001 ?<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 7FBFFD6590 ? 7FBFFD65F0 ?<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 7FBFFD6530 ? 000000000 ?<br><br>看到前面加粗的部分就知道个大概了,AIO不足,<br>session的等待表现为:<br>SO: 0x159d85068, type: 4, owner: 0x15f94e478, flag: INIT/-/-/0x00<br>&nbsp;&nbsp;&nbsp; (session) sid: 2553 trans: (nil), creator: 0x15f94e478, flag: (100051) USR/- BSY/-/-/-/-/-<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; DID: 0002-02E5-00000030, short-term DID: 0000-0000-00000000<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; txn branch: (nil)<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; oct: 0, prv: 0, sql: (nil), psql: (nil), user: 0/SYS<br>&nbsp;&nbsp;&nbsp; service name: SYS$BACKGROUND<br>&nbsp;&nbsp;&nbsp; last wait for 'Data file init write' wait_time=0.000016 sec, seconds since wait started=46124<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; count=1, intr=100, timeout=ffffffff<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; blocking sess=0x(nil) seq=224<br>&nbsp;&nbsp;&nbsp; Dumping Session Wait History<br>&nbsp;&nbsp;&nbsp;&nbsp; for 'Data file init write' count=1 wait_time=0.000016 sec<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; count=1, intr=100, timeout=ffffffff<br>&nbsp;&nbsp;&nbsp;&nbsp; for 'Data file init write' count=1 wait_time=0.000016 sec<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; count=1, intr=100, timeout=ffffffff<br>&nbsp;&nbsp;&nbsp;&nbsp; for 'Data file init write' count=1 wait_time=0.000035 sec<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; count=1, intr=100, timeout=ffffffff<br>&nbsp;&nbsp;&nbsp;&nbsp; for 'Data file init write' count=1 wait_time=0.614215 sec<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; count=1, intr=100, timeout=ffffffff<br>&nbsp;&nbsp;&nbsp;&nbsp; for 'CSS operation: action' count=1 wait_time=0.000080 sec<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; function_id=41, =0, =0<br>&nbsp;&nbsp;&nbsp;&nbsp; for 'CSS initialization' count=1 wait_time=0.000004 sec<br>解决问题的办法也很简单:<br>增加fs.aio-max-nr 的值,比如本例中增加到fs.aio-max-nr = 1048576即可以解决该问题,<br>参考metalink :<font face="helvetica"><strong>1313555.1、</strong></font><font face="helvetica"><strong>9949948.8</strong></font><br>这个问题归属于一个<font face="helvetica"><strong>Bug: 9949948 </strong></font><br><font face="helvetica"><strong><br></strong></font><br>
页: [1]
查看完整版本: 10.2.0.5 RAC on Linux上的一个Bug