Chinaunix

标题: 紧急求救!!!数据库down了起不来 [打印本页]

作者: badmouse    时间: 2009-02-16 23:45
标题: 紧急求救!!!数据库down了起不来
22:27:31  Checkpoint Completed:  duration was 0 seconds.
22:27:31  Mon Feb 16 - loguniq 1079, logpos 0xc4f018, timestamp: 0x6c8673ca Interval: 25422

22:27:31  Maximum server connections 231
22:27:31  Checkpoint Statistics - Avg. Txn Block Time 0.000, # Txns blocked 0, Plog used 58, Llog used 690

22:30:10  Assert Failed: Exception Caught. Type: MT_EX_OS, Context: mem
22:30:10  IBM Informix Dynamic Server Version 11.50.FC1   
22:30:10   Who: Session(16, informix@, 0, 0x126b45e2
                Thread(61, dbWorker1, 126b07208, 1)
                File: mtex.c Line: 406
22:30:10   Action: Please notify IBM Informix Technical Support.
22:30:10  stack trace for pid 5779 written to /home/informix/tmp/af.4257872
22:30:10   See Also: /home/informix/tmp/af.4257872, shmem.4257872.0
22:31:01  Error writing '/home/informix/tmp/shmem.4257872.0' errno = 28
22:31:01  Exception Caught. Type: MT_EX_OS, Context: mem
22:31:01  (-9791): ERROR: Routine execution trap -- procname=<db_sch_worker> procid=415
    reason: mem
22:31:01  SCHAPI: Re-starting 1 dbWorker threads.
作者: liaosnet    时间: 2009-02-16 23:45
原帖由 我是DBA 于 2009-2-17 14:05 发表
22:27:31  Maximum server connections 231

这个报错是什么意思?
连接满了吗


自数据库启动以来...出现的最大的连接数....当前可能没有这么大....并不代表是数据库的最大极限连接数..
作者: liaosnet    时间: 2009-02-16 23:49
标题: 回复 #1 badmouse 的帖子
额.11.50..没用过..不熟悉....
从online.log中看,这只是mem引起的af..具体得看af里的内容..

不过出现这样的错误,重启应该能起来的吧...不能启动报什么错?
作者: wangbin_km    时间: 2009-02-17 06:18
标题: 可以看看finderr
在数据库用户下使用命令finderr 28看看报错,如下:
No space left on device.

An operating-system error code with the meaning shown was unexpectedly returned to the database server. Either a database table or an ASCII output file has probably filled the available disk space. Look for other operating-system error messages that might give more information.

应该是你Informix用户下对应的tmp目录或是数据库空间满了,没有空间了,仔细检查一下!
作者: badmouse    时间: 2009-02-17 08:30
标题: 回复 #2 liaosnet 的帖子
回2楼    就是停不了数据库。。。
作者: badmouse    时间: 2009-02-17 08:31
标题: 回复 #3 wangbin_km 的帖子
半个小时报错的临时文件就把home空间给爆了
作者: liaosnet    时间: 2009-02-17 09:33
原帖由 badmouse 于 2009-2-17 08:30 发表
回2楼    就是停不了数据库。。。


停不了数据库...停的方法很多...
kill掉oninit主进程也行...清除占用的内存也行...

/home目录满了..当然是要先移走/删除 这些af文件啰~~
作者: antyison    时间: 2009-02-17 11:21
df看一下,把TEMP移到另外的设备吧
作者: badmouse    时间: 2009-02-17 13:11
标题: 回复 #6 liaosnet 的帖子
昨天晚上别人已经处理完了,但具体原因还是没有找到,现在有两台机器(软硬)配置的一模一样,业务也一样,其中一台没出过问题,另外这台就出过2次问题了,怕 能不能帮忙分析下(或者说给个方向什么的)    谢了

[ 本帖最后由 badmouse 于 2009-2-17 13:24 编辑 ]
作者: liaosnet    时间: 2009-02-17 13:33
原帖由 badmouse 于 2009-2-17 13:11 发表
昨天晚上别人已经处理完了,但具体原因还是没有找到,现在有两台机器(软硬)配置的一模一样,业务也一样,其中一台没出过问题,另外这台就出过2次问题了,怕 能不能帮忙分析下(或者说给个方向什么的)    谢了


CALL IBM 800...
作者: 我是DBA    时间: 2009-02-17 14:05
22:27:31  Maximum server connections 231

这个报错是什么意思?
连接满了吗
作者: antyison    时间: 2009-02-17 15:33
连接数过多报错通常是因为没有足够的内存来分配,onstat -g ses看看会话使用内存情况,也许会某个应用把内存耗尽了
作者: 我是DBA    时间: 2009-02-17 22:09
标题: 回复 #11 liaosnet 的帖子
我明白了,连接数达到一定数后会自己加
我这边每次是加128个
作者: badmouse    时间: 2009-02-18 19:50
标题: 回复 #12 antyison 的帖子
我当时用free -m 看内存还是剩很多的啊
free -m
             total       used       free     shared    buffers     cached
Mem:         20064       7359      12705          0        159       5089
-/+ buffers/cache:       2109      17955
Swap:        20479          0      20479
。。。。。。。。
就是报错产生的临时文件把home空间吃空了。
至于产生报错的原因还是没确定下来,郁闷
作者: badmouse    时间: 2009-02-18 19:52
标题: 回复 #2 liaosnet 的帖子
谢谢一直在分析这个问题
作者: liaosnet    时间: 2009-02-18 20:41
原帖由 badmouse 于 2009-2-18 19:50 发表
我当时用free -m 看内存还是剩很多的啊
free -m
             total       used       free     shared    buffers     cached
Mem:         20064       7359      12705          0        159       5089 ...


af产生的文件可能会很多..尤其是内存很大的情况下.....
一般来说,最好把INFORMIXDUMP 目录放到一个单独的文件系统中...建议最少2GB...
作者: 我是DBA    时间: 2009-02-18 21:32
这问题就这样解决了?
作者: liaosnet    时间: 2009-02-18 22:02
标题: 回复 #17 我是DBA 的帖子
没解决..因为已经重启过了~~要信息难找啰~~
作者: badmouse    时间: 2009-02-19 18:50
标题: 回复 #18 liaosnet 的帖子
现在正在找IBM的人分析呢,结果就不知道了。。。
没确切答复




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2