免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 12003 | 回复: 17
打印 上一主题 下一主题

[故障求助] AIX中系统报错,目前IO较大,请大家帮忙诊断 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-05-29 21:51 |只看该作者 |正序浏览
各位好!

2台P550机器.共同连接一台TAST T600磁盘阵列.每台主机配置了2块HBA卡,但是各有一块HBA卡连接到TAST T600上.机器4月20日安装完成,5月13日左右开始,每分钟有3-4次左右报错:

#root:/>errpt | more
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
C86ACB7E   0529213706 I H hdisk3         ARRAY CONFIGURATION CHANGED
0148FAED   0529213606 I H dac0           SINGLE CONTROLLER RESTARTED
C86ACB7E   0529213606 I H hdisk3         ARRAY CONFIGURATION CHANGED
0148FAED   0529213606 I H dac0           SINGLE CONTROLLER RESTARTED
C86ACB7E   0529213606 I H hdisk3         ARRAY CONFIGURATION CHANGED
0148FAED   0529213506 I H dac0           SINGLE CONTROLLER RESTARTED
C86ACB7E   0529213506 I H hdisk3         ARRAY CONFIGURATION CHANGED
0148FAED   0529213406 I H dac0           SINGLE CONTROLLER RESTARTED
C86ACB7E   0529213406 I H hdisk3         ARRAY CONFIGURATION CHANGED
0148FAED   0529213406 I H dac0           SINGLE CONTROLLER RESTARTED
C86ACB7E   0529213306 I H hdisk3         ARRAY CONFIGURATION CHANGED
0148FAED   0529213306 I H dac0           SINGLE CONTROLLER RESTARTED
C86ACB7E   0529213206 I H hdisk3         ARRAY CONFIGURATION CHANGED
0148FAED   0529213106 I H dac0           SINGLE CONTROLLER RESTARTED
C86ACB7E   0529213106 I H hdisk3         ARRAY CONFIGURATION CHANGED
0148FAED   0529213106 I H dac0           SINGLE CONTROLLER RESTARTED
C86ACB7E   0529213006 I H hdisk3         ARRAY CONFIGURATION CHANGED
0148FAED   0529213006 I H dac0           SINGLE CONTROLLER RESTARTED

查看详细报错信息:
#root:/>errpt -aj 0148FAED | more
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR27
IDENTIFIER:     0148FAED

Date/Time:       Mon May 29 21:38:58 BEIST 2006
Sequence Number: 33016
Machine Id:      000A593AD600
Node Id:         sapdev
Class:           H
Type:            INFO
Resource Name:   dac0            
Resource Class:  array
Resource Type:   ibm-dac-V4
Location:        U787B.001.DNW84AD-P1-C2-T1-W200500A0B821040C
VPD:            
        Manufacturer................IBM     
        Machine Type and Model......1722-600        
        Part Number.................12844-00        
        ROS Level and ID............0520

Description
SINGLE CONTROLLER RESTARTED

Probable Causes
A COMMUNICATION OR HARDWARE PROBLEM REPAIRED
LUN MOVED TO A CONTROLLER WITHOUT A PATH

User Causes
ONE CONTROLLER DECONFIGURED BY USER

        Recommended Actions
        IF THIS IS A DUAL CONTROLLER, IT IS IN A
        NON-REDUNDANT CONFIGURATION, RECONFIGURE
        THE DAC WHEN POSSIBLE

Failure Causes
ARRAY CONTROLLER
CABLES AND CONNECTIONS

        Recommended Actions
        NO ACTION NECESSARY

Detail Data
SENSE DATA
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0400 00EE 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 2D3C 9000 F705 3207 0000 0000 0000 0003 0000 0000 E400 0000 0000 0003
0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR27
IDENTIFIER:     0148FAED



#root:/>errpt -aj C86ACB7E | more
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR10
IDENTIFIER:     C86ACB7E

Date/Time:       Mon May 29 21:39:47 BEIST 2006
Sequence Number: 33017
Machine Id:      000A593AD600
Node Id:         sapdev
Class:           H
Type:            INFO
Resource Name:   hdisk3         
Resource Class:  disk
Resource Type:   array
Location:        U787B.001.DNW84AD-P1-C2-T1-W200500A0B821040C-L1000000000000

Description
ARRAY CONFIGURATION CHANGED

Probable Causes
ARRAY CONTROLLER
CABLES AND CONNECTIONS

Failure Causes
ARRAY CONTROLLER
CABLES AND CONNECTIONS

        Recommended Actions
        NO ACTION NECESSARY

Detail Data
SENSE DATA
0600 1600 0000 0000 0000 0000 0000 0000 0000 0000 0000 19AA 0102 0000 7000 0500
0000 0098 0000 0000 9401 0000 0000 0000 0100 0000 0000 0000 0000 0000 0000 0000
0002 1600 0016 0000 0000 0000 0000 0000 0000 3154 3630 3236 3235 3738 2020 2020
2020 0612 1600 0001 0000 0600 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 001B 82F2 3035 3239 3036 2F30 3733 3234 3900 0000 0000 0000 0000 0000
0000 0000 2E06 B000 F705 3207 0000 0000 0000 0000 0000 0000 E400 FFFF 0000 0003
0000 0000
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR10
IDENTIFIER:     C86ACB7E


用iostat 1查看,iowait为26%左右,但是任何一个硬盘都没有读写忙的信息:
tty:      tin         tout    avg-cpu: % user % sys % idle % iowait
          0.0        709.0                0.1   0.2   73.8     26.0

Disks:        % tm_act     Kbps      tps    Kb_read   Kb_wrtn
hdisk1           0.0       0.0       0.0          0         0
hdisk0           0.0       0.0       0.0          0         0
dac0             0.0       0.0       0.0          0         0
dac0-utm         0.0       0.0       0.0          0         0
hdisk2           0.0       0.0       0.0          0         0
hdisk3           0.0       0.0       0.0          0         0
hdisk4           0.0       0.0       0.0          0         0
cd0              0.0       0.0       0.0          0         0

tty:      tin         tout    avg-cpu: % user % sys % idle % iowait
          0.0        695.1                0.1   0.1   74.2     25.6

Disks:        % tm_act     Kbps      tps    Kb_read   Kb_wrtn
hdisk1           0.0       0.0       0.0          0         0
hdisk0           0.0       0.0       0.0          0         0
dac0             0.0       0.0       0.0          0         0
dac0-utm         0.0       0.0       0.0          0         0
hdisk2           0.0       0.0       0.0          0         0
hdisk3           0.0       0.0       0.0          0         0
hdisk4           0.0       0.0       0.0          0         0
cd0              0.0       0.0       0.0          0         0

查看dac;信息如下
#root:/usr/ucb>fget_config -l dar0
dac0 ACTIVE dacNONE ACTIVE
hdisk2   dac0
hdisk3   dac0
hdisk4   dac0
#root:/usr/ucb>fget_config -l dar0
dac0 ACTIVE dacNONE ACTIVE
hdisk2   dacNONE
hdisk3   dacNONE
hdisk4   dacNONE
#root:/usr/ucb>fget_config -l dar0
dac0 ACTIVE dacNONE ACTIVE
hdisk2   dacNONE
hdisk3   dacNONE
hdisk4   dacNONE
dac0 ACTIVE dacNONE ACTIVE
hdisk2   dac0
hdisk3   dac0
hdisk4   dac0


不知道上面的信息是什么意思?由于运行的是公司的ERP系统(SAP+DB2),现在整个系统运行非常缓慢,从系统资源上看,除了iowait到达26%左右,CPU\内存\SWAP都没有问题.数据库的BUFFER命中率94%以上,SAP中的内存管理中也没有瓶径,请各位大侠帮助分析一下原因,最好能给出解决办法.

十分感谢!

论坛徽章:
0
18 [报告]
发表于 2010-02-01 21:54 |只看该作者
是没有负载均衡的 。。只是起到故障转移的作用。。你说你CPU 内存 IO没有问题 那贴出来大家看看是什么情况。。

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2015-08-06 06:20:00
17 [报告]
发表于 2010-02-01 15:56 |只看该作者
学习中。。。。

论坛徽章:
0
16 [报告]
发表于 2010-01-19 17:54 |只看该作者
感觉 楼主没把FAST的多路径工具 配置好

论坛徽章:
2
CU大牛徽章
日期:2013-09-18 15:15:15CU大牛徽章
日期:2013-09-18 15:15:45
15 [报告]
发表于 2010-01-19 14:00 |只看该作者
受用。。谢谢

论坛徽章:
0
14 [报告]
发表于 2006-06-06 09:47 |只看该作者
原帖由 wgj 于 2006-6-5 18:07 发表


这个也没有那么严重,但是一定要,a控接进,b控接出~


楼上说的这个也不一定的,FC的通道,每个通路都有收和发2条连路,A控和B控都一样,就是说IN 和OUT都一样的概念。但是IBM建议同一个控制器中,最好IN和OUT不要同时都使用。

论坛徽章:
0
13 [报告]
发表于 2006-06-05 18:07 |只看该作者
原帖由 RS9000 于 2006-6-1 09:13 发表
FASTT600可以有4个接口和主机连接,一般一台主机的2个HBA卡分别接FASTT的A和B控。如果不用交换机,好像做HA会发生一些不可预见的状况。你还是先用SM连下看看吧


这个也没有那么严重,但是一定要,a控接进,b控接出~

论坛徽章:
0
12 [报告]
发表于 2006-06-03 21:44 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
11 [报告]
发表于 2006-06-03 13:57 |只看该作者
FAStT600好像不可以做负载均衡,看看有没有驱动程序可以支持DMP功能的,要不久暂时把一根光纤拔掉,免得它碍事,再慢慢看资料想办法了

论坛徽章:
0
10 [报告]
发表于 2006-06-02 11:57 |只看该作者
原帖由 yycon 于 2006-6-1 20:29 发表
我觉得大家还是不要告诉他!原因很简单,
他根本不熟悉fastt,如果只知道点皮毛就操作正在运行的生产系统,极可能造成数据丢失,如果那样还不如不告诉他的好.哪个责任是他负担不了的,因为最底层的操作没办法恢复.应该 ...


FASTT系列的东西,是做不了负载均衡的.只能是主备切换。
集成商的解释也有问题,明显是LUN在控制器之间切换了,才报的错。频繁切换肯定会影响性能的呀。一个切换正常都要10S以上。
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP