免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1976 | 回复: 0
打印 上一主题 下一主题

[RAID与磁盘阵列] 存储局域网(SAN)中排错数据收集指南 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-05-03 21:36 |只看该作者 |倒序浏览

存储局域网(SAN)中排错数据收集指南
本指南介绍了在解决SAN有关的问题时应该收集的基本信息。如果能够及时收集到这些信息,对加速问题的解决会大有帮助。我们最好不要假设问题出在最明显得地方而不全面收集数据。通过全面收集SAN相关的数据,我们将会大大增加获得快速解决问题的机会。
另一个妨碍问题快速解决的原因是数据的收集是在问题发生后的数小时甚至几天后,这种情况下,往往导致原始问题的原因已不复存在了。及时和全面收集数据将会帮助问题的快速解决。下面介绍了收集主机(服务器)、存储设备、交换机等有关信息的步骤。
大家都知道收集日志信息的重要性,但是有时一些主机的时间没有被正确设置,所以我们需要知道主机时间和正确时间的差异。另外一个SAN的物理连接示意拓扑图也是非常重要的信息来源,它必须是更新的,包含了SAN中所有的主机,交换机,存储设备,它会大大减少从所有的日志中重构整个构架图的时间。
IBM TotalStorage SAN 主机(服务器)数据收集

AIX
时间差
用date命令来显示系统日期和时间。
日志收集
收集errpt和errpt -a(输出到两个独立文件中)
收集硬件配置
收集 snap 信息
为IBM TotalStorage DS 产品问题收集信息的命令是
snap –gfiLc
其中:
g - 收集lslpp -hBc 命令的输出,即收集操作系统的环境
f - 收集文件系统信息
i - 收集安装调试VPD信息
L - 收集LVM 信息
c – 产生一个压缩的pax
文件(snap.pax.Z)
多路径(Multi-pathing)数据收集
SDD (AIX的各种版本)
用以下命令来收集输出(这些数据不包含在snap中),最好是在发生错误时收集这些命令的输出:
datapath query
adapter
datapath query device
lsvpcfg
MPIO (AIX 5.2及以上版本可用)
用以下命令来收集输出(这些数据不包含在snap中):
pcmpath query
adapter
pcmpath query device
pcmpath query essmap
HP-UX
时间差
用date命令来显示系统日期和时间。
日志收集
收集/var/adm/syslog/syslog.log 文件
收集硬件配置
对每个在SAN中的服务器提供以下的详细信息:
制造商 机器类型和型号(Type/Model) 特性详细情况:如CPU特性, 内存数量等
HBA 详情
制造商,品牌、型号 BIOS (firmware) 版本 – 如果是QLogic ,还需要BIOS 设置情况 Driver 版本
软件配置收集
收集 uname -a 的输出信息
多路径(Multi-pathing)数据收集
SDD
用以下命令来收集输出,最好是在发生错误时收集这些命令的输出:
datapath query
adapter
datapath query device
Linux
时间差
用date命令来显示系统日期和时间。
日志收集
收集/var/log/messages 文件
收集dmesg 命令的输出
硬件配置收集
对于 IBM xSeries 服务器, 最好的收集配置数据的方法是使用e-gatherer 工具。 同时提供HBA 卡的详情。可以从以下网站下载e-gatherer :
http://www-306.ibm.com/pc/support/site.wss/MIGR-4R5VKC.html
软件配置收集
收集 uname -a 的输出信息
如果是用Redhat, 安装并运行 sysreport 并收集它的输出.
多路径(Multi-pathing)数据收集
SDD
用以下命令来收集输出,最好是在发生错误时收集这些命令的输出:
datapath query
adapter
datapath query device
Microsoft Windows
时间差
在命令行窗口中用date和time命令来显示系统日期和时间。
收集日志
请在发生事件后立刻保存system logs 和application logs. (不要输出成EVT 格式)
保存系统日志:鼠标右键单击“我的电脑”->“管理”:
选择:
系统工具 —> 时间查看器 —> 系统日志
然后:
点击操作 —> 另存日志文件,并将类型改为CSV
重复以上步骤,收集应用程序日志.
硬件配置收集
对于 IBM xSeries 服务器, 最好的收集配置数据的方法是使用e-gatherer 工具。 同时提供HBA 卡的详情。可以从以下网站下载e-gatherer :
http://www-306.ibm.com/pc/support/site.wss/MIGR-4R5VKC.html

软件配置收集
如果不能提供e-gatherer 数据请提供:
操作系统 补丁包Service Pack版本
多路径(Multi-pathing)数据收集
SDD
用以下命令来收集输出,最好是在发生错误时收集这些命令的输出:
datapath query
adapter
datapath query device
Novell Netware
时间差
显示系统日期和时间并记录。
日志收集
CONLOG.EXE 程序可以把所有系统控制台的信息写入一个.LOG 文件。
可以参考以下网站查看详细信息:
http://www.novell.com/documentation/lg/nw42/index.html?utlrfenu/data/hq1lykxx.html

软件配置收集:
操作系统版本 表明这是否是一个集群系统
多路径(Multi-pathing)数据收集
SDD
用以下命令来收集输出,最好是在发生错误时收集这些命令的输出:
datapath query
adapter
datapath query device

SUN Solaris
时间差
用date命令来显示系统日期和时间。
日志收集
收集/var/adm/messages文件。几天前的记录会存在/var/adm/messagesx中,其中的x是过去几天的天数。
收集硬件配置
对每个在SAN中的服务器提供以下的详细信息:
制造商 机器类型和型号(Type/Model) 特性详细情况:如CPU特性, 内存数量等
软件配置收集:
操作系统的详细信息 sd.conf 文件iostat –El的输出
根据HBA卡的情况收集/kernel/drv/*.conf 文件,其中 * 是QLogic 或JNI。
多路径(Multi-pathing)数据收集
SDD
用以下命令来收集输出,最好是在发生错误时收集这些命令的输出:
datapath query
adapter
datapath query device
Veritas Volume Manager DMP
提供以下命令的输出:
ls -lL /dev/rdsk/*
ls -la /dev/vx/dmp/*
format


IBM TotalStorage SAN 存储设备数据收集
IBM TotalStorage DS4000家族磁盘系统
时间差
时间通常与Storage
Manager PC同步. 要想显示和改变时间,从Storage Manager GUI 进入Storage
Subsystem —> Set Controller Clock. 显示的时间就是IBM TotalStorage DS 4000 (以前的FAStT)
控制器时间。在改变它之前,记下时间差。
日志收集
1. 系统的profile
启动IBM FAStT
Storage Manager 8 Client, 并进入Subsystem Management. 选择View>>Storage Subsystem
Profile:


  
  
  
  
  
  
  
  
  
  
  
  




file:///C:/DOCUME%7E1/kevinho/LOCALS%7E1/Temp/msohtml1/01/clip_image002.jpg
(图1)

file:///C:/DOCUME%7E1/kevinho/LOCALS%7E1/Temp/msohtml1/01/clip_image004.jpg
选择Save As, 将系统profile 保存下来,如果是一台FAStT500,其系列号为23A1234,建议文件名为 IBM_FAStT500_Profile_23A1234.txt。
2.系统的错误日志:
在图1 中,选择选择View>>Event Log:

file:///C:/DOCUME%7E1/kevinho/LOCALS%7E1/Temp/msohtml1/01/clip_image006.jpg
确保View Only
critical enents 和 View Detail 的选择框为空,Retrieve most recent events为1000,并按Update刷新。 点击Select All, 并Save As:

file:///C:/DOCUME%7E1/kevinho/LOCALS%7E1/Temp/msohtml1/01/clip_image008.jpg
建议文件名为eventlogYYYYMMDD.log

3. 收集Read Link Status Diagnostics信息
在Subsystem
Management中,选择Storage
Subsystem>> Read Link Status Diagnostics:


file:///C:/DOCUME%7E1/kevinho/LOCALS%7E1/Temp/msohtml1/01/clip_image010.jpg



file:///C:/DOCUME%7E1/kevinho/LOCALS%7E1/Temp/msohtml1/01/clip_image012.jpg

选择Save As, 保存为LinkStatusYYYYMMDD.csv,然后点击Set Baseline,重新设置基准线,为以后的检测做准备。

在Storage
Manager9.1中收集DS4000日志更加简单:
1 打开storage manager client,点击”storage subsystem fastt”,
  菜单中选择advancedàtroubleshootingàcollect
all support data;

file:///C:/DOCUME%7E1/kevinho/LOCALS%7E1/Temp/msohtml1/01/clip_image014.jpg

2 为将要收集到的文件取名(例子中是error log):

file:///C:/DOCUME%7E1/kevinho/LOCALS%7E1/Temp/msohtml1/01/clip_image016.jpg

它会把DS4000有关的所有信息打包成一个.zip文件,信息会非常全面。
IBM TotalStorage 企业存储服务器
IBM TotalStorage
Enterprise Storage Server™ 发生问题时,应该拨打IBM技术支持热线,请求进行远程支持,或在问题发生后立刻请IBM工程师现场支持来收集相关的日志PE package和statesaves 。
3583 磁带库和SAN数据网关 (SDGM)
时间差
3583 磁带库
磁带库日期和时间可以从前面板上看到,请参考《3583 Setup and Operator Guide for Multi-Path Libraries》。
3583 SDGM
如果 3583 磁带库装有数据网关 SDGM, 联到 SDGM 串口用date 命令来显示时间和日期。
绝大多数的
SDGM 的时间并未被设置,因为它不影响操作,我们建议把它正确设置:<span style="font-size: 10pt; font-family: Arial; color: black;" lan

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/7000/showart_108097.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP