平台论坛博客文库

› 论坛 › 操作系统 › BSD › [硬盘][回entsee]　有了smart大师，服务器租用维护再也 ...

12 / 2 页下一页

[硬盘][回entsee]　有了smart大师，服务器租用维护再也不怕奸商旧瓶装新酒 [复制链接]

HonestQiao

版主

论坛徽章:: 1

电梯直达

1楼 [收藏(0)] [报告]

发表于 2007-05-09 14:03 |只看该作者 |倒序浏览

[硬盘][回entsee]　有了smart大师，服务器租用维护再也不怕奸商旧瓶装新酒

　　首先，让我们简单了解一下子什么是Smart：

　　S.M.A.R.T技术(Self Monitoring Analysis And Reporting Technology)：自我监测、分析和报告技术。目前硬盘的平均无故障运行时间(MTBF)已达50000小时以上，但这对于挑剔的专业用户来说还是不够的，因为他们储存在硬盘中的数据才是最有价值的，因此专业用户所需要的就是能提前对故障进行预测的功能。正是这种需求才使S.M.A.R.T.技术得以应运而生。在ATA-3标准中S.M.A.R.T.技术才被正式确立起来。S.M.A.R.T.监测的对象包括磁头、磁盘、马达、电路等硬盘主要部分，它由硬盘的监测电路和主机上的监测软件对被监测对象的运行情况与历史记录及预设的安全值进行分析、比较，当出现安全值范围以外的情况时，会自动向用户发出警告，而更先进的技术还可以提醒网络管理员的注意，自动降低硬盘的运行速度，把重要数据文件转存到其他安全扇区，甚至把文件备份到其他存储设备上。通过S.M.A.R.T.技术，确实可以对硬盘潜在故障进行有效预测，提高数据的安全性。但同时也应该看到S.M.A.R.T.技术并不是万能的，对渐发性的故障的监测是它的用武之地，而对于一些突发性的故障，如对盘片的突然冲击等，S.M.A.R.T.技术也同样是无能为力的。

复制代码

　　然后，我们抓两个小工具：
　　1. FreeBSD的：cd /usr/ports/sysutils/smartmontools;make install clean;rehash
　　2. 瘟到死的：http://smartmontools.sourceforge.net/（这个和FreeBSD的是一样的）
　　　　　　　　 http://www.hdtune.com/（这个是图形界面的）
　　3. 分别安装好他们以备使用。

　　安装好了，我们可以开始监测信息了。
　　首先要知道，我们有几块硬盘了，fdisk一下子，我用的是：/dev/ad0
　　如果是瘟到死的话，呵呵，开始－》运行－》cmd，然后smartd & smartd，就显示smartd运行了。
　　不过我在瘟到死下面，直接用的HDtune，图形界面。

　　FreeBSD执行：smartctl -a /dev/ad0（记住先知道你用的硬盘挂接点哦）；
　　你会看到，有一块信息，与HDTune里面的一样。如果用瘟到死版本的就是smartctl -a /dev/hda
　　以下是这块信息的对照表：

ID 当前最差阈值数据状况
(01) 底层数据读取错误率
(02) 数据吞吐量性能
(03) 主轴马达旋转同步时间
(04) 主轴马达启动/停止次数
(05) 重新分配扇区数量
(07) 寻道错误率
(08) 寻道时间性能
(09) 硬盘加电累计时间
(0A) 主轴马达旋转重试次数
(0C) 硬盘加电次数
(C0) 硬盘断电回位次数
(C1) 磁头升降次数
(C2) 硬盘温度
(C4) 重新分配扇区数据操作次数
(C5) 当前待决扇区数量
(C6) 脱机无法纠正扇区数量
(C7) Ultra DMA 奇偶校验错误次数
(DC) 磁盘偏移
(DE) 磁头上升时间
(DF) 磁头升/降重试次数
(E0) 磁头上升摩擦力
(E2) 磁头上升时间
(F0) 磁头悬浮时间
ID Current Worst ThresholdData Status
(01) Raw Read Error Rate
(02) Throughput Performance
(03) Spin Up Time
(04) Start/Stop Count
(05) Reallocated Sector Count
(07) Seek Error Rate
(08) Seek Time Performance
(09) Power On Hours Count
(0A) Spin Retry Count
(0C) Power Cycle Count
(C0) Power Off Retract Count
(C1) Load Cycle Count
(C2) Temperature
(C4) Reallocated Event Count
(C5) Current Pending Sector
(C6) Offline Uncorrectable
(C7) Ultra DMA CRC Error Count
(DC) Disk Shift
(DE) Loaded Hours
(DF) Load/Unload Retry Count
(E0) Load Friction
(E2) Load-in time
(F0) Head Flying Hours

复制代码

　　有了这个表，嘿嘿，硬盘的使用信息可谓一目了然了，从此不怕奸商酒瓶装新酒。（ＰＳ：如果有超级HB的JS刷了这个信息，那就没有办法了，不过一般是不会的，刷新的话，他想维修也不好办的）。

　　以下还有几条指令可以使用：

　　#简单查一下硬盘健康状态
　　smartctl -H /dev/ad0
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
　　#查硬盘历史错误信息(error log)
　　smartctl -l error /dev/ad0
=== START OF READ SMART DATA SECTION ===
SMART Error Log Version: 1
No Errors Logged
　　
　　#硬盘自测
　　smartctl -l selftest /dev/ad0
　　#终止硬盘自测。
　　smartctl -X /dev/ad0

复制代码

　　特别注意的是：
　　/usr/local/share/doc/smartmontools之中有详细的说明文档，smartctl -h也会有帮助，smartd -h也是的哦。
　　/usr/local/share/doc/smartmontools/examplescripts之中有相关的演示用的例子，可以用脚本调用，例如daemon定时检测什么的。
　　而smartd就是一个daemon，可以查看/usr/local/share/doc/smartmontools/smartd.conf和smartd -h，它甚至可以在磁盘smart检测异常时发送电子邮件给你，抢先在奸商之前获取信息非常重要啊。

　　简单使用就这么多了，好好看说明体会更多的功能吧。
　　
　　参考文档：http://it.sohu.com/20041201/n223268649.shtml
　　　　　　　http://blog.vfocus.net/archives/000411.html

PS:entsee，不好意思，没有仔细调研就回复你没有这样子的工具，真是非常抱歉。不过这个贴出来，想必完全满足你的需要了，呵呵。

FreeBSD_smartctl.jpg (176.37 KB, 下载次数: 93)

瘟到死_smartctl.jpg (395.28 KB, 下载次数: 93)

HDTune.jpg (47.91 KB, 下载次数: 91)

HDTune2.jpg (51.89 KB, 下载次数: 83)

smartmontools-5.37-1.win32-setup.rar

256.7 KB, 下载次数: 490

HDTune.rar

162.72 KB, 下载次数: 192

评分

参与人数 1	可用积分 +3	收起理由
大大狗	+ 3	好东东

查看全部评分

文库|博客

HonestQiao

版主

论坛徽章:: 1

2楼 [报告]

发表于 2007-05-09 14:04 |只看该作者

说明：
S.M.A.R.T检测参数的详细含义，可以看参考文档的：
http://it.sohu.com/20041201/n223268729.shtml

1.ID检测代码

　　ID检测代码不是唯一的，厂商可以根据需要，使用不同的ID代码或根据检测参数的多少增减ID代码的数量。例如，西数公司的产品ID检测代码为“04”，检测的参数是Start/Stop Count(加电次数)，而富士通公司同样代码的检测参数却为“Number of times the spindle motor is activated”(电机激活时间)。

2.属性描述(Attribute Description)

　　属性描述(Attribute Description)即检测项目名称。可由厂商自定义增减，由于ATA标准不断更新，有时候同一品牌的不同型号产品也会有所不同。但必须确保S.M.A.R.T规定的几个主要检测项目(虽然不同厂商对检测项目都有特定的命名规则，但这些监测项目的实质其实是一样的)。

Read Error Rate 错误读取率
Start/Stop Count 启动/停止次数(又称加电次数)
Relocated Sector Count 重新分配扇区数
Spin up Retry Count 旋转重试次数(即硬盘启动重试次数)
Drive Calibration Retry Count 磁盘校准重试次数
ULTRA DMA CRC Error Rate (ULTRA DMA奇偶校验错误率)
Multi-zone Error Rate 多区域错误率
Vendor-specific 厂商特性

　　需要注意的是，不同厂商、不同类型产品的属性描述不尽相同。对用户而言，无须深入了解它们的具体含义，只需了解属性监测值的含义即可。

3.阈值(Threshold)

　　又称门限值。是由硬盘厂商指定的可靠的属性值，通过特定公式计算而得。如果有一个属性值低于相应的阈值，就意味着硬盘将变得不可靠，保存在硬盘里的数据也很容易丢失。可靠属性值的组成和大小对不同硬盘来说是有差异的。这里需要注意的是，ATA标准中只规定了一些S.M.A.R.T参数，它没有规定具体的数值，“Threshold”的数值是厂商根据自己产品特性而确定的。因此，用厂商自己提供的检测软件往往会跟Windows下的检测软件(例如AIDA32)的检测结果有较大出入。这里，我们推荐以厂商软件的检测结果为标准，因为Windows环境下，系统要求硬盘的启动程序比DOS下多得多，这可能导致硬盘S.M.A.R.T值比DOS环境下检测的波动更大。以参数Raw ErrorRate(错误读取率)为例：该参数的计算公式为10×log10(主机和硬盘之间所传输数据的扇区数)×512×8/重读的扇区数。其中 “512×8”是把扇区数转化为所传输的数据位(bits)，这个值只在所传输的数据位处于10^10～10^12范围时才作计算，而当Windows系统启动后，主机和硬盘之间所传输的数据扇区大于或等于10^12时，此值将重新复位。这就是为什么有些值在不同的操作环境、不同检测程序下时波动较大的原因。
......

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

HonestQiao

版主

论坛徽章:: 1

3楼 [报告]

发表于 2007-05-09 14:08 |只看该作者

以后知道好东西需要慢慢找了。

我刚才去：
cd /usr/ports
make search key=disk | more
一个个看说明，就看到了smarttools，去网上看看，smart真的很好用，呵呵。

isjfk

白手起家

论坛徽章:: 0

4楼 [报告]

发表于 2007-05-09 14:30 |只看该作者

这个如果是阵列的话能查出来单块硬盘的信息吗？

HonestQiao

版主

论坛徽章:: 1

5楼 [报告]

发表于 2007-05-09 14:34 |只看该作者

原帖由 isjfk 于 2007-5-9 14:30 发表
这个如果是阵列的话能查出来单块硬盘的信息吗？

-d TYPE, --device=TYPE
Specify device type to one of: ata, scsi, marvell, sat, 3ware,N

只有这些。

entsee

白手起家

论坛徽章:: 0

6楼 [报告]

发表于 2007-05-09 14:43 |只看该作者

谢谢啦，检测了一下

qyowiyru# smartctl -H /dev/ad4
smartctl version 5.37 [i386-portbld-freebsd6.2] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Please note the following marginal Attributes:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
190 Temperature_Celsius 0x0022 048 017 045 Old_age Always In_the_past 52
好像是健康的，不过下面出来一堆就不知是什么意思了！

剑心通明

版主

论坛徽章:: 2

7楼 [报告]

发表于 2007-05-09 14:48 |只看该作者

不错，回头装下看看

HonestQiao

版主

论坛徽章:: 1

8楼 [报告]

发表于 2007-05-09 14:52 |只看该作者

原帖由 entsee 于 2007-5-9 14:43 发表
谢谢啦，检测了一下

qyowiyru# smartctl -H /dev/ad4
smartctl version 5.37 [i386-portbld-freebsd6.2] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/ ...

晕，你要看我前面的说明啊，我不是给出了对照表啊。

(09) 硬盘加电累计时间这个就相当于硬盘的使用时间了。

虽然不加电也可以使用，但是通常加电就是使用时间了。