免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6479 | 回复: 12
打印 上一主题 下一主题

[硬盘][回entsee] 有了smart大师,服务器租用维护再也不怕奸商旧瓶装新酒 [复制链接]

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-05-09 14:03 |只看该作者 |倒序浏览
[硬盘][回entsee] 有了smart大师,服务器租用维护再也不怕奸商旧瓶装新酒

  首先,让我们简单了解一下子什么是Smart:

  1.   S.M.A.R.T技术(Self Monitoring Analysis And Reporting Technology):自我监测、分析和报告技术。目前硬盘的平均无故障运行时间(MTBF)已达50000小时以上,但这对于挑剔的专业用户来说还是不够的,因为他们储存在硬盘中的数据才是最有价值的,因此专业用户所需要的就是能提前对故障进行预测的功能。正是这种需求才使S.M.A.R.T.技术得以应运而生。在ATA-3标准中S.M.A.R.T.技术才被正式确立起来。S.M.A.R.T.监测的对象包括磁头、磁盘、马达、电路等硬盘主要部分,它由硬盘的监测电路和主机上的监测软件对被监测对象的运行情况与历史记录及预设的安全值进行分析、比较,当出现安全值范围以外的情况时,会自动向用户发出警告,而更先进的技术还可以提醒网络管理员的注意,自动降低硬盘的运行速度,把重要数据文件转存到其他安全扇区,甚至把文件备份到其他存储设备上。通过S.M.A.R.T.技术,确实可以对硬盘潜在故障进行有效预测,提高数据的安全性。但同时也应该看到S.M.A.R.T.技术并不是万能的,对渐发性的故障的监测是它的用武之地,而对于一些突发性的故障,如对盘片的突然冲击等,S.M.A.R.T.技术也同样是无能为力的。
复制代码


  然后,我们抓两个小工具:
  1. FreeBSD的:cd /usr/ports/sysutils/smartmontools;make install clean;rehash
  2. 瘟到死的:http://smartmontools.sourceforge.net/(这个和FreeBSD的是一样的)
         http://www.hdtune.com/(这个是图形界面的)
  3. 分别安装好他们以备使用。

  安装好了,我们可以开始监测信息了。
  首先要知道,我们有几块硬盘了,fdisk一下子,我用的是:/dev/ad0
  如果是瘟到死的话,呵呵,开始-》运行-》cmd,然后smartd & smartd,就显示smartd运行了。
  不过我在瘟到死下面,直接用的HDtune,图形界面。

  FreeBSD执行:smartctl -a /dev/ad0(记住先知道你用的硬盘挂接点哦);
  你会看到,有一块信息,与HDTune里面的一样。如果用瘟到死版本的就是smartctl -a /dev/hda
  以下是这块信息的对照表:


  1. ID                               当前     最差     阈值     数据     状况     
  2. (01) 底层数据读取错误率                                                           
  3. (02) 数据吞吐量性能                                                               
  4. (03) 主轴马达旋转同步时间                                                        
  5. (04) 主轴马达启动/停止次数                                                      
  6. (05) 重新分配扇区数量                                                            
  7. (07) 寻道错误率                                                                  
  8. (08) 寻道时间性能                                                                 
  9. (09) 硬盘加电累计时间                                                            
  10. (0A) 主轴马达旋转重试次数                                                         
  11. (0C) 硬盘加电次数                                                               
  12. (C0) 硬盘断电回位次数                                                            
  13. (C1) 磁头升降次数                                                               
  14. (C2) 硬盘温度                                                                 
  15. (C4) 重新分配扇区数据操作次数                                                      
  16. (C5) 当前待决扇区数量                                                              
  17. (C6) 脱机无法纠正扇区数量                                                         
  18. (C7) Ultra DMA 奇偶校验错误次数                                                   
  19. (DC) 磁盘偏移                                                                    
  20. (DE) 磁头上升时间                                                                 
  21. (DF) 磁头升/降重试次数                                                            
  22. (E0) 磁头上升摩擦力                                                               
  23. (E2) 磁头上升时间                                                               
  24. (F0) 磁头悬浮时间                                                                  

  25. ID                               Current  Worst    ThresholdData     Status   
  26. (01) Raw Read Error Rate                                                         
  27. (02) Throughput Performance                                                      
  28. (03) Spin Up Time                                                               
  29. (04) Start/Stop Count                                                           
  30. (05) Reallocated Sector Count                                                     
  31. (07) Seek Error Rate                                                              
  32. (08) Seek Time Performance                                                        
  33. (09) Power On Hours Count                                                         
  34. (0A) Spin Retry Count                                                            
  35. (0C) Power Cycle Count                                                         
  36. (C0) Power Off Retract Count                                                      
  37. (C1) Load Cycle Count                                                            
  38. (C2) Temperature                                                              
  39. (C4) Reallocated Event Count                                                      
  40. (C5) Current Pending Sector                                                        
  41. (C6) Offline Uncorrectable                                                         
  42. (C7) Ultra DMA CRC Error Count                                                     
  43. (DC) Disk Shift                                                                  
  44. (DE) Loaded Hours                                                                 
  45. (DF) Load/Unload Retry Count                                                      
  46. (E0) Load Friction                                                                 
  47. (E2) Load-in time                                                               
  48. (F0) Head Flying Hours                                                            
复制代码


  有了这个表,嘿嘿,硬盘的使用信息可谓一目了然了,从此不怕奸商酒瓶装新酒。(PS:如果有超级HB的JS刷了这个信息,那就没有办法了,不过一般是不会的,刷新的话,他想维修也不好办的)。

  以下还有几条指令可以使用:

  1.   #简单查一下硬盘健康状态
  2.   smartctl -H /dev/ad0
  3. === START OF READ SMART DATA SECTION ===
  4. SMART overall-health self-assessment test result: PASSED

  5.   #查硬盘历史错误信息(error log)
  6.   smartctl -l error /dev/ad0
  7. === START OF READ SMART DATA SECTION ===
  8. SMART Error Log Version: 1
  9. No Errors Logged
  10.   
  11.   #硬盘自测
  12.   smartctl -l selftest /dev/ad0
  13.   #终止硬盘自测。
  14.   smartctl -X /dev/ad0
复制代码


  特别注意的是:
  /usr/local/share/doc/smartmontools之中有详细的说明文档,smartctl -h也会有帮助,smartd -h也是的哦。
  /usr/local/share/doc/smartmontools/examplescripts之中有相关的演示用的例子,可以用脚本调用,例如daemon定时检测什么的。
  而smartd就是一个daemon,可以查看/usr/local/share/doc/smartmontools/smartd.conf和smartd -h,它甚至可以在磁盘smart检测异常时发送电子邮件给你,抢先在奸商之前获取信息非常重要啊。

  简单使用就这么多了,好好看说明体会更多的功能吧。
  
  参考文档:http://it.sohu.com/20041201/n223268649.shtml
       http://blog.vfocus.net/archives/000411.html

PS:entsee,不好意思,没有仔细调研就回复你没有这样子的工具,真是非常抱歉。不过这个贴出来,想必完全满足你的需要了,呵呵。

FreeBSD_smartctl.jpg (176.37 KB, 下载次数: 93)

FreeBSD_smartctl.jpg

瘟到死_smartctl.jpg (395.28 KB, 下载次数: 93)

瘟到死_smartctl.jpg

HDTune.jpg (47.91 KB, 下载次数: 91)

HDTune.jpg

HDTune2.jpg (51.89 KB, 下载次数: 83)

HDTune2.jpg

smartmontools-5.37-1.win32-setup.rar

256.7 KB, 下载次数: 490

HDTune.rar

162.72 KB, 下载次数: 192

评分

参与人数 1可用积分 +3 收起 理由
大大狗 + 3 好东东

查看全部评分

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
2 [报告]
发表于 2007-05-09 14:04 |只看该作者
说明:
S.M.A.R.T检测参数的详细含义,可以看参考文档的:
http://it.sohu.com/20041201/n223268729.shtml
1.ID检测代码

  ID检测代码不是唯一的,厂商可以根据需要,使用不同的ID代码或根据检测参数的多少增减ID代码的数量。例如,西数公司的产品ID检测代码为“04”,检测的参数是Start/Stop Count(加电次数),而富士通公司同样代码的检测参数却为“Number of times the spindle motor is activated”(电机激活时间)。

2.属性描述(Attribute Description)

  属性描述(Attribute Description)即检测项目名称。可由厂商自定义增减,由于ATA标准不断更新,有时候同一品牌的不同型号产品也会有所不同。但必须确保S.M.A.R.T规定的几个主要检测项目(虽然不同厂商对检测项目都有特定的命名规则,但这些监测项目的实质其实是一样的)。

Read Error Rate 错误读取率
Start/Stop Count 启动/停止次数(又称加电次数)
Relocated Sector Count 重新分配扇区数
Spin up Retry Count 旋转重试次数(即硬盘启动重试次数)
Drive Calibration Retry Count 磁盘校准重试次数
ULTRA DMA CRC Error Rate (ULTRA DMA奇偶校验错误率)
Multi-zone Error Rate 多区域错误率
Vendor-specific 厂商特性

  需要注意的是,不同厂商、不同类型产品的属性描述不尽相同。对用户而言,无须深入了解它们的具体含义,只需了解属性监测值的含义即可。

3.阈值(Threshold)

  又称门限值。是由硬盘厂商指定的可靠的属性值,通过特定公式计算而得。如果有一个属性值低于相应的阈值,就意味着硬盘将变得不可靠,保存在硬盘里的数据也很容易丢失。可靠属性值的组成和大小对不同硬盘来说是有差异的。这里需要注意的是,ATA标准中只规定了一些S.M.A.R.T参数,它没有规定具体的数值,“Threshold”的数值是厂商根据自己产品特性而确定的。因此,用厂商自己提供的检测软件往往会跟Windows下的检测软件(例如AIDA32)的检测结果有较大出入。这里,我们推荐以厂商软件的检测结果为标准,因为Windows环境下,系统要求硬盘的启动程序比DOS下多得多,这可能导致硬盘S.M.A.R.T值比DOS环境下检测的波动更大。以参数Raw ErrorRate(错误读取率)为例:该参数的计算公式为10×log10(主机和硬盘之间所传输数据的扇区数)×512×8/重读的扇区数。其中 “512×8”是把扇区数转化为所传输的数据位(bits),这个值只在所传输的数据位处于10^10~10^12范围时才作计算,而当Windows系统启动后,主机和硬盘之间所传输的数据扇区大于或等于10^12时,此值将重新复位。这就是为什么有些值在不同的操作环境、不同检测程序下时波动较大的原因。
......

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
3 [报告]
发表于 2007-05-09 14:08 |只看该作者
以后知道好东西需要慢慢找了。

我刚才去:
cd /usr/ports
make search key=disk | more
一个个看说明,就看到了smarttools,去网上看看,smart真的很好用,呵呵。

论坛徽章:
0
4 [报告]
发表于 2007-05-09 14:30 |只看该作者
这个如果是阵列的话能查出来单块硬盘的信息吗?

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
5 [报告]
发表于 2007-05-09 14:34 |只看该作者
原帖由 isjfk 于 2007-5-9 14:30 发表
这个如果是阵列的话能查出来单块硬盘的信息吗?


  -d TYPE, --device=TYPE
         Specify device type to one of: ata, scsi, marvell, sat, 3ware,N

只有这些。

论坛徽章:
0
6 [报告]
发表于 2007-05-09 14:43 |只看该作者
谢谢啦,检测了一下

qyowiyru# smartctl -H /dev/ad4
smartctl version 5.37 [i386-portbld-freebsd6.2] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Please note the following marginal Attributes:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
190 Temperature_Celsius     0x0022   048   017   045    Old_age   Always   In_the_past 52
好像是健康的,不过下面出来一堆就不知是什么意思了!

论坛徽章:
2
丑牛
日期:2013-09-29 09:47:222015七夕节徽章
日期:2015-08-21 11:06:17
7 [报告]
发表于 2007-05-09 14:48 |只看该作者
不错,回头装下看看

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
8 [报告]
发表于 2007-05-09 14:52 |只看该作者
原帖由 entsee 于 2007-5-9 14:43 发表
谢谢啦,检测了一下

qyowiyru# smartctl -H /dev/ad4
smartctl version 5.37 [i386-portbld-freebsd6.2] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/ ...


晕,你要看我前面的说明啊,我不是给出了对照表啊。

(09) 硬盘加电累计时间      这个就相当于硬盘的使用时间了。

虽然不加电也可以使用,但是通常加电就是使用时间了。

论坛徽章:
0
9 [报告]
发表于 2007-05-09 19:00 |只看该作者
如果是js的话,没有买之前会让你随便安装东西吗?^_^

谢谢 小乔 斑竹的工具。

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
10 [报告]
发表于 2007-05-09 20:30 |只看该作者
这个用处大  哈哈 感谢推荐
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP