Chinaunix

标题: ZFS遇到类似设备错误? [打印本页]

作者: bleakwind    时间: 2015-12-28 18:05
标题: ZFS遇到类似设备错误?


Dell 730 2U, 6块硬盘做raidz2

进入系统后系统pool一切正常,1个多月,出现过两次死机,开机就出现图中这种错误.

第一次坏类似这种提示,但是一直循环读取,死循环导致系统慢,最后无法网络断开,去机房插显示器看到的.
第二次今天发现系统稍微有点慢,重启了下无法启动,去机房发现图中错误,重启后HBA卡通过,到FreeBSD卡在最开始步骤,旋转光标无法进行下去,查看硬盘灯da3不正常,读取不过.热拔掉da3系统顺利启动.现在是拔掉da3降级运行.

1.是否硬盘坏? 硬盘坏应该不会导致开不了机吧?
2.是否硬盘背板,也就是图中提示的sas读取设备损坏?
作者: lsstarboy    时间: 2015-12-28 19:54
应该是硬盘坏了,背板坏的可能性很小,如果卡支持,可以在卡上做个测试,或者干脆另找台机器测试da3。
作者: bleakwind    时间: 2015-12-29 05:08
lsstarboy 发表于 2015-12-28 19:54
应该是硬盘坏了,背板坏的可能性很小,如果卡支持,可以在卡上做个测试,或者干脆另找台机器测试da3。


硬盘坏了缘何造成启动不了呢?
作者: lsstarboy    时间: 2015-12-29 08:14
我也遇到过,应该不是不启动,而是启动非常慢而已。da3出问题了有几种情况导致慢,最常见的一种就是读不出来,所以上端的程序就一直等,另一种就是卡一直在重试,极端情况下可能重试进入死循环然后就重启了。
作者: rtm009    时间: 2015-12-29 09:30
硬件坏都看不出来 还是换人吧!
作者: bleakwind    时间: 2015-12-30 00:15
回复 5# rtm009


   你除了信口开河还能干啥?

作者: bleakwind    时间: 2015-12-30 00:20
lsstarboy 发表于 2015-12-29 08:14
我也遇到过,应该不是不启动,而是启动非常慢而已。da3出问题了有几种情况导致慢,最常见的一种就是读不出来 ...


对,就是读不出来,很慢的感觉.
1.所以硬盘坏有可能不会自动下线,会一直重试?
2.即使正常启动,zpool信息没有任何错误异常,硬盘还是有可能是有问题的?

有空试一下换块好的硬盘上去看看.
作者: rtm009    时间: 2015-12-30 17:18
回复 6# bleakwind


    能耐不大 脾气不小
作者: bleakwind    时间: 2015-12-30 22:51
rtm009 发表于 2015-12-29 09:30
硬件坏都看不出来 还是换人吧!

本来就是因为硬件有问题才开的这个贴啊, 你这话说的驴唇不对马嘴啊,你不觉得吗?恐怕你连我帖子都没看完,或者说没看懂?

rtm009 发表于 2015-12-30 17:18
回复 6# bleakwind
能耐不大 脾气不小

别人的能耐不是你有资格评价的, 你说你编程不会, 运维不精, 我估计只是个维护win服务器的吧? 拿着win那一套经验来信口开河, 你觉得你合适吗? 每个贴子发个笑脸不代表你的自信, 也不说明你的专业.


rtm009 发表于 2015-12-29 09:31
装最新的版本 一般都没问题 估计双显卡切换会有困难

FreeBSD配置显卡,特别是最新的双显卡因为都用集成显卡输出,不是像win装了最新驱动就可以的了.要配置xorg.conf的.


rtm009 发表于 2015-12-23 09:52
回复 4# qq261787305
一般独立存储都建议raid5+1或者raid10的 raid 5太危险 特别是管理员对硬件不熟悉的情况!很多时候能用不代表没问题!

raid10同组坏两块跟raid5一样危险,只是为了追求性能才会用raid10,你作为一个运维这都不知道?


rtm009 发表于 2015-12-24 15:31
不会代码的大叔要吗?

建议你去落伍论坛,那边适合你这种灌水的人.也适合信口开河,东扯西扯.根本不关心技术问题.


我只是个PHP和Android码农而已,写过一些不火的开源软件,做过不少项目而已. FreeBSD我只是顺带维护, 省了你这种混饭吃的人而已.
面对lsstarboy和大飞机这种专注技术的人,虚心学习还来不及.

作者: bleakwind    时间: 2015-12-30 22:58
贴一下大飞机对我疑问的解答...

[quote="delphij"][quote="bleakwind"]1.是否硬盘坏? 硬盘坏应该不会导致开不了机吧?[/quote]

是。会(取决于HBA卡固件版本,如果低于 Phase 16 则一切皆有可能,后续版本做了workaround可能会好一些)。

[quote="bleakwind"]2.是否硬盘背板,也就是图中提示的sas读取设备损坏?[/quote]

存在这种可能,但你遇到的这个情况我认为极有可能是硬盘的问题。这种情况在SATA硬盘插到SAS HBA上的时候比较普遍,是否是这种情况?[/quote]


1.所以硬盘坏有可能不会自动下线坏硬盘, 是会导致无法开机, 无法启动等问题的.
2.我的是六块sas硬盘,具体情况要等备机装好,数据妥当,我才能测试下.

备机准备好后,数据转移过去后我会详细测试下是硬盘还是背板坏.
作者: rtm009    时间: 2015-12-31 09:17
本帖最后由 rtm009 于 2015-12-31 09:18 编辑

回复 9# bleakwind


    那你慢慢搞 会写代码的牛人
作者: xdsnet    时间: 2015-12-31 10:09
楼主的是raidz,不是raid5之类的,虽然有点类似
作者: lsstarboy    时间: 2015-12-31 20:00
为什么不在zfs 里下线da3试试呢?
作者: bleakwind    时间: 2016-01-01 05:42
lsstarboy 发表于 2015-12-31 20:00
为什么不在zfs 里下线da3试试呢?


上次有问题就已经下线了.
本来对raidz认识不充分.以为硬盘出问题会直接下线.

大飞机说硬盘有问题也可能不会下线,也会造成开不了机的,这才知道原来如此.
所以硬盘有可能有问题也不会下线.遇到有问题的直接手工下线设备并替换.
作者: lsstarboy    时间: 2016-01-01 09:40
一般来说,如果硬盘有问题,高档的raid卡会用指示灯报警,但是zfs一般是没办法报警的。
作者: 流氓无产者    时间: 2016-01-05 09:34
貌似是scsi报错,sense code没打出来,具体啥也不知道,理论上应该跳过去才对




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2