免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: ryangecko
打印 上一主题 下一主题

最近系统老是损坏文件系统,大家帮忙看看,谢谢! [复制链接]

论坛徽章:
0
11 [报告]
发表于 2011-04-23 11:05 |只看该作者
10楼的问题和1楼有相识性,不过看起来更像Kernel的Bug,可以找个软件测试下你们的I/O Throughput情况

楼主的问题可能也和这个问题相关,不过还是先仔细检查下你们自己修改的内核读写文件代码

Apr 11 15:22:20  kernel: php-cgi[5609]: segfault at 0 ip 00007fc170fc8a09 sp 00007fff82384ea0 error 4 in pdo_pgsql.so[7fc170fc2000+8000]
这个错误信息应该就是和你们代码相关的吧?

论坛徽章:
0
12 [报告]
发表于 2011-04-24 02:40 |只看该作者
这位仁兄可以说的详细一些么?我的系统之前是centos5.4,第一次出现input/output error,文件系统变成只读的。我就把硬盘换了,换硬盘后装的CentOS5.5.   
以下是我的dmesg...等日志信息。帮忙研究研究哈,谢谢啦。实在是郁闷,遇到这个问题。

Input_Output error.tar.gz (60.39 KB, 下载次数: 14)

论坛徽章:
0
13 [报告]
发表于 2011-05-12 23:40 |只看该作者
日志中显示,硬盘出错了,出现文件系统损坏与这个关系很大。

论坛徽章:
0
14 [报告]
发表于 2011-05-13 11:47 |只看该作者
Apr 13 09:29:52   kernel: ata1.00: irq_stat 0x40000001
Apr 13 09:29:52   kernel: ata1.00: cmd c8/00:08:ff:7f:8a/00:00:00:00:00/e0 tag 0 dma 4096 in
Apr 13 09:29:52   kernel:         res 51/40:00:ff:7f:8a/f1:00:00:00:00/e0 Emask 0x9 (media error)
Apr 13 09:29:52   kernel: ata1.00: status: { DRDY ERR }
Apr 13 09:29:52   kernel: ata1.00: error: { UNC }
Apr 13 09:29:52   kernel: ata1.00: configured for UDMA/133
Apr 13 09:29:52   kernel: ata1: EH complete
Apr 13 09:29:52   kernel: ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Apr 13 09:29:52   kernel: ata1.00: irq_stat 0x40000001
Apr 13 09:29:52   kernel: ata1.00: cmd c8/00:08:ff:7f:8a/00:00:00:00:00/e0 tag 0 dma 4096 in
Apr 13 09:29:52   kernel:         res 51/40:00:ff:7f:8a/f1:00:00:00:00/e0 Emask 0x9 (media error)
Apr 13 09:29:52   kernel: ata1.00: status: { DRDY ERR }
Apr 13 09:29:52   kernel: ata1.00: error: { UNC }


这个错误是硬盘坏道的错误,你的硬盘都坏道了,文件系统肯定会出问题的
详见
http://lime-technology.com/wiki/ ... sis_of_Drive_Issues

论坛徽章:
0
15 [报告]
发表于 2011-05-20 11:16 |只看该作者
回复 14# highnjupt

我第一次出现问题的时候,把硬盘拆下来去检测了。在中关村一家电脑医院。他们说硬盘没有问题。然后我买了一个新硬盘,换上新硬盘半个月后又出现这个问题。我感觉不是硬盘的问题。然后后来我问卖我服务器的那个IDC的技术。他说是数据线的问题。现在那台服务器一家下架了,我想全面的检查一下。这个问题到底是什么原因。高手们提供点信息,或者步骤,方法等哦。谢谢。

论坛徽章:
0
16 [报告]
发表于 2011-05-20 11:18 |只看该作者
回复 13# todaygood

恩。我就是想找到硬盘出错的原因。怎样去查呢?

论坛徽章:
0
17 [报告]
发表于 2011-05-20 13:35 |只看该作者
硬盘的坏道错误基本有两种,一种是软坏道错误,可能某个时候你读写,会报错误,但是你重启下系统可能就自动恢复好了;
一种是硬的坏道错误,你再怎么去修复都无补于事,但是硬盘对坏道的处理机制作了改善,一般硬盘的大小实际上是比标示的
容量要大,硬盘隐藏了部分的备份扇区,比如说你某一个扇区坏了,磁盘内部会用备份的扇区来代替刚刚坏过的扇区,这样等
你再次来操作硬盘该扇区的时候,就不会有坏道的提示;备份扇区是有限的,当硬盘坏道一定的时候,这个备份扇区用完之后,
再次出现坏道的话,你用硬盘检测工具检测就很快出现了。所以我怀疑你的硬盘的坏道被备份的扇区取代了。

http://blog.chinaunix.net/space. ... o=blog&id=81455
这个下面是参考ata的指令修改的坏道检测代码,你可以试试能不能检测出来

另外,linux下可以使用smartctl工具来检测硬盘的信息,你可以读取smart信息,看看是不是硬盘有记录坏道的信息!

论坛徽章:
0
18 [报告]
发表于 2011-05-20 16:41 |只看该作者
回复 11# AlexWoo2011

我们公司好多服务器,就这个有问题。是不是可以理解为系统内核与硬件不兼容?还有,这种不兼容为什么是间断性犯问题。重启后有时候会好起来。这台服务器是IBM X336,硬盘是用的普通PC硬盘,是不是很有可能是硬盘转换接口的问题?

论坛徽章:
0
19 [报告]
发表于 2011-05-20 17:57 |只看该作者
普通PC硬盘的设计以8×5为基础。8×5指的是普通PC硬盘每天工作8个小时,每周工作5天(硬盘工作是指硬盘处于读写状态。需要特别注意的是硬盘加电后有两个状态:工作状态和等待状态,其中工作状态是硬盘进行读写工作,等待状态是硬盘没有进行读写工作但处于待命状态。)
服务器硬盘是按24×7的企业级环境要求进行设计开发的。24×7就是每天工作24个小时,每周工作7天(就是连续不断的进行工作)。
所以普通PC硬盘并不适合长时间连续读写,如果要求普通PC硬盘长时间连续读写就会极大的损伤硬盘,使硬盘出现异常声音、读写错误、工作中止等多种问题并由此导致硬盘最终损坏。

论坛徽章:
0
20 [报告]
发表于 2011-05-23 15:11 |只看该作者
我是菜鸟,进来学习一下
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP