免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6148 | 回复: 5
打印 上一主题 下一主题

关于void sync(void)函数被阻塞问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-07-06 13:52 |只看该作者 |倒序浏览
情况是这样的:有一个测试USB Disk SPeed的Shell,使用的方法是调用/bin下的hdparm命令,将会自动读取USB设备,并计算其读取速度,然后Show在屏幕上,核心代码如下
  1. /bin/hdparm -t /dev/sda
复制代码


    由于在测试USB Disk前有许多其它测试项目,导致测试到USB时,系统长时间不响应,虽然最终会有测试结果,但是delay时间过长(5-10分钟)。
    用strace跟踪上述代码发现hdparm在执行到sync()时候被阻塞(没有返回),分析hdparm的原码,发现就是在如下的代码中被阻塞
  1. sync()
  2. sleep(3)//清除对设备的请求,并给其清除的时间
复制代码


    sync为什么会在此处被阻塞呢?我想分析kernel source sync的原码,可是没有找到,哪个大虾知道路径麻烦告诉一声。。。
    由man2 可知sync就是将在kernel缓存的东西都写到disk上,并且目前的Linux在数据真正被写好前都会一直等待。

   那么什么情况会导致调用sync阻塞那么久的时间呢?应该不是sync在等待数据写完。

   猜测是由于前几个测试项目中是不是有没有close的文件句柄?没有free的内存空间?内核缓冲中本来有写到某个device的数据,但是在系统sync前,设备被移除了,导致执行到这里sync时候阻塞?

   补充:文件系统是放在NAND这种存储设备上的,有一个试验,写一个比较大的文件到nand以后,然后unlink操作,再立刻reboot -nf,关机再开机以后做sync,会有3/77 的比率存在sync调用时间>40s以上,都已经关机了,为什么开机再sync还会阻塞这么久呢?难道是unlink操作即使在关机后依然有效?

   大小虾们有什么想法见解都来说说吧!  这个问题实在搞得我没有想法了。。。

这个帖子本来放在C,C++板块,可是没有什么响应,可能在内核板块会有很多高手知道原因...

[ 本帖最后由 lilianglinux 于 2007-7-9 08:22 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2007-07-06 16:46 |只看该作者
程序关闭就会自动关闭句柄,关闭前会将缓存数据写到物理介质中。

“内核缓冲中本来有写到某个device的数据,但是在系统sync前,设备被移除了,导致执行到这里sync时候阻塞?”
这个我觉得有可能。

设备移除后,该文件描述符无效,但仍会保留直到应用程序关闭,具体阻塞在哪还要看看U盘部分处理。

论坛徽章:
0
3 [报告]
发表于 2007-07-07 08:43 |只看该作者
原帖由 apony 于 2007-7-6 16:46 发表于 2楼  

“内核缓冲中本来有写到某个device的数据,但是在系统sync前,设备被移除了,导致执行到这里sync时候阻塞?”
这个我觉得有可能。

设备移 ...


   我写了一个测试的程序,就是用有缓存模式打开设备后,往设备写入数据,然后移出设备,然后程序中再做sync调用,sync不会被阻塞,反而会报出设备不存在的错误,
  1. 0:0:0:0: rejecting I/O to dead device
复制代码

论坛徽章:
0
4 [报告]
发表于 2007-07-09 13:08 |只看该作者
设备不存在的错误应该是在设备拔除后程序进行写操作时发生的,你原先说的是sync()的时候(我理解为关闭的时候)。
你的测试程序可能在数据量上还差些。
可以strace跟一下hdparm命令做多少数据,尽量使你的测试程序和他一致,才容易重现。
PS:hdparm有代码吧?可以直接调试的吧?

论坛徽章:
0
5 [报告]
发表于 2007-07-09 15:34 |只看该作者
原帖由 apony 于 2007-7-9 13:08 发表于 4楼  
设备不存在的错误应该是在设备拔除后程序进行写操作时发生的,你原先说的是sync()的时候(我理解为关闭的时候)。
你的测试程序可能在数据量上还差些。
可以strace跟一下hdparm命令做多少数据,尽量使你的测试 ...


   我的测试程序目的是验证系统缓存中的数据,如果在目标设备移除后,再次调用sync时候,会出现什么问题,会不会导致一样的阻塞现象. 结果是移除设备后再次sync,sync会出现 "dead device"的报错..

   hdparm有源代码,下面附上
http://www.filefactory.com/mupc/93fd5b/

   我们所说的sync阻塞就发生在其hdparm.c的502行,不过这个源代码我好像改过,把这行mark了,原始是没有的.

   现在我想直接在hdparm的源代码中做类似的试验,在hdparm源代码调用sync前移除系统中的某个设备(不会是usb,因为hdparm就是用来测试usb),看看有什么情况发生.

[ 本帖最后由 lilianglinux 于 2007-7-9 15:38 编辑 ]

论坛徽章:
0
6 [报告]
发表于 2007-07-16 19:10 |只看该作者
自己顶顶不可以吗?
....凑字数
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP