免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1964 | 回复: 2
打印 上一主题 下一主题

[内存管理] 【已解决】测试发现一个umount时的异常现场 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-04-27 21:55 |只看该作者 |倒序浏览
本帖最后由 chenyu105 于 2014-06-10 10:30 编辑

内核版本 2.6.32
cpu 架构 mips64
复现方法是大IO下,不停的插拔usb
异常现场如下:

  1. CPU 1 Unable to handle kernel paging request at virtual address 6b6b6b6b6b6b6b9b, epc == ffffffffc07127c4, ra == ffffffffc071271c
  2. [<ffffffffc0638b1c>] die+0xa4/0x130
  3. [<ffffffffc06491a0>] do_page_fault+0x2e8/0x3b8
  4. [<ffffffffc0601024>] ret_from_exception+0x0/0x10
  5. [<ffffffffc07127c4>] __mark_inode_dirty+0x124/0x1f8
  6. [<ffffffffc0776c30>] ext3_put_super+0xb8/0x2c8
  7. [<ffffffffc06ec454>] generic_shutdown_super+0x7c/0x130
  8. [<ffffffffc06ec52c>] kill_block_super+0x24/0x50
  9. [<ffffffffc06ed57c>] deactivate_super+0x94/0xc0
  10. [<ffffffffc070b438>] SyS_umount+0xb8/0x4e8
  11. [<ffffffffc06038c4>] handle_sys64+0x44/0x60
复制代码
出错的C代码位置是下面的bdi_cap_writeback_dirty(bdi),即尝试访问bdi->bdi->capabilities时,
由于bdi为6b6b6b6b6b6b6b6b,导致出错。
  1. void __mark_inode_dirty(struct inode *inode, int flags)
  2. {
  3.         struct super_block *sb = inode->i_sb;
  4.         if (!was_dirty) {
  5.                         struct bdi_writeback *wb = &inode_to_bdi(inode)->wb;
  6.                         struct backing_dev_info *bdi = wb->bdi;

  7.                         if (bdi_cap_writeback_dirty(bdi)
复制代码
错误位置,大概是inode_to_bdi 返回的backing_dev_info结构体内的bdi_writeback成员,
其bdi的值有问题。 根据错误地址6b6b6b6b6b6b6b9b
可以知道,这个bdi_writeback成员指向的bdi的值,已经被slab释放了。
  1. #define POISON_FREE        0x6b        /* for use-after-free poisoning */
复制代码
我查了下目前内核对inode_to_bdi的补丁,感觉下面这个补丁修改了inode_to_bdi实现,
但感觉和这个故障没太大联系。大家看看这个是不是什么新的bug?
  1. diff --git a/fs/fs-writeback.c b/fs/fs-writeback.c
  2. index 5581122..ab38fef 100644
  3. --- a/fs/fs-writeback.c
  4. +++ b/fs/fs-writeback.c
  5. @@ -72,22 +72,11 @@ int writeback_in_progress(struct backing_dev_info *bdi)
  6. static inline struct backing_dev_info *inode_to_bdi(struct inode *inode)
  7. {
  8.         struct super_block *sb = inode->i_sb;
  9. -       struct backing_dev_info *bdi = inode->i_mapping->backing_dev_info;

  10. -       /*
  11. -        * For inodes on standard filesystems, we use superblock's bdi. For
  12. -        * inodes on virtual filesystems, we want to use inode mapping's bdi
  13. -        * because they can possibly point to something useful (think about
  14. -        * block_dev filesystem).
  15. -        */
  16. -       if (sb->s_bdi && sb->s_bdi != &noop_backing_dev_info) {
  17. -               /* Some device inodes could play dirty tricks. Catch them... */
  18. -               WARN(bdi != sb->s_bdi && bdi_cap_writeback_dirty(bdi),
  19. -                       "Dirtiable inode bdi %s != sb bdi %s\n",
  20. -                       bdi->name, sb->s_bdi->name);
  21. -               return sb->s_bdi;
  22. -       }
  23. -       return bdi;
  24. +       if (strcmp(sb->s_type->name, "bdev") == 0)
  25. +               return inode->i_mapping->backing_dev_info;
  26. +
  27. +       return sb->s_bdi;
  28. }
复制代码

论坛徽章:
0
2 [报告]
发表于 2014-06-10 10:30 |只看该作者
这个问题,需要合入一个scsi的补丁。 在配置CONFIG_SLAB_DEBUG时容易出是因为magic number 0x6b更容易在第一现场就触发非法地址访问。
  1. [SCSI] Fix oops caused by queue refcounting failure
  2. In certain circumstances, we can get an oops from a torn down device.
  3. Most notably this is from CD roms trying to call scsi_ioctl.
  4. The root cause of the problem is the fact that after scsi_remove_device() has been called,
  5. the queue is fully torn down.
  6. This is actually wrong since the queue can be used until the sdev release function is called.
  7. Therefore, we add an extra reference to the queue which is released in sdev->release,
  8. so the queue always exists.
  9. Reported-by: Parag Warudkar <parag.lkml@gmail.com>
  10. Cc: stable@kernel.org
  11. Signed-off-by: James Bottomley <jbottomley@parallels.com>
复制代码
  1. diff --git a/drivers/scsi/scsi_scan.c b/drivers/scsi/scsi_scan.c
  2. index 58584dc..44e8ca3 100644
  3. --- a/drivers/scsi/scsi_scan.c
  4. +++ b/drivers/scsi/scsi_scan.c


  5. @@ -297,7 +297,7 @@ static struct scsi_device *scsi_alloc_sdev(struct scsi_target *starget,



  6. kfree(sdev);



  7. goto out;



  8. }



  9. -



  10. + blk_get_queue(sdev->request_queue);



  11. sdev->request_queue->queuedata = sdev;



  12. scsi_adjust_queue_depth(sdev, 0, sdev->host->cmd_per_lun);







  13. diff --git a/drivers/scsi/scsi_sysfs.c b/drivers/scsi/scsi_sysfs.c
  14. index e639125..e0bd3f7 100644
  15. --- a/drivers/scsi/scsi_sysfs.c
  16. +++ b/drivers/scsi/scsi_sysfs.c



  17. @@ -322,6 +322,7 @@ static void scsi_device_dev_release_usercontext(struct work_struct *work)



  18. kfree(evt);



  19. }







  20. + blk_put_queue(sdev->request_queue);



  21. /* NULL queue means the device can't be used */



  22. sdev->request_queue = NULL;
复制代码

论坛徽章:
20
CU大牛徽章
日期:2013-04-17 11:48:26羊年新春福章
日期:2015-03-10 22:39:202015年中国系统架构师大会
日期:2015-06-29 16:11:282015亚冠之平阳省
日期:2015-07-31 09:19:042015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-09-30 06:20:002015亚冠之柏太阳神
日期:2015-10-19 20:29:5915-16赛季CBA联赛之天津
日期:2016-11-29 14:03:4315-16赛季CBA联赛之北控
日期:2016-12-24 20:51:492015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-12 20:58:532014年中国系统架构师大会
日期:2014-10-14 15:59:00
3 [报告]
发表于 2014-06-10 12:41 |只看该作者
不错,学习了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP