免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: f22jay
打印 上一主题 下一主题

[内存管理] 怎么区分一个物理页面属于内核还是用户空间 [复制链接]

论坛徽章:
22
丑牛
日期:2014-08-15 14:32:0015-16赛季CBA联赛之同曦
日期:2017-12-14 15:28:14黑曼巴
日期:2017-08-10 08:14:342017金鸡报晓
日期:2017-02-08 10:39:42黑曼巴
日期:2016-11-15 15:48:38CU十四周年纪念徽章
日期:2016-11-09 13:19:1015-16赛季CBA联赛之同曦
日期:2016-04-08 18:00:03平安夜徽章
日期:2015-12-26 00:06:30程序设计版块每日发帖之星
日期:2015-12-03 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-09 06:20:002015亚冠之吉达阿赫利
日期:2015-07-03 08:39:42
11 [报告]
发表于 2013-04-19 22:06 |只看该作者
我觉得lz这个问题挺好的,我说说我的理解,不对之处大家多多指教,为了少打几个字,下面用用户指示用户空间,内核指示内核空间
一个物理页可以被内核使用,也可以被用户使用。但是它从伙伴系统分配出来只有一次
如果被内核分配出来后,那么用户就不可能再拥有这个页了。(用户通过系统调用分配页,如果一个页已经不再伙伴系统中,那么就不会给用户了)。但上述逻辑没有考虑到mmap系统调用(这个系统调用太imba了)。用户也可以去直接操作物理地址(这里是不是绕过了伙伴系统呢?)
小结:用户所占用的物理页是有反向映射的,是通过lru管理的。但是内核占用的页是没有在lru中的。所以大致可以通过struct page中的mapping字段判断

论坛徽章:
0
12 [报告]
发表于 2013-04-19 22:26 |只看该作者
回复 11# amarant
是指直接对“/dev/mem” mmap 吗?buddy应该不感知吧


   

论坛徽章:
0
13 [报告]
发表于 2013-04-20 11:07 |只看该作者
                        查tlb

论坛徽章:
22
丑牛
日期:2014-08-15 14:32:0015-16赛季CBA联赛之同曦
日期:2017-12-14 15:28:14黑曼巴
日期:2017-08-10 08:14:342017金鸡报晓
日期:2017-02-08 10:39:42黑曼巴
日期:2016-11-15 15:48:38CU十四周年纪念徽章
日期:2016-11-09 13:19:1015-16赛季CBA联赛之同曦
日期:2016-04-08 18:00:03平安夜徽章
日期:2015-12-26 00:06:30程序设计版块每日发帖之星
日期:2015-12-03 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-09 06:20:002015亚冠之吉达阿赫利
日期:2015-07-03 08:39:42
14 [报告]
发表于 2013-04-20 19:14 |只看该作者
回复 12# junnyg


    是的,对/dev/mem mmap后,几乎和内核的权限一样大了

论坛徽章:
16
2015亚冠之吉达阿赫利
日期:2015-08-17 11:21:462015年迎新春徽章
日期:2015-03-04 09:58:11酉鸡
日期:2014-12-07 09:06:19水瓶座
日期:2014-11-04 14:23:29天秤座
日期:2014-03-02 08:57:52双鱼座
日期:2014-02-22 13:07:56午马
日期:2014-02-14 11:08:18双鱼座
日期:2014-02-13 11:09:37卯兔
日期:2014-02-06 15:10:34子鼠
日期:2014-01-20 14:48:19戌狗
日期:2013-12-19 09:37:46射手座
日期:2013-12-19 09:33:47
15 [报告]
发表于 2013-04-21 08:03 |只看该作者
本帖最后由 embeddedlwp 于 2013-04-21 08:19 编辑

回复 11# amarant


用户空间使用的hugetlbfs page不在lru上的, 用户进程页表占用的页也不在。

/dev/mem只是让用户访问mmio的内存,内核使用的内存从RAM分配,不会从这里分配,而且/dev/mem的内存也不归buddy管理的。

论坛徽章:
16
2015亚冠之吉达阿赫利
日期:2015-08-17 11:21:462015年迎新春徽章
日期:2015-03-04 09:58:11酉鸡
日期:2014-12-07 09:06:19水瓶座
日期:2014-11-04 14:23:29天秤座
日期:2014-03-02 08:57:52双鱼座
日期:2014-02-22 13:07:56午马
日期:2014-02-14 11:08:18双鱼座
日期:2014-02-13 11:09:37卯兔
日期:2014-02-06 15:10:34子鼠
日期:2014-01-20 14:48:19戌狗
日期:2013-12-19 09:37:46射手座
日期:2013-12-19 09:33:47
16 [报告]
发表于 2013-04-21 08:05 |只看该作者
回复 9# f22jay


the fucking source codes.


   

论坛徽章:
0
17 [报告]
发表于 2013-04-21 10:56 |只看该作者
回复 15# embeddedlwp
hugetlb page使用自己的freelist管理,不归回收算法管,不过THP之后好像支持了大页换出的功能

用户程序占用的页表资源属于内核态使用的资源,建立修改清除都是内核来做的;

/dev/mem不能访问系统的全内存吗?


   

论坛徽章:
16
2015亚冠之吉达阿赫利
日期:2015-08-17 11:21:462015年迎新春徽章
日期:2015-03-04 09:58:11酉鸡
日期:2014-12-07 09:06:19水瓶座
日期:2014-11-04 14:23:29天秤座
日期:2014-03-02 08:57:52双鱼座
日期:2014-02-22 13:07:56午马
日期:2014-02-14 11:08:18双鱼座
日期:2014-02-13 11:09:37卯兔
日期:2014-02-06 15:10:34子鼠
日期:2014-01-20 14:48:19戌狗
日期:2013-12-19 09:37:46射手座
日期:2013-12-19 09:33:47
18 [报告]
发表于 2013-04-21 11:32 |只看该作者
本帖最后由 embeddedlwp 于 2013-04-21 11:33 编辑

回复 17# junnyg

》hugetlb page使用自己的freelist管理,不归回收算法管,不过THP之后好像支持了大页换出的功能

Agreed.

》用户程序占用的页表资源属于内核态使用的资源,建立修改清除都是内核来做的;

page table属于user process的,看oom_badness中对user process所用内存的计算: get_mm_rss(p->mm) + p->mm->nr_ptes + get_mm_counter(p->mm, MM_SWAPENTS); (v3.9-rc7)

》/dev/mem不能访问系统的全内存吗?

系统的内存分RAM和mmio两类,/dev/mem专门用于user process访问mmio的。


   

论坛徽章:
22
丑牛
日期:2014-08-15 14:32:0015-16赛季CBA联赛之同曦
日期:2017-12-14 15:28:14黑曼巴
日期:2017-08-10 08:14:342017金鸡报晓
日期:2017-02-08 10:39:42黑曼巴
日期:2016-11-15 15:48:38CU十四周年纪念徽章
日期:2016-11-09 13:19:1015-16赛季CBA联赛之同曦
日期:2016-04-08 18:00:03平安夜徽章
日期:2015-12-26 00:06:30程序设计版块每日发帖之星
日期:2015-12-03 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-09 06:20:002015亚冠之吉达阿赫利
日期:2015-07-03 08:39:42
19 [报告]
发表于 2013-04-21 11:56 |只看该作者
本帖最后由 amarant 于 2013-04-21 12:12 编辑

回复 15# embeddedlwp


   你好,谢谢指出。关于mmap,我花了一点时间测试。用的是git上最新的内核,arch采用的是mips。结果跟你说的不太一样。测试过程如下
代码:
  1. #include <stdio.h>
  2. #include <unistd.h>
  3. #include<sys/mman.h>
  4. #include<sys/types.h>
  5. #include<sys/stat.h>
  6. #include<fcntl.h>

  7. int main(int argc, char *argv[])
  8. {
  9.         int fd, i;
  10.         long* map_base, *addr;
  11.         off_t offset = 0;

  12.         printf("start\n");
  13.         fd = open("/dev/mem", O_RDWR|O_SYNC);
  14.         if ( fd == -1 ) {
  15.                 printf("open failed\n");
  16.                 return -1;
  17.         }

  18.         if (argv[1])
  19.                 offset = atol(argv[1]);
  20.         map_base = mmap(0, 0x10*sizeof(long), PROT_READ|PROT_WRITE, MAP_SHARED, fd, offset);
  21.         if ( (long)map_base < 0) {
  22.                 printf("mmap failed\n");
  23.                 return -1;
  24.         }
  25.         addr = map_base;
  26.         printf("phys: %p -> virt: %p\n", (void*)offset, addr);

  27.         for (i = 0; i < 0x10; ++i){
  28.                 printf("address: 0x%p   content 0x%lx\n", addr, *addr);
  29.                 addr ++;
  30.         }

  31.         munmap(map_base, 0x10*sizeof(long));
  32.         close(fd);

  33.         return (1);
  34. }
复制代码
执行结果:
  1. / # /a.out 2097152
  2. start
  3. phys: 0x200000 -> virt: 0x773c9000
  4. address: 0x0x773c9000   content 0x0
  5. address: 0x0x773c9004   content 0xde220000
  6. address: 0x0x773c9008   content 0x212fa
  7. address: 0x0x773c900c   content 0x30420001
  8. address: 0x0x773c9010   content 0x2c420001
  9. address: 0x0x773c9014   content 0x20336
  10. address: 0x0x773c9018   content 0xc0b465a
  11. address: 0x0x773c901c   content 0xde320030
  12. address: 0x0x773c9020   content 0x24030010
  13. address: 0x0x773c9024   content 0xd2440000
  14. address: 0x0x773c9028   content 0x832825
  15. address: 0x0x773c902c   content 0xf2450000
  16. address: 0x0x773c9030   content 0x10a0fffc
  17. address: 0x0x773c9034   content 0x0
  18. address: 0x0x773c9038   content 0x30840010
  19. address: 0x0x773c903c   content 0x14800060
  20. / # QEMU 1.4.50 monitor - type 'help' for more information
  21. (qemu) xp/16 0x200000
  22. 0000000000200000: 0x00000000 0xde220000 0x000212fa 0x30420001
  23. 0000000000200010: 0x2c420001 0x00020336 0x0c0b465a 0xde320030
  24. 0000000000200020: 0x24030010 0xd2440000 0x00832825 0xf2450000
  25. 0000000000200030: 0x10a0fffc 0x00000000 0x30840010 0x14800060
  26. (qemu)
复制代码

论坛徽章:
16
2015亚冠之吉达阿赫利
日期:2015-08-17 11:21:462015年迎新春徽章
日期:2015-03-04 09:58:11酉鸡
日期:2014-12-07 09:06:19水瓶座
日期:2014-11-04 14:23:29天秤座
日期:2014-03-02 08:57:52双鱼座
日期:2014-02-22 13:07:56午马
日期:2014-02-14 11:08:18双鱼座
日期:2014-02-13 11:09:37卯兔
日期:2014-02-06 15:10:34子鼠
日期:2014-01-20 14:48:19戌狗
日期:2013-12-19 09:37:46射手座
日期:2013-12-19 09:33:47
20 [报告]
发表于 2013-04-21 12:07 |只看该作者
本帖最后由 embeddedlwp 于 2013-04-21 12:07 编辑

回复 19# amarant


这个offset不是物理地址,而是在文件中的偏移,能在x86上运行吗,mips不懂啊。

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP