免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1838 | 回复: 0
打印 上一主题 下一主题

Glibc 的malloc源代码分析 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-04-23 16:52 |只看该作者 |倒序浏览

                                          Glibc 的malloc源代码分析
有人写了一个测试程序
#include
#include
#include
#include
main()
{
  int alloc_time = 20000;
  char* a[alloc_time];
  char* b[alloc_time];
for(int j=0; j
发现该程序在测试机上运行会占用1G内存,不释放,为了解决这个问题,特别去研究了一下glibc中malloc的源代码。




一.对于小于128k的块在heap中分配。
1.堆是通过brk的方式来增长或压缩的,如果在现有的堆中不能找到合适的chunk,会通过增长堆的方式来满足分配,如果堆顶的空闲块超过一定的阀值会收缩堆,所以只要堆顶的空间没释放,堆是一直不会收缩的。
2.堆中的分配信息是通过两个方式来记录。
第一.是通过chunk的头,chunk中的头一个字是记录前一个chunk的大小,第二个字是记录当前chunk的大小和一些标志位,从第三个字开始是要使用的内存。所以通过内存地址可以找到chunk,通过chunk也可以找到内存地址。还可以找到相邻的下一个chunk,和相邻的前一个chunk。一个堆完全是由n个chunk组成。
第二.是由3种队列记录,只用空闲chunk才会出现在队列中,使用的chunk不会出现在队列中。如果内存块是空闲的它会挂到其中一个队列中,它是通过内存复用的方式,使用空闲chunk的第3个字和第4个字当作它的前链和后链(变长块是第5个字和第6个字),省的再分配空间给它。
第一种队列是bins,bins有128个队列,前64个队列是定长的,每隔8个字节大小的块分配在一个队列,后面的64个队列是不定长的,就是在一个范围长度的都分配在一个队列中。所有长度小于512字节(大约)的都分配在定长的队列中。后面的64个队列是变长的队列,每个队列中的chunk都是从小到大排列的。
第二种队列是unsort队列(只有一个队列),(是一个缓冲)所有free下来的如果要进入bins队列中都要经过unsort队列。
第三种队列是fastbins,大约有10个定长队列,(是一个高速缓冲)所有free下来的并且长度是小于80的chunk就会进入这种队列中。进入此队列的chunk在free的时候并不修改使用位,目的是为了避免被相邻的块合并掉。
3.malloc的步骤
l        
先在fastbins中找,如果能找到,从队列中取下后(不需要再置使用位为1了)立刻返回。
l        
判断需求的块是否在小箱子(bins的前64个bin)范围,如果在小箱子的范围,并且刚好有需求的块,则直接返回内存地址;如果范围在大箱子(bins的后64个bin)里,则触发consolidate。(因为在大箱子找一般都要切割,所以要优先合并,避免过多碎片)
l        
然后在unsort中取出一个chunk,如果能找到刚好和想要的chunk相同大小的chunk,立刻返回,如果不是想要chunk大小的chunk,就把他插入到bins对应的队列中去。转3,直到清空,或者一次循环了10000次。
l        
然后才在bins中找,找到一个最小的能符合需求的chunk从队列中取下,如果剩下的大小还能建一个chunk,就把chunk分成两个部分,把剩下的chunk插入到unsort队列中去,把chunk的内存地址返回。
l        
在topchunk(是堆顶的一个chunk,不会放到任何一个队列里的)找,如果能切出符合要求的,把剩下的一部分当作topchunk,然后返回内存地址。
l        
如果fastbins不为空,触发consolidate即把所有的fanbins清空(是把fanbins的使用位置0,把相邻的块合并起来,然后挂到unsort队列中去),然后继续第3步。
l        
还找不到话就调用sysalloc,其实就是增长堆了。然后返回内存地址。
4.free的步骤
l        
如果和topchunk相邻,直接和topchunk合并,不会放到其他的空闲队列中去。
l        
如果释放的大小小于80字节,就把它挂到fastbins中去,使用位仍然为1,当然更不会去合并相邻块。
l        
如果释放块大小介于80-128k,把chunk的使用位置成0,然后试图合并相邻块,挂到unsort队列中去,如果合并后的大小大于64k,也会触发consolidate,(可能是周围比较多小块了吧),然后才试图去收缩堆。(收缩堆的条件是当前free的块大小加上前后能合并chunk的大小大于64k,并且要堆顶的大小要达到阀值,才有可能收缩堆)
l        
对于大于128k的块,直接munmap



二.大于128k的块通过mmap的方式来分配。




根据以上的分析,我们可以得出为什么会还占用1G的内存。
测试程序有两重循环,内层循环先分配1G,然后全部释放,外层执行这个步骤5次,但为什么最后一次释放会不成功呢。
主要是因为按照这个程序分配后,内存变成由小块和大块交替出现,释放小块的时候,直接把小块放到fastbins中去,而且他的使用位还是1,释放大块的时候,它试图合并相邻的块,但是和它相邻的块的使用位还是1,所以它不能把相邻的块合并去来,而且释放的块的大小小于64k,也不会触发consolidate,即不会把fastbins清空,所以当所有的块都被释放完后,所有的小块都在fastbins里面,使用位都为1,大块都挂在unsort队列里面。全部都无法合并。所以使用的堆更加无法压缩。

如果在外循环后面再分配2000字节然后释放的话,所有内存将全部清空。这是因为在申请2000字节的时候,由malloc的第二步,程序会先调用consolidate,即把所有的fastbins清空,同时把相邻的块合并起来,等到所有的fastbins清空的时候,所有的块也被合并去来了,然后调用free2000字节的时候,这块被将被合并起来,成为topchunk,并且大小远大于64k,所有堆将会收缩,内存归还给系统。



               
               
               

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u3/94916/showart_1908306.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP