Unix/Linux内存管理

jopen 10年前

一、底层结构

        采用三层结构,实际使用中可以方便映射到两层或者三层结构,以适用不同的硬件结构。最下层的申请内存函数get_free_page。之上有三种类型的内存分配函数:

        1.kmalloc类型。内核进程使用,基于切片(slab)技术,用于管理小于内存页的内存申请。思想出发点和应用层的内存缓冲池同出一辙。但它针对内核结构,特别处理应用场景固定,不考虑释放。

        2.vmalloc类型。内核进程使用。用于申请不连续内存。

        3.brk/mmap类型。用户进程使用。malloc/free实现的基础。

二、内存管理的相关函数图

        STL  ->  内存自动分配和自动回收(C++)

           |

        C++  ->  new分配内存,delete回收内存

           |

          C  ->  malloc分配内存,free回收内存

           |

        Unix 系统函数 ->  sbrk/brk  分配和回收内存

           |

        Unix底层系统函数  ->  mmap/munmap分配回收

                                                                                        (用户层)

----------------------------------------------------------------------------

                                                                                        (内核层)

        Unix内核函数  kmalloc/vmalloc/get_free_page

三、进程与内存

        a.所有进程(执行的程序)都必须占用一定数量的内存

        b.对任何一个普通进程来讲,它都会涉及到5种不同的数据段,其内存空间划分为:

                1.代码区    ——    存放代码/函数,也就是说它是可执行程序的内存中的镜像。(只读)

                2.全局区    ——    保存全局变量,static局部变量。

                3.BSS段     ——    未初始化的全局变量,BSS段在main函数执行之前会自动清零

                4.栈区       ——    局部变量,包括函数的形参,栈区内存自动分配和自动回收。

                5.堆区       ——    程序员自己管理的区域,malloc/free操作的都是堆区。

                6.只读常量区    ——    存放字符串常量和const修饰的全局变量

                注:只读常量区和代码区非常接近,有些书把只读常量区和代码区合并为代码区。

        c.进程如何组织这些区域?

                从小到大次序:代码区、只读常量区、全局区、BSS段、堆区、栈区

                堆区在离前面四个区不远的地址空间开始,从小到大分配,栈区从3G开始,从大到小分配。主要为了避免堆区和栈区重叠。

        d.查看内存分配

                Linux把一切都看做成文件,内存也可以在文件中查看。每个进程都在/proc目录下有一个对应的子目录,以进程ID作为子目录名。进程ID是系统对进程的标识。可以用ps-aux命令查看进程。

                cat /proc/进程ID/maps    可以查看当前进程的内存情况。

四、虚拟内存管理技术

        Linux使用了虚拟内存地址。每个Linux中的进程都有 0~4G的虚拟内存地址,就是0~4G的数字。虚拟内存地址在开始时只是一个数字,不对应任何的内存。虚拟内存地址必须先映射一段物理内存或硬盘上的文件才能被使用。所谓的分配内存其实就是让虚拟内存地址映射一段物理内存。如果使用没有映射的虚拟内存地址就会引发段错误。

        程序员所操作的内存地址都是虚拟内存地址,看不到物理内存地址。

        0~4G的虚拟内存地址中,0~3G是用户使用,叫做“用户空间”,3G~4G是内核使用的,叫做“内核空间”。用户空间不能直接使用内核空间,但可以通过内核空间提供的一些函数(系统调用)访问内核空间。

        注:内存管理的基本单位是4096 byte (4K),叫内存页。内存的映射和回收都是以内存页作为基本单位。

五、进程内存管理

        进程内存管理的对象是进程线性地址空间上的内存镜像,这些内存镜像其实就是进程使用的虚拟内存区域(memory region)。进程虚拟空间是个32或64位的“平坦”(独立的连续区间)地址空间(空间的具体大小取决于体系结构)。要统一管理这么大的平坦空间可绝非易事,为了方便管理,虚拟空间被划分为许多大小可变的(但必须是4096byte的整数倍数)内存区域,这些区域在进程线性地址中像停车位一样有序排列。这些区域的划分原则是“将访问属性一致的地址空间存放在一起”,所谓访问属性一致无非是指“可读、可写、可执行等”。

六、物理内存管理(页管理)

        Linux内核管理物理内存是通过分页机制实现的,它将整个内存划分成无数4K(在i386体系结构中)大小页,从而分配和回收内存的基本单位便是内存页了。利用分页管利用助于灵活分配内存地址,因为分配时不必要求必须有大块的连续内存,系统可以东一页、西一页的凑出所需要的内存供进程使用。虽然如此,但是实际上系统使用内存还是倾向于分配连续的内存块,因为分配连续内存时,页表不需要修改,因此能降低刷新率(频繁刷新会很大增加访问速度)。

七、brk/sbrk的虚拟内存管理

        void *sbrk(int size);

            size = 0    返回sbrk/brk上次的末尾地址,代表取当前的位置,

            size > 0    分配内存空间,返回上次的末尾地址,代表分配size字节的内存,

            size < 0    释放空间,代表回收size字节内存。

        int brk(void* ptr);

            直接修改访问的有效范围的末尾地址,释放空间形成一个完整的page,则该页映射被解除

            返回:0    分配成功

                      -1    分配失败

        经验:sbrk在分配内存上简单,brk在释放内存上简单。因此,开发大多数使用sbrk分配内存,使用brk释放内存。

八、系统底层的内存映射(mmap/munmap)

1 #include <sys/mman.h>
2 void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset);
3 int munmap(void *start, size_t length);

        参数公共部分:

            start:指向欲映射的内存起始地址,通常设为 NULL,代表让系统自动选定地址,映射成功后返回该地址。

            length:代表将文件中多大的部分映射到内存。    映射空间大小。建议4k倍数,不是4K倍数,自动对齐。

        mmap独有部分:

            prot:映射区域的保护方式。可以为以下几种方式的组合:

                1.PROT_EXEC 映射区域可被执行

                2.PROT_READ 映射区域可被读取    

                3.PROT_WRITE 映射区域可被写入

                4.PROT_NONE 映射区域不能存取

            flags:影响映射区域的各种特性。在调用mmap()时必须要指定MAP_SHARED 或MAP_PRIVATE。

                1.MAP_FIXED 如果参数start所指的地址无法成功建立映射时,则放弃映射,不对地址做修正。通常不鼓励用此标志。

                2.MAP_SHARED对映射区域的写入数据会复制回文件内,而且允许其他映射该文件的进程共享。

                3.MAP_PRIVATE 对映射区域的写入操作会产生一个映射文件的复制,即私人的“写入时复制”(copy on write)对此区域作的任何修改都不会写回原来的文件内容。

                4.MAP_ANONYMOUS建立匿名映射。此时会忽略参数fd,不涉及文件,而且映射区域无法和其他进程共享。

                    5.MAP_DENYWRITE只允许对映射区域的写入操作,其他对文件直接写入的操作将会被拒绝。

                    6.MAP_LOCKED 将映射区域锁定住,这表示该区域不会被置换(swap)。

            fd:要映射到内存中的文件描述符。如果使用匿名内存映射时,即flags中设置了MAP_ANONYMOUS,fd设为-1。有些系统不支持匿名内存映射,则可以使用fopen打开/dev/zero文件,然后对该文件进行映射,可以同样达到匿名内存映射的效果。

            offset:文件映射的偏移量,通常设置为0,代表从文件最前方开始对应,offset必须是分页大小的整数倍。

        返回值:

            若映射成功则返回映射区的内存起始地址,否则返回MAP_FAILED(-1),错误原因存于errno 中。

九、errno错误代码

           1.EBADF 参数fd 不是有效的文件描述词

            2.EACCES 存取权限有误。如果是MAP_PRIVATE 情况下文件必须可读,使用MAP_SHARED则要有PROT_WRITE以及该文件要能写入。

            3.EINVAL 参数start、length 或offset有一个不合法。

            4.EAGAIN 文件被锁住,或是有太多内存被锁住。

            5.ENOMEM 内存不足。