1.前言
本文所述关于内存管理的系列文章主要是对陈莉君老师所讲述的内存管理知识讲座的整理。
本讲座主要分三个主题展开对内存管理进行讲解:内存管理的硬件基础、虚拟地址空间的管理、物理地址空间的管理.
本文将主要以X86架构为例来介绍虚拟地址空间的管理。
2.虚拟地址空间展示
图 进程地址空间
- 程序一旦被执行就成为一个进程,内核就会为每个运行的进程提供了大小相同的虚拟地址空间,这使得多个进程可以同时运行而又不会互相干扰
- 具体来说一个进程对某个地址的访问,绝不会干扰其他进程对同一地址的访问。
- 每个进程都拥有4GB(32位)大小的虚拟地址空间,每个进程都拥有私有的前3G空间,即“用户空间”;而后1G空间被每个进程所共享,即“内核空间”。
- 进程访问内核空间的唯一途径为系统调用。
- 在每个进程眼中,它们各自拥有4GB大小的地址空间;而在CPU眼中,任意时刻,一个CPU上只存在一个虚拟地址空间。虚拟地址空间随着进程间的切换而变化。
3.虚拟内存实现机制
图 虚拟内存实现机制
- 地址映射
可执行文件从磁盘映射到虚拟地址空间
虚拟地址空间映射到物理地址空间
- 请页
将可执行文件从磁盘调入物理内存
- 内存的分配与回收
- 缓存和刷新
- 交换机制
把内存的内容换到磁盘,把磁盘内容换到内存,需要用到文件系统
4. 进程地址空间布局图
图 进程地址空间布局图
- Linux把进程的地址空间划分为多个区间,这些区间称为虚拟内存区域(VMA)
- 可以通过cat /proc/进程号/maps来查看进程的地址空间布局
图 mymmap可执行文件的内存布局
5. 进程用户空间的描述
- 一个进程的用户地址空间主要由mm_struct结构和vm_area_structs结构来描述
- mm_struct结构对进程整个用户空间进行描述
- mm_area_structs结构对用户空间中各个内存区进行描述
- mm_struct内存描述符基本字段
图 内存描述符基本字段
- vm_area_structs主要字段
图 vm_area_structs主要字段
6. 相关数据结构之间的关系
图 相关数据结构之间的关系
- 进程在内核中通过task_struct结构体进行描述
- task_struct->mm指向与该进程用户空间对应的mm_struct结构体
- mm_struct->mmap指向VMA双链表
- 使用current->mm->mmap可获得VMA链表的头指针
- current->mm->mmap->vm_next获得指向该VMA双链表的下一个结点的指针
7. 新建虚拟内存区域
图 mmap()和do_mmap()
- 在内核空间通过do_mmap()创建一个新的虚拟内存区域
- 在用户空间通过mmap()系统调用获取do_mmap()的功能
8.内存映射
- 内存映射
把文件从磁盘映射到进程用户空间的一个虚拟内存区域中,对文件的访问转化为对虚存区的访问。
当从这段虚拟内存中读数据时,就相当于读磁盘文件中的数据,将数据写入这段虚拟内存时,则相当于将数据直接写入磁盘文件。
这样就可以在不使用基本I/O操作函数read和write的情况下执行I/O操作。
有共享的、私有的虚存映射和匿名映射
- mmap()函数
图 mmap函数说明
- mmap的演示
如下实现了将磁盘文件mapping_file.txt映射到进程的虚拟用户空间,通过修改首字符,实现对文件的读写
图 mmap的演示
9.虚拟内存与物理内存
(1)用户态的程序经过编译执行形成进程,进程虽然可以任意访问整个用户空间的内存,但这毕竟属于虚拟地址空间,因此进程最终必须访问到物理内存。
(2)将虚拟内存和物理内存连接起来的就是分页机制,它在虚拟地址和物理地址之间建立了一种映射关系。
(3)进程访问的是虚拟地址,虚拟地址通过页表的转换最终形成物理地址。如果某个虚拟地址在页表中并不存在和某个物理地址之间的映射,那么系统将发生一次缺页异常。
(4)当一个进程运行时,CPU访问的地址是用户空间的虚拟地址。Linux采用请页机制来节约物理内存,也就是说它仅仅将当前要使用的用户空间中少量页装入物理内存。
(5)当访问的虚拟内存页面尚未装入物理内存时,处理器将产生一个缺页异常。当发生缺页异常时,操作系统必须从磁盘或交换文件中将要访问的页装入物理内存。
10. 参考文献
[7].GNU的C语言,http://www.faqs.org/docs/learnc/
[8].GCC参考手册