20145308 《信息安全系统设计基础》第14周学习总结
教材学习内容总结
第9章 虚拟存储器
- 虚拟存储器(VM):对主存的抽象概念
- 将主存看成是一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据
9.1 物理和虚拟寻址
- 存储器管理单元:地址翻译,利用存放在主存中的查询表动态翻译虚拟地址
9.2 地址空间
- 一个包含N=2^n个地址的虚拟地址空间就叫做一个n位地址空间
- 主存中的每个字节都有一个选自虚拟地址空间的虚拟地址和一个选自物理地址空间的物理地址
9.3 虚拟存储器作为缓存的工具
- 虚拟存储器被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。每个字节都有一个唯一的虚拟地址,这个唯一的虚拟地址是作为到数组的索引的
- 磁盘上数据的内容被缓存在主存中
- 和存储器层次结构中其他缓存一样,磁盘上的数据被分割成块,这些块作为磁盘和主存之间的传输单元
9.4 虚拟存储器作为存储器管理的工具
- 操作系统为每个进程提供了一个单独的页表,也就是一个独立的虚拟地址空间
- 多个虚拟页面可以映射到同一个共享物理页面上
- 将一组连续的虚拟页映射到任意一个文件中的任意位置的表示法称作存储器映射
9.5 虚拟存储器作为存储器保护的工具
- SUP位表示进程是否必须运行在内核(超级用户)模式下才能访问该页
9.6 地址翻译
- CPU中的一个控制寄存器,页表基址寄存器(PTBR)指向当前页表
- n位的虚拟地址包含两个部分:一个p位的虚拟页面偏移和一个(n-p)位的虚拟页号
- MMU利用VPN来选择适当的PTE(页表条目,一个页表其实就是多个页表条目的数组)
- 页面命中,CPU硬件执行的步骤:
处理器生成一个虚拟地址,并把它传送给MMU
MMU生成PTE地址,并从高速缓存/主存请求得到它。
高速缓存/主存向MMU返回PTE。
MMU构造物理地址,并把它传送给高速缓存/主存。
高速缓存/主存返回所请求的数据字给处理器。 - 页面命中完全是由硬件来处理的,与之不同的是,处理缺页要求硬件和操作系统内核协作完成
- 前三步都是一样的
PTE中的有效位为0,所以MMU触发了一次异常,传递CPU中的控制到操系统内核中的缺页异常处理程序。
缺页处理程序确定出物理存储器中的牺牲页,如果这个页面被修改了,则把它换出到磁盘。
缺页处理程序页面调入新的页面,并更新存储器中的PTE。
缺页处理程序返回到原来的进程,再次执行导致缺页的指令。CPU将引起缺页的虚拟地址重新发送给MMU。 - 如果页面没有命中,最后还是处理器再次发送虚拟地址给MMU,不过这次不会导致缺页异常
- LB命中和不命中的情况下处理流程: CPU产生一个虚拟地址, MMU从TLB中取出相应的PTE,MMU将这个虚拟地址翻译成一个屋里地址,并且将它发送到高速缓冲/主存,高速缓存/主存将所请求的数据字返回给CPU。
如果TLB不命中时,MMU必须从L1缓存中取出相应的PTE,新取出的PTE存放在TLB中,可能覆盖一个已经存在的条目。
9.7 案例研究:Intel Core i7/Linux存储器系统
- 处理器包:四个核、一个大的所有核共享的L3高速缓存,一个DDR3存储器控制器。每个核包含一个层次结构的TLB、一个层次结构的数据和指令高速缓存,以及一组快速的点到点连接
- linux为每个进程维护一个单独的虚拟地址空间
- 内核虚拟存储器包含内核中的代码和数据结构
- 内核虚拟存储器的某些区域被映射到所有进程共享的物理页面
- linux页将一组连续的虚拟页面映射到相应的一组连续的物理页面。这就为内核提供了一种遍历的方法来访问物理存储器中任何特定的位置,例如,当它需要访问页表,或在一些设备上执行存储器映射的I/O操作,而这些设备被映射到特定的物理储存器位置时
- 内核虚拟存储器的其他区域包含每个进程都不相同的数据
- task_struct中的一个条码指向mm_struct,它描述了虚拟存储器的当前状态。其中pgd指向第一级页表(页全局目录)的基址。而mmap指向一个vm_area_structs的链表,其中每个vm_area_structs都描述了当前虚拟地址空间的一个区域。当内核运行这个进程时,它就将pgdf存放在CR3控制寄存器中
9.8 存储器映射
- 虚拟存储器区域可以映射到两种类型的对象:
1)unix文件系统中的普通文件:一个区域可以映射到一个普通磁盘文件的连续部分。
2)匿名文件:一个区域也可以映射到一个匿名文件,匿名文件是由内核创建的,包含的全是二进制零。
- 一旦一个虚拟页面被初始化了,它就在一个由内核维护的专门的交换文件(swap file)间换来换去
- 共享对象:一个对象可以被映射到虚拟存储器的一个区域,要么作为共享对象,或作为私有对象
- 私有对象,写时拷贝(copy-on-write):私有对象是使用一种叫做写时拷贝的技术被映射到虚拟存储器中的。如图中所示:只要有一个进程试图写私有区域内的某个页面,那么这个写操作就会触发一个保护策略。它就会在物理存储器中创建这个页面的一个新拷贝,更新页面条目指向这个新的拷贝,然后恢复这个页面的可写
- unix进程可以使用mmap函数来创建新的虚拟存储器区域,并将对象映射到这些区域中
9.9 动态存储器分配
- 需要额外的虚拟存储器时,使用一种动态存储器分配器(dynamic memory allocator)
- 一个动态存储器分配器维护着一个进程的虚拟存储器区域,称为堆(heap)
- 在大多数的unix系统中,堆是一个请求二进制0的区域;对于每个进程,内核维护着一个变量brk,它指向堆的顶部
- 分配器将堆视为一组不同大小的块(block)的集合来维护。每个块就是一个连续的虚拟存储器组块(chunk),要么是已分配的,要么是未分配的
1)显式分配器(explicit allocator):如通过malloc,free或C++中通过new,delete来分配和释放一个块。
2)隐式分配器(implicit allocator):也叫做垃圾收集器(garbage collector)。自动释放未使用的已分配的块的过程叫做垃圾回收(garbage collection)。 - 分配器必须对齐块,使得它们可以保存任何类型的数据对象。在大多数系统中,以8字节边界对齐
- 不修改已分配的块:分配器只能操作或者改变空闲块。一旦被分配,就不允许修改或者移动它
- 碎片
外部碎片:在一个已分配块比有效载荷在时发生的。(如对齐要求,分配最小值限制等)
外部碎片:当空闲存储器合计起来足够满足一个分配请求,但是没有一个单独的空闲块足够大可以来处理这个请求时发生的
- 放置分配的块的策略有:首次适配(first fit),下一次适配(next fit),和最佳适配(best fit)
- 称为分离存储:维护多个空闲链表,其中每个链表中的块有大致相等的大小
9.10 垃圾收集
- 垃圾收集器将存储器视为一张有向可达图
- Mark%Sweep垃圾收集器由标记(mark)阶段和清除(sweep)阶段组成。标记阶段标记出根节点的所有可达的和已分配的后继,而后面的清除阶段释放每个被标记的已分配块
9.11 C程序中常见的与存储器有关的错误
- 间接引用坏指针
- 读未初始化的存储器
- 允许栈缓冲区溢出
- 假设指针和他们指向的对象是相同大小的
- 引用不存在的变量
- 误解指针运算
- 造成错位错误
- 引用空闲堆块中的数据
- 引用指针,而不是它所指向的对象
- 引起存储器泄露
其他
- 本周学习了第9章的内容,虚拟存储器,内容和操作系统和有一部分相同,但是感觉还是有很多不同的。主要注重学习了不同的方面,了解了虚拟存储器的工作过程。
学习进度条
代码行数(新增/累积) | 博客量(新增/累积) | 学习时间(新增/累积) | 重要成长 | |
---|---|---|---|---|
目标 | 5000行 | 30篇 | 400小时 | |
第一周 | 0/0 | 1/2 | 25/30 | 学习Linux指令 |
第二周 | 50/50 | 1/3 | 25/55 | Linux系统下的开发环境 |
第三周 | 20/70 | 1/4 | 25/80 | 信息的表示和处理 |
第五周 | 20/90 | 1/5 | 30/110 | 程序的机器级表示 |
第六周 | 20/110 | 1/6 | 30/140 | 处理器体系结构 |
第七周 | 20/130 | 1/7 | 30/170 | 存储器层次结构 |
第八周 | 0/130 | 2/9 | 10/180 | 期中复习 |
第九周 | 48/178 | 2/11 | 10/190 | 系统级I/O、错误处理 |
第十周 | 539/717 | 2/13 | 10/200 | 系统调用学习 |
第十一周 | 429/1146 | 2/15 | 10/210 | 异常控制流 |
第十二周 | 20/1166 | 3/18 | 10/220 | 第九、十、十一周代码 |
第十三周 | 1174/2340 | 1/19 | 10/230 | 网络编程、并发编程 |
第十四周 | 0/2340 | 1/20 | 10/240 | 虚拟存储器 |