信息安全系统设计基础第十四周学习总结
【学习时间:7小时】
【学习内容:CHAPTER9——虚拟存储器】
一、课本内容理解(个人理解部分用【】标出)
1.虚拟存储器(VM)
- 作用:
- 将主存看作是一个存储在磁盘上的地址空间的高速缓存,在主存中只保护活动的区域,并根据需要在磁盘和主存之间来回传送数据;
- 为每个进程提供了一致的地址空间,从而简化了存储器管理;
- 保护了每个进程的地址空间不被其它进程破坏
【理解:其实2.与3.是密切相关的。因为虚存为每个进程提供了一致的地址空间的表示方法,就好像为各进程提供了统一的房间编号机制,这样各个进程就不会进错房间,也不会在有房间的情况下还找不到房间】
- 地位:
- 虚拟存储器是中心的:它是硬件异常、硬件地址翻译、主存、磁盘文件和内核软件的交互中心;
- 虚拟存储器是强大的:它可以创建和销毁存储器片、可以映射存储器片映射到磁盘某个部分等等;
- 虚拟存储器若操作不当则十分危险
2.物理和虚拟寻址
- 物理寻址(PA):主存中每个字节都有唯一的物理地址;依靠此来寻址,就叫做物理寻址;
- 虚拟寻址(VA):CPU生成一个虚拟地址然后用这个地址访问主存,这个虚拟地址在送到存储器之前先被转换成适当的物理地址(这个过程叫做地址翻译)
3.虚拟存储器的基本思想
允许每个数据对象有多个独立的地址,其中每个地址都选自不同的地址空间(比如,虚拟地址空间或者是物理地址空间)。
4.虚存如何作为缓存工具?
- 理念:
- 首先,VM上被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。每个字节都有一个唯一的虚拟地址,这个虚拟地址是作为到数组的索引的。
- 其次,VM系统将虚拟存储器分割为大小固定的虚拟页,每个虚拟页的大小为P=2^p字节;类似地,物理存储器被分割为物理页(也叫做页帧),大小也为P字节
【理解:也就是说,虚存上的空间用来存放的是数据真正的地址(所以说虚存相当于索引),一个个虚存单元组织起来就可以指向唯一对应的物理页】
- 虚存页面集合
- 未分配的:VM系统没有将它们与任何数据关联起来,也不占用任何磁盘空间;
- 缓存的:当前缓存在物理存储器中的已分配的页;
- 未缓存的:没有还存在物理存储器中的已分配页
5.页表
- 作用:将虚拟页映射到物理页。每次地址翻译硬件将一个虚拟地址转换为物理地址时都会读取页表。操作系统负责维护页表中的内容。
- 结构:页表就是一个页表条目(PTE)数组;虚拟地址空间中的每个页在页表中一个固定偏移量处都有一个PTE。为了我们的目的,我们假设每个PTE是由一个有效位和一个n位的地址字段组成的。有效位表明了该物理页的起始位置,这个物理页中缓存了该虚拟页。
6.缺页
- DRAM缓存不命中称为缺页。
- 处理过程:
- 缺页异常调用内核中的缺页异常处理程序,该程序会选择一个牺牲页,将其换出内存;
- 内核从磁盘中拷贝需要的条目到牺牲页之前所在的位置,随后返回;
- 当异常处理程序返回之后,它会再次启动导致缺页的指令,该指令会把导致缺页的虚拟地址重发送到地址翻译硬件;
- 此时,页面命中
- 概念补充:
- 在存储器的习惯说法中,块被称为页;
- 在磁盘和存储器之间传送页的活动叫做交换或者页面调度;
- 页从磁盘换入DRAM和从DRAM换出磁盘;一直等待到不命中发生的时候才换入页面;这种策略被称为按需页面调度
7.地址翻译
- 解释:形式上说,地址翻译是一个N元素的虚拟地址空间(VAS)中的一个元素和一个M元素的物理地址空间(PAS)之间的映射;
- 过程:
- CPU中的一个控制寄存器,页表基址寄存器指向当前页表;
- n位的虚拟地址包括以下两个部分:一个p位的虚拟页面偏移和一个(n-p)位的虚拟页号;
- MMU用后者选择适当的PTE,再将物理页号和虚拟地址中的VPO串联起来得到物理地址;
- 因为物理和虚拟页面都是P字节的,所以物理页面偏移和VPO是相同的
- CPU执行步骤(页面命中)
- 处理器生成一个虚拟地址,并把它传递给MMU;
- MMU生成一个PTE地址,并从高速缓存/主存中请求得到它;
- 高速缓存/主存向MMU返回PTE;
- MMU构造物理地址,并把它传给高速缓存/主存;
- 高速缓存/主存返回所请求的数据字给处理器
- CPU执行步骤(缺页)
- 处理器生成一个虚拟地址,并把它传递给MMU;
- MMU生成一个PTE地址,并从高速缓存/主存中请求得到它;
- 高速缓存/主存向MMU返回PTE;
- PTE中有效位是0,触发了一次异常,传递CPU中的控制到操作系统内核中的缺页异常处理程序;
- 缺页处理程序确定物理存储器中的牺牲页,如果这个页已经被修改了,则把它换出到磁盘;
- 缺页处理程序调入新的页面,并更新存储器中的PTE;
- 缺页处理程序返回到原来的进程,再次执行导致缺页的指令。CPU将引起缺页的虚拟地址重新发送给MMU;因为虚拟页面现在缓存在物理存储器中,所以发生命中。
8.linux虚拟存储器系统
- linux为每个进程维持了一个单独的虚拟地址空间,其中,内核虚拟存储器位于用户栈之上;
- 内核虚拟存储器包含内核中的代码和数据结构,还有一些被映射到一组连续的物理页面(主要是便捷地访问特定位置,比如执行I/O操作的时候需要的位置)
- linux将虚拟存储器组织成一些区域(也叫做段)的集合。一个区域就是已经存在的(已分配的)虚拟存储器的连续片;
- 意义:允许虚拟地址空间有间隙;内核不用记录那些不存在的页,这样的页也不用占用存储器;
- 区域结构
- vm_start:指向这个区域的起始处;
- vm_end:指向这个区域的结束处;
- vm_prot:描述这个区域内所包含的所有页的读写许可权限;
- vm_fags:描述这个区域内的页面是与其他进程共享的,还是这个进程私有的,等等;
- vm_next:指向链表的下一个结构
9.存储器映射
- 概念:linux(以及一些其他形式的unix)通过将一个虚拟存储器区域与一个磁盘上的对象关联起来,以初始化这个虚拟存储器区域的内容;
- 类型:
- unix文件系统中的普通文件:一个区域可以映射到一个普通磁盘文件的连续部分,例如一个可执行目标文件;
- 匿名文件:一个区域也可以映射到一个匿名文件,匿名文件由内核创建,包含的全是二进制零(CPU第一次引用这样一个区域内的虚拟页面的时候,内核就在物理存储器中找到合适的牺牲页面然后用二进制零将其覆盖)
10.共享对象&私有对象比较研究
【共享对象和私有对象在操作上有哪些区别,或者是对于进程来说的区别;这些东西与虚拟存储器是密不可分的】
- 引入:一个对象可以被映射到虚拟存储器的一个区域,要么作为共享对象,要么作为私有对象。
- 如果一个进程将一个共享对象映射到它的虚拟地址空间的一个区域内,那么进程对这个区域的任何写操作,对其他也把这个共享对象映射到自己的虚拟地址空间的进程来说也是可见的【无论对象被映射到多少个共享区域中,在物理存储器中也只需要该对象的一个拷贝】;
- 对于一个映射到私有对象的区域所做的改变,对于其他进程来说是不可见的,并且进程对这个区域所做的任何写操作都不会反映在磁盘上的对象中
(图1)
- 深入:
- 私有对象通过写时拷贝的巧妙技术被映射到虚拟存储器中,对于每个映射私有对象的进程,相应私有区域的页表条目都被标记为只读,并且区域结构被标记为私有对象的写时拷贝;
- 只要没有进程试图写它自己的私有区域,它们就可以继续共享;
- 只要有一个进程试图去写私有区域内的某个页面,那么这个写操作就会触发一个保护故障,当故障处理程序注意到保护异常是由于进程试图写私有的写时拷贝区域中的一个页面而引起的时候,它就会在物理存储区域中创建这个页面的一个新的拷贝,更新页表条目指向这个新的拷贝,然后恢复其可写权限
【这样做的好处就是最大限度地、最长时间地保护了物理存储器空间,使得其不到必须的时候绝不会被浪费】
11.垃圾收集
- 概念:垃圾收集器是一种动态存储分配器,它自动释放程序不再需要的已分配块。这些块称为垃圾。自动回收的过程就叫做垃圾收集。垃圾收集器定期地识别垃圾块,并相应地调用free,将这些块放回到空闲链表中
二、课后习题筛选
1.练习题9.2
确定下列虚拟地址大小(n)和页大小(P)的组合所需要的PTE数量
n = 16,P = 4K-->#PTE=16;
n = 16,P = 8K-->#PTE=8;
n = 32,P = 4K-->#PTE=1M
【解析:因为每个虚拟页面都是 P = 2^p个字节,所以在系统中总共有2^n/2^p = 2^(n-p)个可能的页面,其中每个都需要一个页表条目(PTE)】
2.练习题9.3
给定一个32位的虚拟地址空间和一个24位的物理地址,对于下面的页面大小P,确定VPN,VPO,PPN,PPO的位数
【补充:VPN——虚拟页号;VPO——虚拟页面偏移量;PPN——物理页号;PPO——物理页面偏移量】
【理解:我们有32个虚拟地址位和24个物理地址位;页面大小是1KB,这意味着对于VPO和PPO,都需要10位(去区分每个页面内这2^10个具体的单位);那么剩下的位分别是VPN,PPN】
P = 1KB——>VPN = 22,VPO = 10,PPN = 14,PPO = 10
P = 4KB——>VPN = 20,VPO = 12,PPN = 12,PPO = 12
3.练习题9.5
编写一个C语言程序mmapcopy.c,使用mmap将任意一个大小的磁盘文件拷贝到stdout,输入文件的名字必需作为一个命令行参数来传递
【答案:】
#include "csapp.h"
void mmapcopy(int fd,int size)
{
char *bufp;
bufp = Mmap(NULL,size,PROT_READ,MAP_PRIVATE,fd,0);
Write(1,bufp,size);
return;
}
int main(int argc,char **argv)
{
struct stat stat;
int fd;
if(argc !=2)//因为传进来的参数应该有两个,一个是文件名(题目要求用命令行传递);第二个是
{
printf("usage:%s ,<filename>
",argv[0]);
exit(0);
}
fd = Open(argv[0],O_RDONLY,0);
fstat(fd,&stat);
mmapcopy(fd,stat.st_size);
exit(0);
}
【解析:】
- struct stat stat:参考http://blog.csdn.net/dumgeewang/article/details/7741033 stat结构体内容如下:
st_mode 文件权限和文件类型信息
st_ino 与该文件关联的inode
st_dev 保存文件的设备
st_uid 文件属主的UID号
st_gid 文件属主的GID号
st_atime 文件上一次被访问的时间
st_ctime 文件的权限、属主、组或内容上一次被修改的时间
stmtime 文件的内容上一次被修改的时间。(和stctime的不同之处显而易见)
st_nlink 该文件上硬连接的个数
-
Open(argv[0],O_RDONLY,0):参考http://blog.csdn.net/liuyang1990i/article/details/7596630
-
函数原型:int open(const char *path, int oflags,mode_t mode);
-
函数说明:open一般用于打开或者创建文件,在打开或创建文件时可以制定文件的属性及用户的权限等各种参数。
- 参数说明:第一个参数path表示:路径名或者文件名。路径名为绝对路径名(如C:/cpp/a.cpp),文件则是在当前工作目录下的。第二个参数oflags表示:打开文件所采取的动作。第三个参数mode表示:设置文件访问权限的初始值。(与用户掩码umask变量有关,实际的访问权限有mode &~umask确定,只有在第二个参数有O_CREAT时才用作用)
-
- fstat:参考http://blog.csdn.net/dumgeewang/article/details/7741033 定义函数 int fstat(int fildes,struct stat *buf);用来将参数fildes所指的文件状态,复制到参数buf所指的结构中(struct stat)。
- Mmap:要求内核创建一个新的虚拟存储区域,并将文件描述符fd所指的对象的一个连续片映射到这个区域中
【说明:】
这样一来,函数的思路就是可以理解的了:
用户输入的两个参数依次是执行动作(这个并不重要,是cat或者其他的都可以)和文件绝对路径(例如,c:/cpp/a.cpp);
在main函数中,首先判断输入个数是否合法(不合法就直接退出),然后将参数2指向的文件打开并返回描述符fd;利用fstat函数取得其文件状态存储stat结构体,跳转到mmapcopy函数;
mmapcopy函数调用Mmap映射到虚拟地址空间,然后利用Write函数将映射到的虚拟空间中的内容(也就是磁盘文件内容)写入STDOUT(文件描述符为1)
三、心得
本章的内容对于前面许多章的内容(比如堆栈、比如进程)而言,都有一种“正中要害”的意义;因为涉及进程、互斥和共享的内容的时候必须要了解虚存,所以看完这一章更是觉得豁然开朗。