信息安全系统设计与实现:第十二章学习笔记
20191331 lyx
教材学习内容总结
第十二章 信号与信号处理
学习目标
学习理解块设备I/O和缓冲区管理;理解块设备I/O的原理和I/O缓冲的优点;讨论Unix的缓冲区管理算法;掌握PV算法,通过编程项目更好的理解文件系统中的I/O操作。
块设备I/O缓冲区
什么是块设备:块设备是i/o设备中的一类,是将信息存储在固定大小的块中,每个块都有自己的地址,还可以在设备的任意位置读取一定长度的数据,例如硬盘,U盘,SD卡等。
文件系统使用一系列I/O缓冲区作为块设备的缓存内存。当进程试图读取(dev,blk)标识的磁盘块时。它首先在缓冲区缓存中搜索分配给磁盘块的缓冲区。如果该缓冲区存在并且包含有效数据、那么它只需从缓冲区中读取数据、而无须再次从磁盘中读取数据块。如果该缓冲区不存在,它会为磁盘块分配一个缓冲区,将数据从磁盘读人缓冲区,然后从缓冲区读取数据。
当某个块被读入时、该缓冲区将被保存在缓冲区缓存中,以供任意进程对同一个块的下一次读/写请求使用。
当进程写入磁盘块时,它首先会获取一个分配给该块的缓冲区。然后,它将数据写入缓冲区,将缓冲区标记为脏,以延迟写入,并将其释放到缓冲区缓存中。
- 定义一个bread(dev, blk)函数,它会返回一个包含有效数据的缓冲区(指针)。
- 从缓冲区读取数据后,进程通过brelse(hp)格缓冲区释放回缓冲区缓存。 write_block(dev, blk, data)函数
Unix I/O缓冲区管理算法
- I/O缓冲区:内核中的一系列NBUF缓冲区用作缓冲区缓存。每个缓冲区用一个结构体表示。
typdef struct buf{
struct buf *next_free; //freelist pointer
struct buf *next_dev; //dev_list pointer
int dev,blk; //assigned disk block;
int opcode; //READ|WRITE
int dirty; //buffer data modified
int async; //ASYNC write flag
int valid; //buffer data valid
int busy; //buffer is in use
int wanted; some process needs this buffer
struct, semaphore lock=l ; //buffer locking semaphore; value=L
struct semaphore iodone=0; //for process to wait for I/O completion;
char buf[BLKSIZE]; //block data area
} BUFFER;
BUFFER buf[NBUF], *freelist; // NBUF buffers and free buffer list
- 设备表:每个块设备用一个设备表结构表示。
struct devtab{
u16 dev; // major device number
BUFFER *dev_list; // device buffer list
BUFFER*io_queue // device I/0 queue
}devtab[NDEV];
-
缓冲区初始化:当系统启动时,所有I/O缓冲区都在空闲列表中,所有设备列表和T/O队列均为空。
-
缓冲区列表:当缓冲区分配给(dev,blk)时,它会被插入设备表的dev_list中。如果缓冲区当前正在使用,则会将其标记为BUSY(繁忙)并从空闲列表中删除。
-
Unix getblk/brelse算法
- 数据一致性:为确保数据一致性,getblk一定不能给同一个(dev, blk)分配多个缓冲区 这可以通过让进程从休眠状态唤醒后再次执行“重试循环”来实现。读者可以验证 分配的每个缓冲区都是唯一的一其次,脏缓冲区在重新分配之前被写出来,这保证了数据的一致性。
- 缓存效果:缓存效果可通过以下方法实现 释放的緩冲区保留在设备列表中,以便 可能重用,标记为延迟写入的緩冲区不会立即产生I/O,并且可以重用。缓冲区会被释放到 空闲列表的末尾,但分配是从空闲列表的前面开始的,这是基于LRU (最近最少使用)原则,它有助于延长所分配缓冲区的使用期,从而提高它们的缓存效果。
- 临界区:设备中断处理程序可操作缓冲区列表,例如从设备表的I/O队列中删除 bp,更改其状态并调用brelse(bp)。所以,在getb汰和brelse中,设备中断在这些临界区中 会被屏蔽。这些都是隐含的,但没有在算法中表现出来。
Unix 算法的缺点
- 效率低下:该算法依赖于重试循环。
- 缓存效果不可预知:在Unix算法中,每个释放的缓冲区都可被获取,如果缓冲区 由需要空闲缓冲区的进程获取,那么将会重新分配缓冲区,即使有些进程仍然需要当前的缓冲区。
- 可能会出现饥饿:Unix算法基于“自由经济”原则,即每个进程都有尝试的机会,但不能保证成功,因此,可能会出现进程饥饿。
- 该算法使用只适用丁单处理器系统的休眠/唤醒操作
新的I/O缓冲区管理算法
-
计数信号量可用来表示可用资源的数量,例如∶空闲缓冲区的数量。
-
当多个进程等待一个资源时,信号量上的V操作只会释放一个等待进程,该进程不必重试,因为它保证拥有资源。
使用信号量的缓冲区管理算法:
假设有一个单处理器内核(一次运行一个进程)。使用计数信号量上的P/V来设计满足以下要求的新的缓冲区管理算法∶
保证数据一致性。
良好的缓存效果。
高效率∶没有重试循环,没有不必要的进程"唤醒"。
无死锁和饥饿。
PV算法
BUFFER *getb1k(dev,blk):
while(1){
P(free);
//get a free buffer first
if (bp in dev_1ist){
if (bp not BUSY){
remove bp from freelist;
P(bp);
// lock bp but does not wait
return bp;
// bp in cache but BUSY
V(free);
// give up the free buffer
P(bp);
// wait in bp queue
return bp;
// bp not in cache,try to create a bp=(dev,blk)
bp = frist buffer taken out of freelist;
P(bp);
// lock bp,no wait
if(bp dirty){
awzite(bp);
// write bp out ASYNC,no wait
continue;
// continue from (1)
reassign bp to(dev,blk);
// mark bp data invalid,not dir
return bp;
// end of while(1);
brelse(BUFFER *bp),
{
iF (bp queue has waiter)( V(bp); return; }
if(bp dirty && free queue has waiter){ awrite(bp);zeturn;}
enter bp into(tail of) freelist;V(bp);V(free);
}
PV算法的优越性:
- 缓冲区唯一性
- 无重试循环
- 无不必要唤醒
- 缓存效果
- 无死锁和饥饿
I/O缓冲区管理算法比较
1.系统组织
用户界面:这是模拟系统的用户界面部分。它会提示输人命令、显示命令执行、显示系统状态和执行结果等。在开发过程中,读者可以手动输入命令来执行任务。在最后测试过程中,任务应该有自己的输入命令序列。例如,各任务可以读取包含命令的输入文件。
2.多任务处理系统
3.磁盘驱动程序
start io():维护设备I/O队列,并对I/O 队列中的缓冲区执行 I/O操作。
中断处理程序:在每次I/O操作结束时,磁盘控制器会中断CPU。当接收到中断后,中断处理程序首先从 IntStatus中读取中断状态。
4.磁盘中断
从磁盘控制器到CPU的中断由 SIGUSR1(#10)信号实现。在每次I/O操作结束时,磁盘控制器会发出kill(ppid,SIGUSR1)系统调用,向父进程发送 SIGUSR1信号,充当虚拟CPU中断。
为防止竞态条件,磁盘控制器必须要从CPU接收一个中断确认,才能再次中断。
5.虚拟磁盘
使用Linux系统调用lseek()、read()和 write(),我们可以支持虚拟磁盘上的任何块I/O操作。
6.磁盘控制器
磁盘控制器是主进程的一个子进程。因此,它与CPU 端独立运行,除了它们之间的通信通道,通信通道是 CPU和磁盘控制器之间的接口。通信通道由主进程和子进程之间的管道实现。
命令:从 CPU到磁盘控制器的I/O命令。
DataOut:在写操作中从 CPU 到磁盘控制器的数据输出。
DataIn:在读操作中从磁盘控制器到CPU 的数据。
IntStatus:从磁盘控制器到CPU 的中断状态。
IntAck:从CPU到磁盘控制器的中断确认。
缓冲区理解
缓冲区是内存与外设(如硬盘)进行数据交互的媒介。内存与硬盘最大的区别在于,硬盘的作用仅仅是对数据信息以很低的成本做大量数据的断电保存,并不参与运算(因为 CPU 无法到硬盘上寻址),而内存除了需要对数据进行保存以外,更重要的是与 CPU、总线配合进行数据运算。缓冲区则介于两者之间,它既对数据信息进行保存,也能够参与一些像查找、组织之类的间接、辅助性运算。有了缓冲区这个媒介后,对外设而言,它仅需要考虑与缓冲区进行数据交互是否符合要求,而不需要考虑内存如何使用这些交互的数据;对内存而言,它也仅需要考虑与缓冲区交互的条件是否成熟,而不需要关心此时外设对缓冲区的交互情况。两者的组织、管理和协调将由操作系统统一操作。
缓冲区在内存中的位置示例
循环缓冲区实践
部分代码截图
代码以托管:https://gitee.com/DKY2019/xxaqxt/tree/master/ch12
编译:
运行:
参考资料
理解块设备 https://baike.baidu.com/item/块设备/2413231
缓冲区作用 https://blog.csdn.net/weixin_43914604/article/details/106274269