1. 进程基本概念
进程:一个具有一定独立功能的程序在一个数据集合上的一次动态执行过程。
进程的组成:
- 程序的代码
- 程序处理的数据
- 程序计数器的值,指示下一条将运行的指令
- 一组通用寄存器的当前值,堆、栈
- 一组系统资源(如打开一个文件)
进程包含了正在运行的一个程序的所有状态信息。
进程与程序的联系:
- 程序是产生进程的基础
- 程序的每次运行构成不同的进程
- 进程是程序功能的体现
- 通过多次执行,一个程序可对应多个进程;通过调用关系,一个进程可包含多个程序。
进程与程序的区别:
- 进程是动态的,程序是静态的:程序是有序代码的集合;进程是程序的执行,进程有核心态/用户态
- 进程是暂时的,程序是永久的:进程是一个状态变化的过程,程序可长久保存
- 进程与程序的组成不同:进程的组成包括程序、数据和进程控制块(即进程状态信息)
进程的特点:
- 动态性:可动态地创建、结束状态。
- 并发性:进程可以被独立调用占用处理运行。
- 独立性:不同进程的工作不相互影响。
- 制约性:因访问共享数据/资源或进程间同步而产生制约。
2. 进程控制块(PCB)
进程控制块:操作系统管理控制进程运行所用的信息集合。
操作系统用PCB来描述进程的基本情况以及运行变化的过程,PCB是进程存在的唯一标志。
PCB含有三大类信息:
- 进程标识信息。如本进程的标识,本进程的产生者标识(父进程标识),用户标识。
- 处理及状态信息保存区。保存进程的运行现场信息:
- 用户可见寄存器。用户可以使用的数据,地址等寄存器
- 控制和状态寄存器。如程序计数器(PC),程序状态字(PSW)
- 栈指针。过程调用/系统调用/中断处理和返回时需要用到它。
- 进程控制信息
- 调用和状态信息
- 进程间通信信息
- 存储管理信息
- 进程所用资源
- 有关数据结构连接信息
PCB的组织方式
- 链表:同一状态的进程其PCB成一链表,多个状态对应多个不同的链表
- 索引表:同一状态的进程归入一个index表(由index指向PCB),多个状态对应多个不同的index表。
3. 进程的生命周期
进程的生命周期:
- 进程创建
- 系统初始化时
- 用户请求创建一个新进程
- 正在运行的进程执行了创建进程的系统调用
- 进程运行
- 内核选择了一个就绪的进程,让它占用处理机并执行
- 为何选择?
- 如何选择?
- 内核选择了一个就绪的进程,让它占用处理机并执行
- 进程等待
- 在以下情况,进程等待
- 请求并等待系统服务,无法马上完成
- 启动某种操作,无法马上完成
- 需要的数据没有到达
- 进程只能自己阻塞自己,因为只有进程自身才知道何时需要等待某件事件的发生。
- 在以下情况,进程等待
- 进程唤醒
- 唤醒进程的原因
- 被阻塞的进程需要的资源可被满足
- 被阻塞进程等待的事件到达
- 将该进程的PCB插入就绪队列
- 进程只能被别的进程或者操作系统唤醒。
- 唤醒进程的原因
- 进程结束
- 以下四种情况,进程结束
- 正常退出(自愿)
- 错误退出(自愿)
- 致命错误(强制性的)
- 被其他进程所杀(强制性的)
- 以下四种情况,进程结束
进程状态变化图:
4. 进程挂起
- 概念
- 进程在挂起状态,意味着进程没有占用内存空间。处在挂起状态的进程映像在磁盘上。
- 挂起状态
- 阻塞挂起状态(Blocked-suspend): 进程在外存并等待某事件的出现
- 就绪挂起状态(Ready-suspend):进程在外存,但只要进入内存,即可运行
- 相关状态转换
- 阻塞到阻塞挂起:
- 没有进程处于就绪状态或就绪进程需要更多内存资源时,会进行这种转换,以提交新进程或运行的就绪进程。
- 就绪到就绪挂起:
- 当有高优先级阻塞(系统认为很快就绪的)进程和低优先就绪进程时,系统会挂起低优先级就绪进程。
- 运行到就绪挂起:
- 对抢先分时系统,当有高优先级阻塞挂起进程因事件出现而进入就绪挂起,系统可能会把运行进程转到就绪挂起状态。
- 在外存的状态转换:阻塞挂起到就绪挂起
- 当有阻塞挂起进程因相关事件出现时,系统会把阻塞挂起进程转换为就绪挂起进程。
- 阻塞到阻塞挂起:
解卦/激活(Activate)
- 概念
- 把一个进程从外存转到内存
- 状态转换
- 就绪挂起到就绪
- 没有就绪进程或挂起就绪进程优先级高于就绪进程时,会进行这种转换。
- 阻塞挂起到阻塞
- 当一个进程释放足够内存时,系统会把一个高优先级阻塞挂起,进程转换为阻塞进程。
- 就绪挂起到就绪
状态队列:
- 由操作系统来维护一组队列,用来表示系统当中所有进程的当前状态
- 不同的状态分别用不同的队列来表示(就绪队列、各种类型的阻塞队列)
- 每个进程的PCB都根据它的状态加入到对应的队列种,当一个进程的状态发生变化时,它的PCB从一个状态队列种脱离处理,加入到另外一个队列。
5. 线程
线程是进程当中的一条执行流程。
从资源组合的角度来看,进程把一组相关的资源组合起来,构成了一个资源平台,包括地址空间(代码段、数据段),打开的文件等各种资源。
从运行的角度来看,进程是代码在这个资源上的一条执行流程。
线程的优点:
- 一个进程中可以同时存在多个线程
- 各个线程之间可以并发地执行
- 各个线程之间可以共享地址空间和文件等资源
线程的缺点:
- 一个线程崩溃,会导致其所属进程的所有线程崩溃
线程与进程的比较
- 进程是资源分配单位,线程是CPU调度单位
- 进程拥有一个完整的资源平台,而线程只独享必不可少的资源,如寄存器和栈
- 线程同样具有就绪、阻塞和执行三种基本状态,同样具有状态之间的转换关系
- 线程能减少并发执行的时间和空间开销
- 线程创建时间比进程短
- 线程终止时间比进程短
- 同一进程内的线程切换时间比进程短
- 由于同一进程的各线程间共享内存和文件资源,可直接进行不通过内核的通信
线程的实现
- 用户线程:在用户空间实现
- 内核线程:在内核中实现
- 轻量级进程:在内核中实现,支持用户线程
用户线程
- 在用户空间实现的线程机制,它不依赖于操作系统的内核,由一组用户级的线程库函数来完成线程的管理,包括进程的创建、终止、同步和调度等。
- 由于用户线程的维护由相应进程来完成(通过线程库函数),不需要操作系统内核了解用户线程的存在,可用于不支持线程技术的多进程操作系统。
- 每个进程都需要它自己私有的线程控制块(TCB)列表,用来追踪记录它的各个线程的状态信息(PC、栈指针、寄存器),TCB由线程库函数来维护。
- 用户线程的切换也是由线程库函数来完成,无需用户态/核心态切换,所以速度特别快。
- 运行每个进程拥有自定义的线程调度算法。
- 用户线程的缺点
- 阻塞性的系统调用如何实现?如果一个线程发起系统调用而阻塞,则整个进程在等待。
- 当一个线程开始运行后,除非它主动地交出CPU的使用权,否则它所在的进程当中的其他线程将无法运行。
- 由于时间片分配给进程,故与其它进程比,在多线程执行时,每个线程得到的时间片较少,执行会较慢。
内核线程
是指在操作系统内核当中实现的一种线程机制,由操作系统的内核来完成线程的创建、终止和管理。
- 在支持内核线程的操作系统中,由内核来维护进程和线程的上下文信息(PCB和TCB)。
- 线程的创建、终止和切换都是通过系统调用/内核函数来进行,由内核来完成,因此系统开销大。
- 在一个进程当中,如果某个内核线程发起系统调用而被阻塞,并不会影响其他内核进程的运行。
轻量级进程
上下文切换
- 停止当前运行进程(从运行状态改变成其他状态)并且调度其他进程(转变成运行状态)
- 必须在切换之前存储许多部分的进程上下文
- 必须能够在之后恢复它们,所以进程不能显示它曾经被暂停过
- 必须快速(上下文转换是非常频繁的)
- 需要存储什么上下文
- 寄存器(PC、SP、…),CPU状态
- 一些时候可能会费时,所以我们应该尽可能避免