• 第八节 进程的切换和系统的一般执行过程—— 20135203齐岳


    第八节 进程的切换和系统的一般执行过程

    By 20135203齐岳

    本周的主要内容:

    1. Linux中进程调度的基本概念与相关知识
    2. schedule函数如何实现进程调度
    3. Linux进程的执行过程(一般情况与特殊情况)
    4. 宏观描述Linux系统执行

    进程切换的主要代码switch_to

    进程的调度时机与进程的切换

    不同类型进程的不同调度需求

    第一种分类:

    • I/O-bound:频繁进行I/O,并且需要花费很多时间等待I/O完成

    • CPU-bound:计算密集,需要大量的CPU时间进行运算

    第二种分类:

    • 批处理进程:不必与用户交互,常在后台进行;不必很快响应(典型的批处理系统:编译程序、科学计算)。

    • 实时进程:有实时需求,不应被低优先级进程阻塞,响应时间短、要稳定(典型的实时进程:视频/音频、机械控制等)。

    • 交互式进程:需要经常与用户交互,因此要花很多时间等待用户输入操作,响应时间要快,平均延迟要低(典型的交互式程序:shell、文本编辑程序、图形应用程序)。

    Linux中的进程调度

    调度策略:是决定什么时候以怎样的方式选择一个新进程运行的规则。Linux中的调度是多种策略和调度算法的组合。

    Linux既支持普通的分是进程。也支持实时进程。Linux的调度基于分时和优先级。

    Linux根据进程的优先级进行排队

    • 根据特定的算法计算出进程的优先级,用一个值表示,这个值表示把进程如何适当的分配给CPU。

    • Linux中进程的优先级是动态的,调度程序会根据进程行为的周期性调整进程的优先级。(较长时间未分配到CPU的进程优先级升高,已在CPU上运行了较长时间的进程优先级下降)

    内核中的调度算法相关代码使用了类似OOD中的策略模式,这些算法从实现的角度看仅仅是从运行队列中选择一个新进程,选择的过程中运用了不同的策略而已。不需要理解这种策略,对我们对于内核的理解并没有帮助。对于理解操作系统的工作机制,反而是进程的调度时机与进程的切换机制更为关键。

    schedule函数

    schedule函数:实现调度,在队列中自傲一个进程把CPU分配给它。

    调用方法:

    • 直接调用schedule()
    • 松散调用,根据need_resched标记
    进程调度的时机
    • 中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule()。

    • 内核线程可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度,也就是说内核线程作为一类的特殊的进程可以主动调度,也可以被动调度(内核线程是只有内核态而没有用户态的特殊进程)。

    • 用户态进程只能被动调度,仅能通过陷入内核态后的某个时机点进行调度,即在中断处理过程中进行调度。

    进程上下文切换相关代码分析

    进程的切换

    进程切换(任务切换、上下文切换):为了控制进程的执行,内核必须有能力挂起正在CPU上执行的进程,并恢复以前挂起的某个进程的执行,

    挂起正在CPU上执行的进程,与中断时保存现场是不同的,中断前后是在同一个进程上下文中,只是由用户态转向内核态执行;而进程切换是在不同的进程之间进行调度。

    进程上下文包含了进程执行需要的所有信息

    • 用户地址空间:包括程序代码,数据,用户堆栈等

    • 控制信息:进程描述符,内核堆栈等

    • 硬件上下文(注意中断也要保存硬件上下文只是保存的方法不同,中断:保存现场&恢复线程;进程调度:switc_to的机制)

    schedule()函数实现方法

    schedule()函数选择一个新的进程来运行,并调用context _ switch进行上下文的切换,这个宏调用switch _ to来进行关键上下文切换

    • next = pick _ next _ task(rq, prev);//封装了使用的某种进程调度策略,选择一个进程作为next

    • context_switch(rq, prev, next);//实现进程上下文切换

    • switch_to切换寄存器的状态和堆栈,利用两个参数:prev指向当前进程,next指向被调度的进程

        #define switch_to(prev, next, last)
        do {       
        unsigned long ebx, ecx, edx, esi, edi;          
        
        asm volatile(
             "pushfl
      	"      #保存当前进程的flags 
             "pushl %%ebp
      	"        #当前进程的堆栈基址压栈 
      
        	 //以下这两句实际上是实现了内核堆栈的切换,之后的所有压栈动作都是在next的内核堆栈中实现 
             "movl %%esp,%[prev_sp]
      	"  #把当前的栈底保存到prev_sp 
             "movl %[next_sp],%%esp
      	"  #把下一个进程的栈顶放入esp寄存器当中
      
             "movl $1f,%[prev_ip]
      	"  #保存当前进程的eip,在恢复当前进程的时候从这里恢复
        	 "pushl %[next_ip]
      	"   #把next进程的起点压入栈,next进程的栈顶就是它的起点
        	 //如果是进程切换这里一般是$1f,如果是新创建的子进程这里是ret_from_fork	
      
             __switch_canary   
               
        	//这里使用jmp,因此是通过寄存器传递参数($1f);如果是call的话直接ret
             "jmp __switch_to
      "  #通过寄存器传递参数
             "1:	"  #prev进程的起始点 
             
        	 //恢复prev进程的上下文执行环境        
             "popl %%ebp
      	"     #ebp出栈    
             "popfl
      "            #flags出栈
      
        	/* output parameters */                
             : [prev_sp] "=m" (prev->thread.sp),   #当前进程内核堆栈的栈底  
               [prev_ip] "=m" (prev->thread.ip),   #当前进程的eip    
               "=a" (last),                 
                               
               /* clobbered output registers: */     
               "=b" (ebx), "=c" (ecx), "=d" (edx),      
               "=S" (esi), "=D" (edi)             
      
               __switch_canary_oparam                
                                    
               /* input parameters: */                
             : [next_sp]  "m" (next->thread.sp),       #下一个内核堆栈的栈底
               [next_ip]  "m" (next->thread.ip),       #下一个进程执行的起点
                                   
               //为进程切换做准备  
               [prev]     "a" (prev),              
               [next]     "d" (next)               
                                  
               __switch_canary_iparam                
                                    
             : /* reloaded segment registers */           
            "memory");                  
        } while (0)
      

    以自己的理解并用图示表示如下:

    Linux系统的一般执行过程

    一般进程切换的过程

    正在运行的用户态进程X切换到运行用户态进程Y的过程:

    1. 正在运行的用户态进程X
    2. 发生中断——save cs:eip/esp/eflags(当前进程CPU的状态压入用户态进程X的内核堆栈) load cs:eipss:esp(加载中断服务例程和内核堆栈)。
    3. 进入中断处理进程,首先SAVE_ALL,保存现场
    4. 中断处理过程中或中断返回前调用了schedule(),其中的switch_to做了关键的进程上下文切换
    5. 标号1之后开始运行用户态进程Y(这里Y曾经通过以上步骤被切换出去过因此可以从标号1继续执行)
    6. restore_all 恢复进程X的执行状态
    7. iret - pop cs:eip/ss:esp/eflags from kernel stack
    8. 继续运行用户态进程Y

    几种特殊情况

    • 通过中断处理过程中的调度时机,用户态进程与内核线程之间互相切换和内核线程之间互相切换,与最一般的情况非常类似,只是内核线程运行过程中发生中断没有进程用户态和内核态的转换;

    • 内核线程主动调用schedule(),只有进程上下文的切换,没有发生中断上下文的切换,比 最一般的情况略简略;

    • 创建子进程的系统调用在子进程中的执行起点及返回用户态,如fork;

    • 加载一个新的可执行程序后返回到用户态的情况,如execve;

    Linux系统架构和执行过程概览

    操作系统的基本概念

    任何计算机系统都包含一个基本的程序集合,称为操作系统。

    • 内核(进程管理,进程调度,进程间通讯机制,内存管理,中断异常处理,文件系统, I/O
      系统,网络部分)

    • 其他程序(例如函数库、 shell程序、系统程序等等)

    操作系统的目的

    • 与硬件交互,管理所有的硬件资源

    • 为用户程序(应用程序)提供一个良好的执行

    从CPU的角度看Linux的系统执行

    1. 从shell中得到一个命令,一个字符串c,c=gets()是一个系统调用,从用户态的堆栈进入内核

    1. CPU等待用户输入命令的过程,会切换到其他的进程执行,涉及到进程调度。

    1. 在键盘上敲击了一个命令,键盘发生I/O中断,调用中断处理程序。此时得到了一个输入的参数,则会唤醒刚才由于等待而进入阻塞状态的进程进入就绪状态。

    1. 中断处理过程会出现进程调度的时机,它可能会把进程X作为next进程来执行,这时进程管理就会切换到进程X。然后gets系统调用就获得了需要从键盘中读取的数据,然后返回到用户态。

    2. 重复这个过程,完成不同的操作指令

    从内存的角度看Linux的系统执行

    物理内存和虚拟之间的映射关系:

    实验——跟踪调试schedule函数

    • 进入虚拟机环境,启动内核,并进入调试状态

    • 在schedule处设置断点,c继续执行。

    • 单步执行直到遇到__schedule函数,进入其中查看

    • 继续执行,发现context_switch函数

    • 设置断点后,进入其内部查看,发现内核切换的重点代码

    (具体代码运行过程可与上文对照并结合分析一并查看便于理解。)

    参考资料

    【原创作品转载请注明出处】

    1. 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
  • 相关阅读:
    [PDF]阅读、注释最佳软件
    [CentOS 7]挂载ntfs格式U盘
    如何更改键盘按键---KeyTweak?
    ssh 文件上传、文件目录上传和下载
    centos7安装Anaconda(Anaconda3-2020.02-Linux-x86_64)与基本命令使用
    Ubuntu 下SVN常用操作
    程序员常用docker命令
    numpy&pandas
    Deep Learning with pytorch笔记(第三章)
    pytorch中的ReflectionPad2d
  • 原文地址:https://www.cnblogs.com/July0207/p/5388943.html
Copyright © 2020-2023  润新知