- 问题描述
通过这一周的学习,我们进一步了解了操作系统的核心工作机制。除了存储计算机和函数调用堆栈机制,还有一个非常基础性的概念叫中断,这3个关键的方法机制可以叫做计算机的3个法宝。现在我们利用linux内核部分源代码模拟存储程序计算机工作模型并完成一个简单的时间片轮转多道程序内核代码。
2. 解决步骤
2.1 虚拟一个x86的CPU硬件平台
打开实验楼环境,打开用户终端,输入如下命令
$ cd ~/LinuxKernel/linux-3.9.4
$ rm -rf mykernel
$ patch -p1 < ../mykernel_for_linux3.9.4sc.patch
$ make allnoconfig
#编译内核需要一段时间
$ make
$ qemu -kernel arch/x86/boot/bzImage
搭建起来后的内核启动效果如下
此时使用命令
cd mykernel
可以看到QEMU窗口输出内容的代码mymain.c和myinterrupt.c
mymain.c和myinterrupt.c中的代码分别如下图所示
当前有一个虚拟的cpu执行C代码的上下文环境,可以看到mymain.c中的代码在不停地执行,同时有一个中断处理程序的上下文环境,周期性的产生的时钟中断信号,能够触发myinterrupt.c中的代码。这样就模拟好了一个带有中断的x86cpu,并初始化好了系统环境。
2.2 简单的os kernel部分源代码分析
mykernel程序有三个源文件,分别是mypcb.h,mymain.c和myinterrupt.c,其中mypcb.h是头文件,定义了一些结构和函数。mymain.c包含模拟多个进程运行的函数。myinerrupt.c包含了模拟中断的函数。
2.2.1 mypcb.h
mypcb.h用来定义进程控制块,也就是进程结构体的定义
#define MAX_TASK_NUM 4
#define KERNEL_STACK_SIZE 1024*8
struct Thread {
unsigned long ip;
unsigned long sp;
}; /* 定义了一个结构体Thread,其中ip和sp用于保存当前现场 */
typedef struct PCB{
int pid;
volatile long state; /* 进程的状态,-1表示不可运行,0表示可运行,>0表示停止运行 */
char stack[KERNEL_STACK_SIZE] /* 进程堆栈空间 */
struct Thread thread;
unsigned long task_entry; /* 进程入口 */
struct PCB *next; /*进程用链表连接*/
}tPCB; /* 定义了一个进程的结构体 */
void my_schedule(void); /* 进程调度器 */
2.2.2 mymain.c
mymain.cs是mykernel内核代码的入口,负责初始化内核的各个组成部分。
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>
#include "mypcb.h"
tPCB task[MAX_TASK_NUM]; /* 定义一个进程数组,这里有4个进程 */
tPCB * my_current_task = NULL; /* 定义了当前变量指针 */
volatile int my_need_sched = 0; /* 定义了一个判断调度与否的标志 */
void my_process(void); /* 声明进程处理函数 */
1. my_start_kernel函数
这个函数可以分为三部分来分析
void __init my_start_kernel(void)
{
int pid = 0;
int i;
task[pid].pid = pid;
task[pid].state = 0;
task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process; /* 设置函数my_process的位置为ip指向的位置,即入口 */
task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE];/* 设置sp自己申请的堆栈空间的最后一个字节的地址 */
task[pid].next = &task[pid];
第一部分,是初始化进程0。pid代表了进程号,0是第一个;state代表运行状态,初始化为可运;Thread的ip就是进程入口点,其实就是进程运行的起点;sp实际上是定义了这个进程的栈空间,最后定义了下一个进程的链接先指向自己。
/*生成多个进程*/
for(i=1;i<MAX_TASK_NUM;i++)
{
memcpy(&task[i],&task[0],sizeof(tPCB));
task[i].pid = i;
task[i].state = -1; /* 将余下进程状态设置为不可运行 */
task[i].thread.sp = (unsigned long)&task[i].stack[ KERNEL_STACK_SIZE-1];
task[i].next = task[i-1].next;
task[i-1].next = &task[i];
}
第二部分,是根据第一个进程0初始化余下的进程。因为我们设置最大进程数为4,所以这里实际上是设置了进程1-3的数据结构的值。
/* 从0进程开始运行 */
pid = 0;
my_current_task = &task[pid];
asm volatile(
"movl %1,%%esp
" /* 将当前进程中sp的值(栈底)放入esp寄存器中 */
"pushl %1
" /* 当前进程sp中的值入栈 */
"pushl %0
" /* 进程入口点入栈 */
"ret
" /* 返回运行地址 */
"pop1 %%ebp
" /* 不会执行 */
:
: "c" (task[pid].thread.ip),"d" (task[pid].thread.sp)
);
}
最后一个部分,是从进程0号开始运行。这里使用了内嵌汇编代码,实际上就是将进程0的thread.sp的值赋给esp,将当前运行的地址保存到栈中,这样如果切换的话就可以保证下一个进程结束时回到原来的位置执行。
2. my_process函数
void my_process(void)
{
int i = 0;
while(1)
{
i++;
if(i%10000000 == 0)
{
printk(KERN_NOTICE "this is process %d -
",my_current_task->pid);
if(my_need_sched == 1)
{
my_need_sched = 0;
my_schedule();
}
printk(KERN_NOTICE "this is process %d +
",my_current_task->pid);
}
}
}
my_process建立一个循环不断运行进程,输出表明进程正在不断运行的语句,并判断是否需要切换进程,调用my_schedule函数。
2.2.3 myinterrupt.c
myinterrupt.c中包含切换进程的代码my_schedule函数
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>
#include "mypcb.h"
extern tPCB task[MAX_TASK_NUM];
extern tPCB * my_current_task;
extern volatile int my_need_sched;
volatile int time_count = 0; /* 计时器 */
首先定义了一些全局变量。然后主要实现了两个函数:my_time_handler和my_schedule,其中my_time_handler实现了中断,而my_schedule实现了中断之后进程的切换。
1. my_timer_handler函数
void my_timer_handler(void)
{
#if 1
if(time_count%1000 == 0 && my_need_sched != 1)
{
printk(KERN_NOTICE ">>>my_timer_handler here<<<
");
my_need_sched = 1;
}
time_count++ ;
#endif
return;
}
这个函数是每1000毫秒的时候产生一个中断,产生中断之后把my_need_sched设置为1,这样mymain.c中的my_process函数就会调用my_schedule函数来进行进程切换。
2. my_schedule函数
这个函数实现了时间片轮转的中断处理过程
void my_schedule(void)
{
tPCB * next; /*下一个进程*/
tPCB * prev; /*当前进程*/
if(my_current_task == NULL
|| my_current_task->next == NULL)
{
return;
}
printk(KERN_NOTICE ">>>my_schedule<<<
");
/* schedule */
next = my_current_task->next;
prev = my_current_task;
初始化两个指针next和prev
if(next->state == 0)
{
/* 切换到下一个进程 */
asm volatile(
"pushl %%ebp
" /* 保存当前ebp到堆栈 */
"movl %%esp,%0
" /* 将当前esp保存到当前进程的sp中 */
"movl %2,%%esp
" /* 将next进程的堆栈栈顶的值存到esp中 */
"movl $1f,%1
" /* 保存当前进程的eip值 */
"pushl %3
" /* 将next进程继续执行的代码入口(标号1)压栈 */
"ret
" /* 出栈(标号1)到eip寄存器 */
"1: " /* 标号1,即next进程开始执行的位置 */
"popl %%ebp
" /* 恢复寄存器ebp里的值 */
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<
",prev->pid,next->pid);
}
这一段是循环运行代码,就是当下一个进程的state状态是可运行时,说明这个进程之前已经在运行了,此时可以继续执行,就切换到下一个进程,这中间有一段内嵌汇编代码,实现了保存栈地址和栈指针,这样进程切换回来的时候就可以正常运行。然后根据之前保存的栈地址恢复执行
else
{
next->state = 0;
my_current_task = next;
printk(KERN_NOTICE ">>>switch %d to %d<<<
",prev->pid,next->pid);
/* 切换到一个新的进程 */
asm volatile(
"pushl %%ebp
"
"movl %%esp,%0
"
"movl %2,%%esp
"
"movl %2,%%ebp
"
"movl $1f,%1
" /* 保存当前eip寄存器的值到当前进程的ip */
"pushl %3
" /* 把即将执行的进程的代码入口地址入栈 */
"ret
" /* 出栈进程的代码入口地址到eip寄存器 */
: "=m" (prev->thread.sp),"=m" (prev->thread.ip)
: "m" (next->thread.sp),"m" (next->thread.ip)
);
}
}
return;
}
当下一个进程的state不为0时,那么也就是说下一个进程还从来都没有执行过,所以这一段内嵌汇编代码的作用是开始执行一个新进程。
通过分析源码,我们了解到时间片轮转算法的具体方法,即每个进程被分配一个时间段,称作它的时间片,即该进程允许运行的时间。如果在时间片结束时进程还在运行,则CPU将被剥夺并分配给另一个进程。如果进程在时间片结束前阻塞或结束,则CPU当即进行切换。调度程序所要做的就是维护一张就绪进程列表,当进程用完它的时间片后,它被移到队列的末尾。这是一种最古老,最简单,最公平且使用最广的算法。
3. 总结
通过这一周的学习,我们对操作系统的核心工作机制有了更进一步的了解,通过对linux内核部分源代码的分析以及完成一个简单的时间片轮转多道程序内核代码的工作,让我对linux内核有了一个模糊的了解,希望在接下来的学习中能够更进一步的学习linux内核的相关知识。