进程0是由linus写在操作系统文件中的,是预先写死了的。那么进程0以后的进程是如何创建的呢?本篇文章主要讲述进程0创建进程1的过程。
在创建之前,操作系统先是进行了一系列的初始化,分别为设备号、块号、内存大小的设置、内存管理、中断、字符设备、时间、LDT和GDT、缓冲区、硬盘、软盘以及开启之前关闭的中断。由于操作系统通常情况下是运行在用户模式下的,因此还进行的一个很重要的工作就是特权级的切换。具体对应linux0.11代码中main.c文件中的内容。
接下来一个很有意思且很重要的事情就是,调用了fork()函数,好家伙,上来就给你创建进程1。这个函数并没有被定义,它是由编译器编译产生的。
fork是通过内联函数static inline _syscall0(int,fork)引入的。_syscall0()定义在unistd.h文件中,具体代码是这样的。
途中第一个冒号后对应输出,a对应寄存器eax,第二个冒号后对应输入,其意思就是将_NR_##name的值给eax,在这里,就是eax = __NR_fork = 2。展开以后,这个函数就是c语言中的fork函数。
linus为什么这么费力的做这件事情呢?有以下几个原因,首先,c语言中的函数在调用的时候,都是要进行保护操作的,也就是入栈,这会占据额外的内存开销,要知道,我们操作系统的内存都是很紧张的,如果所有函数都这样做会很容易导致操作系统内存的不够用。而内联函数不一样,它与宏函数有点像,是直接将函数代码插入在调用位置,这样能避免入栈操作,也就能避免这样的问题了。此外,除了fork,操作系统还有各种相似的系统调用来写,系统调用里面还有不同的参数.如果挨个写,可能要写上百个,但是这里只给了一个程序架子,就能自动生成所需要的代码。
这个函数首先是调用了int 0x80中断,这个中断首先去中断描述符表中找自己对应的中断服务程序在哪里,然后呢去中断服务程序对应的程序入口地址去执行对应程序,执行的是_system_call(在system_call.s文件中)。它大致做了这么些事情,首先,由用户特权级跳转到内核特权级,接下来将当前系统状态入栈保存(TSS),然后通过sys_call_table数组去调用对应的系统调用函数,这里显然是_sys_fork。具体代码是这个样子的:
_sys_fork长这样:
显然这个函数先调用了c中find_empty_process()函数,这个函数在fork.c文件中,它做了这么一件事情,为当前创建的进程争取在task数组中空闲的位置。
last_pid的初始值为0,为long类型,显然系统中最大的last_pid为0x8000,当超过这个值后就会回转计算了。第一个if判断起到两种作用,是的pid每次都从1开始,因为0是进程0,已经创建且会一直在task数组中存在,为什么呢?这可是所有进程的最大的父亲,当然不能动,不然后续怎么进行复制呢?然后每次让last_pid + 1,用last_pid来标记当前进程的进程号,显然,当一个进程在task数组中存在了,就会对应一个last_pid值,两个创建的进程显然不能一样呀,这可是进程的标识符。在我们这呢,由于是第一次创建,因此,不会出现这样的情况,直接for循环结束进入下一个循环,这个循环就是返回一个空闲的task数组中的位置。如果没找到合适的task数组中的位置怎么办呢?没找到,显然意味着这个数组已经满了,没有空闲的位置了。因此返回一个-EAGAIN(-11)标识符。
执行完当然是回到_sys_fork里面。首先肯定要判断下咱返回来的是个啥,就是testl %eax,%eax这行。这里如果是负数那么直接就返回去了,后续需要进程调度,在这里不展开讲,因为和这篇文章的主题离得太远了。现在咱已经在task数组里面占到坑了,那当然是赶紧创建,创建操作是调用c函数copy_process()来实现的,这个函数也在fork.c里面。调用函数前,当然是要保存当前的系统状态了,因此也要进行一系列的入栈操作,此外这些值在copy_process()中都要用到。然后,咱就到了copy_process()。
这个函数长这样:
1 int copy_process(int nr,long ebp,long edi,long esi,long gs,long none, 2 long ebx,long ecx,long edx, 3 long fs,long es,long ds, 4 long eip,long cs,long eflags,long esp,long ss) 5 { 6 struct task_struct *p; 7 int i; 8 struct file *f; 9 10 p = (struct task_struct *) get_free_page(); 11 if (!p) 12 return -EAGAIN; 13 task[nr] = p; 14 *p = *current; /* NOTE! this doesn't copy the supervisor stack */ 15 p->state = TASK_UNINTERRUPTIBLE; 16 p->pid = last_pid; 17 p->father = current->pid; 18 p->counter = p->priority; 19 p->signal = 0; 20 p->alarm = 0; 21 p->leader = 0; /* process leadership doesn't inherit */ 22 p->utime = p->stime = 0; 23 p->cutime = p->cstime = 0; 24 p->start_time = jiffies; 25 p->tss.back_link = 0; 26 p->tss.esp0 = PAGE_SIZE + (long) p; 27 p->tss.ss0 = 0x10; 28 p->tss.eip = eip; 29 p->tss.eflags = eflags; 30 p->tss.eax = 0; 31 p->tss.ecx = ecx; 32 p->tss.edx = edx; 33 p->tss.ebx = ebx; 34 p->tss.esp = esp; 35 p->tss.ebp = ebp; 36 p->tss.esi = esi; 37 p->tss.edi = edi; 38 p->tss.es = es & 0xffff; 39 p->tss.cs = cs & 0xffff; 40 p->tss.ss = ss & 0xffff; 41 p->tss.ds = ds & 0xffff; 42 p->tss.fs = fs & 0xffff; 43 p->tss.gs = gs & 0xffff; 44 p->tss.ldt = _LDT(nr); 45 p->tss.trace_bitmap = 0x80000000; 46 if (last_task_used_math == current) 47 __asm__("clts ; fnsave %0"::"m" (p->tss.i387)); 48 if (copy_mem(nr,p)) { 49 task[nr] = NULL; 50 free_page((long) p); 51 return -EAGAIN; 52 } 53 for (i=0; i<NR_OPEN;i++) 54 if (f=p->filp[i]) 55 f->f_count++; 56 if (current->pwd) 57 current->pwd->i_count++; 58 if (current->root) 59 current->root->i_count++; 60 if (current->executable) 61 current->executable->i_count++; 62 set_tss_desc(gdt+(nr<<1)+FIRST_TSS_ENTRY,&(p->tss)); 63 set_ldt_desc(gdt+(nr<<1)+FIRST_LDT_ENTRY,&(p->ldt)); 64 p->state = TASK_RUNNING; /* do this last, just in case */ 65 return last_pid; 66 }
它首先做的一件事情是申请一个空页,调用了get_free_page()函数。该函数是在memory.c文件中定义。
回到copy_process()函数,它先做了个强制类型转换,将这个页面的指针强制类型转换为指向task_struct的指针向量,并挂接在task[nr=1]上。nr是find_empty_process返回的任务号。需要注意的是,c语言中的指针有地址和类型的含义,强制类型转换的意思是认定这个页面的低地址 端就是进程1的task_struct的首地址,同时暗示了高地址部分是内核栈,长这样:
空白部分是stack数组。
下面就要开始讲进程创建部分的很有意思的内容了,请听下回分解。