转自:http://blog.chinaunix.net/uid-26833883-id-3222794.html
1.fork() ,vfork() 创建进程
2‘ exec()类 在进程中执行其他的程序
3‘wait(),waitpid(),获取子进程结束的状态和处理僵尸进程
僵尸进程:如果子进程先于父进程结束,子进程就变成僵尸进程,(在父进程结束前一直都是),其进程号和栈等资源都没有回收。
如果父进程先于子进程结束,子进程的父进程变为init进程
由
fork创建的新进程被称为子进程(child
process)。该函数被调用一次,但返回两次。两次返回的区别是子进程的返回值是0,而父进程的返回值则是
新子进程的进程ID。将子进程ID返回给父进程的理由是:因为一个进程的子进程可以多于一个,所有没有一个函数使一个进程可以获得其所有子进程的进程
ID。fork使子进程得到返回值0的理由是:一个进程只会有一个父进程,所以子进程总是可以调用getppid以获得其父进程的进程ID(进程 ID
0总是由交换进程使用,所以一个子进程的进程ID不可能为0)。
子进程和父进程继续执行fork之后的指令。子进程是父进程的复制品。例如,子进程获得父进程数据空间、堆和栈的复制品。注意,这是子进程拥有的拷贝。父、子进程并共享这些存储部分。如果正文段是只读的,则父、子进程共享正文段。
现在很多的实现并不做一个父进程数据段和堆的完全拷贝,因为在fork之后经常跟随着exec。作为替代,使用了写时复制(copy-on-
write,cow)的技术。这些区域由父、子进程共享,而且内核将他们的存取许可权改变位只读的。如果有进程试图修改这些区域,则内核包异常,典型的是
虚存系统中的“页”,做一个拷贝。
实例1:
#include
#include
#include
int glob = 6;
char buf[] = "a write to stdout
";
int main()
{
int var;
int pid;
var = 88;
if(write(STDOUT_FILENO,buf,sizeof(buf) -1) != sizeof(buf) -1)
{
perror("fail to write");
return -1;
}
printf("before fork
");
if((pid = fork()) < 0)
{
perror("fail to fork");
return -1;
}else
if(pid == 0)
{
glob ++;
var ++;
}else{
sleep(2);
}
printf("pid = %d,glob = %d,var = %d
",getpid(),glob,var);
exit(0);
}
从上面可以看出,因为子进程和父进程拥有独立的物理内存空间,所以当子进程对拷贝来的数据做修改的时候,并没有影响到父进程。
注意:
1.一般来说,fork之后父进程先执行还是子进程先执行是不确定的。这取决于内核所使用的调度算法。
2.从上面可以看到两次的运行结果不一样。我们知道write函数是不带缓存的。因为在fork之前调用write,所以其数据写到标准输出一次。但是,标准 I/O库是带缓存的。如果标准输出连到终端设备,则它是行缓存的,否则它是全缓存的。当以交互方式运行该程序时,只得到printf输出的行一次,其原因是标准输出缓存由新行符刷新。但是当将标准输出重新定向到一个文件时,却得到printf输出行两次。其原因是,在fork之前调用了printf一次,当调用fork时,该行数据仍在缓存中,然后在父进程数据空间复制到子进程中时,该缓存数据也被复制到子进程中。于是那时父、子进程各自有了带该行内容的缓存。在exit之前的第二个printf将其数据添加到现存的缓存中。当每个进程终止时,其缓存中的内容被写到相应文件中。
实例 2:
#include
#include
#include
int glob = 6;
int main()
{
int var;
int pid;
var = 88;
printf("father:
");
printf("&glob = %p
",&glob);
printf("&var = %p
",&var);
printf("__________________________________
");
if((pid = fork()) < 0)
{
perror("fail to fork");
return -1;
}else
if(pid == 0)
{
printf("child var value not change
:");
printf("&glob = %p
",&glob);
printf("&var = %p
",&var);
glob ++;
var ++;
printf("__________________________________
");
printf("child var value change:
");
printf("&glob = %p
",&glob);
printf("&var = %p
",&var);
}
exit(0);
}
从
上面可以看出,根据copy-on-write的思想,在子进程中,改变父进程的数据时,会先
复制父进程的数据修然后再改,从而达到子进程对数据的修改不影响父进程。但是我们发现,复制的前后,其值的地址都是一样的。为什么呢?子进程拷贝的时候也
拷贝了父进程的虚拟内存"页",这样他们的虚拟地址都一样,但是对应不同的物理内存空间。
二、copy-on-write工作原理
假设进程A创建子进程B,之后进程A和进程B共享A的地址空间,同时该地址空间中的页面全部被标识为写保护。此时B若写address的页面,由于写保护
的原因会引起写异常,在异常处理中,内核将address所在的那个写保护页面复制为新的页面,让B的address页表项指向该新的页面,新页面可写。
而A的address页表项依然指向那个写保护的页面。然后当B在访问address时就会直接访问新的页面了,不会在访问到哪个写保护的页面。当A试图
写address所在的页面时,由于写保护的原因此时也会引起异常,在异常处理中,内核如果发现该页面只有一个拥有进程,此种情况下也就是A,则直接对该
页面取消写保护,此后当A再访问address时不会在有写保护错误了。如果此时A又创建子进程C,则该address所在的页面又被设置为写保护,拥有
进程A和C,同时其他页面例如PAGEX依然维持写保护,只是拥有进程A、B和C。如果此时A访问PAGEX,则异常处理会创建一个新页面并将PAGEX
中的内容复制到该页面,同时A相应
的pte指向该新页面。如果此时C也访问PAGEX,也会复制新页面并且让C对应的pte指向新页面。如果B再访问PAGEX,则由于此时PAGEX只有
一个拥有进程B,故不再复制新页面,而是直接取消该页面的写保护,由于B的pte本来就是直接指向该页面,所以无需要在做其它工作。
三、exit和_exit
(1)正常终止:
(a)在main函数内执行return语句。这等效于调用exit。
(b)调用exit函数
(c)调用_exit系统调用函数
(2)异常终止:
(a)调用abort。它产生SIGABRT信号,所以是一种异常终止的一种特列。
(b)当进程接收到某个信号时。例如,进程越出其地址空间访问存储单元,或者除以0,内核就会为该进程产生相应的信号。
注意:不管进程如何终止,最后都会执行内核中的同一段代码。这段代码为相应进程关闭所有打开描述符,释放它所使用的存储器等。
_exit()函数的作用最为简单:直接进程停止运行,清除其使用的内存空间,并销毁其在内核中的各种数据结构;
exit()函数与_exit()函数最大的区别就在于exit()函数在调用exit系统调用之前要检查文件的打开情况,把文件缓冲区中的内容写回文件,就是"清理I/O"缓冲。
探究 1._exit()
//_exit(0) exit(0) return 0
编译运行结果:
从上面我们看到,test.txt的内容为空.为什么呢?因为标准I/O函数是带缓存的,进行fputs的时候是先向缓存中写的,只有当缓存满的时候才会刷新的缓冲区的。从以上我们发现,当进程退出时,执行_exit()函数并没有刷新缓冲区的数据,而是直接终止进程的。
从上面我们可以看到,当exit()函数结束进程的时候,对缓存进行了处理,把缓存的数据写到了磁盘文件中。
探究3.return
由读者自己完成,其实return语句用在main函数中,和exit是一样的。但是我们知道,return返回的值是给调用者的,它代表着一个函数的结束。
四、exec函数族
exec.c 调用exec其中的一个函数; gcc exec.c -o exec; ./exec
exec函数族提供了一种在进程中启动另一个程序执行的方法。它可以根据指定的文件名或目录名找到可执行文件,并用它来取代原调用进程的数据段、代码段、和堆栈段。在执行完之后,原调用进程的内容除了进程号外,其他全部都被替换了。
可执行文件既可以是二进制文件,也可以是任何Linux下可执行的脚本文件。
何时使用?
当进程认为自己不能再为系统和用户做任何贡献了就可以调用exec函数族中的函数,让自己执行新的程序。
当前目录: 可执行程序A B(1,2,3)
如果某个进程想同时执行另一个程序,它就可以调用fork函数创建子进程,然后在子进程中调用任何一个exec函数。这样看起来就好像通过执行应用程序而产生了一个新进程一样。
execl("./B","B","1","2","3",NULL);
char *const envp[] = {"B","1","2","3",NULL}
注意:不管file,第一个参数必须是可执行文件的名字
可执行文件查找方式
表中的前四个函数的查找方式都是指定完整的文件目录路劲,而最后两个函数(以p结尾的函数)可以只给出文件名,系统会自动从环境变量"$PATH"所包含的路径中进行查找。
参数表传递方式
两种方式:一个一个列举和将所有参数通过指针数组传递
一函数名的第5个字母按来区分,字母"l"(list)的表示一个一个列举方式;字母"v"(vector)的表示将所有参数构造成指针数组传递,其语法为char *const argv[]
环境变量的使用
exec函数族可以默认使用系统的环境变量,也可以传入指定的环境变量。这里,以"e"(Envirment)结尾的两个函数execle、execve就可以在envp[]中传递当前进程所使用的环境变量。
使用的区别
可执行文件查找方式
参数表传递方式
环境变量的使用
程序运行结果:
案例一execl
#include
#include
int main(int argc,char *argv[])
{
printf("start to execl.
");
if(execl("/bin/ls","ls",NULL) < 0)
{
perror("Fail to execl");
return -1;
}
printf("end of execl.
");
return 0;
}
案例二、execlp
#include
#include
int main(int argc,char *argv[])
{
printf("start to execl.
");
if(execlp("ls","ls","-l",NULL) < 0)
{
perror("Fail to execl");
return -1;
}
printf("end of execl.
");
return 0;
}
运行结果:
案例三、execle
#include
#include
int main(int argc,char *argv[])
{
if(getenv("B") == NULL)
{
printf("fail to getenv B.
");
}else{
printf("env B = %s.
",getenv("B"));
}
if(getenv("C") == NULL)
{
printf("fail to getenv C.
");
}else{
printf("env C = %s.
",getenv("C"));
}
if(getenv("PATH") == NULL)
{
printf("fail to getenv PATH.
");
}else{
printf("env PATH = %s.
",getenv("PATH"));
}
return 0;
}
运行结果:
#include
int main(int argc,char *argv[])
{
printf("start to execle.
");
char * const envp[] = {"B=hello",NULL};
if(execle("./A.out","A.out",NULL,envp) < 0)
{
perror("Fail to execl");
return -1;
}
printf("end of execl.
");
return 0;
}
运行结果:
案例四:execv
#include
#include
#include
#include
int main()
{
char * const arg[] = {"ps", "-ef", NULL};
//if (execl("/bin/ps", "ps", "-ef", NULL) < 0)
if (execv("/bin/ps" ,arg) < 0)
{
perror("execl");
exit(-1);
}
while (1);
return 0;
}
五、进程的创建vfork()函数
vfork与fork一样都创建一个子进程,但是它并不将父进程的地址空完全复制到子进程中,因为子进程会立即调用exec(或exit)于是也就不会存、访该地址空间。不过在子进程调用exec或exit之前,它在父进程的空间中运行。
vfork和fork之间的另一个区别是:vfork保证子进程先运行,在它调用exec或exit之后 父进程才可能被调度运行。(如果在调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁)
因
为我们知道vfork保证子进程先运行,子进程运行结束后,父进程才开始运行。所以,第一次打印的是子进程的打印的信息,可以看到var值变成了89。子
进程结束后,父进程运行,父进程首先打印fork调用返回给他pid的值(就是子进程pid)。以上我们可以看出,vfork创建的子进程和父进程运行的
地址空间相同(子进程改变了var 值,父进程中的var值也进行了改变)。
注意:如果子进程中执行的是exec函数,那就是典型的fork的copy-on-wirte。
五、wait和waitpid
wait函数:调用该函数使进程阻塞,直到任一个子进程结束或者是该进程接收到一个信号为止。如果该进程没有子进程或者其子进程已经结束,wait函数会立即返回。
waitpid函数:功能和wait函数类似。可以指定等待某个子进程结束以及等待的方式(阻塞或非阻塞)。
wait函数
#include
#include
pid_t wait(int *status);
函数参数:
status是一个整型指针,指向的对象用来保存子进程退出时的状态。
A.status若为空,表示忽略子进程退出时的状态
B.status若不为空,表示保存子进程退出时的状态
子进程的结束状态可由Linux中一些特定的宏来测定。
案例一、
#include
#include
int main()
{
int pid;
if((pid = fork()) < 0)
{
perror("Fail to fork");
return -1;
}else if(pid == 0){
printf("child exit now.
");
exit(0);
}else{
while(1);
}
exit(0);
}
运行结果:
输入字符后:
给进程15494发个信号
程序运行结果:
从以上可以看出,子进程正常退出时,处于僵尸态。这个时候子进程的pid,以及内核栈资源并没有释放,这样是不合理的,我们应该避免僵尸进程。如果父进程先退出呢,子进程又会怎样?
#include
#include
int main()
{
int pid;
if((pid = fork()) < 0)
{
perror("Fail to fork");
return -1;
}else if(pid == 0){
printf("child running now - pid : %d.
",getpid());
while(1);
}else{
getchar();
printf("Father exit now - pid : %d.
",getpid());
exit(0);
}
从上面可以看出,如果父进程先退出,则子进程的父进程的ID号变为1,也就是说当一个子进程的父进程退出时,这个子进程会被init进程自动收养。
案例二、利用wait等待回收处于僵尸态的子进程
#include
#include
int main()
{
int pid;
if((pid = fork()) < 0)
{
perror("Fail to fork");
return -1;
}else if(pid == 0){
printf("child runing now - pid : %d.
",getpid());
getchar();
printf("child exiting now - pid : %d.
",getpid());
exit(0);
}else{
printf("Father wait zombie now - pid : %d.
",getpid());
wait(NULL);
printf("Father exiting now - pid : %d.
",getpid());
exit(0);
}
}
没有输入字符前:
输入字符后:
此时我们没有发现僵尸进程,当子进程退出时,父进程的wait回收了子进程未释放的资源。
案例三、获取进程退出时的状态
#include
#include
int main()
{
int pid;
int status;
if((pid = fork()) < 0)
{
perror("Fail to fork");
exit(-1);
}else if(pid == 0){
printf("create child process : %d.
",getpid());
printf("child process : %d calling exit(7).
",getpid());
exit(7);
}else{
if((pid = fork()) < 0 ){
perror("Fail to fork");
exit(-1);
}else if(pid == 0){
printf("create child process : %d.
",getpid());
while(1);
}else{
while((pid = wait(&status)) != -1)
{
if(WIFEXITED(status))
{
printf("child process %d is normal exit,the value is %d.
",pid,WEXITSTATUS(status));
}else if(WIFSIGNALED(status)){
printf("child process %d is exit by signal,the signal num is %d.
",pid,WTERMSIG(status));
}else{
printf("Not know.
");
}
}
}
}
printf("All child process is exit,father is exit.
");
exit(0);
}
给进程15494发个信号
程序运行结果:
从以上探究可以知道,每当子进程结束后,wait函数就会返回哪个子进程结束的pid。如果没有子进程存在,wait函数就返回-1。
函数返回值:
成功:子进程的进程号
失败:-1
#include
#include
pid_t waitpid(pid_t pid,int *status,int options);
参数:
1.在父进程中创建两个子进程(A B)
2.A进程打印"child process %d exit",调用exit(2),结束
3.B进程一直运行
注意:父进程调用while(waitpid(-1,&status,WUNTRACED) != -1 )
status:同wait
options:
WNOHANG,若由pid指定的子进程并不立即可用,则waitpid不阻塞,此时返回值为0
WUNTRACED,若某实现支持作业控制,则由pid指定的任一子进程状态已暂停,且其状态自暂停以来还没报告过,则返回其状态。
0:同wait,阻塞父进程,等待子进程退出。
返回值
正常:结束的子进程的进程号
使用选项WNOHANG且没有子进程结束时:0
调用出错:-1
案例一、
#include
#include
int main()
{
int pid;
int status;
if((pid = fork()) < 0)
{
perror("Fail to fork");
exit(-1);
}else if(pid == 0){
printf("create child process : %d.
",getpid());
printf("child process : %d calling exit(7).
",getpid());
exit(7);
}else{
if((pid = fork()) < 0 ){
perror("Fail to fork");
exit(-1);
}else if(pid == 0){
printf("create child process : %d.
",getpid());
while(1);
}else{
while((pid = wait(&status)) != -1)
{
if(WIFEXITED(status))
{
printf("child process %d is normal exit,the value is %d.
",pid,WEXITSTATUS(status));
}else if(WIFSIGNALED(status)){
printf("child process %d is exit by signal,the signal num is %d.
",pid,WTERMSIG(status));
}else{
printf("Not know.
");
}
}
}
}
printf("All child process is exit,father is exit.
");
exit(0);
}
从以上可以看出,子进程15783退出时,父进程并没有回收它的资源,此时可以看到它处于僵尸态。
由于父进程调用waitpid等待子进程15784退出,此时这个进程还没退出,看可以看到父进程处于可中断的睡眠状态。
程序运行结果:
可以看到当waitpid指定等待的进程退出时,waitpid立即返回,此时父进程退出。
案例二、
#include
#include
int main()
{
int pid;
int status;
if((pid = fork()) < 0)
{
perror("Fail to fork");
exit(-1);
}else if(pid == 0){
printf("create child process : %d.
",getpid());
printf("child process : %d calling exit(7).
",getpid());
exit(7);
}else{
if((pid = fork()) < 0 ){
perror("Fail to fork");
exit(-1);
}else if(pid == 0){
printf("create child process : %d.
",getpid());
while(1);
}else{
sleep(2);
printf("Father wait child %d exit.
",pid);
while((pid = waitpid(pid,NULL,WNOHANG)))
{
printf("The process %d is exit.
",pid);
}
printf("The process %d is exit.
",pid);
}
}
exit(0);
}
从上面探究我们可以看出,如果有子进程处于僵尸态,waitpid(pid,NULL,WNOHANG)立即处理后返回,如果没有子进程处于僵尸态,此时waitpid(pid,NULL,WNOHANG)也会立即返回,而不阻塞,此时返回值为0。
案例探究三、
#include
#include
#include
int main(int argc,char *argv[])
{
int pid;
int status;
if((pid = fork()) < 0)
{
perror("Fail to fork");
exit(-1);
}else if(pid == 0){
printf("create child process : %d.
",getpid());
printf("child process in proces group %d.
",getpgid(0));
printf("child process : %d calling exit(7).
",getpid());
exit(7);
}else{
if((pid = fork()) < 0 ){
perror("Fail to fork");
exit(-1);
}else if(pid == 0){
sleep(3);
printf("create child process : %d.
",getpid());
setpgid(0,0); //让子进程属于以自己ID作为组的进程组
printf("child process in proces group %d.
",getpgid(0));
printf("child process : %d calling exit(6).
",getpid());
}else{
while(pid = waitpid(0,NULL,0))
{
printf("Father wait the process %d is exit.
",pid);
}
}
}
exit(0);
}
当在父进中创建子进程时,父进程和子进程都在以父进程ID号为组的进程组。以上代码中,有一个子进程改变了自己所在的进程组.