fork的作用是根据一个现有的进程复制出一个新进程,原来的进程称为父进程(Parent Process),新进程称为子进程(Child Process)。系统中同时运行着很多进程,这些进程都是从最初只有一个进程开始一个一个复制出来的。在Shell下输入命令可以运行一个程序,是因为Shell进程在读取用户输入的命令之后会调用fork复制出一个新的Shell进程,然后新的Shell进程调用exec执行新的程序。
我们知道一个程序可以多次加载到内存,成为同时运行的多个进程,例如可以同时开多个终端窗口运行/bin/bash,另一方面,一个进程在调用exec前后也可以分别执行两个不同的程序,例如在Shell提示符下输入命令ls,首先fork创建子进程,这时子进程仍在执行/bin/bash程序,然后子进程调用exec执行新的程序/bin/ls,如下图所示。
一、fork系统调用
包含头文件 <sys/types.h> 和 <unistd.h>
函数功能:创建一个子进程
函数原型
pid_t fork(void);
参数:无参数。
返回值:
如果成功创建一个子进程,对于父进程来说返回子进程ID
如果成功创建一个子进程,对于子进程来说返回值为0
如果为-1表示创建失败
(1)、fork出的子进程继承了父进程下面这些属性:
- uid,gid,euid,egid
- 附加组id(sgid,supplementary group id) //sgid引入原因是有时候希望这个用户属于多个其他部门,这些其他部门的gid就是sgid
- 进程组id,会话id
- SUID标记和SGID标记
- 控制终端
- 当前工作目录/根目录
- 文件创建时的umask
- 文件描述符的文件标志(close-on-exec)
- 信号屏蔽和处理
- 存储映射
- 资源限制
(2)、下面是不同的部分:
- pid不同
- 进程时间被清空
- 文件锁没有继承
- 未处理信号被清空
(3)、fork系统调用需要注意的地方
fork系统调用之后,父子进程将交替执行。
如果父进程先退出,子进程还没退出那么子进程的父进程将变为init进程。(注:任何一个进程都必须有父进程)
如果子进程先退出,父进程还没退出,那么子进程必须等到父进程捕获到了子进程的退出状态才真正结束,否则这个时候子进程就成为僵进程。
子进程退出会发送SIGCHLD信号给父进程,可以选择忽略或使用信号处理函数接收处理就可以避免僵尸进程。
(4)、写时复制 copy on write
如果多个进程要读取它们自己的那部分资源的副本,那么复制是不必要的。
每个进程只要保存一个指向这个资源的指针就可以了。
如果一个进程要修改自己的那份资源的“副本”,那么就会复制那份资源。这就是写时复制的含义
例如fork就是基于写时复制,只读代码段是可以共享的。
若使用vfork 则子进程和父进程占用同一个内存映像,在子进程修改会影响父进程。 同时只有在子进程执行exec/exit之后才会运行父进程。实际上子进程占用的栈空间就是父进程的栈空间,所以需要非常小心。如果vfork的子进程并没有 exec或者是exit的话,那么子进程就会执行直到程序退出之后,父进程才开始执行。而这个时候父进程的内存已经完全被写坏。
(5)、fork之后父子进程共享文件
子进程继承了父进程打开的文件描述符,故每个打开文件的引用计数为2。
示例程序:
1
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 |
/*************************************************************************
> File Name: process_fork.c > Author: Simba > Mail: dameng34@163.com > Created Time: Sat 23 Feb 2013 02:34:02 PM CST ************************************************************************/ /* 如果父进程先退出,子进程还没退出那么子进程的父进程将变为init进程。(注:任何一个进程都必须有父进程) * 如果子进程先退出,父进程还没退出,那么子进程必须等到父进程捕获到了子进程的退出状态才真正结束, * 否则这个时候子进程就成为僵进程。 */ #include<sys/types.h> #include<sys/stat.h> #include<unistd.h> #include<fcntl.h> #include<stdio.h> #include<stdlib.h> #include<errno.h> #include<string.h> #include<signal.h> #define ERR_EXIT(m) do { perror(m); exit(EXIT_FAILURE); } while(0) int main(int argc, char *argv[]) { signal(SIGCHLD, SIG_IGN); // 避免产生僵尸进程,忽略SIGCHLD信号 printf("before fork pid=%d ", getpid()); int fd; fd = open("test.txt", O_WRONLY); if (fd == -1) ERR_EXIT("open error"); pid_t pid; pid = fork(); // 写时复制copy on write,只读代码段可以共享 /* 若使用vfork()则在还没调用exec之前,父子进程是共享同一个地址空间, * 不像fork()一样会进行拷贝 */ if (pid == -1) ERR_EXIT("fork error"); if (pid > 0) { printf("this is parent "); printf("parent pid=%d child pid=%d ", getpid(), pid); write(fd, "parent", 6); // 父子进程共享一个文件表 sleep(10); } else if (pid == 0) { printf("this is child "); printf("child pid=%d parent pid=%d ", getpid(), getppid()); write(fd, "child", 5); } return 0; } |
测试输出如下:
simba@ubuntu:~/Documents/code/linux_programming/APUE/process$ ./process_fork
before fork pid=2572
this is parent
parent pid=2572 child pid=2573
this is child
child pid=2573 parent pid=2572
simba@ubuntu:~/Documents/code/linux_programming/APUE/process$ cat test.txt
parentchild
simba@ubuntu:~/Documents/code/linux_programming/APUE/process$
可以看到因为共享一个文件表,故文件偏移也共享,父子进程打印进test.txt文件的内容是紧随的而不是从头开始的。
参考:《APUE》