《UNIX环境高级编程》(APUE) 笔记第八章

《UNIX环境高级编程》(APUE) 笔记第八章
8 - 进程控制

Github 地址

1. 进程标识

每个进程都有一个非负整型表示的 唯一进程 ID 。进程 ID 是可复用的（延迟复用算法）。

ID 为 (0) 的进程通常是调度进程，常常被称为 交换进程 (swapper) 。该进程是内核的一部分，它并不执行任何磁盘上的程序，因此也被称为 系统进程 。

ID 为 (1) 通常是 init 进程，负责在自举内核后启动一个 UNIX 系统。init 进程决不会终止，它是一个普通的用户进程（不是内核中的系统进程），但它以超级用户特权运行。

获取各种标识符 的函数：
```
#include <unistd.h>
pit_t getpid(void);		//返回值：调用进程的进程ID
pid_t getppid(void);	//返回值：调用进程的父进程ID
uid_t getuid(void);		//返回值：调用进程的实际用户ID
uid_t geteuid(void);	//返回值：调用进程的有效用户ID
gid_t getgid(void);		//返回值：调用进程的实际组ID
gid_t getegid(void);	//返回值：调用进程的有效组ID
```
这些函数都没有出错返回。

2. 函数 fork

一个现有的进程可以调用 fork 函数 创建一个新进程：
```
#include <unistd.h>
pid_t fork(void);
```
返回值：子进程返回 (0) ，父进程返回子进程ID；若出错，返回 (-1) 。

由 fork 创建的新进程被称为 子进程 (child process) 。fork 函数被调用一次，但是返回两次。

父进程返回值是子进程ID 的原因是：一个进程的子进程可以有多个，并且没有一个函数使一个进程可以获得其所有子进程的进程ID。

子进程返回值是 0 的原因是：一个进程只会有一个父进程，所以子进程总是可以调用 getppid 以获得父进程的进程 ID 。

子进程是父进程的副本。父进程和子进程 共享正文段 。

写时复制 (COW) 技术使得子进程可与父进程共享 数据段 、栈、堆，且内核将它们的访问权限改变为只读　。如果父进程和子进程中的任一个试图修改这些区域，则内核只为修改区域的那块内存制作一个副本，通常是虚拟存储系统中的一页。

clone 系统调用允许调用者控制哪些部分由父进程和子进程共享。

fork 之后是父进程先执行还是子进程先执行是不确定的，取决于内核所使用的调度算法。如果要求父进程和子进程之间相互同步，则要求某种形式的 进程间通信 。

3. 文件共享

父进程所有打开 文件描述符 都被复制到子进程中。父进程和子进程每个相同的打开描述符 共享一个文件表项 （所以父子进程共享一个 文件偏移量）。

描述符在 fork 前打开，之后 处理文件描述符 有以下两种常见情况：
- 父进程等待子进程完成：在这种情况下，父进程无需对其描述符做任何处理。当子进程终止后，它曾进行过读、写操作的任一共享描述符的文件偏移量已做了相应更新。
- 父进程和子进程各自执行不同的程序段：在这种情况下，在 fork 之后，父进程和子进程各自关闭它们不需要使用的文件描述符，这样就不会干扰对方使用的文件描述符。这种方法是网络服务进程经常使用的。
父进程与子进程具体区别：
- fork 的返回值不同
- 进程 ID 不同
- 这两个进程的父进程 ID 不同：子进程的父进程 ID 是创建它的进程 ID，而父进程的父进程 ID 不变
- 子进程的 tms_utime 、tms_stime 、tms_cutime 和 tms_ustime 的值设置为 (0)
- 子进程不继承父进程设置的文件锁
- 子进程的未处理闹钟被清除
- 子进程的未处理信号集设置为空集
使用 fork 失败的两个主要原因：
- 系统中已经有了太多的进程（通常意味着某个方面出了问题）
- 该实际用户 ID 的进程总数超过了系统限制
fork 的两种用法：
- 一个父进程希望复制自己，使父进程和子进程执行不同的代码段 。这在网络服务进程中是最常见的——父进程等待客户端的服务请求。当这种请求到达时，父进程调用 fork，使子进程处理此请求，父进程则继续等待下一个服务请求。
- 一个进程要执行一个不同的程序 。这对 shell 是常见的情况。这种情况下，子进程从 fork 返回后立即调用 exec。
4. 函数 vfork

vfork 函数的调用序列和返回值与 fork 相同，但两者的语义不同。vfork 函数用于创建一个新进程，而该新进程的目的是 exec 一个新程序。

vfork 与 fork 区别：
bubian
- vfork 不将父进程的地址空间完全复制到子进程中，因为子进程会立即调用 exec 或 exit ，不过子进程在调用这两个函数之前，会在父进程的空间中运行。
- vfork 保证子进程先运行，在它调用 exec 或 exit 后父进程才可能被调度运行。
5. 函数 exit

进程的五种正常终止方式：
1. 在 main 函数内执行 return 语句，等效于调用 exit 。
2. 调用 exit 函数。其操作包括调用各终止处理程序（由 atexit 函数登记的），然后关闭所有标准 I/O 流等。
3. 调用 _exit 和 _Exit 函数。这两个函数无需运行终止处理程序或信号处理程序，不对标准 I/O 流进行冲洗。
4. 进程最后一个线程在其启动例程中执行 return 语句。此时进程以终止状态 (0) 返回。
5. 进程的最后一个线程调用 pthread_exit 函数。
进程的三种异常终止方式：
1. 调用 abort ，产生 SIGABRT 信号。
2. 当进程接收到某些信号。信号可由进程自身（如调用abort）、其他进程或内核产生。
3. 最后一个线程对 取消 (cancellation) 请求做出响应。
不管进程如何终止，都会关闭所有打开描述符，释放使用的存储器等。

终止进程如何通知其父进程是如何终止的？
- 对于三个终止函数（exit、_exit、_Exit），将其退出状态作为参数传递给函数。
- 对于异常终止情况，内核（不是进程本身）产生一个指示其异常终止原因的终止状态。
- 任一情况下，父进程都通过 wait 或 waitpid 函数取得其终止状态。
若父进程在子进程前终止，如何处理？

通过 init 进程收养：对于父进程已经终止的子进程（ 孤儿进程 ），它们的父进程改变为 init 进程。操作过程为：在一个进程终止时，内核逐个检查所有活动进程，以判断它是否是正要终止进程的子进程，如果是，则该进程的父进程 ID 就更改为 (1) （ init 进程的 ID）。孤儿进程 不会有什么危害。

若子进程在父进程之前终止，父进程如何得到子进程终止状态？

当终止进程的父进程调用 wait 或 waitpid 时，可以得到关于终止进程的信息，包括：进程 ID、该进程的终止状态以及该进程使用的 CPU时间总量。

僵死进程 (zombie) ：

一个已经终止、但是其父进程尚未对其进行善后处理（获取终止子进程的有关信息、释放它仍占用的资源）的进程。僵死进程的资源不会被释放，进程 ID 也一直被占用，但是系统所能使用的进程 ID 是有限的，如果大量地产生僵死进程，将因为没有可用的进程 ID 而导致系统不能产生新的进程. 此即为僵尸进程的危害，应当避免

一个由 init 进程收养的进程终止时会变成僵死进程吗？

不会。因为 init 被编写成无论何时只要有一个子进程终止，init 就会调用一个 wait 函数取得其终止状体。这样也就防止了在系统中塞满僵死进程。

6. 函数 wait 和 waitpid

当一个进程正常或异常终止时，内核就向其父进程发送 SIGCHLD 信号。子进程终止和内核向父进程发送信号都是异步事件。

调用 wait 或 waitpid 的函数会：
- 如果其所有的子进程都还在运行，则阻塞。
- 如果一个子进程已终止，正等待父进程获取其终止状态，则取得该子进程的终止状态立即返回。
- 如果它没有任何子进程，则立即出错返回。
wait 和 waitpid 函数：
```
#include <sys/wait.h>
pid_t wait(int *statloc);
pid_t waitpid(pid_t pid, int *statloc, int options);
```
返回值：若成功，返回进程 ID；若出错，返回 (0) 或 (-1) 。

两个函数区别：
- 在一个子进程终止前，wait 使其调用者阻塞，而 waitpid 有一选项，可使调用者不阻塞。
- waitpid 可等待一个特定进程，而 wait 则返回任一终止子进程的状态（某一子进程终止，就立即返回）。
- waitpid 通过 WUNTRACED 和 WCONTINUD 选项支持作业控制。
- wait 唯一出错情况是没有子进程，对于 waitpid ，如果指定的进程或进程组不存在，或者参数 (pid) 指定的进程不是调用进程的子进程，都可能出错。
(statloc) 参数是一个整型指针，终止进程的终止状态存放在它所指向的单元内。若不关心终止状态，可设为空指针。

终止状态的宏 定义在 <sys/wait.h> 中：

waitpid 中 (pid) 参数bubian作用解释如下：
- (pid==-1) ：等待任一子进程。此种情况下，waitpid 与 pid 等效。
- (pid > 0) ：等待进程 ID 与 (pid) 相等的子进程。
- (pid==0) ：等待组 ID 等于调用进程组 ID 的任一子进程。
- (pid < -1) ：等待组 ID 等于 (pid) 绝对值的任一子进程。
waitpid 的 (options) 参数或是 (0) ，或是以下常量按位或运算的结果：

7. 函数 waitid

waitid 是另一个可以取得进程终止状态的函数，提供了更多灵活性。
```
#include <sys/wait.h>
int waitid(idtype_t idtype, id_t id, siginfo_t *infop, int options);
```
返回值：若成功，返回 (0) ；若出错。返回 (-1) 。

waitid 允许一个进程指定要等待的子进程，使用两个单独的参数表示要等待的子进程所属的类型。

(id) 参数的作用与 (idtype) 的值相关：

(options) 参数是下图各标志的按位或运算，这些标志指示调用者关注哪些状态变化：

WCONTINUED 、WEXITED 或 WSTOPPED 这三个常量之一必须指定。

(infop) 参数是指向 siginfo 结构的指针。该结构包含了造成子进程状态改变有关信号的详细信息。

8. 函数 wait3 和 wait4

这两个函数多了 (rusage) 参数，允许内核返回由终止进程及其所有子进程使用的资源概况：
```
#include <sys/types.h>
#include <sys/wait.h>
#include <sys/time.h>
#include <sys/resource.h>

pid_t wait3(int *stbubianatloc, int options, struct rusage *rusage);
pid_t wait4(pid_t pid, int *statloc, int options, struct rusage *rusage);
```
资源统计信息包括 用户CPU时间总量 、系统CPU时间总量 、缺页次数 、接收到信号的次数 等。

9. 竞争条件

当多个进程都企图对共享数据进行某种处理，而最后的结果又取决于运行的顺序时，认为发生了 竞争条件 。

如果一个进程要 等待其父进程终止 ，则可使用下列形式的循环：
```
while (getppid() != 1)
    sleep(1);
```
这种形式的循环称为 轮询 (polling) ，它的问题是浪费了 CPU 时间，因为调用者每隔 1s 都被唤醒，然后进行条件测试。

为 避免竞争条件和轮询 ，在多个进程之间需要有某种形式的信号发送和接收的方法。可使用 信号机制 或多种形式的 进程间通信 (IPC) 。

10. 函数 exec

当进程调用一种 exec 函数时，该进程执行的程序完全替换为新程序，而新程序则从其 main 函数开始执行。因为调用 exec 并不创建新进程，所以前后的进程 ID 并未改变。exec 只是用磁盘上的一个新程序替换了当前进程的正文段、数据段、堆段和栈段。

有七种不同的 exec 函数可供使用，用于初始执行新的程序：
```
#include <unistd.h>
int execl(const char *pathname, const char *arg0, ... /* (char *)0 */);
int execv(const char *pathname， char *const argv[]);
int execle(const char *pathname, const char *arg0, ... /* (char *)0, char *const envp[] */);
int execve(const char *pathname, char *const argv[], char *const envp[]);
int execlp(const char *filename, const char *arg0, ... /* (char *)0 */);
int execvp(const char *filename, char *const argv[]);
int fexecve(int fd, char *const argv[], char *const envp[]);
```
bubian
返回值：若出错，返回 (-1) ；若成功，不返回。

7个函数的区别 ：
1. 前四个函数以路径名作为参数，之后两个以文件名作为参数（函数名中带 p ），最后一个函数以文件描述符为参数。当指定 (filename) 作为参数时，如果 (filename) 中含有 (/) ，将其视为路径名；否则就按 PATH 环境变量，在它所指定的各目录中搜寻可执行文件。
2. 参数表传递有区别，l 表示列表 list ，v 表示矢量 vector 。若使用列表，参数表以空指针结尾。若使用矢量，要先构造一个指向各参数的指针数组。
3. 与向新进程传递 环境表 有关。以 e 结尾的 (3) 个函数（ execle 、execve 和 fexecve ）可以传递一个指向环境字符串指针数组的指针，其他 (4) 个函数则使用调用进程中的 environ 变量为新程序复制现有的环境。
对打开文件的处理 与每个描述符的 执行时关闭 (close-on-exec) 标志值有关。进程中每个打开描述符都有一个执行时关闭标志。若设置了此标志，则在执行 exec 时关闭该描述符；否则该描述符仍打开。除非特定使用 fcntl 设置了该执行时关闭标志，否则系统的默认操作是在 exec 后仍保持这种描述符打开。

在 exec 时要关闭打开目录流 ，这通常是由 opendir 函数实现的，它调用 fcntl 函数为对应于打开目录流的描述符设置执行时关闭标志。

在 exec 前后实际用户 ID 和实际组 ID 保持不变，而有效 ID 是否改变取决于所执行程序文件的设置用户 ID 位和设置组 ID 位是否设置 。如果新程序的设置用户 ID 位已设置，则有效用户 ID 变成程序文件所有者的 ID；否则有效用户 ID 不变。对组 ID 的处理方式与此相同。

只有 execve 是 系统调用 ，别的函数都是库函数，调用此系统调用，示意图为：

11. 更改用户 ID 和更改组 ID

特权（如能改变当前日期的表示法）和 访问控制 （如能否读、写一个特定文件），是基于 用户 ID 和 组 ID 的。在设计应用时，一般使用 最小特权模型 。

可使用 setuid 函数设置 实际用户 ID 和 有效用户 ID ：
```
#include <unistd.h>
int setuid(uid_t uid);
int setgid(gid_t gid);
```
返回值：若成功，返回 (0) ；若出错，返回 (-1) 。

更改用户ID 的规则：
- 若进程具有超级用户特权，则 setuid 函数将 实际用户 ID 、有效用户 ID 以及 保存的设置用户 ID 设置为 (uid) 。
- 若进程没有超级用户权限，但是 (uid) 等于实际用户 ID 或保存的设置用户 ID，则 setuid 只将 有效用户 ID 设置为 (uid) 。
- 若两个条件都不满足，则 errno 设置为 EPERM ，并返回 (-1) 。
关于内核所维护的 (3) 个用户ID，还要注意：
- 只有超级用户可以更改实际用户ID 。
- 仅当对程序文件设置了用户ID位时，exec 函数才设置有效用户 ID 。
- 保存的设置用户 ID 是由 exec 复制有效用户 ID 而得到的。如果设置了文件的设置用户ID位，则在exec根据文件的用户ID设置了进程的有效用户ID之后，这个副本就被保存起来了。
getuid 和 geteuid 函数获得实际用户ID和有效用户ID的当前值。getresuid 和 getresgid 函数分别用于获取保存的设置用户ID和保存的设置组ID。

函数 setreuid 和 setregid ：

用于设置实际用户ID为 (ruid) ，设置有效用户ID为 (euid)
```
#include <unistd.h>
int setreuid(uid_t ruid, uid_t euid);
int setregid(gid_t rgid, gid_t egid);
```
若其中任一参数的值为 (-1) ，则表示相应的ID应当保持不变。

函数 seteuid 和 setegid 只更改有效用户ID和有效组ID。

下图总结了更改 3 个不同用户ID的各个函数：

组 ID 相关函数用法同用户ID函数。

保存的设置用户ID的作用：在需要提升特权的时候，通过设置程序文件的设置用户ID而得到额外的权限。

12. 解释器文件

解释器文件 (interpreter file) 是文本文件，其起始行的形式是：
```
#!pathname [optional-argument]
//如: #!/bin/sh
```
(pathname) 通常是绝对路径名。内核调用 exec 函数的进程执行解释器文件第一行中 (pathname) 所指定的文件。

优点：
- 有些程序是用某种语言写的脚本，解释器文件可将这一事实隐藏起来。
- 解释器在脚本效率方面也提供了好处。
- 解释器脚本使我们可以使用除 /bin/sh 以外的其他shell来编写 shell 脚本。
13. 函数 system

system 用于执行一个命令字符串：
```
#include <stdlib.h>
int system(const char *cmdstring);
```
system 在其实现中调用了 fork 、exec 和 waitpid ，因此有 (3) 种返回值：
1. fork 失败或者 waitpid 返回除 EINTR 之外的出错，则 system 返回 (-1) ，并且设置 errno 以指示错误类型。
2. 如果 exec 失败（表示不能执行shell），则其返回值如同 shell 执行了 exit(127) 。
3. 否则所有 (3) 个函数（ fork 、exec 和 waitpid）都成功，那么 system 返回的是 shell 的终止状态，其格式已在 waitpid 中说明。
使用 system 而不是直接使用 fork 和 exec 的优点是：system 进行了所需的各种出错处理以及各种信号处理。

14. 用户标识

系统通常记录用户登录时使用的名字，getlogin 函数可以获取此登录名：
```
#include <unistd.h>
char *getlogin(void);
```
返回值：若成功，返回指向登录名字字符串的指针；若出错，返回 NULL 。

如果调用此函数的进程（ 守护进程 ）没有连接到用户登录时所用的终端，则函数会失败。

15. 进程调度

UNIX 系统对进程提供的只是 基于调度优先级的粗粒度的控制 ，调度策略 和 调度优先级 是由内核确定的。

进程可以通过调整 nice 值降低它对CPU的占有，从而降低运行优先级。只有 特权进程 允许提高调度权限。友好值越小，优先级越高。NZERO 是系统默认的友好值。

进程可以通过 nice 函数获取或更改它的友好值：
```
#include <unistd.h>
int nice(int incr);
```
返回值：若成功，返回新的 nice 值 NZERO ；若出错，返回 (-1) 。

(incr) 参数被增加到进程的 nice 值上。若 (incr) 太大，系统把它降到最大合法值；若太小，提高到最小合法值。如果 nice 返回 (-1) 且 errno 不为 (0) ，说明 nice 调用失败。

getpriority 函数可以用于获取一组相关进程的 nice 值：
```
#include <sys/resource.h>
int getpriority(int which, id_t who);
```
返回值：若成功，返回 -NZERO~NZERO-1 之间的 nice 值；若出错，返回 (-1) 。

(which) 参数控制 (who) 参数是如何解释的，PRIO_PROCESS 表示进程，PRIO_PGRP 表示进程组，PRIO_USER 表示用户 ID。(who) 参数选择感兴趣的一个或多个进程，如果 (who) 参数为 (0) ，表示调用进程、进程组或者用户（取决于 (which) 参数的值）；当 (which) 设为 PRIO_USER 并且 (who) 为 (0) 时，使用调用进程的实际用户ID；如果 (which) 参数作用于多个进程，则返回所有作用进程中优先级最高的（最小的 nice 值）。

setpriority 函数可用于为进程、进程组和属于特定用户 ID 的所有进程设置优先级：
```
#include <sys/resources.h>
int setpriority(int which, id_t who, int value);
```
参数 (which) 和 (who) 与 getpriority 函数中相同。(value) 增加到 NZERO 上，然后变为新的友好值。

子进程从父进程中继承友好值 。

16. 进程时间

可度量的时间包括 (3) 种：墙上时钟时间 、用户 CPU 时间 和 系统 CPU 时间 ，任一进程可以调用 times 函数获得它自己以及终止子进程的上述值：
```
#include <sys/time.h>
clock_t times(struct tms *buf);
```
返回值：若成功，返回流逝的 墙上时钟时间（以时钟滴答数为单位）；若出错，返回 (-1) 。

(tms) 结构为：
```
struct tms {
    clock_t tms_utime;	//user CPU time
    clock_t tms_stime;	//system CPU time
    clock_t tms_cutime;	//user CPU time, terminated children
    clock_t tms_cstime;	//system CPU time, terminated children
};
```
times 函数返回墙上时钟时间作为其函数值，此值是相对于过去某一时刻度量的，所以需要使用相对值，所有此函数返回的 clock_t 值都用 _SC_CLK_TCK 转换成秒数。
相关阅读:
Cobar-Client 实现策略总结
 xsltproc docbook 转 html
一个使用高并发高线程数 Server 使用异步数据库客户端造成的超时问题
 Hessian 初探
 关于 tomcat nio connector, servlet 3.0 async, spring mvc async 的关系
 Two-Phase Commit (两阶段提交)
HashedWheelTimer 原理
 Photoshop 使用曲线
 Photoshop 使用可选颜色
 MySQL Batch 与 Transaction
原文地址：https://www.cnblogs.com/brianleelxt/p/13209267.html

《UNIX环境高级编程》(APUE) 笔记第八章

8 - 进程控制

1. 进程标识

2. 函数 fork

3. 文件共享

4. 函数 vfork

5. 函数 exit

6. 函数 wait 和 waitpid

7. 函数 waitid

8. 函数 wait3 和 wait4

9. 竞争条件

10. 函数 exec

11. 更改用户 ID 和 更改组 ID

12. 解释器文件

13. 函数 system

14. 用户标识

15. 进程调度

16. 进程时间

11. 更改用户 ID 和更改组 ID