第6章 信号和信号处理
摘要
本章讲述了信号和信号处理;介绍了信号和中断的统一处理,有助于从正确的角度看待信号;将信号视为进程中断,将进程从正常执行转移到信号处理;解释了信号的来源,包括来自硬件、异常和其他进程的信号;然后举例说明了信号在Unix/Linux中的常见用法;详细解释了Unix/Linux中的信号处理,包括信号类型、信号向量位、信号掩码位、进程PROC结构体中的信号处理程序以及信号处理步骤;用示例展示了如何安装信号捕捉器来处理程序异常,如用户模式下的段错误;还讨论了将信号用作进程间通信(IPC)机制的适用性。读者可借助该编程项目,使用信号和管道来实现用于进程交换信息的进程间通信机制。
6.1信号和中断
“中断”是从1/0设备或协处理器发送到CPU的外部请求,它将CPU从正常执行转移到中断处理。与发送给CPU的中断请求一样,“信号”是发送给进程的请求,将进程从正常执行转移到中断处理。
(1)首先,我们将进程的概念概括为:一个“进程”(引号中)就是一系列活动。广义的 “进程”包括
・从事日常事务的人。
・在用户模式或内核模式下运行的Unix/Linux进程。
・执行机器指令的CPU。
(2)“中断”是发送给“进程”的事件,它将“进程”从正常活动转移到其他活动,称 为“中断处理”。“进程”可在完成“中断”处理后恢复正常活动。
(3)“中断” 一词可应用于任何“进程”,并不仅限于计算机中的CPU。例如,我们可能会提到以下几种“中断”。
(3)当我在办公室读书、评分、做白日梦时,可能会发生一些真实事件,比如:
真实事件 | ID | 动作函数 |
---|---|---|
大楼着火了 | 1 | 马上离开 |
电话响了 | 2 | 拿起电话和打电话的人聊天 |
有人敲门 | 3 | 回答请进(或假装不在) |
切到自己的手指 | 4 | 贴创口贴 |
所有这些事件都叫作人员中断。因为他们把人从正常活动转向“应对或处理中断”。处理完中断后,此人可以继续此前的活动(如果这个人还活着而且仍然记得自己之前的活动)。
每个中断都分配有一个唯一的ID识别号,并有一个预先安装的动作函数,人可在收到中断请求时“执行”动作函数。根据来源,中断可分为三类:
- 来自硬件的中断:大楼着火,闹钟响了等。
- 来自其他人的中断:电话响了,有人敲门等。
- 自己造成的中断:切到手指,吃得太多等。
按照紧急程度,中断可分为以下几类:
- 不可屏蔽(NMI):大楼着火!
- 可屏蔽:有人敲门等。
人员的每个动作函数都是通过本能或经验实现的。由于人员中断的种类太多,所以不能在上表中全部列出,但是思路应该清晰。
(3).2进程中断。
这类中断是发送给进程的中断。当某进程正在执行时,可能会收到来自3个不同来源的中断:
- 来自硬件的中断:终端、间隔定时器的“Ctrl+C”组合键等。
- 来自其他进程的中断:kill(pid, SIG#)、death_of_child 等。
- 自己造成的中断:除以0、无效地址等。
每个进程中断都被转换为一个唯一ID号,发送给进程。与多种类的人员中断不同,我们始终可限制在一个进程中的中断的数量。Unix/Linux中的进程中断称为信号,编号为1到31。进程的PROC结构体中有对应每个信号的动作函数,进程可在收到信号后执行该动作函数。与人员类似,进程也可屏蔽某些类型的信号,以推迟处理。必要时,进程还可能会修改信号动作函数。
(3) .4进程的陷阱错误。
进程可能会自己造成中断。这些中断是由被CPU识别为异常的错误引起的,例如除以0、无效地址、非法指令、越权等。当进程遇到异常时,它会陷入操作系统内核,将陷阱原因转换为信号编号,并将信号发送给自己。如果在用户模式下发生异常,则进程的默认操作是终止,并使用一个可选的内存转储进行调试。我们会在后面学习到,进程可以用信号捕捉 器代替默认动作函数,允许它在用户模式下处理信号。如果在内核模式下发生陷阱,原因一定是硬件错误,或者很可能是内核代码中的漏洞,在这种情况下,内核无法处理。在Unix/Linux中,内核只打印一条PANIC错误消息,然后就停止了。希望在下一个内核版本中可以跟踪并修复这个问题。
6.2 Unix/Linux信号示例
(1)按"Ctrl+C”组合键通常会导致当前运行的进程终止。原因如下。“Ctrl+C”组合键会生成一个键盘硬件中断。键盘中断处理程序将"Ctrl+C”组合键转换为SIGINT (2)信号,发送给终端上的所有进程,并唤醒等待键盘输入的进程。在内核模式下,每个进程都要检查和处理未完成的信号。进程对大多数信号的默认操作是调用内核的kexit(exitValue)函数来终止。在Linux中,exitValue的低位字节是导致进程终止的信号编号。
(2)用户可使用nohup a.out &命令在后台运行一个程序。即使在用户退出后,进程仍将继续运行。nohup命令会使sh像往常一样复刻子进程来执行程序,但是子进程会忽略S1GHUP(1)信号。当用户退出时,sh会向与终端有关的所有进程发送一个S1GHUP信号。后台进程在接收到这一信号后,会忽略它并继续运行。为防止后台进程使用终端进行I/O, 后台进程通常会断开与终端的连接(通过将其文件描述符0、1、2重定向到/dev/null),使 其完全不受任何面向终端信号的影响。
(3)也许几天后,用户再次登录时会发现(通过ps-u LTD)后台进程仍在运行。用户可以使用sh命令
kill pid (or kill -s 9 pid)
杀死该进程。方法如下。执行杀死的进程向pid标识的目标进程发送一个SIGTERM(15)信号,请求它死亡。目标进程将会遵从请求并终止。如果进程选择忽略SIGTERM信号,它可能拒绝死亡。在这种情况下,我们可以使用kill -s 9 pid
,肯定能杀死它。因为进程不能修改对9号信号的动作。读者可能会问,为什么是9号信号呢?在最初的Unix中,只有9个信号。9号信号被保留为终止进程的终极手段。虽然后来的Unix/Linux系统将信号编号扩展到了31,但是信号编号9的含义仍然保留了下来。
6.3 Unix/Linux中的信号处理
6.3.1 信号类型
Unix/Linux支持31种不同的信号,每种信号在signal.h文件中都有定义。
#define SIGHUP 1
#define SIGINT 2
#define SIGQUIT 3
#define SIGILL 4
#define SIGTRAP 5
#define SIGABRT 6
#define SIGIOT 6
#define SIGBUS 7
#define SIGFPE 8
#define SIGKILL 9
#define SIGUSR1 10
#define SIGSEGV 11
#define SIGUSR2 12
#define SIGPIPE 13
#define SIGALRM 14
#define SIGTERM 15
#define SIGSTKFLT 16
#define SIGCHLD 17
#define SIGCONT 18
#define SIGSTOP 19
#define SIGTSTP 20
#define STGTTTN 21
#define SIGTTOU 22
#define SIGURG 23
#define SIGXCPU 24
#define SIGXFSZ 25
#define SIGVTALRM 26
#define SIGPROF 27
#define SIGWINCH 28
#define SIGPOLL 29
#define SIGPWR 30
#define SIGSYS 31
每种信号都有一个符号名,如 SIGHUP ( 1 )、SIGEMT ( 2 )、SIGKILL ( 9 )、S1GSEGV (11)等。
6.3.2 信号的来源
- 来自硬件中断的信号:在进程执行过程中,一些硬件中断被转换为信号发送给进程。 硬件信号示例是
- 中断键(Ctrl+C),它产生一个SIGINT ( 2 )信号。
- 间隔定时器,当它的时间到期时,会生成一个SIGALRM ( 14 ) .SIGVTALRM ( 26 ) 或 SIGPROF ( 27 )信号。
- 其他硬件错误,如总线错误、IO陷阱等。
- 来自异常的信号:当用户模式下的进程遇到异常时,会陷入内核模式,生成一个信 号,并发送给自己。常见的陷阱信号有SIGFPE ( 8 ),表示浮点异常(除以0),最常 见也是最可怕的是SIGSEGV (11),表示段错误,等等。
- 来自其他进程的信号:进程可使用kill(pid, sig)系统调用向pid标识的目标进程发送 信号。读者可以尝试以下实验。在Linux下,运行简单的C程序
main()( while(1); }
使进程无限循环。从另一个(X-window)终端,使用ps-u查找循环进程pid。然后 输入sh命令
kill -s 11 pid
循环进程会因为段错误而死亡。读者可能会问:这怎么可能呢?所有进程都在一个 While(l)循环中执行,它是如何产生段错误的呢?答案是:这并不重要。当某进程被某个信号终止时,它的exitValue就包含这个信号编号。父进程sh只是将死亡子进程的信号编号转换为一个错误字符串,不管它是什么。
6.3.3 进程PROC结构体中的信号
每个进程PROC都有一个32位向量,用来记录发送给进程的信号。在位向量中,每一 位(0位除外)代表一个信号编号。此外,它还有一个信号MASK位向量,用来屏蔽相应的 信号。可使用一系列系统调用,如sigmasks sigsetmask, siggetmask. sigblock等设置、清
除和检查MASK位向量。待处理信号只在未被屏蔽的情况下才有效。这样可以让进程延迟 处理被屏蔽的信号,类似于CPU屏蔽某些中断。
6.3.4 信号处理函数
每个进程PROC都有一个信号处理数组int sig[32]o sig[32]数组的每个条目都指定了如何处理相应的信号,其中0表示DEFault (默认),1表示IGNore (忽略),其他非零值表示 用户模式下预先安装的信号捕捉(处理)函数。图6.1给岀了信号位向量、屏蔽位向量和信号处理函数。