Linux：信号

前言

信号量和信号是两码事，大家不要搞混了噢。

1. 信号的概念

以红绿灯为例，我们为什么认识红绿灯的含义，知道什么灯亮该作什么行为，是原地等待呢？还是快速通过呢？我们认识是因为在以前有人告诉了我们，就像偏远小山村的孩子，可能没见过红绿灯，就不会知道红绿灯的含义代表着什么。
信号的到来，我们并不清楚具体是什么时候，信号相对于我们当前的工作，是异步产生的。比如你在打游戏，点了个外卖，你并不知道外卖什么时候会送达。
所以其实信号没有产生的时候，我们已经知道了，对于不同的信号我们该怎么处理。信号产生了，我们不一定是要立即处理它，比如绿灯，可能突然有人打电话，我们可以先接电话，再通过马路，再比如打游戏，你正在玩着游戏，暂时无法拿外卖，会让外卖小哥把外卖先放到某个地方，等自己处理完当前的事情（打完游戏）再去取外卖。所以信号产生了，我们不需要立即处理它，只需要在合适的时机再处理就可以了。而对于产生的信号，因为无法立即处理。所以我们要进行暂时的保存。
上面说的异步是什么呢？举个例子，小明在上课，老师让小明去外面拿个东西，小明去了，老师并没有停止讲课，这就是异步。而如果老师说，等小明回来我们再继续讲课，这就是同步。
对于信号，我们之前其实已经见过一些了，我们可以通过kill -l 指令来查看系统中的信号。
在这里插入图片描述
那么信号在计算机中到底是什么呢？信号就是一种向目标进程发送通知消息的一种机制。

2. 信号的产生

不知道大家对于前台进程和后台进程还与没有印象。
在这里插入图片描述
对于前台进程，我们可以通过ctrl + c来终止，但是后台进程却不行：
我们可以发现无法终止，甚至还可以执行其他的前台进程，那么要如何终止呢？

就需要给进程发送一个终止信号来使该进程终止。
对于后台进程可以通过 jobs 指令来查看。而通过 fg + 任务编号的方式指令可以将后台进程变成前台进程。数字就是
在这里插入图片描述
数任务编号就是前面这个1，后面的20146是该进程的pid。注意：前台进程只能有一个（一般都是bash，后台进程可以有多个。OS系统会自动把shell变为前台进程或后台进程。

此时这个进程就变成了前台进程，通过查看后台已经没有了。我们可以通过ctrl + z 的方式来使这个进程从前台进程再变回后台进程。前台进程无法暂停，如果被暂停就会被放到后台。在这里插入图片描述虽然又变回了后台进程，但此时它还是暂停的状态，并不是执行状态，可以通过bg + 任务编号的方式进行。
此时就会发现它从暂停状态变成了运行状态。

OS是怎么知道键盘有数据输入了呢？
在这里插入图片描述
每一个硬件设备都会与一个叫8259的设备相连，当键盘被按时，就会向8259发送信号，8259再通知CPU，从而使CPU发生中断，去读取键盘的数据。
键盘的这种通信方式，就与我们的信号十分相似。信号的本质就是使用软件，来模拟中断机制。只不过键盘是硬件层面，信号是软件层面。

2.1 通过键盘产生信号

信号可以通过 ctrl + c 来产生2号信号。在这里插入图片描述
我们现在只了解普通信号，实际信号暂不做了解，它实际上是要求被立即执行。

每一个信号都是一个个的宏，进程收到信号时，是如何判断该接下来该怎么操作呢？其实在进程中是维护了一张自己的函数指针数组，数组的下标就是和信号的编号有关，当进程收到信号时，会跟着这个表的下标，找到对应的函数，从而使进程执行对应的行为。
而一个进程可能不可能同时收到多个信号呢？是有可能的，所以对于信号，我们也要管理起来，先描述再组织。其实它是在进程中存放了一个变量，通过位图思想将所有的信号管理起来（只对于普通信号。后续我们讲的都是针对与普通信号）。
OS向进程发信号实际上，也就是修改进程的位图中相应信号所对应的比特位，由0改为1。无论信号的产生的方式有多少种，永远都只能由OS向目标进程发送。
每个进程对于信号有两个部分：

函数指针数组。
信号位图。

对于signal系统调用，我们传入的handle的作用实际上就是，将进程维护的关于相应信号的函数指针数组中的默认内容覆盖掉了，换成了我们所写的函数，参数signal就是对应的记号信号，我们来通过代码来查看。
在这里插入图片描述

那我们如何查看原函数指针数组中的默认的内容呢？可以通过man 7 signal 指令来查看。

但是其中却有几个例外，其中就有9号信号，它是不可被自定义捕捉的，意思就是我们无法用我们自己自定义的函数，覆盖掉进程PCB中维护的函数指针数组中下标为9的内容。防止出现杀不死进程的现象。

2.2 通过系统调用产生信号

给任意进程发送任意信号。
在这里插入图片描述
给自己发送信号。

给自己发送abort信号，也就是6号信号。

2.3 异常

我们先来看一个异常片段：
在这里插入图片描述

再来看看CPU是如何发现异常的：

当出错时，就会通知OS，OS就会将溢出标志位，解释成kill(targetprocess，signal），向目标进程发送信号，从而终止进程。
溢出错误对应的是8号信号，可以通过man 7 kill来查看。
如何验证呢？我们可以将8号信号换成我们自己写的，来看结果：
在这里插入图片描述

我们发现确实是换成了我们自定义的函数了。但是我们并没有写循环，为什么它会一直打印我们自定义函数中的内容呢？这是因为我们自己写的自定义函数中并没有写退出函数，同时，CPU中的status寄存器中的溢出标记位也一直是1，并没有置0，所有会一直读取。
为什么不会置0呢？因为寄存器！= 寄存器的内容，寄存器是属于CPU的，但是寄存器中的内容是属于进程的，只有当进程被杀死，寄存器中的内容才会失效，也就是status寄存器中的数据才会被置0。但是上面我们并没有退出进程，寄存器中的内容依旧存在，status寄存器中的溢出标志位依旧为1，本来有错误是直接终止进程了，但是现在换成了我们的自定义函数，不会终止了，进程不退出CPU就会继续调度，一调度就发现CPU中有错误，一发现有错误就发信号，然后又调度，又发现有错误，又发信号…………

2.4 软件条件产生信号

比如我们之前说过的管道，当我们将读端关闭时，写端继续写是没有意义的，所以当OS检测到管道的引用计数为1时，就会将写端发送SIGPIPE信号，将写端强行关闭，这就是软件条件产生的信号。
alarm：
我们来认识一个函数——闹钟。它的作用是几秒之后暂停进程，我们可以通过它可以观察到一些现象：
在这里插入图片描述
我们可以看到一秒可以打印8万多次。

如果只打印一次cnt却是1亿多次，多次打印只能打印8万次，说明访问外设的效率是非常慢的。

所有用户的行为，都是以进程的形式在OS中表现的。
操作系统只要把进程调度好，就能完成所有的用户任务。（那么就要一个问题了，OS也是代码，进程都是OS来管理的，那么OS是谁来让它执行的呢？）
CMOS，可以以周期性的，高频率的，向CPU发送时钟中断。
操作系统的本质实际上就是一个死循环，我们上面说过，内核中是会维护一个函数指针数组，它也叫中断向量表，里面存放了各个信号所对应的方法，而CMOS是一个硬件，它会持续的以周期性的，高频率的，向CPU发送时钟中断，这个时钟中断在向量表中所对应的方法，就是不断让CPU执行OS的死循环。
所以OS实际上就是由硬件来不断刺激CPU来运行的。

2.5 Core Dump

首先解释什么是Core Dump。当一个进程要异常终止时，可以选择把进程的用户空间内存数据全部保存到磁盘上，文件名通常是core，这叫做Core Dump。进程异常终止通常是因为有Bug，比如非法内存访问导致段错误，事后可以用调试器检查core文件以查清错误原因，这叫做Post-mortem Debug（事后调试）。一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存在PCB中)。默认是不允许产生core文件的，因为core文件中可能包含用户密码等敏感信息，不安全。在开发调试阶段可以用ulimit命令改变这个限制，允许产生core文件。
在这里插入图片描述
我们发现中断有两种，Term就是正常的中断，Core是属于一种严重的中断，并且中断原因可能不清楚，需要用户多加注意。

简单来说，对于Core，当程序出错时，会生成一个Core file 文件，来保存出异常的上下文数据和一些异常信息。可以通过ulimit -a来查看：
在这里插入图片描述
这里是0的意思是，可以存放core file文件的可用内存大小为0，也就是说现在系统种并不允许存在core file 文件，可以通过 ulimit -c + 大小来修改：

我们来运行一个代码看是不是我说的那样会生成一个core文件：
在这里插入图片描述

发现确实是会出现。程序员可以通过core文件更好的修改错误。

2.6 小结

上面所说的所有信号产生，最终都要有OS来进行执行，为什么？OS是进的管理者
信号的处理是否是立即处理的？在合适的时候。
信号如果不是被立即处理，那么信号是否需要暂时被进程记录下来？记录在哪里最合适呢？
一个进程在没有收到信号的时候，能否能知道，自己应该对合法信号作何处理呢？
如何理解OS向进程发送信号？能否描述一下完整的发送处理过程？

3. 信号的保存

3.1 阻塞信号

3.1.1 信号其他相关常见概念

实际执行信号的处理动作称为信号递达(Delivery)
信号从产生到递达之间的状态，称为信号未决(Pending)。
进程可以选择阻塞 (Block ) 某个信号。
被阻塞的信号产生时将保持在未决状态，直到进程解除对此信号的阻塞，才执行递达的动作。
注意，阻塞和忽略是不同的，只要信号被阻塞就不会递达，而忽略是在递达之后可选的一种处理动作。

3.1.2 在内核中的表示

在这里插入图片描述

每个信号都有两个标志位分别表示阻塞(block)和未决(pending)，还有一个函数指针表示处理动作。信号产生时，内核在进程控制块中设置该信号的未决标志，直到信号递达才清除该标志。在上图的例子中，SIGHUP信号未阻塞也未产生过，当它递达时执行默认处理动作。
SIGINT信号产生过，但正在被阻塞，所以暂时不能递达。虽然它的处理动作是忽略，但在没有解除阻塞之前不能忽略这个信号，因为进程仍有机会改变处理动作之后再解除阻塞。
SIGQUIT信号未产生过，一旦产生SIGQUIT信号将被阻塞，它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次，将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次，而实时信号在递达之前产生多次可以依次放在一个队列里。本章不讨论实时信号。

3.1.3 sigset_t

从上图来看，每个信号只有一个bit的未决标志，非0即1，不记录该信号产生了多少次，阻塞标志也是这样表示的。因此，未决和阻塞标志可以用相同的数据类型sigset_t来存储，sigset_t称为信号集，这个类型可以表示每个信号的“有效”或“无效”状态，在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞，而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。下一节将详细介绍信号集的各种操作。阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask)，这里的“屏蔽”应该理解为阻塞而不是忽略。

3.2. 信号集操作函数

sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态，至于这个类型内部如何存储这些bit则依赖于系统实现，从使用者的角度是不必关心的，使用者只能调用以下函数来操作sigset_ t变量，而不应该对它的内部数据做任何解释，比如用printf直接打印sigset_t变量是没有意义的。

#include 
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set， int signo);
int sigdelset(sigset_t *set， int signo);
int sigismember（const sigset_t *set， int signo);
1
2
3
4
5
6

函数sigemptyset初始化set所指向的信号集，使其中所有信号的对应bit清零，表示该信号集不包含任何有效信号。
函数sigfillset初始化set所指向的信号集，使其中所有信号的对应bit置位，表示该信号集的有效信号包括系统支持的所有信号。
注意，在使用sigset_ t类型的变量之前，一定要调用sigemptyset或sigfillset做初始化，使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。

这四个函数都是成功返回0，出错返回-1。sigismember是一个布尔函数，用于判断一个信号集的有效信号中是否包含某种信号，若包含则返回1，不包含则返回0，出错返回-1。

3.2.1 sigprocmask

调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。

#include 
int sigprocmask(int how， const sigset_t *set， sigset_t *oset); 
返回值:若成功则为0，若出错则为-1
1
2
3

如果oset是非空指针，则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针，则更改进程的信号屏蔽字，参数how指示如何更改。如果oset和set都是非空指针，则先将原来的信号屏蔽字备份到oset里，然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask，下表说明了how参数的可选值。

SIG_BLOCK	set包含了我们希望添加到当前信号屏蔽字的信号，相当于mask=mask l set
SIG_UNBLOCK	set包含了我们希望从当前信号屏蔽字种解除阻塞信号，相当于mask=mask & ~set
SIG_SETMASK	设置当前信号屏蔽字为set所指向的值，相当于mask = set

如果调用sigprocmask解除了对当前若干个未决信号的阻塞，则在sigprocmask返回前，至少将其中一个信号递达。

eg：
在这里插入图片描述

我们发现就无法通过ctrl + c 终止进程了，这就是因为2号信号被阻塞了。那么是不是所有信号都可以被阻塞呢？并不是的，其中的9号和19号信号是无法被阻塞的，有兴趣的小伙伴可以自行验证。

3.2.2 sigpending

#include 
sigpending
读取当前进程的未决信号集，通过set参数传出。调用成功则返回0，出错则返回-1。 
下面用刚学的几个函数做个实验。程序如下:
1
2
3
4

在这里插入图片描述

我们先将2号信号阻塞，所以当我们发送2号信号时，会被阻塞，那么它就处于未决状态，那么就会被存放到pending位图中，所以当我们发送2号信号时，就可以在pinding中看到2号信号。
而当我们解除信号的屏蔽，那么2号信号就会从pending中消失。
在这里插入图片描述

4. 信号处理

信号在合适的时候被处理 ------ 什么时候？

进程从内核态返回到用户态的时候，进行信号的检测和信号的处理。
用户态是一种受控的状态，访问的资源是有限的。
内核态是一种OS的工作状态，能够访问大量的系统资源。（系统调用背后，就包含了身份的变化）
十个进程就会有十个PCB，就会有十个页表，但是内核级页表，在OS中只需要一份就足够了，因为大家都一样，使用同一个就可以了。
无论进程如何调度，CPU都可以直接找到OS。我们的进程的所以代码的执行，都可以在自己的地址空间内通过跳转的方式，进行调用和返回。
那么CPU是如何知道是用户态还是内核态呢？在CPU中是有一个寄存器叫CS，它里面有2个比特位，其中用1（01）代表内核态，用3表示用户态（11），只需要检测CS寄存器就可以知道是什么态了。同时在寄存器中还要CR1、CR3寄存器，CR3是用来存储用户级页表的，那么CR1是用来存储什么的呢？
当CPU调度进程时，发现在页表中有一个虚拟地址对应的物理地址还未开辟，那么就会发生缺页中断，为该虚拟地址开辟一块对应的物理地址，再开辟完成后，要如何再次找到该虚拟地址呢？那就是CR1，CR1就是用来保存这个的。

4.1 信号捕捉

如果信号的处理动作是用户自定义函数，在信号递达时就调用这个函数，这称为捕捉信号。由于信号处理函数的代码是在用户空间的，处理过程比较复杂，举例如下: 用户程序注册了SIGQUIT信号的处理函sighandler。当前正在执行main函数，这时发生中断或异常切换到内核态。在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。内核决定返回用户态后不是恢复main函数的上下文继续执行，而是执行sighandler函数，sighandler和main函数使用不同的堆栈空间，它们之间不存在调用和被调用的关系，是两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。如果没有新的信号要递达，这次再返回用户态就是恢复main函数的上下文继续执行了。

4.2 sigaction

#include 
int sigaction(int signo， const struct sigaction *act， struct sigaction *oact);
1
2

在这里插入图片描述

sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0，出错则返回- 1。signo是指定信号的编号。若act指针非空，则根据act修改该信号的处理动作。若oact指针非空，则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体：
将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号，赋值为常数SIG_DFL表示执行系统默认动作，赋值为一个函数指针表示用自定义函数捕捉信号，或者说向内核注册了一个信号处理函数，该函数返回值为void，可以带一个int参数，通过参数可以得知当前信号的编号，这样就可以用同一个函数处理多种信号。显然，这也是一个回调函数，不是被main函数调用，而是被系统所调用。

当某个信号的处理函数被调用时，内核自动将当前信号加入进程的信号屏蔽字（block表），当信号处理函数返回时自动恢复原来的信号屏蔽字，这样就保证了在处理某个信号时，如果这种信号再次产生，那么它会被阻塞到当前处理结束为止。如果在调用信号处理函数时，除了当前信号被自动屏蔽之外，还希望自动屏蔽另外一些信号，则用sa_mask字段说明这些需要额外屏蔽的信号，当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项，本章的代码都把sa_flags设为0，sa_sigaction是实时信号的处理函数，本章不详细解释这两个字段，有兴趣的同学可以在了解一下。
在这里插入图片描述

然后我们再使用mask添加其他的屏蔽信号来测试：

可重入函数

main函数调用insert函数向一个链表head中插入节点node1，插入操作分为两步，刚做完第一步的时候，因为硬件中断使进程切换到内核，再次回用户态之前检查到有信号待处理，于是切换到sighandler函数，sighandler也调用insert函数向同一个链表head中插入节点node2，插入操作的两步都做完之后从sighandler返回内核态，再次回到用户态就从main函数调用的insert函数中继续往下执行，先前做第一步之后被打断，现在继续做完第二步。结果是，main函数和sighandler先后向链表中插入两个节点，而最后只有一个节点真正插入链表中了。
像下图这样，insert函数被不同的控制流程调用，有可能在第一次调用还没返回时就再次进入该函数，这称为重入，insert函数访问一个全局链表，有可能因为重入而造成错乱，像这样的函数称为不可重入函数，反之，如果一个函数只访问自己的局部变量或参数，则称为可重入(Reentrant) 函数。想一下，为什么两个不同的控制流程调用同一个函数，访问它的同一个局部变量或参数就不会造成错乱?

如果一个函数符合以下条件之一则是不可重入的：
调用了malloc或free，因为malloc也是用全局链表来管理堆的。
调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

volatile

volatile 作用：保持内存的可见性（CPU），告知编译器，被该关键字修饰的变量，不允许被优化，对该变量的任何操作，都必须在真实的内存中进行操作。

SIGCHLD信号

进程一章讲过用wait和waitpid函数清理僵尸进程，父进程可以阻塞等待子进程结束，也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式，父进程阻塞了就不能处理自己的工作了；采用第二种方式，父进程在处理自己的工作的同时还要记得时不时地轮询一下，程序实现复杂。
其实，子进程在终止时会给父进程发SIGCHLD信号，该信号的默认处理动作类似于忽略，父进程可以自定义SIGCHLD信号的处理函数，这样父进程只需专心处理自己的工作，不必关心子进程了，子进程终止时会通知父进程，父进程在信号处理函数中调用wait清理子进程即可。
请编写一个程序完成以下功能:父进程fork出子进程，子进程调用exit(2)终止，父进程自定义SIGCHLD信号的处理函数，在其中调用wait获得子进程的退出状态并打印。
事实上，由于UNIX 的历史原因，要想不产生僵尸进程还有另外一种办法：父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN，这样fork出来的子进程在终止时会自动清理掉，不会产生僵尸进程，也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略通常是没有区别的，但这是一个特例。此方法对于Linux可用，但不保证在其它UNIX系统上都可用。

总结

本章主要讲解了有关信号的一系列知识，其中使用了许多系统调用，比较难以记忆，希望大家可以多加练习来尝试理解，共勉！！！
如果大家发现有什么错误的地方，可以私信或者评论区指出喔。我会继续深入学习Linux，希望能与大家共同进步，那么本期就到此结束，让我们下期再见！！觉得不错可以点个赞以示鼓励！！

相关阅读:
【算法】深度搜索(DFS) 和广度搜索(BFS)
一个分布在多次Softmax后，会趋于相同
 Java项目：SSM在线宿舍管理系统
 cmd常用命令行
 安卓老项目改造为AndroidX
一、MongoDB安装（CentOS7）
java计算机毕业设计口红专卖网站源码+mysql数据库+系统+lw文档+部署
 宝塔面板怎么一键安装emlog?
Java如何获取泛型类型
 PS001:PS2020及GeographicImager6.2安装
原文地址：https://blog.csdn.net/qq_62321047/article/details/136769266

Linux：信号

文章目录

前言

1. 信号的概念

2. 信号的产生

2.1 通过键盘产生信号

2.2 通过系统调用产生信号

2.3 异常

2.4 软件条件产生信号

2.5 Core Dump

2.6 小结

3. 信号的保存

3.1 阻塞信号

3.1.1 信号其他相关常见概念

3.1.2 在内核中的表示

3.1.3 sigset_t

3.2. 信号集操作函数

3.2.1 sigprocmask

3.2.2 sigpending

4. 信号处理

4.1 信号捕捉

4.2 sigaction

可重入函数

volatile

SIGCHLD信号

总结