信号量和信号是两码事,大家不要搞混了噢。
以红绿灯为例,我们为什么认识红绿灯的含义,知道什么灯亮该作什么行为,是原地等待呢?还是快速通过呢?我们认识是因为在以前有人告诉了我们,就像偏远小山村的孩子,可能没见过红绿灯,就不会知道红绿灯的含义代表着什么。
信号的到来,我们并不清楚具体是什么时候,信号相对于我们当前的工作,是异步产生的。比如你在打游戏,点了个外卖,你并不知道外卖什么时候会送达。
所以其实信号没有产生的时候,我们已经知道了,对于不同的信号我们该怎么处理。信号产生了,我们不一定是要立即处理它,比如绿灯,可能突然有人打电话,我们可以先接电话,再通过马路,再比如打游戏,你正在玩着游戏,暂时无法拿外卖,会让外卖小哥把外卖先放到某个地方,等自己处理完当前的事情(打完游戏)再去取外卖。所以信号产生了,我们不需要立即处理它,只需要在合适的时机再处理就可以了。而对于产生的信号,因为无法立即处理。所以我们要进行暂时的保存。
上面说的异步是什么呢?举个例子,小明在上课,老师让小明去外面拿个东西,小明去了,老师并没有停止讲课,这就是异步。而如果老师说,等小明回来我们再继续讲课,这就是同步。
对于信号,我们之前其实已经见过一些了,我们可以通过kill -l 指令来查看系统中的信号。

那么信号在计算机中到底是什么呢?信号就是一种向目标进程发送通知消息的一种机制。
不知道大家对于前台进程和后台进程还与没有印象。

对于前台进程,我们可以通过ctrl + c来终止,但是后台进程却不行:
我们可以发现无法终止,甚至还可以执行其他的前台进程,那么要如何终止呢?

就需要给进程发送一个终止信号来使该进程终止。
对于后台进程可以通过 jobs 指令来查看。而通过 fg + 任务编号的方式指令可以将后台进程变成前台进程。数字就是

数任务编号就是前面这个1,后面的20146是该进程的pid。注意:前台进程只能有一个(一般都是bash,后台进程可以有多个。OS系统会自动把shell变为前台进程或后台进程。


此时这个进程就变成了前台进程, 通过查看后台已经没有了。我们可以通过ctrl + z 的方式来使这个进程从前台进程再变回后台进程。前台进程无法暂停,如果被暂停就会被放到后台。
虽然又变回了后台进程,但此时它还是暂停的状态,并不是执行状态,可以通过bg + 任务编号的方式进行。
此时就会发现它从暂停状态变成了运行状态。
OS是怎么知道键盘有数据输入了呢?

每一个硬件设备都会与一个叫8259的设备相连,当键盘被按时,就会向8259发送信号,8259再通知CPU,从而使CPU发生中断,去读取键盘的数据。
键盘的这种通信方式,就与我们的信号十分相似。信号的本质就是使用软件,来模拟中断机制。只不过键盘是硬件层面,信号是软件层面。
信号可以通过 ctrl + c 来产生2号信号。

我们现在只了解普通信号,实际信号暂不做了解,它实际上是要求被立即执行。

每一个信号都是一个个的宏,进程收到信号时,是如何判断该接下来该怎么操作呢?其实在进程中是维护了一张自己的函数指针数组,数组的下标就是和信号的编号有关,当进程收到信号时,会跟着这个表的下标,找到对应的函数,从而使进程执行对应的行为。
而一个进程可能不可能同时收到多个信号呢?是有可能的,所以对于信号,我们也要管理起来,先描述再组织。其实它是在进程中存放了一个变量,通过位图思想将所有的信号管理起来(只对于普通信号。后续我们讲的都是针对与普通信号)。
OS向进程发信号实际上,也就是修改进程的位图中相应信号所对应的比特位,由0改为1。无论信号的产生的方式有多少种,永远都只能由OS向目标进程发送。
每个进程对于信号有两个部分:
对于signal系统调用,我们传入的handle的作用实际上就是,将进程维护的关于相应信号的函数指针数组中的默认内容覆盖掉了,换成了我们所写的函数,参数signal就是对应的记号信号,我们来通过代码来查看。


那我们如何查看原函数指针数组中的默认的内容呢?可以通过man 7 signal 指令来查看。

但是其中却有几个例外,其中就有9号信号,它是不可被自定义捕捉的,意思就是我们无法用我们自己自定义的函数,覆盖掉进程PCB中维护的函数指针数组中下标为9的内容。防止出现杀不死进程的现象。
给任意进程发送任意信号。

给自己发送信号。

给自己发送abort信号,也就是6号信号。

我们先来看一个异常片段:


再来看看CPU是如何发现异常的:

当出错时,就会通知OS,OS就会将溢出标志位,解释成kill(targetprocess,signal),向目标进程发送信号,从而终止进程。
溢出错误对应的是8号信号,可以通过man 7 kill来查看。
如何验证呢?我们可以将8号信号换成我们自己写的,来看结果:


我们发现确实是换成了我们自定义的函数了。但是我们并没有写循环,为什么它会一直打印我们自定义函数中的内容呢?这是因为我们自己写的自定义函数中并没有写退出函数,同时,CPU中的status寄存器中的溢出标记位也一直是1,并没有置0,所有会一直读取。
为什么不会置0呢?因为寄存器 != 寄存器的内容,寄存器是属于CPU的,但是寄存器中的内容是属于进程的,只有当进程被杀死,寄存器中的内容才会失效,也就是status寄存器中的数据才会被置0。但是上面我们并没有退出进程,寄存器中的内容依旧存在,status寄存器中的溢出标志位依旧为1,本来有错误是直接终止进程了,但是现在换成了我们的自定义函数, 不会终止了,进程不退出CPU就会继续调度,一调度就发现CPU中有错误,一发现有错误就发信号,然后又调度,又发现有错误,又发信号…………
比如我们之前说过的管道,当我们将读端关闭时,写端继续写是没有意义的,所以当OS检测到管道的引用计数为1时,就会将写端发送SIGPIPE信号,将写端强行关闭,这就是软件条件产生的信号。
alarm:
我们来认识一个函数——闹钟。它的作用是几秒之后暂停进程,我们可以通过它可以观察到一些现象:

我们可以看到一秒可以打印8万多次。

如果只打印一次cnt却是1亿多次,多次打印只能打印8万次,说明访问外设的效率是非常慢的。

首先解释什么是Core Dump。当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部 保存到磁盘上,文件名通常是core,这叫做Core Dump。进程异常终止通常是因为有Bug,比如非法内存访问导致段错误,事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug(事后调试)。一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存 在PCB中)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。

我们发现中断有两种,Term就是正常的中断,Core是属于一种严重的中断,并且中断原因可能不清楚,需要用户多加注意。

简单来说,对于Core,当程序出错时,会生成一个Core file 文件,来保存出异常的上下文数据和一些异常信息。可以通过ulimit -a来查看:

这里是0的意思是,可以存放core file文件的可用内存大小为0,也就是说现在系统种并不允许存在core file 文件,可以通过 ulimit -c + 大小来修改:

我们来运行一个代码看是不是我说的那样会生成一个core文件:


发现确实是会出现。程序员可以通过core文件更好的修改错误。

从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。下一节将详细介绍信号集的各种操作。 阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。
#include
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);
这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。
调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。
#include
int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
返回值:若成功则为0,若出错则为-1
如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号 屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。
| SIG_BLOCK | set包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask l set |
|---|---|
| SIG_UNBLOCK | set包含了我们希望从当前信号屏蔽字种解除阻塞信号,相当于mask=mask & ~set |
| SIG_SETMASK | 设置当前信号屏蔽字为set所指向的值,相当于mask = set |
如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。
eg:


我们发现就无法通过ctrl + c 终止进程了,这就是因为2号信号被阻塞了。那么是不是所有信号都可以被阻塞呢?并不是的,其中的9号和19号信号是无法被阻塞的,有兴趣的小伙伴可以自行验证。
#include
sigpending
读取当前进程的未决信号集,通过set参数传出。调用成功则返回0,出错则返回-1。
下面用刚学的几个函数做个实验。程序如下:


我们先将2号信号阻塞,所以当我们发送2号信号时,会被阻塞,那么它就处于未决状态,那么就会被存放到pending位图中,所以当我们发送2号信号时,就可以在pinding中看到2号信号。
而当我们解除信号的屏蔽,那么2号信号就会从pending中消失。


信号在合适的时候被处理 ------ 什么时候?
进程从内核态返回到用户态的时候,进行信号的检测和信号的处理。
用户态是一种受控的状态,访问的资源是有限的。
内核态是一种OS的工作状态,能够访问大量的系统资源。(系统调用背后,就包含了身份的变化)
十个进程就会有十个PCB,就会有十个页表,但是内核级页表,在OS中只需要一份就足够了,因为大家都一样,使用同一个就可以了。
无论进程如何调度,CPU都可以直接找到OS。我们的进程的所以代码的执行,都可以在自己的地址空间内通过跳转的方式,进行调用和返回。
那么CPU是如何知道是用户态还是内核态呢?在CPU中是有一个寄存器叫CS,它里面有2个比特位,其中用1(01)代表内核态,用3表示用户态(11),只需要检测CS寄存器就可以知道是什么态了。同时在寄存器中还要CR1、CR3寄存器,CR3是用来存储用户级页表的,那么CR1是用来存储什么的呢?
当CPU调度进程时,发现在页表中有一个虚拟地址对应的物理地址还未开辟,那么就会发生缺页中断,为该虚拟地址开辟一块对应的物理地址,再开辟完成后,要如何再次找到该虚拟地址呢?那就是CR1,CR1就是用来保存这个的。
如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下: 用户程序注册了SIGQUIT信号的处理函sighandler。 当前正在执行main函数,这时发生中断或异常切换到内核态。 在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函 数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是 两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。
#include
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);

当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字(block表),当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项,本章的代码都把sa_flags设为0,sa_sigaction是实时信号的处理函数,本章不详细解释这两个字段,有兴趣的同学可以在了解一下。


然后我们再使用mask添加其他的屏蔽信号来测试:



volatile 作用:保持内存的可见性(CPU),告知编译器,被该关键字修饰的变量,不允许被优化,对该变量的任何操作,都必须在真实的内存中进行操作。
进程一章讲过用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。
其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作类似于忽略,父进程可以自定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。
请编写一个程序完成以下功能:父进程fork出子进程,子进程调用exit(2)终止,父进程自定义SIGCHLD信号的处理函数,在其中调用wait获得子进程的退出状态并打印。
事实上,由于UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证在其它UNIX系统上都可用。
本章主要讲解了有关信号的一系列知识,其中使用了许多系统调用,比较难以记忆,希望大家可以多加练习来尝试理解,共勉!!!
如果大家发现有什么错误的地方,可以私信或者评论区指出喔。我会继续深入学习Linux,希望能与大家共同进步,那么本期就到此结束,让我们下期再见!!觉得不错可以点个赞以示鼓励!!