• Linux:信号


    前言

      信号量和信号是两码事,大家不要搞混了噢。

    1. 信号的概念

      以红绿灯为例,我们为什么认识红绿灯的含义,知道什么灯亮该作什么行为,是原地等待呢?还是快速通过呢?我们认识是因为在以前有人告诉了我们,就像偏远小山村的孩子,可能没见过红绿灯,就不会知道红绿灯的含义代表着什么。
      信号的到来,我们并不清楚具体是什么时候,信号相对于我们当前的工作,是异步产生的。比如你在打游戏,点了个外卖,你并不知道外卖什么时候会送达。
      所以其实信号没有产生的时候,我们已经知道了,对于不同的信号我们该怎么处理。信号产生了,我们不一定是要立即处理它,比如绿灯,可能突然有人打电话,我们可以先接电话,再通过马路,再比如打游戏,你正在玩着游戏,暂时无法拿外卖,会让外卖小哥把外卖先放到某个地方,等自己处理完当前的事情(打完游戏)再去取外卖。所以信号产生了,我们不需要立即处理它,只需要在合适的时机再处理就可以了。而对于产生的信号,因为无法立即处理。所以我们要进行暂时的保存。
      上面说的异步是什么呢?举个例子,小明在上课,老师让小明去外面拿个东西,小明去了,老师并没有停止讲课,这就是异步。而如果老师说,等小明回来我们再继续讲课,这就是同步。
      对于信号,我们之前其实已经见过一些了,我们可以通过kill -l 指令来查看系统中的信号。
    在这里插入图片描述
      那么信号在计算机中到底是什么呢?信号就是一种向目标进程发送通知消息的一种机制。

    2. 信号的产生

      不知道大家对于前台进程和后台进程还与没有印象。
    在这里插入图片描述
    在这里插入图片描述  对于前台进程,我们可以通过ctrl + c来终止,但是后台进程却不行:在这里插入图片描述
      我们可以发现无法终止,甚至还可以执行其他的前台进程,那么要如何终止呢?
    在这里插入图片描述
      就需要给进程发送一个终止信号来使该进程终止。
      对于后台进程可以通过 jobs 指令来查看。而通过 fg + 任务编号的方式指令可以将后台进程变成前台进程。数字就是
    在这里插入图片描述
      数任务编号就是前面这个1,后面的20146是该进程的pid。注意:前台进程只能有一个(一般都是bash,后台进程可以有多个。OS系统会自动把shell变为前台进程或后台进程。
    在这里插入图片描述
    在这里插入图片描述
      此时这个进程就变成了前台进程, 通过查看后台已经没有了。我们可以通过ctrl + z 的方式来使这个进程从前台进程再变回后台进程。前台进程无法暂停,如果被暂停就会被放到后台。在这里插入图片描述  虽然又变回了后台进程,但此时它还是暂停的状态,并不是执行状态,可以通过bg + 任务编号的方式进行。在这里插入图片描述
      此时就会发现它从暂停状态变成了运行状态。

      OS是怎么知道键盘有数据输入了呢?
    在这里插入图片描述
      每一个硬件设备都会与一个叫8259的设备相连,当键盘被按时,就会向8259发送信号,8259再通知CPU,从而使CPU发生中断,去读取键盘的数据。
      键盘的这种通信方式,就与我们的信号十分相似。信号的本质就是使用软件,来模拟中断机制。只不过键盘是硬件层面,信号是软件层面。

    2.1 通过键盘产生信号

      信号可以通过 ctrl + c 来产生2号信号。在这里插入图片描述在这里插入图片描述
      我们现在只了解普通信号,实际信号暂不做了解,它实际上是要求被立即执行。
    在这里插入图片描述
      每一个信号都是一个个的宏,进程收到信号时,是如何判断该接下来该怎么操作呢?其实在进程中是维护了一张自己的函数指针数组,数组的下标就是和信号的编号有关,当进程收到信号时,会跟着这个表的下标,找到对应的函数,从而使进程执行对应的行为。
       而一个进程可能不可能同时收到多个信号呢?是有可能的,所以对于信号,我们也要管理起来,先描述再组织。其实它是在进程中存放了一个变量,通过位图思想将所有的信号管理起来(只对于普通信号。后续我们讲的都是针对与普通信号)。
      OS向进程发信号实际上,也就是修改进程的位图中相应信号所对应的比特位,由0改为1。无论信号的产生的方式有多少种,永远都只能由OS向目标进程发送。
      每个进程对于信号有两个部分:

    1. 函数指针数组。
    2. 信号位图。

      对于signal系统调用,我们传入的handle的作用实际上就是,将进程维护的关于相应信号的函数指针数组中的默认内容覆盖掉了,换成了我们所写的函数,参数signal就是对应的记号信号,我们来通过代码来查看。
    在这里插入图片描述
    在这里插入图片描述
      那我们如何查看原函数指针数组中的默认的内容呢?可以通过man 7 signal 指令来查看。
    在这里插入图片描述
      但是其中却有几个例外,其中就有9号信号,它是不可被自定义捕捉的,意思就是我们无法用我们自己自定义的函数,覆盖掉进程PCB中维护的函数指针数组中下标为9的内容。防止出现杀不死进程的现象。

    2.2 通过系统调用产生信号

      给任意进程发送任意信号。
    在这里插入图片描述
      给自己发送信号。
    在这里插入图片描述
      给自己发送abort信号,也就是6号信号。
    在这里插入图片描述

    2.3 异常

      我们先来看一个异常片段:
    在这里插入图片描述
    在这里插入图片描述
      再来看看CPU是如何发现异常的:
    在这里插入图片描述
      当出错时,就会通知OS,OS就会将溢出标志位,解释成kill(targetprocess,signal),向目标进程发送信号,从而终止进程。
      溢出错误对应的是8号信号,可以通过man 7 kill来查看。
      如何验证呢?我们可以将8号信号换成我们自己写的,来看结果:
    在这里插入图片描述
    在这里插入图片描述
      我们发现确实是换成了我们自定义的函数了。但是我们并没有写循环,为什么它会一直打印我们自定义函数中的内容呢?这是因为我们自己写的自定义函数中并没有写退出函数,同时,CPU中的status寄存器中的溢出标记位也一直是1,并没有置0,所有会一直读取。
      为什么不会置0呢?因为寄存器 != 寄存器的内容,寄存器是属于CPU的,但是寄存器中的内容是属于进程的,只有当进程被杀死,寄存器中的内容才会失效,也就是status寄存器中的数据才会被置0。但是上面我们并没有退出进程,寄存器中的内容依旧存在,status寄存器中的溢出标志位依旧为1,本来有错误是直接终止进程了,但是现在换成了我们的自定义函数, 不会终止了,进程不退出CPU就会继续调度,一调度就发现CPU中有错误,一发现有错误就发信号,然后又调度,又发现有错误,又发信号…………

    2.4 软件条件产生信号

      比如我们之前说过的管道,当我们将读端关闭时,写端继续写是没有意义的,所以当OS检测到管道的引用计数为1时,就会将写端发送SIGPIPE信号,将写端强行关闭,这就是软件条件产生的信号。
      alarm:
      我们来认识一个函数——闹钟。它的作用是几秒之后暂停进程,我们可以通过它可以观察到一些现象:
    在这里插入图片描述
      我们可以看到一秒可以打印8万多次。
    在这里插入图片描述
    如果只打印一次cnt却是1亿多次,多次打印只能打印8万次,说明访问外设的效率是非常慢的。

    1. 所有用户的行为,都是以进程的形式在OS中表现的。
    2. 操作系统只要把进程调度好,就能完成所有的用户任务。(那么就要一个问题了,OS也是代码,进程都是OS来管理的,那么OS是谁来让它执行的呢?)
    3. CMOS,可以以周期性的,高频率的,向CPU发送时钟中断。
      操作系统的本质实际上就是一个死循环,我们上面说过,内核中是会维护一个函数指针数组,它也叫中断向量表,里面存放了各个信号所对应的方法,而CMOS是一个硬件,它会持续的以周期性的,高频率的,向CPU发送时钟中断,这个时钟中断在向量表中所对应的方法,就是不断让CPU执行OS的死循环。在这里插入图片描述
        所以OS实际上就是由硬件来不断刺激CPU来运行的。

    2.5 Core Dump

      首先解释什么是Core Dump。当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部 保存到磁盘上,文件名通常是core,这叫做Core Dump。进程异常终止通常是因为有Bug,比如非法内存访问导致段错误,事后可以用调试器检查core文件以查清错误原因,这叫做Post-mortem Debug(事后调试)。一个进程允许产生多大的core文件取决于进程的Resource Limit(这个信息保存 在PCB中)。默认是不允许产生core文件的,因为core文件中可能包含用户密码等敏感信息,不安全。在开发调试阶段可以用ulimit命令改变这个限制,允许产生core文件。
    在这里插入图片描述
      我们发现中断有两种,Term就是正常的中断,Core是属于一种严重的中断,并且中断原因可能不清楚,需要用户多加注意。
    在这里插入图片描述
      简单来说,对于Core,当程序出错时,会生成一个Core file 文件,来保存出异常的上下文数据和一些异常信息。可以通过ulimit -a来查看:
    在这里插入图片描述
      这里是0的意思是,可以存放core file文件的可用内存大小为0,也就是说现在系统种并不允许存在core file 文件,可以通过 ulimit -c + 大小来修改:
    在这里插入图片描述
      我们来运行一个代码看是不是我说的那样会生成一个core文件:
    在这里插入图片描述
    在这里插入图片描述
      发现确实是会出现。程序员可以通过core文件更好的修改错误。

    2.6 小结

    • 上面所说的所有信号产生,最终都要有OS来进行执行,为什么?OS是进的管理者
    • 信号的处理是否是立即处理的?在合适的时候。
    • 信号如果不是被立即处理,那么信号是否需要暂时被进程记录下来?记录在哪里最合适呢?
    • 一个进程在没有收到信号的时候,能否能知道,自己应该对合法信号作何处理呢?
    • 如何理解OS向进程发送信号?能否描述一下完整的发送处理过程?

    3. 信号的保存

    3.1 阻塞信号

    3.1.1 信号其他相关常见概念

    • 实际执行信号的处理动作称为信号递达(Delivery)
    • 信号从产生到递达之间的状态,称为信号未决(Pending)。
    • 进程可以选择阻塞 (Block ) 某个信号。
    • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作。
    • 注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

    3.1.2 在内核中的表示

    在这里插入图片描述

    • 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
    • SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
    • SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。 如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。本章不讨论实时信号。

    3.1.3 sigset_t

      从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。下一节将详细介绍信号集的各种操作。 阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。

    3.2. 信号集操作函数

      sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。

    #include 
    int sigemptyset(sigset_t *set);
    int sigfillset(sigset_t *set);
    int sigaddset (sigset_t *set, int signo);
    int sigdelset(sigset_t *set, int signo);
    int sigismember(const sigset_t *set, int signo);
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
    • 函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置位,表示该信号集的有效信号包括系统支持的所有信号。
    • 注意,在使用sigset_ t类型的变量之前,一定要调 用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。

      这四个函数都是成功返回0,出错返回-1。sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。

    3.2.1 sigprocmask

      调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。

    #include 
    int sigprocmask(int how, const sigset_t *set, sigset_t *oset); 
    返回值:若成功则为0,若出错则为-1
    
    • 1
    • 2
    • 3

      如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号 屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。

    SIG_BLOCKset包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask l set
    SIG_UNBLOCKset包含了我们希望从当前信号屏蔽字种解除阻塞信号,相当于mask=mask & ~set
    SIG_SETMASK设置当前信号屏蔽字为set所指向的值,相当于mask = set

      如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。

      eg:
    在这里插入图片描述
    在这里插入图片描述
      我们发现就无法通过ctrl + c 终止进程了,这就是因为2号信号被阻塞了。那么是不是所有信号都可以被阻塞呢?并不是的,其中的9号和19号信号是无法被阻塞的,有兴趣的小伙伴可以自行验证。

    3.2.2 sigpending

    #include 
    sigpending
    读取当前进程的未决信号集,通过set参数传出。调用成功则返回0,出错则返回-1。 
    下面用刚学的几个函数做个实验。程序如下:
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述
    在这里插入图片描述
      我们先将2号信号阻塞,所以当我们发送2号信号时,会被阻塞,那么它就处于未决状态,那么就会被存放到pending位图中,所以当我们发送2号信号时,就可以在pinding中看到2号信号。
      而当我们解除信号的屏蔽,那么2号信号就会从pending中消失。
    在这里插入图片描述
    在这里插入图片描述

    4. 信号处理

      信号在合适的时候被处理 ------ 什么时候?

      进程从内核态返回到用户态的时候,进行信号的检测和信号的处理。
      用户态是一种受控的状态,访问的资源是有限的。
      内核态是一种OS的工作状态,能够访问大量的系统资源。(系统调用背后,就包含了身份的变化)
    在这里插入图片描述  十个进程就会有十个PCB,就会有十个页表,但是内核级页表,在OS中只需要一份就足够了,因为大家都一样,使用同一个就可以了。
      无论进程如何调度,CPU都可以直接找到OS。我们的进程的所以代码的执行,都可以在自己的地址空间内通过跳转的方式,进行调用和返回。
      那么CPU是如何知道是用户态还是内核态呢?在CPU中是有一个寄存器叫CS,它里面有2个比特位,其中用1(01)代表内核态,用3表示用户态(11),只需要检测CS寄存器就可以知道是什么态了。同时在寄存器中还要CR1、CR3寄存器,CR3是用来存储用户级页表的,那么CR1是用来存储什么的呢?
      当CPU调度进程时,发现在页表中有一个虚拟地址对应的物理地址还未开辟,那么就会发生缺页中断,为该虚拟地址开辟一块对应的物理地址,再开辟完成后,要如何再次找到该虚拟地址呢?那就是CR1,CR1就是用来保存这个的。
    在这里插入图片描述

    4.1 信号捕捉

      如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下: 用户程序注册了SIGQUIT信号的处理函sighandler。 当前正在执行main函数,这时发生中断或异常切换到内核态。 在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函 数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是 两个独立的控制流程。 sighandler函数返回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。

    4.2 sigaction

    #include 
    int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);
    
    • 1
    • 2

    在这里插入图片描述

    • sigaction函数可以读取和修改与指定信号相关联的处理动作。调用成功则返回0,出错则返回- 1。signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体:
    • 将sa_handler赋值为常数SIG_IGN传给sigaction表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。

      当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字(block表),当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项,本章的代码都把sa_flags设为0,sa_sigaction是实时信号的处理函数,本章不详细解释这两个字段,有兴趣的同学可以在了解一下。
    在这里插入图片描述
    在这里插入图片描述
      然后我们再使用mask添加其他的屏蔽信号来测试:
    在这里插入图片描述在这里插入图片描述

    可重入函数

    • main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的两步都做完之后从sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续 往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main函数和sighandler先后向链表中插入两个节点,而最后只有一个节点真正插入链表中了。
    • 像下图这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数,反之,如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。想一下,为什么两个不同的控制流程调用同一个函数,访问它的同一个局部变量或参数就不会造成错乱?
      在这里插入图片描述
        如果一个函数符合以下条件之一则是不可重入的:
    • 调用了malloc或free,因为malloc也是用全局链表来管理堆的。
    • 调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。

    volatile

      volatile 作用:保持内存的可见性(CPU),告知编译器,被该关键字修饰的变量,不允许被优化,对该变量的任何操作,都必须在真实的内存中进行操作。

    SIGCHLD信号

      进程一章讲过用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一下,程序实现复杂。
      其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作类似于忽略,父进程可以自定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。
      请编写一个程序完成以下功能:父进程fork出子进程,子进程调用exit(2)终止,父进程自定义SIGCHLD信号的处理函数,在其中调用wait获得子进程的退出状态并打印。
      事实上,由于UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN,这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证在其它UNIX系统上都可用。

    总结

      本章主要讲解了有关信号的一系列知识,其中使用了许多系统调用,比较难以记忆,希望大家可以多加练习来尝试理解,共勉!!!
      如果大家发现有什么错误的地方,可以私信或者评论区指出喔。我会继续深入学习Linux,希望能与大家共同进步,那么本期就到此结束,让我们下期再见!!觉得不错可以点个赞以示鼓励!!

  • 相关阅读:
    RAID5的配置流程及模拟硬盘损坏
    Python实现SSA智能麻雀搜索算法优化LightGBM回归模型(LGBMRegressor算法)项目实战
    JVM原理:JVM运行时内存模型(通俗易懂)
    Unity实现方圆X范围随机生成怪物
    Electron Forge 打包
    给灭霸点颜色看看
    反爬篇 | 手把手教你处理 JS 逆向之图片伪装
    [论文评析]AdaptivePose: Human Parts as Adaptive Points,AAAI 2022
    PCL 计算两空间直线的交点
    【JVM笔记】创建类和数组实例的字节码指令
  • 原文地址:https://blog.csdn.net/qq_62321047/article/details/136769266