• 【Linux】进程信号


    进程信号入门

    在这里插入图片描述

    生活角度信号
    • 你在网上买了很多件商品,在等待不同商品快递的到来。但即便快递还没有到来,你也知道快递到了的时候应该怎么处理快递,也就是你能“识别快递”。
    • 当快递到达目的地了,你收到了快递到来的通知,但是你不一定要马上下楼取快递,也就是说取快递的行为并不是一定要立即执行,可以理解成在“在合适的时候去取”。
    • 在你收到快递到达的通知,再到你拿到快递期间,是有一个时间窗口的,在这段时间内你并没有拿到快递,但是你知道快递已经到了,本质上是你“记住了有一个快递要去取”。
    • 当你时间合适,顺利拿到快递之后,就要开始处理快递了,而处理快递的方式有三种:1、执行默认动作(打开快递,使用商品)2、执行自定义动作(快递是帮别人买的,你要将快递交给他)3、忽略(拿到快递后,放在一边继续做自己的事)。
    • 快递到来的整个过程,对你来讲是异步的,你不能确定你的快递什么时候到。
    技术应用角度的信号

    硬件中断:实际上当用户按Ctrl+C时,这个键盘输入会产生一个硬中断,被操作系统获取并解释成信号(Ctrl+C被解释成2号信号),然后操作系统将2号信号发送给目标前台进程,当前台进程收到2号信号后就会退出。

    #include 
    #include 
    
    using namespace std;
    int main()
    {
        while(true)
        {
            cout << "我是一个进程" << endl;
            sleep(1);
        }
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    在这里插入图片描述

    signal:捕捉信号,并且将信号原来的执行方法替代为自定义的方法
    我们可以使用signal函数证明CTRL + C 按键被转换为 信号 2,结束程序

    说明: 有些信号是不能被捕捉的,比如9号信号。因为如果所有信号都能被捕捉的话,那么进程就可以将所有信号全部进行捕捉并将动作设置为忽略,此时该进程将无法被杀死,即便是操作系统

        #include 
    
        typedef void (*sighandler_t)(int);//函数指针,返回值为void类型
    
        sighandler_t signal(int signum, sighandler_t handler);
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • signum:要接受的信号宏定义或者数子,两者都可以填入
    • handler:返回值为void类型的函数指针,可以将要替代执行的函数名填入,前提必须为void类型且形参需要接受一个整型。
      在这里插入图片描述

    注意:

    • Ctrl+C产生的信号只能发送给前台进程。在一个命令后面加个&就可以将其放到后台运行,这样Shell就不必等待进程结束就可以接收新的命令,启动新的进程。
    • Shell可以同时运行一个前台进程和任意多个后台进程,但是只有前台进程才能接到像Ctrl+C这种控制键产生的信号。
    • 前台进程在运行过程中,用户随时可能按下Ctrl+C而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都可能收到SIGINT信号而终止,所以信号相对于进程的控制流程来说是异步的。
    • 信号是进程之间事件异步通知的一种方式,属于软中断。
    信号的发送和记录

    我们使kill -l命令可以查看Linux当中的所有信号列表。
    在这里插入图片描述
    其中1 ~ 31号信号是普通信号,34 ~ 64号信号是实时信号,普通信号和实时信号各自都有31个,每个信号都有一个编号和一个宏定义名称:
    在这里插入图片描述

    信号是如何记录的?

    实际上,当一个进程接收到某种信号后,该信号是被记录在该进程的进程控制块当中的。我们都知道进程控制块本质上就是一个结构体变量,而对于信号来说我们主要就是记录某种信号是否产生,因此,我们可以用一个32位的位图来记录信号是否产生。

    在这里插入图片描述
    其中比特位的位置代表信号的编号,而比特位的内容就代表是否收到对应信号,比如第6个比特位是1就表明收到了6号信号。

    信号是如何产生的?

    • 一个进程收到信号,本质就是该进程内的信号位图被修改了,也就是该进程的数据被修改了,而只有操作系统才有资格修改进程的数据,因为操作系统是进程的管理者。也就是说,信号的产生本质上就是操作系统直接去修改目标进程的task_struct中的信号位图。

    注意: 信号只能由操作系统发送,但信号发送的方式有多种。

    信号常见的处理方法
    1. 执行该信号的默认处理动作。
    2. 提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行
      这个处理函数,这种方式称为捕捉(Catch)一个信号。
    3. 忽略该信号。
    查看信号处理动作

    在Linux当中,我们可以通过man手册查看各个信号默认的处理动作。

    man 7 signal
    
    • 1

    在这里插入图片描述

    信号产生

    产生信号

    通过终端按键产生信号

    最为具有代表性就是 ctrl + C我们在以上技术应用角度已经阐述过,这里就不在讲解
    除了按Ctrl+C之外,按Ctrl+\也可以终止该进程
    在这里插入图片描述

    按Ctrl+C终止进程和按Ctrl+\终止进程,有什么区别?
    按Ctrl+C实际上是向进程发送2号信号SIGINT,而按Ctrl+\实际上是向进程发送3号信号SIGQUIT。查看这两个信号的默认处理动作,可以看到这两个信号的Action是不一样的,2号信号是Term,而3号信号是Core

    在这里插入图片描述
    Term和Core都代表着终止进程,但是Core在终止进程的时候会进行一个动作,那就是核心转储
    在这里插入图片描述

    • Trem:默认终止进程
    • Core:默认操作是终止进程并转诸核心

    什么是核心转储?及它的应用

    在云服务器中,核心转储是默认被关掉的,我们可以通过使用ulimit -a命令查看当前资源限制的设定。
    ulimit -a:列出所有的参数选项

    在这里插入图片描述
    其中,第一行显示core文件的大小为0,即表示核心转储是被关闭的。

    我们可以通过ulimit -c size命令来设置core文件的大小。
    在这里插入图片描述
    core文件的大小设置完毕后,就相当于将核心转储功能打开了。此时如果·我们再使用Ctrl+\对进程进行终止,就会发现终止进程后会显示core dumped,并且会在当前路径下生成一个core文件,该文件以一串数字为后缀,而这一串数字实际上就是发生这一次核心转储的进程的PID。
    在这里插入图片描述

    核心转储功的作用

    当我们的代码出错了,我们最关心的是我们的代码是什么原因出错的。如果我们的代码运行结束了,那么我们可以通过退出码来判断代码出错的原因,而如果一个代码是在运行过程中出错的,那么我们也要有办法判断代码是什么原因出错的。

    当我们的程序在运行过程中崩溃了,我们一般会通过调试来进行逐步查找程序崩溃的原因。而在某些特殊情况下,我们会用到核心转储,核心转储指的是操作系统在进程收到某些信号而终止运行时,将该进程地址空间的内容以及有关进程状态的其他信息转而存储到一个磁盘文件当中,这个磁盘文件也叫做核心转储文件,一般命名为core.pid。

    而核心转储的目的就是为了在调试时,方便问题的定位。

    如何运用核心转储进行调试?

    int main()
    {
      printf("我的进程开始了\n");
      sleep(1);
      int a = 10/0;
      printf("我的进程结束了\n");
      return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    在这里插入图片描述
    使用gdb对当前可执行程序进行调试,然后直接使用core-file core文件命令加载core文件,即可判断出该程序在终止时收到了8号信号,并且定位到了产生该错误的具体代码。
    在这里插入图片描述
    说明一下: 事后用调试器检查core文件以查清错误原因,这种调试方式叫做事后调试。

    core dump标志

    还记得进程等待函数waitpid函数的第二个参数吗:

    pid_t waitpid(pid_t pid, int *status, int options);
    
    • 1

    waitpid函数的第二个参数status是一个输出型参数,用于获取子进程的退出状态。status是一个整型变量,但status不能简单的当作整型来看待,status的不同比特位所代表的信息不同,具体细节如下(只关注status低16位比特位):
    在这里插入图片描述
    若进程是正常终止的,那么status的次低8位就表示进程的退出状态,即退出码。若进程是被信号所杀,那么status的低7位表示终止信号,而第8位比特位是core dump标志,即进程终止时是否进行了核心转储。
    在这里插入图片描述
    打开Linux的核心转储功能,并编写下列代码。代码中父进程使用fork函数创建了一个子进程,子进程所执行的代码当中存在野指针问题,当子进程执行到*p = 100时,必然会被操作系统所终止并在终止时进行核心转储。此时父进程使用waitpid函数便可获取到子进程退出时的状态,根据status的第7个比特位便可得知子进程在被终止时是否进行了核心转储。

    int main()
    {
      if(fork() == 0)
      {
        //child
        int *p = nullptr;
        *p = 100;//野指针
        exit(0);
      }
      else
      {
        if(fork > 0)
        {
          //father
          int status = 0;
          waitpid(-1,&status,0);
          printf("退出码为:%d,收到的信号编号为:%d,是否修改了核心存储:%d\n",
                  (status >> 8) & 0xff,status & 0x7f,(status >> 7) & 1);
        }
      }
      return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22

    可以看到,所获取的status的第7个比特位为1,即可说明子进程在被终止时进行了核心转储。
    在这里插入图片描述
    因此,core dump标志实际上就是用于表示程序崩溃的时候是否进行了核心转储。

    通过系统函数像进程发信号

    当我们要使用kill命令向一个进程发送信号时,我们可以以kill -信号名 进程ID的形式进行发送。(这里的信号名也可以换位信号数字)

    在这里插入图片描述

    实现原理

    实际上kill命令是通过调用kill函数实现的,kill函数可以给指定的进程发送指定的信号,kill函数的函数原型如下:

    int kill(pid_t pid, int sig);
    
    • 1

    kill函数用于向进程ID为pid的进程发送sig号信号,如果信号发送成功,则返回0,否则返回-1。

    我们可以用kill函数自定义模拟实现一个kill命令,实现逻辑如下:

    #include 
    #include 
    #include 
    #include 
    
    using namespace std;
    
    void Usage(char* proc)
    {
      printf("Usage:%s pid signo\n",proc);
    }
    
    int main(int argc,char* argv[])
    {
     
      if(argc != 3)
      {
        Usage(argv[0]);
        return 1;
      }
      pid_t id = atoi(argv[1]);
      int signo = atoi(argv[2]);
      kill(id,signo);
      return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25

    在这里插入图片描述

    raise函数

    raise函数可以给当前进程发送指定信号,即自己给自己发送信号,raise函数的函数原型如下:

    int raise(int sig);
    
    • 1

    raise函数用于给当前进程发送sig号信号,如果信号发送成功,则返回0,否则返回一个非零值。
    例如,下列代码当中用raise函数每隔一秒向自己发送一个2号信号。

    #include 
    #include 
    #include 
    #include 
    
    using namespace std;
    void handler(int sig)
    {
        cout << "我是自定义类型,接受的信号数字为: %d  "  << sig << endl;
    }
    
    int main()
    {
     signal(2,handler);
     while(1)
     {
       raise(2);
       sleep(1);
     }
     return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21

    在这里插入图片描述

    abort函数

    在Linux中,abort() 是一个库函数,它用于向当前进程发送一个SIGABRT信号,以使进程异常终止。当程序运行过程中发生严重错误或违反了某个约束条件时,可以通过调用abort()函数来终止程序的执行。通常情况下,abort()函数会导致进程生成一个core dump文件,以便开发人员进行后续的故障排查和分析。
    abort函数的函数原型如下:

    void abort(void);
    
    • 1

    abort函数是一个无参数无返回值的函数。

    例如,下列代码当中每隔一秒向当前进程发送一个SIGABRT信号。

    在这里插入图片描述

    说明一下: abort函数的作用是异常终止进程,exit函数的作用是正常终止进程,而abort本质是通过向当前进程发送SIGABRT信号而终止进程的,因此使用exit函数终止进程可能会失败,但使用abort函数终止进程总是成功的。

    由软件条件产生信号

    SIGPIPE信号

    SIGPIPE信号实际上就是一种由软件条件产生的信号,当进程在使用管道进行通信时,读端进程将读端关闭,而写端进程还在一直向管道写入数据,那么此时写端进程就会收到SIGPIPE信号进而被操作系统终止。(也就是十三号信号)

    在管道部分我们已经讲解过了

    SIGALRM信号

    调用alarm函数可以设定一个闹钟,也就是告诉操作系统在若干时间后发送SIGALRM信号给当前进程,alarm函数的函数原型如下:

    unsigned int alarm(unsigned int seconds);
    
    • 1

    alarm函数的作用就是,让操作系统在seconds秒之后给当前进程发送SIGALRM信号,SIGALRM信号的默认处理动作是终止进程。

    alarm函数的返回值:

    • 若调用alarm函数前,进程已经设置了闹钟,则返回上一个闹钟时间的剩余时间,并且本次闹钟的设置会覆盖上一次闹钟的设置。
    • 如果调用alarm函数前,进程没有设置闹钟,则返回值为0。

    根据alarm函数方法,我们可以看看IO到底有多吃时间

    例如,我们可以用下面的代码,测试自己的云服务器一秒时间内可以将一个变量累加到多大。

    int main()
    {
      int count = 0;
      alarm(1);
      while(1)
      {
        count++;
        cout << count << endl;
      }
      return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    在这里插入图片描述
    我们可以看到,如果带IO输出的情况下是能输出七万多,那么当我们不进行IO时我们看看能有多少数字

    int main()
    {
    int count = 0;
    void handler(int sig)
    {
        cout << "我是自定义类型,接受的信号数字为: %d  "  << sig << endl;
        cout << count << endl;
    }
    
    int main()
    {
      signal(SIGALRM,handler);
      alarm(1);
      while(1)
      {
        count++;
      }
      return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19

    在这里插入图片描述
    我们可以看到已经远远超过了进行IO时的数据。

    由硬件异常产生信号

    为什么C/C++程序会崩溃?

    当我们程序当中出现类似于除0、野指针、越界之类的错误时,为什么程序会崩溃?本质上是因为进程在运行过程中收到了操作系统发来的信号进而被终止,那操作系统是如何识别到一个进程触发了某种问题的呢?

    我们知道,CPU当中有一堆的寄存器,当我们需要对两个数进行算术运算时,我们是先将这两个操作数分别放到两个寄存器当中,然后进行算术运算并把结果写回寄存器当中。此外,CPU当中还有一组寄存器叫做状态寄存器,它可以用来标记当前指令执行结果的各种状态信息,如有无进位、有无溢出等等。而操作系统是软硬件资源的管理者,在程序运行过程中,若操作系统发现CPU内的某个状态标志位被置位,而这次置位就是因为出现了某种除0错误而导致的,那么此时操作系统就会马上识别到当前是哪个进程导致的该错误,并将所识别到的硬件错误包装成信号发送给目标进程,本质就是操作系统去直接找到这个进程的task_struct,并向该进程的位图中写入8信号,写入8号信号后这个进程就会在合适的时候被终止。

    那对于下面的野指针问题,或者越界访问的问题时,操作系统又是如何识别到的呢?

    int main()
    {
      printf("开始运行\n");
      sleep(1);
      int *p = nullptr;
      *p = 100;
      return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    在这里插入图片描述
    首先我们必须知道的是,当我们要访问一个变量时,一定要先经过页表的映射,将虚拟地址转换成物理地址,然后才能进行相应的访问操作。
    在这里插入图片描述

    其中页表属于一种软件映射关系,而实际上在从虚拟地址到物理地址映射的时候还有一个硬件叫做MMU,它是一种负责处理CPU的内存访问请求的计算机硬件,因此映射工作不是由CPU做的,而是由MMU做的,但现在MMU已经集成到CPU当中了。

    当需要进行虚拟地址到物理地址的映射时,我们先将页表的左侧的虚拟地址导给MMU,然后MMU会计算出对应的物理地址,我们再通过这个物理地址进行相应的访问。

    而MMU既然是硬件单元,那么它当然也有相应的状态信息,当我们要访问不属于我们的虚拟地址时,MMU在进行虚拟地址到物理地址的转换时就会出现错误,然后将对应的错误写入到自己的状态信息当中,这时硬件上面的信息也会立马被操作系统识别到,进而将对应进程发送SIGSEGV信号。

    总结一下:
    C/C++程序会崩溃,是因为程序当中出现的各种错误最终一定会在硬件层面上有所表现,进而会被操作系统识别到,然后操作系统就会发送相应的信号将当前的进程终止。

    信号保存

    阻塞信号

    信号其他相关常见概念
    • 实际执行信号的处理动作,称为信号递达(Delivery)。
    • 信号从产生到递达之间的状态,称为信号未决(pending)。
    • 进程可以选择阻塞(Block)某个信号.
    • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作。
    • 需要注意的是,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是递达之后的一种处理动作
    在内核中表示

    信号在内核中的表示示意图如下:

    在这里插入图片描述

    • 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
    • SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会在改变处理动作之后再接触阻塞。
    • SIGQUIT信号未产生过,但一旦产生SIGQUIT信号,该信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前,这种信号产生过多次,POSIX.1允许系统递达该信号一次或多次。Linux是这样实现的:普通信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里,这里只讨论普通信号。
      总结一下:
    1. 在block位图中,比特位的位置代表某一个信号,比特位的内容代表该信号是否被阻塞。
    2. 在pending位图中,比特位的位置代表某一个信号,比特位的内容代表是否收到该信号。
    3. handler表本质上是一个函数指针数组,数组的下标代表某一个信号,数组的内容代表该信号递达时的处理动作,处理动作包括默认、忽略以及自定义。
    4. block、pending和handler这三张表的每一个位置是一一对应的。
    sigset_t

    根据信号在内核中的表示方法,每个信号的未决标志只有一个比特位,非0即1,如果不记录该信号产生了多少次,那么阻塞标志也只有一个比特位。

    因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储。在我当前的云服务中,sigset_t类型的定义如下:(不同操作系统实现sigset_t的方案可能不同)

    #define _SIGSET_NWORDS (1024 / (8 * sizeof (unsigned long int)))
    typedef struct
    {
    	unsigned long int __val[_SIGSET_NWORDS];
    } __sigset_t;
    
    typedef __sigset_t sigset_t;
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态。

    • 在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞。
    • 在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。

    阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。

    信号集操作函数

    sigset_t类型对于每种信号用一个bit表示“有效”或“无效”,至于这个类型内部如何存储这些bit则依赖于系统的实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的。

    #include 
    
    int sigemptyset(sigset_t *set);
    
    int sigfillset(sigset_t *set);
    
    int sigaddset(sigset_t *set, int signum);
    
    int sigdelset(sigset_t *set, int signum);
    
    int sigismember(const sigset_t *set, int signum);  
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    函数解释:

    • sigemptyset函数:初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含任何有效信号。
    • sigfillset函数:初始化set所指向的信号集,使其中所有信号的对应bit置位,表示该信号集的有效信号包括系统支持的所有信号。
    • sigaddset函数:在set所指向的信号集中添加某种有效信号。
    • sigdelset函数:在set所指向的信号集中删除某种有效信号。
    • sigemptyset、sigfillset、sigaddset和sigdelset函数都是成功返回0,出错返回-1。
    • sigismember函数:判断在set所指向的信号集中是否包含某种信号,若包含则返回1,不包含则返回0,调用失败返回-1。

    注意: 在使用sigset_t类型的变量之前,一定要调用sigemptyset或sigfillset做初始化,使信号处于确定的状态。

    例如,我们可以按照如下方式使用这些函数。

    #include 
    #include 
    
    int main()
    {
    	sigset_t s; //用户空间定义的变量
    
    	sigemptyset(&s);
    
    	sigfillset(&s);
    
    	sigaddset(&s, SIGINT);
    
    	sigdelset(&s, SIGINT);
    
    	sigismember(&s, SIGINT);
    	return 0;
    }
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19

    注意: 代码中定义的sigset_t类型的变量s,与我们平常定义的变量一样都是在用户空间定义的变量,所以后面我们用信号集操作函数对变量s的操作实际上只是对用户空间的变量s做了修改,并不会影响进程的任何行为。因此,我们还需要通过系统调用,才能将变量s的数据设置进操作系统。

    sigprocmask

    sigprocmask函数可以用于读取或更改进程的信号屏蔽字(阻塞信号集),该函数的函数原型如下:

    int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);
    
    • 1

    参数说明:

    • 如果oset是非空指针,则读取进程当前的信号屏蔽字通过oset参数传出。
    • 如果set是非空指针,则更改进程的信号屏蔽字,参数how指示如何更改
    • 如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。

    假设当前的信号屏蔽字为mask,下表说明了how参数的可选值及其含义:

    SIG_BLOCK:set包含了我们希望添加到当前信号屏蔽字的信号,相当于mask=mask|set

    SIG_UNBLOCK:set包含了我们希望从当前信号屏蔽字中解除阻塞的信号,相当mask=mask|~set

    SIG_SETMASK:设置当前信号屏蔽字为set所指向的值,相当于mask=set
    返回值说明:

    • sigprocmask函数调用成功返回0,出错返回-1。

    注意: 如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。

    void printPenging(sigset_t* pending)
    {
        for(int i = 1;i <= 31;++i)
        {
            if(sigismember(pending,i))
            {
                printf("1");
            }
            else
            {
                printf("0");
            }
    
        }
        printf("\n");
    }
    
    void handler(int sig)
    {
        printf("收到了信号:%d",sig);
    }
    
    int main()
    {
        signal(2,handler);
        sigset_t set,oset;
        sigemptyset(&set);//初始化信号变量
        sigemptyset(&oset);
    
        sigaddset(&set,2);//SIGINT   添加信号
        //int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);
        sigprocmask(SIG_SETMASK,&set,&oset);//因为oset为空,但是set不为空,所以可以起到阻塞的作用
        //SIG_SETMASK	设置当前信号屏蔽字为set所指向的值,相当于mask=set
    
        sigset_t pending;
        sigemptyset(&pending);
    
        int count = 0;
        while(1)
        {
            sigpending(&pending);//获取pending
            printPenging(&pending);//打印pending位图(1表示未决)
            sleep(1);
            count++;
            if(count == 5)
            {
                sigprocmask(SIG_SETMASK,&oset,NULL);
                printf("恢复信号屏蔽字\n");
            }
        }
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52

    在这里插入图片描述

    证明函数具有阻塞功能,当我们阻塞 2 号信号后,输入再多的 2 号信号也都会被阻塞在一边。知道我们const计数到指定数字后,才会恢复其功能

    sigpending

    sigpending函数可以用于读取进程的未决信号集,该函数的函数原型如下:

    int sigpending(sigset_t *set);
    
    • 1

    sigpending函数读取当前进程的未决信号集,并通过set参数传出。该函数调用成功返回0,出错返回-1。

    下面我们来做一个简单的实验

    实验步骤如下:

    1. 先用上述的函数将2号信号进行屏蔽(阻塞)。
    2. 使用CTRL + C命令或组合按键向进程发送2号信号。
    3. 此时2号信号会一直被阻塞,并一直处于pending(未决)状态。
    4. 使用sigpending函数获取当前进程的pending信号集进行验证。
    5. 再设置一段自动解除阻塞的操作
    #include 
    #include 
    #include 
    
    void printPenging(sigset_t* pending)
    {
        for(int i = 1;i <= 31;++i)
        {
            if(sigismember(pending,i))
            {
                printf("1");
            }
            else
            {
                printf("0");
            }
    
        }
        printf("\n");
    }
    
    void handler(int signo)
    {
        printf("收到了信号:%d\n",signo);
    }
    
    int main()
    {
        signal(2,handler);
        sigset_t set,oset;
        sigemptyset(&set);
        sigemptyset(&oset);
    
        sigaddset(&set,2);//SIGINT
        //int sigprocmask(int how, const sigset_t *set, sigset_t *oldset);
        sigprocmask(SIG_SETMASK,&set,&oset);
        //SIG_SETMASK	设置当前信号屏蔽字为set所指向的值,相当于mask=set
    
        sigset_t pending;
        sigemptyset(&pending);
    
        int count = 0;
        while(1)
        {
            sigpending(&pending);//获取pending
            printPenging(&pending);//打印pending位图(1表示未决)
            sleep(1);
            count++;
            if(count == 10)
            {
                sigprocmask(SIG_SETMASK,&oset,NULL);
                printf("恢复信号屏蔽字\n");
            }
        }
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56

    可以看到,程序刚刚运行时,因为没有收到任何信号,所以此时该进程的pending表一直是全0,而当我们使用CTRL + C命令向该进程发送2号信号后,由于2号信号是阻塞的,因此2号信号一直处于未决状态,所以我们看到pending表中的第二个数字一直是1。
    在这里插入图片描述
    为了看到2号信号递达后pending表的变化,我们可以设置一段时间后,自动解除2号信号的阻塞状态,解除2号信号的阻塞状态后2号信号就会立即被递达。因为2号信号的默认处理动作是终止进程,所以为了看到2号信号递达后的pending表,我们可以将2号信号进行捕捉,让2号信号递达时执行我们所给的自定义动作。
    此时就可以看到,进程收到2号信号后,该信号在一段时间内处于未决状态,当解除2号信号的屏蔽后,2号信号就会立即递达,执行我们所给的自定义动作,而此时的pending表也变回了全0。
    细节: 在解除2号信号后,2号信号的自定义动作是在打印“恢复信号屏蔽字”之前执行的。因为如果调用sigprocmask解除对当前若干个未决信号的阻塞,则在sigprocmask函数返回前,至少将其中一个信号递达。

    信号处理

    捕捉信号

    内核空间与用户空间

    每一个进程都有自己的进程地址空间,该进程地址空间由内核空间和用户空间组成:

    • 用户所写的代码和数据位于用户空间,通过用户级页表与物理内存之间建立映射关系。
    • 内核空间存储的实际上是操作系统代码和数据,通过内核级页表与物理内存之间建立映射关系。

    内核级页表是一个全局的页表,它用来维护操作系统的代码与进程之间的关系。因此,在每个进程的进程地址空间中,用户空间是属于当前进程的,每个进程看到的代码和数据是完全不同的,但内核空间所存放的都是操作系统的代码和数据,所有进程看到的都是一样的内容。
    在这里插入图片描述
    需要注意的是,虽然每个进程都能够看到操作系统,但并不意味着每个进程都能够随时对其进行访问。

    如何理解进程切换?

    1. 在当前进程的进程地址空间中的内核空间,找到操作系统的代码和数据。
    2. 执行操作系统的代码,将当前进程的代码和数据剥离下来,并换上另一个进程的代码和数据。

    注意: 当你访问用户空间时你必须处于用户态,当你访问内核空间时你必须处于内核态。

    内核态与用户态

    内核态与用户态:

    • 内核态通常用来执行操作系统的代码,是一种权限非常高的状态。
    • 用户态是一种用来执行普通用户代码的状态,是一种受监管的普通状态。

    进程收到信号之后,并不是立即处理信号,而是在合适的时候,这里所说的合适的时候实际上就是指,从内核态切换回用户态的时候。

    内核态和用户态之间是进行如何切换的?

    从用户态切换为内核态通常有如下几种情况:

    1. 需要进行系统调用时。
    2. 当前进程的时间片到了,导致进程切换。
    3. 产生异常、中断、陷阱等。

    与之相对应,从内核态切换为用户态有如下几种情况:

    1. 系统调用返回时。
    2. 进程切换完毕。
    3. 异常、中断、陷阱等处理完毕。

    补充说明:

    • 发生系统调用:当用户程序需要访问受保护的系统资源或请求操作系统提供的服务时,它会发起系统调用。操作系统会接收到系统调用请求,然后执行相应的系统代码来处理该请求,并返回结果给用户程序。
    • 异常或中断事件:当发生硬件故障、软件错误或外部中断等事件时,操作系统需要对其进行处理。操作系统会通过中断处理程序或异常处理程序来响应这些事件,并执行必要的系统代码来处理它们。
    • 定时器事件:操作系统通常会使用定时器来进行时间管理和调度。当定时器触发时,操作系统会响应该事件,执行系统代码以更新任务调度和执行状态。

    其中,由用户态切换为内核态我们称之为陷入内核。每当我们需要陷入内核的时,本质上是因为我们需要执行操作系统的代码,比如系统调用函数是由操作系统实现的,我们要进行系统调用就必须先由用户态切换为内核态。

    内核如何实现信号的捕捉

    当我们在执行主控制流程的时候,可能因为某些情况而陷入内核,当内核处理完毕准备返回用户态时,就需要进行信号pending的检查。(此时仍处于内核态,有权力查看当前进程的pending位图)

    在查看pending位图时,如果发现有未决信号,并且该信号没有被阻塞,那么此时就需要该信号进行处理。

    如果待处理信号的处理动作是默认或者忽略,则执行该信号的处理动作后清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,从主控制流程中上次被中断的地方继续向下执行即可。
    在这里插入图片描述
    但如果待处理信号是自定义捕捉的,即该信号的处理动作是由用户提供的,那么处理该信号时就需要先返回用户态执行对应的自定义处理动作,执行完后再通过特殊的系统调sigreturn再次陷入内核并清除对应的pending标志位,如果没有新的信号要递达通过函数sys_sigreturn,就直接返回用户态,继续执行主控制流程的代码。
    在这里插入图片描述
    在检测信号后,会将要处理的信号在block表对应位置置为1,将pending表中对应位置置为0,然后再执行处理动作。

    当待处理信号是自定义捕捉时的情况比较复杂,可以借助下图进行记忆:
    在这里插入图片描述
    其中,该图形与直线有几个交点就代表在这期间有几次状态切换,而箭头的方向就代表着此次状态切换的方向,图形中间的圆点就代表着检查pending表。

    当识别到信号的处理动作是自定义时,能直接在内核态执行用户空间的代码吗?
    理论上来说是可以的,因为内核态是一种权限非常高的状态,但是绝对不能这样设计。

    如果允许在内核态直接执行用户空间的代码,那么用户就可以在代码中设计一些非法操作,比如清空数据库等,虽然在用户态时没有足够的权限做到清空数据库,但是如果是在内核态时执行了这种非法代码,那么数据库就真的被清空了,因为内核态是有足够权限清空数据库的。

    也就是说,不能让操作系统直接去执行用户的代码,因为操作系统无法保证用户的代码是合法代码,即操作系统不信任任何用户。

    sigaction

    捕捉信号除了用前面用过的signal函数之外,我们还可以使用sigaction函数对信号进行捕捉,sigaction函数的函数原型如下:

    int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);
    
    • 1

    sigaction函数可以读取和修改与指定信号相关联的处理动作,该函数调用成功返回0,出错返回-1。

    参数说明:

    • signum代表指定信号的编号。
    • 若act指针非空,则根据act修改该信号的处理动作。
    • 若oldact指针非空,则通过oldact传出该信号原来的处理动作。
    • 调用成功则返回0,出错则返回- 1。

    其中,参数act和oldact都是结构体指针变量,该结构体的定义如下:

    struct sigaction {
    	void(*sa_handler)(int);
    	void(*sa_sigaction)(int, siginfo_t *, void *);
    	sigset_t   sa_mask;
    	int        sa_flags;
    	void(*sa_restorer)(void);
    };
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    结构体的第一个成员sa_handler:

    • 将sa_handler赋值为常数SIG_IGN传给sigaction函数,表示忽略信号。
    • 将sa_handler赋值为常数SIG_DFL传给sigaction函数,表示执行系统默认动作。
    • 将sa_handler赋值为一个函数指针,表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数。

    注意: 所注册的信号处理函数的返回值为void,参数为int,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然这是一个回调函数,不是被main函数调用,而是被系统所调用。

    结构体的第二个成员sa_sigaction:

    sa_sigaction是实时信号的处理函数。

    结构体的第三个成员sa_mask:

    首先需要说明的是,当某个信号的处理函数被调用,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。

    如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时,自动恢复原来的信号屏蔽字。

    结构体的第四个成员sa_flags:

    sa_flags字段包含一些选项,这里直接将sa_flags设置为0即可。

    结构体的第五个成员sa_restorer:

    后续了解

    例如,下面我们用sigaction函数对2号信号进行了捕捉,将2号信号的处理动作改为了自定义的打印动作,并在执行一次自定义动作后将2号信号的处理动作恢复为原来默认的处理动作。

    struct sigaction act,oact;
    
    void handler(int signo)
    {
        printf("收到了信号:%d\n",signo);
        //sigaction(2, &act, &oact);
        sleep(5);
    }
    
    int main()
    {
        //struct sigaction {
    	// void(*sa_handler)(int);
    	// void(*sa_sigaction)(int, siginfo_t *, void *);
    	// sigset_t   sa_mask;
    	// int        sa_flags;
    	// void(*sa_restorer)(void);
        // };
        //signal(2,handler);
        memset(&act,0,sizeof(act));
        memset(&oact,0,sizeof(oact));
        act.sa_handler = handler;
        act.sa_flags = 0;
        sigemptyset(&act.sa_mask);
    
        sigaddset(&act.sa_mask,3);
        sigaction(2, &act, &oact);
        while (1)
        {
    		printf("I am a process...\n");
    		sleep(5);
    	}
    
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34

    在这里插入图片描述

    SIGCHLD子进程退出信号

    为了防止子进程退出时变为僵尸状态,Linux给出了两种解决方案,一种时wait,还有一种就是waitpid,在进程等待那一块我已经说过。
    其实当我们不使用这两种方式的时候,系统给的方法就是默认忽略的,但是我们可以使用 signal函数和sigacion函数来进行信号捕捉,重新定义忽略,这时os就会将忽略定义为回收僵尸状态。

    int main()
    {
        pid_t id = fork();
        if(id == 0)
        {
            //子进程
            printf("进入了子进程\n");
            sleep(3);
            exit(1);
        }
    
        //父进程
        printf("进入了父进程\n");
        while(1);
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16

    在这里插入图片描述
    这时的进程退出时,为默认动作,不进行回收。

    signal(SIGCHLD,SIG_IGN);
    
    • 1

    当我们对退出信号进行捕捉时,将他的状态设置为忽略后(SIG_IGN),这时,os就会把它进行回收,它的另一个默认动作

    除了定义默认忽略状态外,我们可以使用两个函数来进行非阻塞式回收僵尸状态。

    这样做的好处是,当我们子进程数量较多时,我们可以一个一个的进行回收,不会存在阻塞问题

    如果我们这里时阻塞等待,当退出的子进程堆积到一块是,由于我们这里是阻塞状态,就不会将子进程全都退出

    void handler(int signo)
    {
    	printf("get a signal: %d\n", signo);
    	int ret = 0;
    	while ((ret = waitpid(-1, NULL, WNOHANG)) > 0){
    		printf("wait child %d success\n", ret);
    	}
    }
    
    int main()
    {
        signal(SIGCHLD,handler);
        pid_t id = fork();
        if(id == 0)
        {
            //子进程
            printf("进入了子进程\n");
            sleep(3);
            exit(1);
        }
    
        //父进程
        printf("进入了父进程\n");
        while(1);
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
  • 相关阅读:
    学会这 29 个 函数,你就是 Pandas 专家
    基于SSM+Vue的在线购书商城系统
    xml 里面判断int类型,String类型不为空
    测试平台部署三——Nginx
    论文精读(保姆级解析)——DiFaReli: Diffusion Face Relighting
    美团T3架构师推荐633页JavaEE核心框架实战
    kafka简述
    python tkinter 使用(二)
    国家高新技术企业,哪些情况将被取消资格?
    FineBI 取日期的最大max、最小值min
  • 原文地址:https://blog.csdn.net/wh9109/article/details/132954257