Linux —— 进程的控制

在linux中fork函数是非常重要的函数，它从已存在进程中创建一个新进程。新进程为子进程，而原进程为父进程。

进程调用fork，当控制转移到内核中的fork代码后，内核做：

1. 分配新的内存块和内核数据结构给子进程

2. 将父进程部分数据结构内容拷贝至子进程

3. 添加子进程到系统进程列表当中

4. fork返回，开始由调度器调度

2.fork函数的返回值


//fork() --- 创建一个子进程
#include <unistd.h> //所需要的头文件
 
pid_t fork(void);

返回值：

1.给父进程返回子进程的PID；

2.给子进程返回0；

3.子进程创建失败会返回-1；

当一个进程调用fork之后，就有两个二进制代码相同的进程。而且它们都运行到相同的地方。但每个进程都将可以开始它们自己的旅程，看如下程序：

运行结果：

这里看到了三行输出，一行before，两行after。进程10237先打印before消息，然后它打印after。另一个after消息有10238打印的。注意到进程10238没有打印before，为什么呢？如下图所示

fork之前父进程独立执行，fork之后，父子两个执行流分别执行。注意，fork之后，谁先执行完全由调度器决定。

3.写时拷贝

通常，父子代码共享，父子再不写入时，数据也是共享的，当任意一方试图写入，便以写时拷贝的方式各自一份副本。具体见下图：

在修改内容之前，父子进程的数据和代码都是共享的，当任意一方试图写入时，操作系统会识别到缺页中断，所谓的缺页中断：是指计算机在执行程序的过程中，当出现异常情况或特殊请求时，计算机停止现行程序的运行，转向对这些异常情况或特殊请求的处理，处理结束后再返回现行程序的间断处，继续执行原程序。那么，操作系统重新分配一块空间，将旧空间的数据拷贝下来，此时操作系统也会重新映射页表。

4.fork函数常规用法

一个父进程希望复制自己，使父子进程同时执行不同的代码段。例如，父进程等待客户端请求，生成子进程来处理请求。

一个进程要执行一个不同的程序。例如子进程从fork返回后，调用exec类函数。

5.fork函数调用失败的原因

系统中有太多的进程，导致内存严重不足，无法加载数据

实际用户的进程数超过了限制

二、进程终止

1.进程的退出场景以及退出码

进程一旦退出，就会存在以下三种情况：

        1.代码运行完毕，结果正确

        2.代码运行完毕，结果不正确

        3.代码异常终止

对于这三种情况，作为用户怎样才能知道某个进程是以什么样的形式退出的呢？那么就有了退出码的概念。 Linux 系统中，程序可以在执行终止后传递值给其父进程，这个值被称为退出码。用户就可以通过相应的退出码，对进程退出状态做以判断。

例如，我们的main函数，每次都会写上 return 0； 其实他就是进程的退出码。我们可以通过 echo $? 来获取最近一次进程退出时的退出码。

[mlg@VM-20-8-centos lesson4-进程控制]$ echo $? //获取退出码

除了main函数以外，我们在命令行中输入的指令它也是进程，指令的正确与否也会有相应的退出码。例如：我们在命令行中输入正确的指令和错误的指令，分别查看一下对应的退出码。

从上图的结果，验证了进程不同的退出状态，对应了不同的退出码。每个退出码都有对应的信息，我们用 0 表示 success、!0 表示 failed。正常退出就只有一种，异常退出会对应不同的值，匹配相应的错误信息。

2.如何查看退出码对应的错误信息

在C语言中有这样一个函数 --- strerror，它是将对应的数字转换为对应的错误信息

3.进程常见的退出方法

1.return退出

刚刚我们已经介绍过main函数是通过return退出进程，需要注意以其他函数（非main函数）return进行区分，非main函数的return是函数返回，而main函数的return是进程退出。

2.exit( )退出

相信大家对exit函数也并不陌生，它也是用来进程退出的，有所不同的是，exit函数可以在代码中的任何位置退出进程。
#include <unistd.h>
void exit(int status);

对于上面的代码，我们想要打印的内容并没有立即打印出来，这是因为数据被暂时保存在了输出缓存区中，无论是exit还是return在进程退出前都会刷新缓存区。

3._exit( )退出

除了上面两种方法来退出进程，我们还可以使用_exit函数来使进程退出。也是可以在代码中的任何位置终止进程，但是_exit函数终止进程时，是强制终止，不会进行进程的后续收尾工作，如：刷新缓冲区。
#include <unistd.h>
void _exit(int status);
//参数：status 定义了进程的终止状态，父进程通过wait来获取该值

exit最后也会调用_exit, 但在调用_exit之前，还做了其他工作：

        1. 执行用户通过 atexit或on_exit定义的清理函数。

        2. 关闭所有打开的流，所有的缓存数据均被写入

        3. 调用_exit

atexit函数和on_exit函数：注册一个在正常进程终止时调用的函数

4.return、exit 和 _exit 的区别

1._exit()执行后会立即返回给内核，而exit()要先执行一些清除操作，然后将控制权交给内核。

2.调用_exit()函数时，其会关闭进程所有的文件描述符，清理内存，以及其他一些内核清理函数，但不会刷新流（stdin 、stdout、stderr）。exit()函数是在_exit()函数上的一个封装，它会调用_exit，并在调用之前先刷新流。

3.return是一种更常见的退出进程方法。执行return（num）等同于执行exit（num）,因为调用main的运行时函数会将main的返回值当做 exit的参数。

以上是正常退出的情况，和进程的退出码①有关；

对于进程的异常退出，就是程序执行了一半后由于地址访问错误、主动终止进程（通过kill -9或ctrl+c 信号②直接在进程运行中，杀掉进程）或代码错误等。（注：这里的①、②是标记，和下文status有关）

三、进程等待

1.进程等待的必要性

1.子进程退出，父进程如果不获取到子进程的退出信息，就可能造成 僵尸进程 的问题，进而造成内存泄漏。

2.进程一旦变成僵尸状态，所谓的 kill -9 也无能为力，因为谁也没有办法杀死一个已经死去的进程。

3.父进程派给子进程的任务完成的如何，我们需要知道。如，子进程运行完成，结果对还是不对，或者是否正常退出。

4.父进程通过进程等待的方式，回收子进程资源，获取子进程退出信息。

2.进程等待方法

1.wait方法

函数原型以及所需头文件
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *status);
返回值：等待成功则返回等待进程的PID，等待失败，返回-1；

参数：输出型参数，获取子进程退出状态,不关心则可以设置成为NULL


#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
/*
    代码含义：通过fork创建子进程，实现5次打印，然后终止掉子进程，子进程便处于僵尸状态。同时父进程是处于等>    待状态的，在10秒后开始对子进程进行处理（也就是获取子进程的pid），处理结束，子进程退出。父进程此时再次等    待10秒后退出。                                                                                         
*/
int main()
{
    pid_t id = fork();
    if(id == 0){
        int ret = 5;
        while(ret){
            printf("child[%d] is running：ret is %d\n", getpid(), ret);
            ret--;
            sleep(1);
        }
        exit(0);
    }
    sleep(10);
    printf("father wait begin..\n");
    pid_t cur = wait(NULL);
    if(cur > 0){
        printf("father wait：%d success\n", cur);
    }
    else{
        printf("father wait failed\n");
    }
    sleep(10);
}

对以上代码编译之后，编写一个shell脚本，进行进程的持续检测。
[mlg@VM-20-8-centos lesson4-进程控制]$ while :; do ps axj | head -1 && ps axj | grep mytest | grep -v grep; sleep 1; echo "**********************"; done

2.waitpid方法

函数原型以及所需头文件
#include <sys/types.h>
#include <sys/wait.h>
 
pid_t waitpid(pid_t pid, int *status, int options);
返回值：

      当正常返回的时候waitpid返回收集到的子进程的进程ID；

      如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0；

      如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在；

参数：

pid：

        Pid=-1,等待任一个子进程。与wait等效。

        Pid>0.等待其进程ID与pid相等的子进程。

status:

        WIFEXITED(status): 若为正常终止子进程返回的状态，则为真。（查看进程是否是正常退出）

        WEXITSTATUS(status): 若WIFEXITED非零，提取子进程退出码。（查看进程的退出码）

options:

        WNOHANG: 若pid指定的子进程没有结束，则waitpid()函数返回0，不予以等待。若正常结束，则返回该子进程的PID。


#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
/*
    代码含义：通过fork创建子进程，实现5次打印，然后终止掉子进程，子进程便处于僵尸状态。同时父进程是处于等>    待状态的，在10秒后开始对子进程进行处理（也就是获取子进程的pid），处理结束，子进程退出。父进程此时再次等    待10秒后退出。                                                                                         
*/
int main()
{
    pid_t id = fork();
    if(id == 0){
        int ret = 5;
        while(ret){
            printf("child[%d] is running：ret is %d\n", getpid(), ret);
            ret--;
            sleep(1);
        }
        exit(0);
    }
    sleep(10);
    printf("father wait begin..\n");
    //pid_t cur = waitpid(id, NULL, 0);//等待指定一个子进程
    pid_t cur = waitpid(-1, NULL, 0);//等待任意一个子进程
    if(cur > 0){
        printf("father wait：%d success\n", cur);
    }
    else{
        printf("father wait failed\n");
    }
    sleep(10);
}

结果和wait一样

3.获取子进程status

1.什么是status

int* status：它是一种输出型的参数

所谓获取子进程的status，就是获取子进程退出时的退出信息；

首先，在子进程中分别用exit(0)和exit(10)来中断子进程，父进程获取status值，判断进程的退出状态。


#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
 
int main()
{
    pid_t id = fork();
    if(id == 0){
        int ret = 3;
        while(ret){
            printf("child[%d] is running：ret is %d\n", getpid(), ret);
            ret--;
            sleep(1);
        }
        exit(0);//比较exit(10)或任意值
    }
    printf("father wait begin..\n");
    int status = 0;
    pid_t cur = waitpid(id, &status, 0);
    if(cur > 0){
        printf("father wait：%d success，status：%d\n", cur, status);
    }
    else
        printf("father wait failed\n");
    }
}

        通过上面的运行结果，我们本来以为status应该是0和10，但和预期的结果却有所不同。这里我们仔细思考一下： 父进程拿到什么样的status结果，一定是和子进程如何退出强相关的。子进程退出问题不就是进程退出嘛。

进程退出不就是三种情况：

        1.代码运行完毕，结果正确

        2.代码运行完毕，结果不正确

        3.代码异常终止

也就是父进程只要通过status反馈出这三种情况，做出相应的决策。

所以代码中的 int status 就不能简单的理解为单纯的整数了！！！！！！

2.status的构成

在上文中，我们对status有了一定的了解后，接下来谈一谈status的构成。

status是由32个比特位构成的一个整数，目前阶段我们只使用低16个位来表示进程退出的结果，如下图所示，就是status低16位的表示图；

进程正常退出有两种，与退出码有关，异常退出与信号有关；（结合上文的进程退出的概念）所以这里我们就需要获取到两组信息：退出码与信号；如果没有收到信号，就表明我们所执行的代码是正常跑完的，然后在判断进程的退出码，究竟是何原因使进程结束的；反之则是异常退出，也就不需要关心退出码了；

3.如何获取status

结合下图，我们用次低8位表示进程退出时的退出状态，也就是退出码；用低7位表示进程终止时所对应的信号；

此时，我们想要拿到这个退出码和信号的值，我们是不是只要拿到了这低16个比特位中的次低8位和低7位就可以了；具体操作如下图所示


status exit_code = (status >> 8) & 0xFF; //退出码
status exit_code = status7 & 0x7F;       //退出信号

接下来将上面的代码重新整理如下，测试子进程的退出状态时的退出码及是否获取到了信号


#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
 
int main()
{
    pid_t id = fork();
    if(id == 0){
        int ret = 3;
        while(ret){
            printf("child[%d] is running：ret is %d\n", getpid(), ret);
            ret--;
            sleep(1);
        }
        exit(10);
    }
    printf("father wait begin..\n");
    int status = 0;
    pid_t cur = waitpid(id, &status, 0);
    if(cur > 0){
        printf("father wait：%d success, status exit_code：%d, status exit_signal：%d\n", cur, (status >> 8)& 0xFF, status & 0x7F);
    }
    else
        printf("father wait failed\n");
    }
}

通过运行结果可以看出，刚好与我们所给的退出码对应，并且没有接受到信号，意味着正常退出，但是这里我们所给的退出码是10，至于退出码的含义可以自由设定。

综上所述，我们理解一下进程退出的三种情况：

1.代码运行完毕，结果正确；对应如下：

2.代码运行完毕，结果不正确；对应如下：

3.代码异常终止；对应如下：

接下来我们在看一段代码以及运行结果：

我们通过这三张图，可以发现，命令行解释器（bash）能够获取到退出码，并且bash是命令行启动的所有进程的父进程（不难看出，我们通过进程查看7120，相应的进程就是bash）所以，bash也一定是通过子进程去执行这段程序，也一定通过wait方式得到子进程的退出结果，刚好我们能看到echo $?能够查到子进程的退出码！

其实这里就是想说，系统也是有自带的，能够获取退出码与退出信号的宏
WIFEXITED(status): 若为正常终止子进程返回的状态，则为真。（查看进程是否是正常退出）
WEXITSTATUS(status): 若WIFEXITED非零，提取子进程退出码。（查看进程的退出码）


#include <stdio.h>                                                          
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
 
int main() {
    pid_t id = fork();
    if(id == 0){
        int ret = 3;
        while(ret){                                  
            printf("child[%d] is running：ret is %d\n", getpid(), ret);
            ret--;
            sleep(1);                          
        }            
        exit(1);         
    }                                   
    printf("father wait begin..\n");
    int status = 0;
    pid_t cur = waitpid(id, &status, 0);                           
    if(cur > 0){                                                 
        if(WIFEXITED(status)){//没有收到任何退出信号的    
            //正常结束，获取对应的退出码
            printf("exit code：%d\n",WEXITSTATUS(status));
        }                                                                   
        else{
            printf("error：get a signal！\n");
        }             
    }
}

4.阻塞等待与非阻塞等待

这里我们所讲的阻塞等待和非阻塞等待，其实就是waitpid函数的第三个参数，我们之前并未提及，直接给的是0，这种是默认行为，阻塞等待；如果设置为WNOHANG，表示的是非阻塞等待方式。

阻塞等待：父进程一直在等待子进程，什么事都不干，直到子进程正常退出。

非阻塞等待：父进程的PCB由运行队列转变为等待队列，直达子进程结束，操作系统获取到子进程退出的信号时，再将父进程从等待队列中调度到运行队列，由父进程去获取子进程的退出码以及退出信号。


//基于阻塞等待的轮询访问
#include <stdio.h>                                                          
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
int main() 
{                                                       
    pid_t id = fork();                                             
    if(id == 0){                                                   
        int ret = 10;                                                                                                                                               
        while(ret){
            printf("child[%d] is running：ret is %d\n", getpid(), ret);
            ret--;
            sleep(1);
        }
        exit(1);
    }
 
    int status = 0;
    while(1){  
    pid_t cur = waitpid(id, &status, WNOHANG);
    if(cur == 0){
        //子进程没有退出，但是waitpid等待是成功的，需要继续重复进行等待
        printf("Do father things!\n");
    }
    else if(cur > 0){
        //子进程退出了，waipid也成功了，获取到了对应的结果
        printf("father wait：%d success, status exit_code：%d, status exit_signal：%d\n", cur, (status >> 8)& 0xFF, status & 0x7F);
        break;
    }
    else{
        //等待失败了
        perror("waitpid");
        break;
    }
    sleep(1);
    }                                                    
}

从运行结果可以看出，父进程在不断的查看子进程是否退出，若未退出，则父进程先去忙自己的事情，过一段时间再来查看，直到子进程退出后读取子进程的退出信息。

四、进程程序替换

1.替换原理

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。

从上图可以看出，进程程序替换前后，进程本身并没有发生任何变化，只是所执行的代码发什么改变。

如果子进程进行程序替换，会影响父进程的代码和数据吗？

不会，首先进程是具有独立性的，虽然子进程共享父进程的代码和数据，但是由于进行了函数替换，发生了代码和数据的修改，此时就会进行写时拷贝。所有子进程进行程序替换时，并不会影响父进程的代码和数据。

2.替换函数

其实有六种以exec开头的函数,统称exec函数: 他们所需的头文件均为 #include <unistd.h>

1.execl函数


int execl(const char *path, const char *arg, ...);
// path --- 可执行程序的路径
// arg --- 可变参数列表，表示你要如何执行这个程序，并以NULL结尾
// 例如：
execl("/usr/bin/ls", "ls", "-a", "-l", NULL);

2.execlp函数


int execlp(const char *file, const char *arg, ...);
// file --- 可执行程序的名字
// arg --- 可变参数列表，表示你要如何执行这个程序，并以NULL结尾
// 例如：
execlp("ls", "ls", "-a", "-l", NULL);

3.execle函数


int execle(const char *path, const char *arg, ..., char * const envp[]);
// path --- 可执行程序的路径
// arg ---  可变参数列表，表示你要如何执行这个程序，并以NULL结尾
// envp --- 自己维护的环境变量
 
// 例如：
char* envp[] = { "Myval=12345", NULL };
execle("./myexe", "myexe", NULL, Myval);

4.execv函数


int execv(const char *path, char *const argv[]);
// path --- 你要执行程序的路径
// argv --- 指针数组，数组当中的内容表示你要如何执行这个程序，数组以NULL结尾
 
// 例如：
char* argv[] = { "ls", "-a", "-l", NULL };
execv("/usr/bin/ls", argv);

5.execvp函数


int execvp(const char *file, char *const argv[]);
// file --- 你要执行程序的名字
// argv --- 指针数组，数组当中的内容表示你要如何执行这个程序，数组以NULL结尾
 
// 例如：
char* argv[] = { "ls", "-a", "-l", NULL };
execvp("ls", argv);

6.execve函数


int execvpe(const char *file, char *const argv[], char *const envp[]);
// file --- 你要执行程序的路径
// argv --- 指针数组，数组当中的内容表示你要如何执行这个程序，数组以NULL结尾
// envp --- 自己维护的环境变量
 
//例如：
char* argv[] = { "mycmd", NULL };
char* envp[] = { "Myval=12345", NULL };
execve("./myexe", argv, envp);

3.函数解释

这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回。

如果调用出错则返回-1

所以exec函数只有出错的返回值而没有成功的返回值。也就是说，exec系列函数只要返回了，就意味着调用失败。

4.命名理解

这些函数原型看起来很容易混,但只要掌握了规律就很好记。

l(list) : 表示参数采用列表
v(vector) : 参数用数组
p(path) : 有p自动搜索环境变量PATH
e(env) : 表示自己维护环境变量

函数名	参数格式	是否带路径	是否使用当前环境变量
execl	列表	不是	是
execlp	列表	是	是
execle	列表	不是	不是，须自己装环境变量
execv	数组	不是	是
execvp	数组	是	是
execve	数组	不是	不是，须自己装环境变量

事实上，只有execve才是真正的系统调用，其它五个函数最终都是调用的execve，所以execve在man手册的第2节，而其它五个函数在man手册的第3节，也就是说其他五个函数实际上是对系统调用execve进行了封装，以满足不同用户的不同调用场景的。

下图为exec系列函数族之间的关系：

相关阅读:
【入门】初识深度学习
 特殊类设计
 Spring Boot的魔法：构建高性能Java应用
 玩转华为ENSP模拟器系列 | IPSec网关负载分担双机热备，隧道之间不备份
 ElasticSearch从入门到精通--第五话（整合SpringBoot高效开发、分页高亮等、Kibana使用篇）
微信小程序合集7（体育赛事+高仿知乎+微赞论坛+数独游戏+小熊日记）
hdfsClient_java对hdfs进行上传、下载、删除、移动、打印文件信息尚硅谷大海哥
 dubbo核心源码流程分析
 深度强化学习与APS的一些感想
 JS实现：统计字符出现频率/计算文字在文本中的出现次数
原文地址：https://blog.csdn.net/sjsjnsjnn/article/details/125581083