• 【Linux】关于进程的理解、状态、优先级和进程切换


    📝一、操作系统进程

    进程不同的状态本质都是在满足不同的运行场景的

    1.运行队列

    • 运行队列

    进程如何在CPU上运行的:CPU在内核上维护了一个运行队列,进行进程的管理。让进程入队列,本质就是将该进程的task_struct 结构体对象放入运行队列之中。

    2.运行状态

    • 运行状态

    进程PCB在运行队列里就是运行状态,不是说这个进程正在运行,才是运行状态。

    状态是进程内部的属性,所有的属性在PCB里

    进程不只是意味着占用CPU资源,也有可能随时要外设资源

    • 阻塞状态

    进程不在运行队列之中,进程不能直接被调度,而是在等待外设资源的状态。本质是对tack_struct对象放到不同的队列中!

    综上,所谓的进程不同的状态,本质是进程在不同的队列之中,等待某种资源

    • 挂起状态

    如果系统中存在许多进程,进程短期内不会被调度,代码和数据在短期内不会被执行,此时如果内存空间不足,操作系统就可以把代码和数据暂时保存到磁盘上,节省一部分空间,该进程暂时被挂起了,这就是挂起状态。

    对于阻塞状态和挂起状态,阻塞不一定挂起,挂起一定是阻塞

    这些都是概念性的,对于Linux下具体的又是什么样子的呢👇


    📝二、Linux进程状态

    为了弄明白正在运行的进程是什么意思,我们需要知道进程的不同状态。一个进程可以有几个状态(在Linux内核里,进程有时候也叫做任务)。下面的状态在kernel源代码里定义

    /*
    * The task state array is a strange "bitmap" of
    * reasons to sleep. Thus "running" is zero, and
    * you can test for combinations of others with
    * simple bit tests.
    */
    static const char * const task_state_array[] = {
    "R (running)", /* 0 */
    "S (sleeping)", /* 1 */
    "D (disk sleep)", /* 2 */
    "T (stopped)", /* 4 */
    "t (tracing stop)", /* 8 */
    "X (dead)", /* 16 */
    "Z (zombie)", /* 32 */
    };
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    R运行状态(running)、S睡眠状态(sleeping) 、D磁盘休眠状态(Disk sleep) 、T停止状态(stopped) 、X死亡状态(dead)

    我们来一起看看Linux下运行状态(R)的样子:

    image-20221106001411809

    创建myprocess.c:

    image-20221106001429115

    image-20221106001200735

    修改一下:

    image-20221106001602908

    image-20221106001733184

    这是因为printf需要去访问外设显示器,外设比较慢,需要等待花时间(相对于CPU而言)。

    我们可以来看看T状态

    image-20221106120848698

    而对于S来说是浅度睡眠,可以被终止,D是深度睡眠,无法被OS杀掉,只能通过断电、自己醒来进行解决。这里简单了解一下即可。

    t状态:

    image-20221109214226435

    这也是一种暂停状态,tracing stop表示该进程正在被追踪


    📝三、两个特殊进程

    进程退出的时候不能立即释放该进程对应的资源!保存一段时间,让对应的父进程/操作系统进行读取

    1.僵尸进程

    僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程没有读取到子进程退出的返回代码时就会产生僵死(尸)进程

    下面,我们可以通过具体的例子来看一看僵尸进程,进程退出,但是没有被回收(父进程、OS)。我们可以通过创建一个子进程,让父进程不退出,让子进程正常退出(exit(1)):

    image-20221109225943797

    监控脚本命令:

    while :; do ps axj | head -1 && ps axj | grep myprocess | grep -v grep; sleep 1; done
    
    • 1

    image-20221109231634937

    右侧运行一段时间后出现Z状态:

    image-20221109231754781

    defunct的意思是失效的,也就是进程是已经死亡的,但是没有被回收。把左侧终止,在执行上面监视的命令,就不存在上面的进程了,这是因为把父子进程都终止的时候,操作系统自动回收了

    image-20221109232325299

    这就是僵尸进程。内存泄漏不仅仅只体现在malloc\new上,在系统中也会存在。

    僵尸进程的危害

    进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。父进程如果一直不读取,那子进程就一直处于Z状态
    维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_struct(PCB)中,换句话说, Z状态一直不退出, PCB一直都要维护
    那一个父进程创建了很多子进程,就是不回收,就会造成内存资源的浪费,因为数据结构对象本身就要占用内存,想想C中定义一个结构体变量(对象),是要在内存的某个位置进行开辟空间

    2.孤儿进程

    父进程先退出,子进程就称之为“孤儿进程”

    孤儿进程被1号init进程领养,由init进程回收。

    话不多说,我们直接通过一小段代码来看一看:

    image-20221109235121461

    先来看一看z状态(杀掉子进程):

    image-20221111083752869

    现在重新启动进程(杀掉父进程):

    image-20221111084248656

    父进程结束掉没有看到它的僵尸状态:父进程也有父进程,都是bash的子进程,所以bash这个进程把父进程的资源回收了

    image-20221111084728120

    此时的30418变成1了:1就是对应的操作系统。子进程被1号领养的就是孤儿进程。

    父进程先退出的现象是一定存在的,子进程会被操作系统领养(1号进程),这是为了回收子进程退出的时候对应的僵尸,管理子进程

    被领养的进程就是孤儿进程。

    image-20221111085235791

    同时,子进程以前的状态是S+,现在变成了S,如果前台进程创建的子进程,如果变成孤儿会自动变成后台(此时用ctrl+C杀不掉,只能用kill解决)

    image-20221111085827532


    📝四、进程优先级

    1.优先级概念

    • 优先级

    对于优先级的理解,决定的是对于获取资源的先后顺序的能力。优先级高的先获得,优先级低的反之

    存在的原因:资源太少,需要进行分配

    cpu资源分配的先后顺序,就是指进程的优先权(priority)。

    优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用,可以改善系统性能。

    • Linux优先级

    优先级本质就是pcb里面的一个/几个整数数字

    2.查看系统进程

    在linux或者unix系统中,用ps –la命令则会类似输出以下几个内容 :

    image-20221109190746763

    UID : 代表执行者的身份
    PID : 代表这个进程的代号
    PPID :代表这个进程是由哪个进程发展衍生而来的,即父进程的代号
    PRI :代表这个进程可被执行的优先级,其值越小越早被执行(就像成绩排名一样,越小越好)
    NI :代表这个进程的nice值

    3.PRI和NI

    在Linux中由两个整数确定优先级:PRI(priority)和NI(nice)

    在Linux下可以认为最终的优先级= 老的优先级+NI

    注意:Linux下老的优先级默认值为80!而NI也就是nice值也有取值范围。取值范围是[-20,19],也就意味着优先级是有取值范围的[80-21,80+19]对于nice值的取值范围我们后面会做演示

    在Linux下支持进程在运行中进行优先级调整的,调整的策略就是更改nice完成的,也就是说会受到nice值影响(但是一般情况下不修改)

    但是大部分情况下,nice值是默认的也就是0:

    image-20221109150904318

    image-20221109150437211

    这里的PRI优先级是80,下面我们可以对其进行更改

    4.top命令更改nice

    步骤1:sudo top

    步骤2:进入top后输入r然后在输入进程的pid(进入进程)输入要修改nice的值

    image-20221109151156968

    image-20221109183003773

    这里还是80,下面开始用top对其进行更改(输入sudo top然后在输入r):

    image-20221109183048484

    image-20221109183208442

    • 开始修改值

    在输入要修改的值,这里以-100为例子,出现以下情况(最终变成-20):

    image-20221109183627209

    这里在修改成100,出现以下情况(最终变成19):

    image-20221109183951376

    注意:调优先级并不意味着你可以随便调,这是操作系统不允许的,会导致调度失衡。所以有着一定的取值范围

    nice的取值范围是[-20,19],一共40个数字

    如上就是Linux优先级的内容,这里简单了解一下。

    5.特性

    竞争性:系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争属性的。为了高效完成任务,更合理竞争相关资源,便具有了优先级
    独立性:多进程运行,需要独享各种资源,多进程运行期间互不干扰
    并行:多个进程在多个CPU下分别,同时进行运行,这称之为并行
    并发:多个进程在一个CPU下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为并发

    这里的独立性对于父进程和子进程是否还是存在?yes

    int main()
    {
        pid_t id = fork();
        if(id == 0)
        {
            while(1)
            {
                printf("this is child process,pid: %d,ppid:%d\n",getpid(),getppid());
                sleep(1);
                int *p = NULL;
                *p = 100;//野指针                                                           
             }
         }
        else
        {
            while(1)
              {
                  printf("this is parent process,pid:%d,ppid:%d\n",getpid(),getppid());
                  sleep(1);
              }
        }
    }
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23

    image-20221109211938883

    image-20221111095307832

    子进程崩溃并没有影响父进程


    📝五、进程切换

    1.并发

    多进程在同一CPU下通过采用进程不断切换的方式让一个单CPU计算机在一个时间段内同时让多个进程代码同时推进的现象称为并发

    采用进程切换的方式在一个时间段内不同的进程都可以把代码跑起来,同时推进

    2.进程如何切换

    一个CPU里面存在一套硬件寄存器,宏观上寄存器分为用户可见,用户不可见

    计算机调度某个进程时,CPU会把这个进程的PCB地址加载到某个寄存器,也就是说,CPU内有寄存器可以只找到进程的PCB地址

    CPU里有一个eip寄存器(PC指针),指向当前执行指令的下一条指令的地址。

    而进程运行的时候一定会产生很多的临时数据,但这些临时数据只属于当前进程,虽然CPU内部只有一套寄存器硬件,但是寄存器保存的数据只属于当前进程,也就是说,寄存器硬件不是寄存器内的数据,这是两码事,寄存器被所有进程共享,但是寄存器里的数据时每个进程各自私有的。

    📄时间片引出

    进程在运行的时候占有CPU,但是却不是一直占有到进程结束,进程都有自己的时间片!因为时间片的存在,进程会出现没有被执行完就被拿下去的情况,这时候问题来了:这个进程下一次如何在次回到CPU继续运行:

    进程切换的时候,需要先进行上下文保护,这里的上下文指的是CPU里的寄存器的数据,而不是寄存器,这里简单理解为临时数据保存至PCB里,而当进程恢复运行的时候,要进行上下文的恢复,该进程在次回到CPU继续运行时,重新加载恢复这些数据。

  • 相关阅读:
    pytorch训练加速技巧
    合肥中科深谷嵌入式项目实战——基于ARM语音识别的智能家居系统(三)
    使用C语言实现单链表(不带头节点)
    [软件工具]opencv-svm快速训练助手教程解决opencv C++ SVM模型训练与分类实现任务支持C# python调用
    HTTP 协议的基本格式(部分)
    Python基础库-正则表达式库
    3.eureka的常用application.yml设置(springcloud)
    镜像神经元过于发达的人,镜像神经元优秀的人
    华为机试真题 Java 实现【最大花费金额】
    研发效能负责人/研发效能1号位 |DevOps负责人
  • 原文地址:https://blog.csdn.net/weixin_60478154/article/details/127818925