重学操作系统(二)进程管理

重学操作系统(二)进程管理
2. 进程管理

 2.1 进程的定义、组成、组织方式、特征

2.1.1 进程的定义

程序段、数据段、PCB三部分组成了进程实体（进程映像）。一般情况下，我们把进程实体就简称为进程，例如，所谓创建进程，实质上是创建进程实体中的PCB；而撤销进程，，实质上是撤销进程实体中的PCB。注意：PCB是进程存在的唯一标志！

从不同的角度，进程可以用不同的定义，比较传统的典型的定义有：
- 进程是程序一次的执行过程。
- 进程是一个程序及其数据在处理机（CPU）上顺序执行时所发生的活动。
- 进程时具有独立功能的程序在数据集合上运行的过程，它是系统进行资源分配和调度的一个独立单位。
所有的定义，就是都强调进程的动态性。

在引入进程实体的概念后，可把进程定义为：

进程是进程实体的运行过程，是系统进行资源分配和调度的一个独立单位。

注意：严格来说，进程实体和进程并不一样，进程实体是静态的，进程则是动态的。不过一般来说都可以认为进程就是进程实体。因此我们可以说：进程是由程序段、数据段和PCB三部分组成的。

2.1.2 进程的组成

进程（进程实体）由程序段、数据段、PCB三部分组成。

2.1.3 进程的组织

在一个系统中，通常有数十、数百万乃至数千个PCB。为了能够对它们加以有效的管理，应该用适当的方式把这些PCB组织起来。

注意：进程的组成讨论的是一个进程内部有哪些部分构成的问题，而进程的组织讨论的是多个进程之间的组织方式问题。

2.1.3.1 链接方式

2.1.3.2 索引方式

2.1.4 进程的特征

进程和程序是两个截然不同的概念，相比于程序，进程拥有以下特征：

2.1.5 总结

 2.2 进程的状态与转换

2.2.1 进程的状态

进程是程序的一次执行。在这个执行过程中，有时进程正在被CPU处理，有时有需要等待CPU服务，可见，进程的状态会有各种变化。为了方便讨论各个进程的管理，操作系统需要将进程合理地划分为几种状态。

进程的三种基本状态：

需要注意的是：
- 对于运行态：注意：单核处理机环境下，每一个时刻最多只有一个进程处于运行态。（双核环境下可以同时有两个进程处于运行状态）。
- 对于就绪态：进程已经拥有了除处理机（CPU）之外有需要的资源，一旦获得处理机，即可立即进入运行态开始运行。即：万事具备，之欠CPU。
- 对于阻塞态：比如进程在运行的过程中，会请求操作系统给他分配打印机、等待磁盘操作的结果。CPU是计算机中最昂贵的部件，为了提高CPU的利用率，需要将其他进程需要的资源分配到位，才能得到CPU的服务。
另外的两种状态：

首先，一个程序想要在计算机上运行的话，在他开始开始运行之前，其实操作系统需要做一些新建进程初始化的工作，需要为这个新的进程分配他所需要的内存空间等系统资源，并为其创建初始化PCB（如：为进程分配PID）。等到一系列的工作做完之后，进程才会正式的被投入到运行。

而这个过程就叫做进程的创建态。

当进程运行结束（或者由于bug导致进程无法继续执行下去，比如数组越界错误），需要撤销进程，这个过程就叫做进程的终止态。而撤销进程不是一瞬间完成的，操作系统需要回收分配给这个进程的资源，另外还需要回收分配给这个进程的内存区域，最后删除进程的PCB程序控制块，这样的话才完成进程撤销的工作。

所以进程除了最基本的状态，还有另外两种状态：

思考：什么情况下需要转换进程状态？

2.2.2 进程状态间的转换

首先，我们从进程从无到有说起：

2.2.3 小结

 2.3 进程控制

2.3.1 基本概念

2.3.1.1 什么是进程控制

进程的控制的主要功能是对系统中的所有进程实施有效的管理，它具有创建新的进程、撤销已有进程、实现进程状态转换等功能。

简化理解：反正进程控制就是实现进程状态转换。

2.3.1.2 如何实现进程控制

比如，从终止态到就绪态转换的时候，需要进行修改PCB内容和并把它添加到就绪队列中，但是此时由于某种异常导致进程并没有被添加到就绪队列，就导致进程的PCB内容和就绪队列的信息不一致，就会出现系统异常。

为了解决上述的问题。操作系统用原语实现进程控制。原语的特点是执行期间不允许被中断，只能一气呵成。这种不可被中断的操作即原子操作。原语采用“关中断指令”和“开中断指令”实现。

2.3.2 进程控制相关的原语

学习技巧：进程控制会导致进程状态的转换。无论哪个原语，要做的无非三类事情：
- 更新PCB中的信息（如修改进程状态标志、将运行环境保存到PCB、从PCB恢复运行环境）
- - 所有的进程控制原语一定都会修改进程状态标志
  - 剥夺当前运行进程的CPU使用权，保存当前线程的运行环境信息到PCB
  - 某进程开始运行前必然要恢复期运行环境
- 将PCB插入合适的队列
- 分配/回收资源
2.3.3 小结

 2.4 进程通信

顾名思义，进程通信就是指进程之间消息交换。进程是分配系统资源的单位（包括内存地址空间），因此各进程拥有的内存地址空间相互独立。

为了保证安全，一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信，操作系统提供了一些方法。比如，共享存储、消息传递、管道通信。

2.4.1 共享存储

两个进程对共享空间的访问必须是互斥的（互斥访问通过操作系统提供的工具实现）。操作系统只负责提供共享空间和同步互斥工具（如P、V操作）。

对于共享存储有两种类型的共享。

基于数据结构共享：比如空想空间只能放一个长度为10的数组。这种共享方式速度慢、限制多，是一种低级通信方式。

基于存储区的共享：在内存中画出一块共享存储区，数据的形式、存放位置都由进程空坠，而不是操作系统。相比之下，这种共享方式速度更快，是一种高级通信方式。

2.4.2 管道通信

管道是指用于连续读写进程的一个共享文件，又名pipe文件。其实就是在内存总开辟一个大小固定的缓冲区。
- 管道只能采用半双工通信，某一时间段只能实现单向的传输。如果要实现双向同时通信，则需要设置两个管道。
- 各进程要互斥地访问管道。
- 数据以字符流的形式写入管道，当管道写满时，写进程的write()被系统调用将被阻塞，等待读进程将数据取走。当读进程将数据全部取走完，管道变空，此时读进程的read()系统调用将被阻塞。
- 如果没写满，就不允许读。如果没有读完，就不允许写。
- 数据一旦被读出，就从管道中被抛弃，这就意味着读进程最多只能有一个，否则可能会有读错数据的情况。
2.4.3 消息传递

进程间的书就交换以格式化的消息（Message）为单位。进程间通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。

2.4.4 小结

 2.5 线程概念和多线程模型

2.5.1 什么是线程、为什么要引入线程？

在现实中，我们使用QQ，既可以一边文字聊天、视频、传送文件。显然有的进程可能需要”同时“做很多事情，而传统的进程只能串行地执行一系列程序。为此，引入了“线程”，来增加并发度。

线程我们也可以理解为“轻量级的进程”。线程是一个基本的CPU执行单元，也是程序执行流的最小单位。引入线程之后，不仅是线程之间可以并发，进程内的各线程之间也可以并发，从而进一步提升了系统的并发度，是的一个进程内可以并发处理各种任务（如QQ视频、文字聊天、传文件）。

引入线程后，进程只做为除CPU之外系统资源分配的基本单位（如打印机、内存地址空间等都是分配给进程的）。

2.5.2 引入线程机制后，有什么变化

2.5.3 线程的属性

2.5.4 线程的实现方式

2.5.4.1 用户级线程（User-Level Thread，ULT）

用户线程是由应用程序通过线程库实现。所有的线程灌流工作都由应用程序负责（包括线程切换）。

用户级别的线程中，线程切换可以在用户态下即可完成，无需操作系统干预。

在用户看来，是有多个线程。但是在操作系统内核看来，并意识不到线程的存在。（用户级线程对用户不透明，对操作系统透明）。

可以理解为，“用户级别的线程”就是“从用户视角能看到的线程”。

2.5.4.2 内核级线程（Kernel-Level Thread，KLT，又称“内核支持的线程”）

内核级线程的管理工作由操作系统内核完成，线程调度、切换等工作都由内核负责，因此内核级线程的切换必然需要在核心态下才能完成。

可以这样理解，”内核级线程“就是“从操作系统内核视角能看得到的线程”。

在同时支持用户级线程和内核级线程的系统中，可采用二者组合的方式：将n各用户级线程映射到m个内核级线程上（n>=m）。

重点：由于操作系统只“看得见”内核级线程，因此只有内核级线程才是处理机（CPU）分配的单位。

例如：如上图，该进程由两个内核级线程、三个用户级线程组成，在用户看来，这个进程中有三个线程。但即使该进程在一个4核处理机的计算机上运行，也最多只能被分配到两个核，最多只能有两个用户级别的线程并行执行。

2.5.5 多线程模型

在同时支持用户级线程和内核级线程的系统中，由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”。

2.5.5.1 多对一模型

多对一模型：多个用户级线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。

优点：用户级线程的切换在用户空间就可以完成，不需要切换到核心态，线程管理的系统开销小，效率高。

缺点：当一个用户级线程被阻塞，整个线程都会被阻塞，并发度不高。多个线程不可在多核处理机上并发运行。

2.5.5.2 一对一模型

一对一模型：一个用户级线程对应一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。

优点：当一个线程被阻塞后，别的线程还可以继续执行，并发能力强。多线程可在多处理机上并行执行。

缺点：一个用户进程会占用多个内核级线程，线程切换有操作系统内核完成，需要切换到核心态，因此线程管理的成本高，开销大。

2.5.5.3 多对多模型

在同时支持用户级线程和内核级线程的系统中，由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”问题。

克服了多对一模型并发度不高的缺点，有克服了一对一模型中一个用户进程占用太多内核级线程，开销太大的缺点。

2.5.6 小结
相关阅读:
Kubernetes学习记录之Pod
SpringBoot中自动装配机制
 量子计算在科技浪潮中的引领作用
 Jmeter组件执行顺序与作用域
 3天精通Postman---动态参数&amp；断言&amp；CSV数据驱动&amp；Mock Server
LeetCode第21题—合并两个有序链表
 Unity VSCode一些插件
 Flutter集成个推推送-安卓原生篇
 等级保护差距测评工作实施方案
 u盘无法复制过大文件怎么解决？揭秘！
原文地址：https://blog.csdn.net/weixin_46487176/article/details/126473622

2. 进程管理

2.1 进程的定义、组成、组织方式、特征

2.1.1 进程的定义

2.1.2 进程的组成

2.1.3 进程的组织

2.1.3.1 链接方式

2.1.3.2 索引方式

2.1.4 进程的特征

2.1.5 总结

2.2 进程的状态与转换

2.2.1 进程的状态

2.2.2 进程状态间的转换

2.2.3 小结

2.3 进程控制

2.3.1 基本概念

2.3.1.1 什么是进程控制

2.3.1.2 如何实现进程控制

2.3.2 进程控制相关的原语

2.3.3 小结

2.4 进程通信

2.4.1 共享存储

2.4.2 管道通信

2.4.3 消息传递

2.4.4 小结

2.5 线程概念和多线程模型

2.5.1 什么是线程、为什么要引入线程？

2.5.2 引入线程机制后，有什么变化

2.5.3 线程的属性

2.5.4 线程的实现方式

2.5.4.1 用户级线程（User-Level Thread，ULT）

2.5.4.2 内核级线程（Kernel-Level Thread，KLT，又称“内核支持的线程”）

2.5.5 多线程模型

2.5.5.1 多对一模型

2.5.5.2 一对一模型

2.5.5.3 多对多模型

2.5.6 小结