


程序段、数据段、PCB三部分组成了进程实体(进程映像)。一般情况下,我们把进程实体就简称为进程,例如,所谓创建进程,实质上是创建进程实体中的PCB;而撤销进程,,实质上是撤销进程实体中的PCB。注意:PCB是进程存在的唯一标志!
从不同的角度,进程可以用不同的定义,比较传统的典型的定义有:
所有的定义,就是都强调进程的动态性。
在引入进程实体的概念后,可把进程定义为:
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
注意:严格来说,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。不过一般来说都可以认为进程就是进程实体。因此我们可以说:进程是由程序段、数据段和PCB三部分组成的。
进程(进程实体)由程序段、数据段、PCB三部分组成。



在一个系统中,通常有数十、数百万乃至数千个PCB。为了能够对它们加以有效的管理,应该用适当的方式把这些PCB组织起来。
注意:进程的组成讨论的是一个进程内部有哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题。



进程和程序是两个截然不同的概念,相比于程序,进程拥有以下特征:



进程是程序的一次执行。在这个执行过程中,有时进程正在被CPU处理,有时有需要等待CPU服务,可见,进程的状态会有各种变化。为了方便讨论各个进程的管理,操作系统需要将进程合理地划分为几种状态。
进程的三种基本状态:

需要注意的是:
另外的两种状态:

首先,一个程序想要在计算机上运行的话,在他开始开始运行之前,其实操作系统需要做一些新建进程初始化的工作,需要为这个新的进程分配他所需要的内存空间等系统资源,并为其创建初始化PCB(如:为进程分配PID)。等到一系列的工作做完之后,进程才会正式的被投入到运行。
而这个过程就叫做进程的创建态。
当进程运行结束(或者由于bug导致进程无法继续执行下去,比如数组越界错误),需要撤销进程,这个过程就叫做进程的终止态。而撤销进程不是一瞬间完成的,操作系统需要回收分配给这个进程的资源,另外还需要回收分配给这个进程的内存区域,最后删除进程的PCB程序控制块,这样的话才完成进程撤销的工作。
所以进程除了最基本的状态,还有另外两种状态:

思考:什么情况下需要转换进程状态?
首先,我们从进程从无到有说起:



进程的控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新的进程、撤销已有进程、实现进程状态转换等功能。
简化理解:反正进程控制就是实现进程状态转换。



比如,从终止态到就绪态转换的时候,需要进行修改PCB内容和并把它添加到就绪队列中,但是此时由于某种异常导致进程并没有被添加到就绪队列,就导致进程的PCB内容和就绪队列的信息不一致,就会出现系统异常。
为了解决上述的问题。操作系统用原语实现进程控制。原语的特点是执行期间不允许被中断,只能一气呵成。这种不可被中断的操作即原子操作。原语采用“关中断指令”和“开中断指令”实现。

学习技巧:进程控制会导致进程状态的转换。无论哪个原语,要做的无非三类事情:
更新PCB中的信息(如修改进程状态标志、将运行环境保存到PCB、从PCB恢复运行环境)
将PCB插入合适的队列
分配/回收资源






顾名思义,进程通信就是指进程之间消息交换。进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。

为了保证安全,一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法。比如,共享存储、消息传递、管道通信。

两个进程对共享空间的访问必须是互斥的(互斥访问通过操作系统提供的工具实现)。操作系统只负责提供共享空间和同步互斥工具(如P、V操作)。
对于共享存储有两种类型的共享。
基于数据结构共享:比如空想空间只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式。
基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程空坠,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。

管道是指用于连续读写进程的一个共享文件,又名pipe文件。其实就是在内存总开辟一个大小固定的缓冲区。
进程间的书就交换以格式化的消息(Message)为单位。进程间通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。




在现实中,我们使用QQ,既可以一边文字聊天、视频、传送文件。显然有的进程可能需要”同时“做很多事情,而传统的进程只能串行地执行一系列程序。为此,引入了“线程”,来增加并发度。

线程我们也可以理解为“轻量级的进程”。线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程之后,不仅是线程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,是的一个进程内可以并发处理各种任务(如QQ视频、文字聊天、传文件)。

引入线程后,进程只做为除CPU之外系统资源分配的基本单位(如打印机、内存地址空间等都是分配给进程的)。



用户线程是由应用程序通过线程库实现。所有的线程灌流工作都由应用程序负责(包括线程切换)。
用户级别的线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。(用户级线程对用户不透明,对操作系统透明)。
可以理解为,“用户级别的线程”就是“从用户视角能看到的线程”。

内核级线程的管理工作由操作系统内核完成,线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
可以这样理解,”内核级线程“就是“从操作系统内核视角能看得到的线程”。
在同时支持用户级线程和内核级线程的系统中,可采用二者组合的方式:将n各用户级线程映射到m个内核级线程上(n>=m)。

重点:由于操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机(CPU)分配的单位。
例如:如上图,该进程由两个内核级线程、三个用户级线程组成,在用户看来,这个进程中有三个线程。但即使该进程在一个4核处理机的计算机上运行,也最多只能被分配到两个核,最多只能有两个用户级别的线程并行执行。
在同时支持用户级线程和内核级线程的系统中,由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”。

多对一模型:多个用户级线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
优点:用户级线程的切换在用户空间就可以完成,不需要切换到核心态,线程管理的系统开销小,效率高。
缺点:当一个用户级线程被阻塞,整个线程都会被阻塞,并发度不高。多个线程不可在多核处理机上并发运行。

一对一模型:一个用户级线程对应一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换有操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
在同时支持用户级线程和内核级线程的系统中,由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”问题。

克服了多对一模型并发度不高的缺点,有克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。
