进程:是动态的,是程序的一次执行过程。同一个程序多次执行会对应多个进程。当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的PID(进程ID)。
操作系统要记录PID、进程所属用户ID(UID),还要记录给进程分配了哪些资源(如:分配了多少内存、正在使用哪些I/O设备、正在使用哪些文件),以及记录进程的运行情况(如:CPU使用时间、磁盘使用情况、网络流量使用情况等)
分别对应:基本的进程描述信息,可以让操作系统区分各个进程;可以用于实现操作系统对资源的管理;可用于实现操作系统对进程的控制、调度
以上信息都被保存在一个数据结构PCB中,即进程控制块
操作系统需要对各个并发运行的进程进行管理,但凡管理时所需要的信息,都会被放在PCB中
PCB是给操作系统用的。程序段、数据段是给进程自己使用的。
一个进程实体(进程映像)由PCB、程序段、数据段组成。
进程是动态的,进程实体(进程映像)是静态的。
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
一个进程被“调度”,就是指操作系统决定让这个进程上CPU运行。
进程的特征:
进程的状态—创建态、就绪态
进程正在被创建时,它的状态是“创建态”,在这个阶段操作系统会为进程分配资源、初始化PCB
当进程创建完成后,便进入“就绪态”,处于就绪态的进程已经具备运行条件,但由于没有空闲CPU,就暂时不能运行
系统中可能会有很多个进程都处于就绪态,当CPU空闲时,操作系统就会选择一个就绪进程,让它上处理机运行
如果一个进程此时在CPU上运行,那么这个进程处于“运行态”。CPU会执行该进程对应的程序(执行指令序列)
在进程运行的过程中,可能会请求等待某个事件的发生(如等待某种系统资源的分配,或者等待其他进程的响应)。在这个事件发生之前,进程无法继续往下执行,此时操作系统会让这个进程下CPU,并让他进入“阻塞态”。
当CPU空闲时,又会选择另一个“就绪态”进程上CPU运行
进程的整个生命周期中,大部分时间都处于三种基本状态
单CPU情况下,同一时刻只会有一个进程处于运行态,多核CPU情况下,可能有多个进程处于运行态
进程PCB中,会有一个变量state来表示进程的当前状态。
进程的组织–链接方式
进程的组织–索引方式
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能
使用原语来实现进程控制,因为原语的执行具有原子性,即执行过程只能一气呵成,期间不允许被中断
可以用“关中断指令”和“开中断指令”这两个特权指令实现原子性
运行环境就是一些必要的寄存器信息,用于切换进程时保存上一个进程存储在寄存器中的中间结果
无论哪个进程控制原语,要做的无非三类事:
进程间通信(IPC)是指两个进程之间产生数据交互。
进程间通信需要操作系统的支持
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。
为了保证安全,一个进程不能直接访问另一个进程的地址空间。
共享存储
Linux中通过shm_open系统调用,申请一片共享内存区,通过mmap系统调用,将共享内存区映射到进程自己的地址空间,通过“增加页表项/段表项”即可将同一片共享内存区映射到各个进程的地址空间中。
为避免出错,各个进程对共享空间的访问应该是互斥的,各个进程可使用操作系统内核提供的同步互斥工具(如P、V操作)
基于存储区的共享:操作系统在内存中划出一块共享存储区,数据的形式、存放位置都由通信进程控制,而不是操作系统。这种共享方式速度很快,是一种高级通信方式。
基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式。
消息传递
进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换
直接通信方式
间接通信方式
那么多个进程往同一个信箱send消息,也可以多个进程从同一个信箱中receive消息
管道通信
“管道”是一个特殊的共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的内存缓冲区。
传统的进程是程序执行流的最小单位。
引入线程后,线程成为了程序执行流的最小单位
线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务。
引入线程后,进程只作为除CPU之外的系统资源的分配单元。
线程的属性
线程的实现方式、多线程模型
用户级线程(ULT)
早期的操作系统只支持进程,不支持线程。当时的“线程”是由线程库实现的。
从代码的角度看,线程其实就是一段代码逻辑。一个while循环就是一个最弱智的“线程库”,线程库完成了对线程的管理工作(如调度)。
很多编程语言提供了强大的线程库,可以实现线程的创建、销毁、调度等功能。
内核级线程(KLT):由操作系统支持的线程
多线程模型
在支持内核级线程的系统中,根据用户级线程和内核级线程的映射关系,可以划分为多个多线程模型
一对一模型:一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并发执行
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
多对一模型:多个用户级线程映射到一个内核级线程。且一个进程只被分配到一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并发运行
重点:操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位
多对多模型:n用户级线程映射到m个内核级线程(n>=m)每个用户进程对应m个内核级线程
克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点
可以这么理解:用户级线程是“代码逻辑”的载体;内核级线程是“运行机会”的载体。
只有所有内核级线程都被阻塞时,进程才算是被阻塞