本文的主要内容是管程的介绍、死锁的概念以及死锁的处理策略,引入管程的目的就是要更方便地实现进程互斥与进程同步,产生死锁需要满足的条件有四个,即互斥条件、不剥夺条件、请求与保持条件以及循环等待条件,而预防死锁时需要破坏其中的一个条件,此外,避免死锁中的银行家算法和死锁的检测和解除也是需要掌握的。
管程是一种高级的同步机制,也是用来解决进程同步和进程互斥问题的。
管程是一种特殊的软件模块(类似于类的概念),其组成有:局部于管程的共享数据结构说明;对该数据结构进行操作的一组过程(这里的过程类似于函数的概念);对局部于管程的共享数据设置初始值的语句;管程有一个名字。
管程的基本特征:
①局部于管程的数据只能被局部于管程的过程所访问;
②一个进程只有通过调用管程内的过程才能进入管程访问共享数据;
③每次仅允许一个进程在管程内执行某个内部过程。
用管程实现生产者消费者问题的代码如下图所示。
有了管程之后,会由编译器负责实现各进程互斥地进入管程中的过程。
引入管程的目的就是要更方便地实现进程互斥与进程同步。在管程中需要做的是:
①定义共享数据(例如生产者消费者问题中的缓冲区);
②定义用于访问这些共享数据的“入口”,这里的“入口”其实就是一些函数;
③只有通过这些特定的“入口”才能访问共享数据;
④管程中有很多“入口”,但是每次只能开放其中的一个,并且只能让一个进程或线程进入(例如生产者消费者问题中,各进程需要互斥地访问缓冲区,管程的这种特性可以保证一个时间段内最多只有一个进程在访问缓冲区,需要注意的是,这种互斥特性是编译器负责实现的);
⑤可以在管程中设置条件变量以及等待和唤醒操作以解决同步问题。一个进程或线程在条件变量上等待,可以通过唤醒操作将等待在条件变量上的进程或线程唤醒。
在 Java 中也有类似于管程的机制,那就是使用关键字 synchronized 来描述一个函数,那么被描述的这个函数一段时间内只能被一个线程所调用。简单的代码示例如下图所示。
对管程这部分内容简单的总结一下,如下图所示。
前面提到的哲学家进餐问题中,如果 5 位哲学家进程并发执行,都拿起左边的筷子,此时,每位哲学家都在等待自己右边的人放下筷子,这些哲学家进程因等待筷子资源而被阻塞,即发生了死锁。如下图所示。
死锁:各进程互相等待对方手里的资源,导致各进程都阻塞无法向前推进的现象。
发生死锁之后,若没有外力的干涉,这些进程都将无法继续向前推进。
饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。例如在短进程优先算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程饥饿。
死循环:某进程执行过程中一直跳不出某个循环的现象,一般是由于程序逻辑错误导致的,但有时也是故意为之,比如 P、V 操作中的死循环。
死锁、饥饿和死循环的共同点和区别如下表所示。
产生死锁必须同时满足下面四个条件,只要其中一项不成立,死锁就不会发生。
①互斥条件。只有对必须互斥使用的资源的争抢才会导致死锁,比如哲学家进餐问题中的筷子、打印机设备等,但是像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的,因为进程不用阻塞等待这种资源。
②不剥夺条件。进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能等待已获得该资源的进程主动释放。
③请求和保持条件。进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但该进程又对自己已有的资源保持不放。
④循环等待条件。存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
需要注意的是,发生死锁时一定有循环等待,但是发生循环等待时未必死锁。如果同类资源数大于1,则即使有循环等待,也未必发生死锁,但如果系统中每类资源都只有一个,那么循环等待就是死锁的充分必要条件了。
那么死锁在什么时候发生呢?
对不可剥夺资源产生不合理的分配时,就会发生死锁。主要的情况有:
①对系统资源的竞争。各进程对不可剥夺资源(比如打印机)的竞争可能引起死锁,但对可剥夺资源(例如CPU)的竞争是不会引起死锁的。
②进程推进顺序非法。请求和释放资源的顺序不当同样也会导致死锁,例如有两个进程 P1、P2 分别申请并占有了资源 R1、R2,之后进程 P1 又申请资源 R2,而进程 P2 又申请资源 R1,两者会因为申请的资源被对方占有而阻塞,从而发生死锁。
③信号量使用不当。之前介绍的经典问题中,如果实现互斥的 P 操作在实现同步的 P 操作之前,就有可能导致死锁。
对死锁的介绍这部分内容简单的总结一下,如下图所示。
死锁的处理策略主要有三个,即预防死锁、避免死锁和死锁的检测与解除。预防死锁也就是破坏死锁产生的四个必要条件中的一个或几个;避免死锁就是用某种方法防止系统进入不安全状态,从而避免死锁;死锁的检测与解除中允许死锁的发生,不过操作系统会负责检测出死锁的发生并采取某种措施解除死锁。下面详细来介绍这三个死锁的处理策略。
预防死锁主要是破坏死锁产生的四个条件,即互斥条件、不剥夺条件、请求与保持条件和循环等待条件,因为这四个条件中只要有一项不成立,死锁就不会发生,因此预防死锁时只要设法破坏其中的一个条件即可。
互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁。
如果把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。比如 SPOOLing 技术,SPOOLing 技术也称为假脱机技术,它实际上是一种外围设备同时联机操作技术,又称为排队转储技术,它在输入和输出之间增加了“输入井”和“输出井”的排队转储环节。
操作系统可以采用 SPOOLing 技术把独占设备在逻辑上改造成共享设备,例如打印机就可以用 SPOOLing 技术改造为共享设备。如果对打印机不使用 SPOOLing 技术,一个进程在还没有用完打印机之前,另一个进程申请使用打印机会被阻塞;使用 SPOOLing 技术之后,在各进程看来,自己对打印机资源的使用请求立即就被接收处理了,不需要再阻塞等待。
破坏互斥条件的缺点:并不是所有的资源都可以改造成可共享使用的资源,并且为了系统安全,很多地方还必须保护这种互斥性,因此很多时候都无法破坏互斥条件。
不剥夺条件:进程所获得的资源在未使用完之前不能由其他进程强行夺走,只能主动释放。
破坏不剥夺条件有两个方案:
方案一:当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,即使某些资源未使用完,也需要主动释放,待以后需要时再重新申请。
方案二:当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺,这种方案下一般需要考虑各进程的优先级。
破坏不剥夺条件的缺点:
ⅰ实现起来比较复杂;
ⅱ释放已获得的资源可能造成前一阶段工作的失效,因此这种方法一般只适用于易保存和恢复状态的资源(例如CPU);
ⅲ 反复地申请和释放资源会增加系统开销,降低系统吞吐量;
ⅳ 若采用方案一,意味着只要暂时得不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请,如果一直发生这样的情况,就会导致进程饥饿。
请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但该进程又对自己已有的资源保持不放。
可以采用静态分配方法,也就是进程在运行前一次性申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行,一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了。
破坏请求与保持条件的缺点:有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低,此外,该策略也有可能导致某些进程饥饿。
如下图所示,如果 A 类进程和 B 类进程源源不断的进来,那么 C 类进程就只能一直等待资源1和资源2被释放,从而导致饥饿。
循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求。
可采用顺序资源分配法,首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(编号相同的资源)一次申请完。
一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源,按照这种规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待现象。
破坏循环等待条件的缺点:
ⅰ不方便增加新的设备,因为可能需要重新分配所有的编号;
ⅱ进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费;
ⅲ 必须按规定次序申请资源,用户编程麻烦。
对预防死锁这部分内容简单的总结一下,如下图所示。
先看一个安全序列的例子,如下图所示。
在上面的例子中,如果事先已经分别借给 B、A、T 20亿、10亿和30亿,那么如果 B 再要求借30亿,这个时候是不能借的,因为一旦借给B,手里的资金就只剩下10亿,而 B、A、T 中还会借的钱数至少为20亿,这个时候就会不安全,也就是借出去的钱收不回来。
如果事先已经分别借给 B、A、T 20亿、10亿和30亿,那么如果 A 再要求借20亿,这个时候是可以借的,因为借给 A 后,手里还剩下20亿,此时可以全借给 T,等 T 还完钱后手里就有了50亿,这个时候再借给 B 50亿,等 B 还完钱后手里就有了70亿,此时再借给 A 10亿,等 A 还完钱后手里就有了100亿,所有的钱就都收回来了。因此,在事先已经分别借给 B、A、T 20亿、10亿和30亿的基础上,按照 A(20亿)——>T(20亿)——>B(50亿)——>A(10亿)的顺序是安全的。
所谓安全序列,就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成,只要能找出一个安全序列,系统就是安全状态,安全序列可能有多个。
如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态,这就意味着之后可能所有进程都无法顺利的执行下去。如果有进程提前归还了一些资源,那么系统也有可能重新回到安全状态,不过在分配资源之前总是要考虑到最坏的情况。
如果系统处于安全状态,就一定不会发生死锁,如果系统进入不安全状态,就可能发生死锁。处于不安全状态未必发生死锁,但发生死锁时一定是在不安全状态。
在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求,这也是银行家算法的核心思想。
银行家算法是荷兰学者 Dijkstra 为银行系统设计的,以确保在发放现金贷款时,不会发生不能满足所有客户需要的情况,后来该算法被用在操作系统中,用于避免死锁。
银行家算法的核心思想是:在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态,如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待。
我们可以把单维的数字拓展为多维的向量,比如系统中有5个进程 P0-P4,3种资源 R0-R2,初始数量为(10,5,7),则某一时刻的资源需求情况和已分配的情况可以由3维向量简单表示,具体的例子如下图所示。
在这个例子中,我们需要将剩余的可用资源分别和上图表中的“最多还需要”列比较,只有剩余的可用资源的每个数都大于“最多还需要”列对应位置的数,则可以进行分配,然后回收已分配的资源,接着往下比较分配,直到所有进程需要的资源都被满足,即找出安全序列,或者无法找到安全序列时停止。上面例子的一个安全序列为:P1——>P3——>P0——>P2——>P4。
银行家算法步骤:
ⅰ检查此次申请是否超过了之前声明的最大需求数;
ⅱ检查此时系统剩余的可用资源是否还能满足这次请求;
ⅲ 试探着分配,更改各数据结构;
ⅳ 用安全性算法检查此次分配是否会导致系统进入不安全状态。
安全性算法步骤:检查当前的剩余可用资源是否能满足某个进程的最大需求,如果可以,就把该进程加入安全序列,并把该进程持有的资源全部回收。
如果系统中既不采取预防死锁的措施,也不采取避免死锁的措施,系统就很可能发生死锁,在这种情况下,系统应当提供两个算法,即死锁检测算法和死锁解除算法。
死锁检测算法用于检测系统状态,以确定系统中是否发生了死锁。
死锁解除算法是当认定系统中已经发生了死锁,利用该算法可将系统从死锁状态中解脱出来。
为了对系统是否已发生了死锁进行检测,需要用某种数据结构来保存资源的请求和分配信息,然后提供一种算法,利用上述信息来检测系统是否已进入死锁状态。
数据结构资源分配图如下图所示,它包含两种结点(进程结点和资源结点)和两种边(进程结点—>资源结点,资源结点—>进程结点)。
如果系统中剩余的可用资源数足够满足进程的需求,那么这个进程暂时是不会阻塞的,可以顺利的执行下去。等这个进程执行完以后把资源归还给系统,就可能使某些正在等待资源的进程被激活,并顺利的执行下去。如此执行下去,最终能消除所有边,就称这个图是可完全简化的,此时一定没有发生死锁(相当于找到了一个安全序列)。如果最终不能消除所有边,那么此时就发生了死锁,最终还连着边的那些进程就是处于死锁状态的进程。
死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁。
能消除所有边的例子如下图所示。
上图中,P1进程先申请 R2 资源,由于 R1 资源全部分配出去,所以 P2 进程暂时处于阻塞态,等 P1进程执行完释放资源以后, P2 进程就可以得到 R1 资源执行,最终 P1 进程和 P2 进程都会执行完。
不能消除所有边的例子如下图所示。
上图中,由于 R1 和 R2 资源全部都分配出去了,所以 P1 和 P2 进程全部被阻塞,只有 P3 进程可以执行,但是当 P3 进程执行完释放资源以后,P1 和 P2 进程由于缺少资源仍然无法执行,因此 P1 和 P2 进程会一直阻塞下去。
一旦检测出死锁的发生,就应该立即解除死锁。解除死锁的方法有资源剥夺法、撤销进程法和进程回退法。
资源剥夺法:挂起某些死锁的进程(暂时放到外存上),并抢占它的资源,将这些资源分配给其他的死锁进程,但是应防止被挂起的进程长时间得不到资源而饥饿。
撤销进程法:也称终止进程法,强制撤销部分甚至全部死锁进程,并剥夺这些进程的资源。这种方法的优点是实现简单,但所付出的代价可能会很大,因为有些进程可能已经运行了很长时间,已经接近结束了,但是一旦进程被终止,之前的所有数据都会消失,以后再运行时就得从头再来。
进程回退法:让一个或多个死锁进程回退到足以避免死锁的地步,这就要求系统要记录进程的历史信息,设置还原点。
那么应该撤销或回退哪些进程呢?
ⅰ可以按照进程的优先级对优先级较低的进程进行撤销或回退;
ⅱ可以按照进程已经执行时间的长短对执行时间较短的进程进行撤销或回退;
ⅲ 可以按照进程还需要多久完成对需要时间长的进程进行撤销或回退;
ⅳ 可以按照进程已经使用的资源数量对使用资源数量较多的进程进行撤销或回退,这样能够更快地解决死锁局面;
ⅴ 可以按照进程是交互式的还是批处理式的对批处理式的进程进行撤销或回退。
对死锁的检测和解除这部分内容简单的总结一下,如下图所示。
以上就是操作系统——管程、死锁及其处理策略的所有内容了,本文中的重点是死锁的处理策略,即如何预防死锁、避免死锁以及检测和解除死锁,这些内容需要好好理解并掌握。
参考视频:
管程
死锁的概念
死锁的处理策略——预防死锁
死锁的处理策略——避免死锁
死锁的处理策略——检测和解除