进程是资源管理的最小单位,线程是程序执行的最小单位。
在操作系统设计上,从进程演化出线程,最主要的目的就是减少进程上下文切换开销。每个进程都用于自己的数据段、代码段和堆栈段,这造成了进程在进行切换时都需要有比较复杂的上下文切换等动作,因为要保存当前进程上下文的内容,还要恢复另一个进程的上下文,因此经常切换进程的话开销会很大,因为在进程切换上下文时,需要重新映射虚拟地址空间、进出OS内核、寄存器切换,还会干扰处理器的缓存机制。因此为了减少CPU在进程切换时的额外开销,Linux进程演化出线程。
线程是操作系统能够调度和执行的基本单位,在Linux上被称为轻量级进程。在Linux系统中,一个进程至少需要一个线程作为它的指令执行体,进程管理着资源(比如CPU、内存、文件等),而将线程分配到某个CPU上执行。一个进程可以拥有多个线程,进程还可以同时使用多个CPU来执行各个线程,以达到最大程度的并行,提高工作的效率。即使是在单CPU的机器上,也依然可以采用多个多线程模型来设计程序,使设计更简洁、功能更完备,程序的执行效率也更高。
线程的本质:是一个进程内部的一个控制序列,属于进程里的东西。一个进程可以拥有一个或多个线程。
当在进程中创建一个子进程时,将创建该进程的一份新副本,子进程拥有自己的变量和PID,子进程的执行几乎完全独立于父进程,这样子开销是很大的。
当在进程中创建一个新线程时,新的执行线程将拥有自己的栈,但与它的创建者共享全局变量、文件描述符、信号处理函数和当前目录状态。即只使用当前进程的资源,而不是产生当前进程的副本。
Linux系统中的每个进程都有独立的地址空间,一个进程崩溃后,在系统的保护模式下并不会对系统中其他进程产生影响,而线程只是进程内部的一个控制序列,当进程崩溃后,线程也随之崩溃,所以一个多进程的程序要比多线程的程序健壮,但在进程切换时,耗费资源较大,效率差一点。但在某些场合下对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。
做个简单的比喻:进程=火车,线程=车厢
线程在进程下运行(单纯的车厢无法运行)
一个进程可以包含多个线程(一辆火车可以有多个车厢)
不同进程间数据很难共享(一辆火车上的乘客很难换到另外一辆火车,比如站点换乘)
同一进程下不同线程间数据共享(A车厢换到B车厢很容易)
进程要比线程消耗更多的计算机资源(采用多列火车相比多个车厢更耗资源)
进程间不会相互影响,一个线程挂掉将导致整个进程挂掉(一列火车不会影响到另外一列火车,但是如果一列火车上中间的一节车厢着火了,将影响到所有车厢)
进程可以拓展到多机,进程最多适合多核(不同火车可以开在多个轨道上,同一火车的车厢不能在行进的不同的轨道上)
进程使用的内存地址可以上锁,即一个线程使用某些共享内存时,其他线程必须等它结束,才能使用这一块内存。(比如火车上的洗手间)-"互斥锁"
进程使用的内存地址可以限定使用量(比如火车上的餐厅,最多只允许多少人进入,如果满了需要在门口等,等有人出来了才能进去)-“信号量”。