进程是程序的一次执行过程,系统程序的基本单位。有自己的main方法,并且主要由主方法运行起来的基本上就是进程。
线程与进程相似,但线程是一个比进程更小的执行单位。一个进程在其执行的过程中可以产生多个线程。与进程不同的是同类的多个线程共享堆和方法区资源,但每个线程有自己的程序计数器、虚拟机栈和本地方法栈,所以系统在产生一个线程,或是在各个线程之间作切换工作时,负担要比进程小得多,也正因为如此,线程也被称为轻量级进程。
新建,就绪,运行,等待,阻塞,死亡。
当两个线程分别thread.start()时,只是将线程变成了就绪态,不是运行态,所以运行的顺序,还不一定。
下图是 Java 内存区域,通过下图我们从 JVM 的角度来说一下线程和进程之间的关系。
图片来自JavaGuide
从上图可以看出:一个进程中可以有多个线程,多个线程共享进程的堆和方法区 (JDK1.8 之后的元空间)*资源,但是每个线程有自己的*程序计数器、虚拟机栈 和 本地方法栈。
堆和方法区是所有线程共享的资源,其中堆是进程中最大的一块内存,主要用于存放新创建的对象 (几乎所有对象都在这里分配内存),方法区主要用于存放已被加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
线程是进程划分成的更小的运行单位。线程和进程最大的不同在于基本上各进程是独立的,而各线程则不一定,因为同一进程中的线程极有可能会相互影响。线程执行开销小,但不利于资源的管理和保护;而进程正相反。
结论:支持了多核CPU的发展。
相当于在CPU 内部再开辟了一个区域,用于连接CPU中的核心和内存。也就是原先是CPU和内存交互,这样占据总线,其他核心就不能再次与内存进行交互。有了高速缓存之后,核心可以与高速缓存交互,然后高速缓存和内存交互,(相当于把高速缓存变成单核,整体速度提升),这样释放总线,不会有被占用的情况。
如果需要对一个变量累加50次,但是不一定高速缓存全加完才更新返回到内存区,实际是可能是累加两次就返回,之后再进入高速缓存区进行累加,所以更新多少次进行返回是不确定的。
如果变量或数据更新完毕,那么传入内存后,高速缓存中的数据就会消失。
在高速缓存中,进程的切换与时间片有关,如果数据处理量很大的话,多线程可能会发生覆盖的问题,例如两个线程都给a累加5000次,那么a的极端情况可能会是2,可能导致线程1和线程2的累加操作互相覆盖,第一个线程刚累加第一次,a变成2,然后进程切换,返回给内存,a又变成1。如果数据量很小的话,时间片够,那就不会进行切换。
相当于50个人接力 打水。站在一起,把水传递给下一个人。让传递速度加快,效率更高。
并发:两个及两个以上的作业在同一 时间段 彼此互相干扰 内执行。
并行:两个及两个以上的作业在同一 时刻 互不干扰的执行。
最关键的点是:是否是 同时 执行,和是否互相干扰。
如果能同时执行,那证明一定是互不干扰的。在同一时间段内,细分时间,一个时间内不能两个作业同时进行,那么证明一定是互相干扰的。
同步:发出一个调用之后,在没有得到结果之前, 该调用就不可以返回,一直等待。
异步:调用在发出之后,不用等待返回结果,该调用直接返回。
例如:a调用一个资源,但是资源被其他作业占用,那么我需要一直等着就是同步,调用完我继续做我自己的事,不傻等着就是异步。
先从总体上来说:
从计算机底层来说: 线程可以比作是轻量级的进程,是程序执行的最小单位,线程间的切换和调度的成本远远小于进程。另外,多核 CPU 时代意味着多个线程可以同时运行,这减少了线程上下文切换的开销。
从当代互联网发展趋势来说: 现在的系统动不动就要求百万级甚至千万级的并发量,而多线程并发编程正是开发高并发系统的基础,利用好多线程机制可以大大提高系统整体的并发能力以及性能。
再深入到计算机底层来探讨:
单核时代:在单核时代多线程主要是为了提高单进程利用 CPU 和 IO 系统的效率。 假设只运行了一个 Java 进程的情况,当我们请求 IO 的时候,如果 Java 进程中只有一个线程,此线程被 IO 阻塞则整个进程被阻塞。CPU 和 IO 设备只有一个在运行,那么可以简单地说系统整体效率只有 50%。当使用多线程的时候,一个线程被 IO 阻塞,其他线程还可以继续使用 CPU。从而提高了 Java 进程利用系统资源的整体效率。
多核时代: 多核时代多线程主要是为了提高进程利用多核 CPU 的能力。举个例子:假如我们要计算一个复杂的任务,我们只用一个线程的话,不论系统有几个 CPU 核心,都只会有一个 CPU 核心被利用到。而创建多个线程,这些线程可以被映射到底层多个 CPU 上执行,在任务中的多个线程没有资源竞争的情况下,任务执行的效率会有显著性的提高,约等于(单核时执行时间/CPU 核心数)。