本专栏学习内容来自尚硅谷宋红康老师的视频以及《深入理解JVM虚拟机》第三版
有兴趣的小伙伴可以点击视频地址观看,也可以点击下载电子书
垃圾回收不是Java语言的伴生产物,早在1960年,第一门开始使用内存动态分配和垃圾收集技术的Lisp语言诞生就已经存在了。
垃圾收集机制是Java的招牌能力,极大地提高了开发效率。
优点
缺点
垃圾标记阶段的作用是判断对象是否存活
验证Java没有使用引用计数算法
利用反证法,让obj1与obj2互相引用
public class RefCountGC {
//5MB,主要作用是让这个对下个占用一些内存
private byte[] bytes = new byte[5 * 1024 * 1024];
Object reference = null;
public static void main(String[] args) {
RefCountGC obj1 = new RefCountGC();
RefCountGC obj2 = new RefCountGC();
obj1.reference = obj2;
obj2.reference = obj1;
obj1 = null;
obj2 = null;
//显示的执行垃圾回收
System.gc();
}
}
如果是使用引用计数算法,obj1和obj2互相引用,不会被标记进行回收。
手动执行GC后,我们发现Eden区的内存确实被清理掉了,这就说明了Java的垃圾回收机制会对obj1和obj2进行回收,所以Java使用的就不是引用技术算法

所有“GC Roots”根集合就是一组必须活跃的引用。
在Java语言中,GC Roots包括以下几类元素
除了这些笃定地GC Roots集合之外,根据用户所选择的垃圾收集器以及当前回收的内存区域不同,还可以有其他对象临时性的加入,共同构成完整GC Roots集合。比如分代收集和局部回收
小技巧
由于Root采用栈方式存放变量和指针,所以如果一个指针,它保存了堆内存里面的对象,但是自己又不存放在对内存里面,那它就是一个Root。
注意点
Java语言提供了对象终止(finalization)机制来允许开发人员提供对象被销毁之前的自定义处理逻辑
当垃圾回收器发现没有引用指向一个对象,即:垃圾回收此对象之前,总会先调用这个对象的finalize()方法
finalize()方法允许在子类中被重写,用于在对象被回收时进行资源释放。通常在这个方法中进行一些资源释放和清理的工作,比如关闭文件、套接字和数据库链接等
永远不要主动调用某个对象的finalize()方法,应该交给垃圾回收机制调用
finalize()时可能会导致对象复活finalize()方法的执行时间是没有保障的,它完全由GC线程决定,极端情况下,若不发生GC,则finalize()方法将没有执行机会finalize()会严重影响GC的性能由于finalize()方法的存在,对象在被GC时可能会出现三种不同的状态。
finalize()中复活finalize()被调用,并且没有复活。不可触及的对象不可能被复活,因为finalize()只会被调用一次。以上3种状态中,是由于finalize()方法的存在,进行的区分。只有在对象不可触及时才可以被回收。
判断一个对象obj是否可以回收,至少要经历两次标记过程
finalize()方法
finalize()方法,或者finalize()方法以及被虚拟机调用过,则虚拟机视为“没有必要执行”,obj被判定为不可触及的。finalize()放啊,且还未执行过,那么obj会被插入到F-Queue队列中,又一个虚拟机自动创建的、低优先级的Finalizer线程触发其finalize()方法finalize()方法是对象逃脱死亡的最后机会,稍后GC会对F-Queue队列中的对象进行第二次标记。如果obj在finalize()方法中与引用链上的任何一个对象建立了联系,那么在第二次标记时,obj会被移除“即将回收”的集合。之后对象会再次出现没有引用存在的情况。在这个情况下finalize()方法不会再次调用,对象会直接变成不可触及的状态,也就是说,一个对象的finalize()方法只会被调用一次。通过输出来查看结果,第一次执行GC时会被进入finalize()方法,复活obj对象,当第二次进行GC时,因为finalize()以及被虚拟机调用过,所以obj直接被判定从不可触及的状态,会被垃圾回收。
public class CanReliveObj {
public static CanReliveObj obj;//类变量,属于 GC Root
//此方法只能被调用一次
@Override
protected void finalize() throws Throwable {
super.finalize();
System.out.println("调用当前类重写的finalize()方法");
obj = this;//当前待回收的对象在finalize()方法中与引用链上的一个对象obj建立了联系
}
public static void main(String[] args) {
try {
obj = new CanReliveObj();
// 对象第一次成功拯救自己
obj = null;
System.gc();//调用垃圾回收器
System.out.println("第1次 gc");
// 因为Finalizer线程优先级很低,暂停2秒,以等待它
Thread.sleep(2000);
if (obj == null) {
System.out.println("obj is dead");
} else {
System.out.println("obj is still alive");
}
System.out.println("第2次 gc");
// 下面这段代码与上面的完全相同,但是这次自救却失败了
obj = null;
System.gc();
// 因为Finalizer线程优先级很低,暂停2秒,以等待它
Thread.sleep(2000);
if (obj == null) {
System.out.println("obj is dead");
} else {
System.out.println("obj is still alive");
}
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
//结果
第1次 gc
调用当前类重写的finalize()方法
obj is still alive
第2次 gc
obj is dead
当成功区分出内存中存活对象和死亡对象后,GC接下来的任务就是执行垃圾回收,释放掉无用对象所占用的内存空间,以便有足够的可用内存空间为新对象分配内存
目前在JVM中比较常见的三种垃圾收集算法是
如下图所示,当堆中的有效内存空间被耗尽时,就会停止整个程序(STW),然后进行两项工作

这里插上一嘴,在创建对象的时,如果空闲空间是连续的,就可以使用指针碰撞的方法来存放对象,效率较高,如果空闲空间不连续,则需要维护一个空闲列表,额外的占据了内存。并且在空间不连续的情况下,可容纳的最大连续空间比较小,当创建大对象时,可容纳的最大连续空间不足,则会尝试插入到老年代中。
这里所谓的清除,并不是真的置空,而是将需要清楚的对象地址保存在空闲的地址列表中。下次由新的对象需要加载时,判断垃圾的位置空间是否够,如果够就存放。
这跟格式化硬盘优点类似,假如我们直接把D盘格式化了,对D盘不进行任何操作,可以使用网上很多恢复工具将其恢复,但如果对D盘格式化后,又将数据写入到D盘,相当于原来的记录被覆盖了,就无法恢复。
复制算法将活着的内存空间分为两块,每次只使用其中一块,在垃圾回收时将正在使用的内存中的存活对象复制到未被使用的内存块中,之后清除正在使用的内存块中所有对象,交换两个内存的角色,最后完成垃圾回收。此方法在之前学到的新生代中的两个幸存者区中有用到过。

如果系统中的垃圾对象过多,就不适合使用复制算法,复制算法需要复制的存活对象数量并不会太大,或者说非常低才行。否则会严重影响效率。
复制算法的高效性建立在存活对象少,垃圾对象多的前提下。这种情况在新生代经常发生,但是在老年代,更常见的情况是大部分对象都存活,如果依然使用复制算法,由于存活对象较多,复制的成本也将很高。因此,基于老年代的垃圾回收特性,需要使用其他的算法。
如下图所示,第一阶段和标记-清除算法一样,从根节点开始标记所有被引用的对象,第二阶段将所有存活的对象压缩到内存的一段,按顺序排放,最后清理边界外所有的空间。

| 标记-清除算法 | 标记-压缩算法 | 复制算法 | |
|---|---|---|---|
| 速度 | 中等 | 最慢 | 最快 |
| 空间开销 | 少(但会堆积碎片) | 少(不堆积碎片) | 统称需要活对象的2倍大小(不堆积碎片) |
| 移动对象 | 否 | 是 | 是 |
对比以上三种算法,复制算法是当之无愧的老大,但却浪费了太多内存。
为了尽量兼顾上面的三个指标,标记-压缩算法相对来说更平滑一些,但是效率是不尽人意,它比复制算法多了一个标记的阶段,比标记-清除算法多了一个整理内存的阶段。
分代收集算法和以上三个算法是作用于不同的地方的,前面所有的算法中,没有一种算法可以完全替代其他算法,都具备自己独特的优势和特点。
而分代收集算法是基于这样一个事实:不同的对象的生命周期是不一样的,因此不同生命周期的对象可以采取不同的收集方式,以便提高回收效率。一般是把Java堆分成新生代和老年代,这样可以根据不同的年代的特点使用不同的算法,以提高垃圾回收的效率
年轻代特点:区域相对老年代较小,对象生命周期短、存活率低,回收频繁。
这种情况复制算法的回收整理,速度是最快的。复制算法的效率只和当前存货对象大小有关,因此很适用于老年代的回收,而复制算法内存利用率不高的问题,通过HotSpot中的两个survivor设计得到缓解。
老年代特点:区域较大,对象生命周期长、存活率高,回收不及年轻代频繁。
这种情况下存在大量存活率高的对象,复制算法明显不合适,一般由标记-清除算法或者标记-压缩算法来实现
上述现有的算法,在垃圾回收过程中,应用软件将处于一种STW的状态,在STW的状态下,应用程序所有的线程都会被挂起,暂停一切正常的工作,等待垃圾回收的完成。如果垃圾回收时间长,应用成熟会被挂起很久,将严重影响用户体验或者系统的稳定性。为了解决这个问题,即对实时垃圾收集算法的研究直接导致了增量收集算法的诞生。
如果一次性将所有的垃圾进行处理,需要造成系统长时间停顿,那么就可以让垃圾收集线程和应用程序线程交替执行。每次,垃圾收集线程只收集一小片区域的内存空间,接着切换到应用程序线程。以此反复,直到垃圾收集完成。
总的来说增量收集算法的基础仍是传统的标记-清除算法和复制算法。增量收集算法通过对线程间冲突的妥善处理,允许垃圾手机现场以分阶段的方式完成标记、清理或复制工作。
使用这种方式,由于在垃圾回收过程中,间断的执行应用程序代码,所以能减少系统的停顿时间,但是因为线程切换和上下文转换的小号,会使得垃圾回收的总体成本上升,造成系统吞吐量的下降。
以上这些算法讲解的都是基本的算法思路,实际GC实现过程要复杂的多,目前还在发展中的前沿GC都是符合算法,并且并行和并发兼备。
垃圾回收的相关概念可以帮助我们理解垃圾回收算法以及垃圾回收器
System.gc()或Runtime.getRuntime().gc()可以触发Full GC,同时对新生代和老年代进行回收。System.gc()时有一个免责声明,无法保证对垃圾回收器的调用。也就是说调用System.gc()后什么时候调用垃圾回收器是不确定的。System.gc()无需手动触发,当我们进行一些性能基准测试时,可以在测试前手动触发一次System.gc()在对象第一次需要被回收时,会触发对象的finalize()方法,多次执行以下代码,可以看到不是每一次都会触发的,这就证明了调用System.gc()无法保证对垃圾回收器的调用
public class SystemGCTest {
public static void main(String[] args) {
new SystemGCTest();
//单单执行System.gc()无法保证会马上执行垃圾回收
System.gc();
//强制执行垃圾回收可以再执行System.runFinalization()
//System.runFinalization();
}
@Override
protected void finalize() throws Throwable {
System.out.println("SystemGCTest重写finalize()");
}
}
执行以下代码,并将GC日志输出,逐条分析。
public class LocalGC {
public void localGC1(){
byte[] buffer = new byte[10 * 1024 * 1024]; //10M
System.gc();
}
public void localGC2(){
byte[] buffer = new byte[10 * 1024 * 1024]; //10M
buffer = null;
System.gc();
}
public void localGC3(){
{
byte[] buffer = new byte[10 * 1024 * 1024]; //10M
}
System.gc();
}
public void localGC4(){
{
byte[] buffer = new byte[10 * 1024 * 1024]; //10M
}
int value = 10;
System.gc();
}
public void localGC5(){
localGC1();
System.gc();
}
public static void main(String[] args) {
LocalGC localGC = new LocalGC();
localGC.localGC1();
// localGC.localGC2();
// localGC.localGC3();
// localGC.localGC4();
// localGC.localGC5();
}
}
对于localGC1()方法来说,堆中的byte数组还被引用,所以无法被回收

对于localGC2()来说,堆中的byte数组没有被任何GC Root引用,所以会被回收

localGC3()比较难以理解,实际上执行的结果是不会被回收

我们可以使用jclasslib工具查看,发现局部变量表的最大槽数是2,但是局部变量表中只有一个this对象,就像标记-清除算法中并不是真正意义上的清除,也就是说实际上我们的buffer是占用了第二个局部变量表,所以引用还是存在的

localGC4()中的byte数组是会被回收的,这是因为原本局部变量表中第二个槽的位置被value替代

localGC5()中执行的第一次GC是localGC1()中调用的System.gc(),这是不会对byte数组回收的,而第二次调用GC时,因为localGC1()方法已经执行完毕,栈帧已经被弹出,所以对于堆中的byte数组来说,已经没有GC Root在引用他,所以会被回收。

Java对内存溢出的解释是:没有空闲内存,并且垃圾收集器也无法提供更多内存
java.nio.BIts.reserveMemory()方法中,我们能清楚的看到,System.gc()会被调用,以清理空间在单例模式中,我们都知道单例模式所用的对象的生命周期从程序启动时创建,在程序结束时才销毁,如果使用单例对象引用外部的对象,则会导致外部对象的生命周期与单例对象的声明周期一样长,这也可以看做宽泛意义上的内存泄漏。
除了单例模式,在调用外部连接时,不及时关闭连接,也会出现内存泄漏,比如数据库连接,网络链接,io链接,都必须要手动close,否则是不能被回收的。
System.gc(),会导致STW的发生程序在执行时,并非在所与欧的地方都能停顿下来开始GC,只有在特定位置才能停顿,这些位置称为安全点
安全点的选择和重要,如果太少可能导致GC等待时间太长,如果太频繁可能导致运行时的性能问题。大部分指令的执行时间都非常短暂,通常会根据”是否具有让程序长时间执行的特征为标准“,比如方法调用、循环跳转和异常跳转
主动式中断:设置一个中断标志,各个线程运行到安全点时主动轮询这个标志,如果中断标志为真,则将自己进行中断挂起。
安全区域时指在一段代码片段中,对象的引用关系不会发生变化,在这个区域中的任何位置开始GC都是安全的。
例如:程序线程有时候会出现sleep的情况,这时候JVM执行GC不可能等到sleep结束,所以在程序线程进入sleep时会告知JVM我已经进入安全区域,可以执行GC。
一道较为偏门又非常高频的面试题:强引用、软引用、弱引用、虚引用有什么区别?具体使用场景是什么?
其实在我们平时写代码中,99%的地方我们使用的都是强引用,在JDK1.2之后,Java对引用的概念进行了扩充,将引用分为强引用、软引用、弱引用、虚引用4种,这4种的引用强度依次逐渐减弱。
除了强引用之外,其他3种引用均可以在java.lang.ref包中找到他们的身影。

在Java程序中,最常见的引用类型就是强引用,也就是我们最常见的普通对象引用,也是默认的引用类型。
强引用的对象是可触及的,垃圾收集器永远不会回收掉被引用的对象。
对于一个普通的对象,如果没有其他的引用关系,只要超过了引用的作用域或者现实的将引用赋值为null,就可以当作垃圾被收集了,具体回收时机还是要看垃圾收集策略。
相对的,软引用、弱引用、虚引用的对象都是软可触及、弱可触及、虚可触及的,在一定条件下,都是可以被回收的,所以,强引用是造成Java内存泄漏的主要原因之一。
通俗理解:内存不足的时候就会回收软引用对象
软引用是用来描述一些还有用,但非必要的对象。只要被软引用关联着的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围中进行第二次回收。
垃圾回收器在某个时刻决定回收软可达的对象的时候,会清理软引用,并可选的把引用存放在一个引用队列。
public class SoftReferenceTest {
public static void main(String[] args) {
//这样堆中new User的引用就是软引用
SoftReference<User> userSoftRef = new SoftReference<>(new User(1, "yellowstar"));
//从软引用中重新获得强引用对象
System.out.println(userSoftRef.get());
System.gc();
System.out.println("After GC:");
// //垃圾回收之后获得软引用中的对象
System.out.println(userSoftRef.get());//由于堆空间内存足够,所有不会回收软引用的可达对象。
//
try {
//让系统认为内存资源紧张、不够
byte[] b = new byte[1024 * 1024 * 7];
} catch (Throwable e) {
e.printStackTrace();
} finally {
//再次从软引用中获取数据
System.out.println(userSoftRef.get());//在报OOM之前,垃圾回收器会回收软引用的可达对象。
}
}
}
class User{
int id;
String name;
public User(int id, String name) {
this.id = id;
this.name = name;
}
@Override
public String toString() {
return "User{" +
"id=" + id +
", name='" + name + '\'' +
'}';
}
}
//结果
User{id=1, name='yellowstar'}
After GC:
User{id=1, name='yellowstar'}
java.lang.OutOfMemoryError: Java heap space
at com.example.practice6.ref.SoftReferenceTest.main(SoftReferenceTest.java:26)
null
通俗来讲弱引用就是发现就会被回收
弱引用也是用来描述那些非必要对象的,只被弱引用关联的对象只能生存道下一次垃圾收集发生为止,在系统GC时,只要发现弱引用,不管系统堆空间使用是否充足,都会回收掉制备弱引用关联的对象。
软引用、弱引用都非常适合来把保存那些可有可无的缓存数据。
弱引用对象与软引用对象最大的不同在于,当GC在进行回收时,需要通过算法检查是否回收软引用对象,而对于弱引用对象,GC总是进行回收。弱引用对象更容易、更快被GC回收。
public class WeakReferenceTest {
public static void main(String[] args) {
//构造了弱引用
WeakReference<User> userWeakRef = new WeakReference<User>(new User(1, "yellowstar"));
//从弱引用中重新获取对象
System.out.println(userWeakRef.get());
System.gc();
// 不管当前内存空间足够与否,都会回收它的内存
System.out.println("After GC:");
//重新尝试从弱引用中获取对象
System.out.println(userWeakRef.get());
}
}
//结果
User{id=1, name='yellowstar'}
After GC:
null
虚引用时所有引用类型中最弱的一个。
一个对象是否有虚引用存在,完全不会决定对象的生命周期,如果一个对象仅持有虚引用,那么它和没有引用几乎是一样的,随时都可能被垃圾回收器回收。
它不能单独使用,也无法通过虚引用来获取被引用的对象,尝试获取对象时,总为null
为一个对象设置虚引用的唯一目的在于跟踪垃圾回收过程,比如:能在这个对象被垃圾收集器回收时收到一个系统通知。
创建虚引用时,除了引用对象还需要传入一个引用队列,当对象被回收时,会将信息发送到引用队列中。
public class PhantomReferenceTest {
public static PhantomReferenceTest obj;//当前类对象的声明
static ReferenceQueue<PhantomReferenceTest> phantomQueue = null;//引用队列
public static class CheckRefQueue extends Thread {
@Override
public void run() {
while (true) {
if (phantomQueue != null) {
PhantomReference<PhantomReferenceTest> objt = null;
try {
objt = (PhantomReference<PhantomReferenceTest>) phantomQueue.remove();
} catch (InterruptedException e) {
e.printStackTrace();
}
if (objt != null) {
System.out.println("追踪垃圾回收过程:PhantomReferenceTest实例被GC了");
}
}
}
}
}
@Override
protected void finalize() throws Throwable { //finalize()方法只能被调用一次!
super.finalize();
System.out.println("调用当前类的finalize()方法");
obj = this;
}
public static void main(String[] args) {
Thread t = new CheckRefQueue();
t.setDaemon(true);//设置为守护线程:当程序中没有非守护线程时,守护线程也就执行结束。
t.start();
phantomQueue = new ReferenceQueue<PhantomReferenceTest>();
obj = new PhantomReferenceTest();
//构造了 PhantomReferenceTest 对象的虚引用,并指定了引用队列
PhantomReference<PhantomReferenceTest> phantomRef = new PhantomReference<PhantomReferenceTest>(obj, phantomQueue);
try {
//不可获取虚引用中的对象
System.out.println(phantomRef.get());
//将强引用去除
obj = null;
//第一次进行GC,由于对象可复活,GC无法回收该对象
System.gc();
Thread.sleep(1000);
if (obj == null) {
System.out.println("obj 是 null");
} else {
System.out.println("obj 可用");
}
System.out.println("第 2 次 gc");
obj = null;
System.gc(); //一旦将obj对象回收,就会将此虚引用存放到引用队列中。
Thread.sleep(1000);
if (obj == null) {
System.out.println("obj 是 null");
} else {
System.out.println("obj 可用");
}
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}
//结果
null
调用当前类的finalize()方法
obj 可用
第 2 次 gc
追踪垃圾回收过程:PhantomReferenceTest实例被GC了
obj 是 null