本节介绍JVM的对象创建、内存分配、内存回收机制,对象创建包含类加载检查、分配内存、初始化、设置对象头、执行init方法;对象内存分配包含对象栈上分配(逃逸分析和标量替换)以及新生代Eden和老年代内存分配介绍;对象内存回收包含引用计数法和可达性分析以及常见的四种引用类型——强引用、软引用、弱引用、虚引用。

虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。new指令对应到语言层面上讲是,new关键词、对象克隆、对象序列化等。
类加载检查通过后,虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定,为对象分配空间的任务等同于把 一块确定大小的内存从Java堆中划分出来。
这个步骤存在两个问题:
划分内存的方法有两种,一是指针碰撞,二是空闲列表,两种方法的区别在于堆中内存是否为规整的。
如果Java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离。
如果Java堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了,JVM虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例, 并更新列表上的记录
虚拟机采用CAS算法以及配上失败重试的方式保证更新操作的原子性来对分配内存空间的动作进行同步处理。
把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存。通过-XX:+/-UseTLAB参数来设定虚拟机是否使用TLAB(JVM会默认开启-XX:+UseTLAB),-XX:TLABSize 指定TLAB大小。
内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头), 如果使用TLAB,这一工作过程也可以提前至TLAB分配时进行。这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。


maven依赖
<dependency>
<groupId>org.openjdk.jol</groupId>
<artifactId>jol-core</artifactId>
<version>0.10</version>
</dependency>
JOL打印三种类型的对象头信息,分别为Object对象、数组对象、Student实例对象。
public class JolExample {
public static void main(String[] args) {
//Object对象
System.out.println(ClassLayout.parseInstance(new Object()).toPrintable());
//数组对象
System.out.println();
System.out.println(ClassLayout.parseInstance(new int[]{}).toPrintable());
//Student对象
System.out.println();
System.out.println(ClassLayout.parseInstance(new Student()).toPrintable());
}
static class Student{
int id;
String name;
byte age;
Object addr;
}
}
默认打印结果:
java.lang.Object object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) e5 01 00 f8 (11100101 00000001 00000000 11111000) (-134217243)
12 4 (loss due to the next object alignment)
Instance size: 16 bytes
Space losses: 0 bytes internal + 4 bytes external = 4 bytes total
[I object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) 6d 01 00 f8 (01101101 00000001 00000000 11111000) (-134217363)
12 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
16 0 int [I.<elements> N/A
Instance size: 16 bytes
Space losses: 0 bytes internal + 0 bytes external = 0 bytes total
com.jvm.JolExample$Student object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 05 00 00 00 (00000101 00000000 00000000 00000000) (5)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) 63 cc 00 f8 (01100011 11001100 00000000 11111000) (-134165405)
12 4 int Student.id 0
16 1 byte Student.age 0
17 3 (alignment/padding gap)
20 4 java.lang.String Student.name null
24 4 java.lang.Object Student.addr null
28 4 (loss due to the next object alignment)
Instance size: 32 bytes
Space losses: 3 bytes internal + 4 bytes external = 7 bytes total
Process finished with exit code 0
关闭指针压缩之后的结果打印:
java.lang.Object object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) 00 1c 1a 1c (00000000 00011100 00011010 00011100) (471473152)
12 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
Instance size: 16 bytes
Space losses: 0 bytes internal + 0 bytes external = 0 bytes total
[I object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) 68 0b 1a 1c (01101000 00001011 00011010 00011100) (471468904)
12 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
16 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
20 4 (alignment/padding gap)
24 0 int [I.<elements> N/A
Instance size: 24 bytes
Space losses: 4 bytes internal + 0 bytes external = 4 bytes total
com.jvm.JolExample$Student object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) f8 cd 83 1c (11111000 11001101 10000011 00011100) (478399992)
12 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
16 4 int Student.id 0
20 1 byte Student.age 0
21 3 (alignment/padding gap)
24 8 java.lang.String Student.name null
32 8 java.lang.Object Student.addr null
Instance size: 40 bytes
Space losses: 3 bytes internal + 0 bytes external = 3 bytes total
java.lang.Object object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) e5 01 00 f8 (11100101 00000001 00000000 11111000) (-134217243)
12 4 (loss due to the next object alignment)
Instance size: 16 bytes
Space losses: 0 bytes internal + 4 bytes external = 4 bytes total
Mark Word标记在64位机器占8个字节,所有前两行为Mark Word标记数据,第三行为Klass Pointer类型指针占4个指针(开启了指针压缩,不开启占用8字节),第四行为对象的对齐(有时候有,有时候没有),为了保证对象是8个字节的整数倍,所以在12个字节的基础上补了4个字节,达到16个字节。
[I object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) 6d 01 00 f8 (01101101 00000001 00000000 11111000) (-134217363)
12 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
16 0 int [I.<elements> N/A
Instance size: 16 bytes
Space losses: 0 bytes internal + 0 bytes external = 0 bytes total
Mark Word标记在64位机器占8个字节,所有前两行为Mark Word标记数据,第三行为Klass Pointer类型指针占4个指针(开启了指针压缩,不开启占用8字节),第四行为数组长度占四个字节,由于16字节是8的整数倍,没有对象对齐。
com.jvm.JolExample$Student object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 4 (object header) 05 00 00 00 (00000101 00000000 00000000 00000000) (5)
4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
8 4 (object header) 63 cc 00 f8 (01100011 11001100 00000000 11111000) (-134165405)
12 4 int Student.id 0
16 1 byte Student.age 0
17 3 (alignment/padding gap)
20 4 java.lang.String Student.name null
24 4 java.lang.Object Student.addr null
28 4 (loss due to the next object alignment)
Instance size: 32 bytes
Space losses: 3 bytes internal + 4 bytes external = 7 bytes total
Mark Word标记在64位机器占8个字节,所有前两行为Mark Word标记数据,第三行为Klass Pointer类型指针占4个指针(开启了指针压缩,不开启占用8字节),第四行为int类型的ID字段占4个字节,第五行为byte类型的age字段占一个字节,内部进行对齐补了3个字节,第六行为String类型的name字段占4个字节,第七行为Object对象指针占四个字节(开启指针压缩占4个字节,不开启占8个字节),最后一行对象对齐补了4字节,整个对象大小为32字节。
执行方法,即对象按照程序员的意愿进行初始化。对应到语言层面上讲,就是为属性赋值(注意,这与上面的初始化零值不同,这是由程序员赋的值),和执行构造方法。
public class Student {
public static final int initData = 666;
public int exam() { //一个方法对应一块栈帧内存区域
int a = 1;
int b = 2;
int c = (a + b) * 2;
return c;
}
public static void main(String[] args) {
Student student = new Student();
student.exam();
}
}
javap -v查看字节码文件:


从JVM内存分配可知JAVA中的对象都是在堆上进行分配,当对象没有被引用的时候,需要依靠GC进行回收内存,如果对象数量较多的时候,会给GC带来较大压力,也间接影响了应用的性能。为了减少临时对象在堆内分配的数量,JVM通过逃逸分析确定该对象不会被外部访问。如果不会逃逸可以将该对象在栈上分配内存,这样该对象所占用的内存空间就可以随栈帧出栈而销毁,就减轻了垃圾回收的压力,也就是说:栈上分配依赖于逃逸分析和标量替换两个方面。
就是分析对象动态作用域,当一个对象在方法中被定义后,它可能被外部方法所引用,例如作为调用参数传递到其他地方中,说明这个参数逃逸了。
例如下面这个代码案例,可以看出saveAndReturn方法中的user对象被返回,因此这个对象的作用域范围不确定;saveNoReturn方法中的user对象我们可以确定当方法结束这个对象就可以认为是无效对象了,对于这样的对象我们其实可以将其分配在栈内存里,让其在方法结束时跟随栈内存一起被回收掉。
//User对象可逃逸
public User saveAndReturn() {
User user = new User();
user.setId(10);
user.setName("张三");
//save to db
return user;
}
//User对象未逃逸
public void saveNoReturn() {
User user = new User();
user.setId(11);
user.setName("李四");
//save to db
}
JVM可以通过开启逃逸分析参数(-XX:+DoEscapeAnalysis)来优化对象内存分配位置,使其通过标量替换优先分配在栈上(栈上分配),JDK7之后默认开启逃逸分析,如果要关闭使用参数(-XX:-DoEscapeAnalysis)
通过逃逸分析确定该对象不会被外部访问,并且对象可以被进一步分解时,JVM不会创建该对象,而是将该对象成员变量分解若干个被这个方法使用的成员变量所代替,这些代替的成员变量在栈帧或寄存器上分配空间,这样就不会因为没有一大块连续空间导致对象内存不够分配。开启标量替换参数(-XX:+EliminateAllocations),JDK7之后默认开启。
标量即不可被进一步分解的量,而JAVA的基本数据类型就是标量(如:int,long等基本数据类型以及reference类型等),标量的对立就是可以被进一步分解的量,而这种量称之为聚合量。而在JAVA中对象就是可以被进一步分解的聚合量。
public class User {
private int id;
private String name;
public User(){}
public User(int id, String name) {
super();
this.id = id;
this.name = name;
}
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
}
/**
* 栈上分配与标量替换代码案例
*
* 1、开启逃逸分析与标量替换,几乎不会发生GC
* -Xmx10m -Xms10m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:+EliminateAllocations
*
* 2、关闭逃逸分析,开启标量替换,发生大量GC
* -Xmx10m -Xms10m -XX:-DoEscapeAnalysis -XX:+PrintGC -XX:+EliminateAllocations
*
* 3、开启逃逸分析,关闭标量替换,发生大量GC
* -Xmx10m -Xms10m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:-EliminateAllocations
**/
public class AllocOnStack {
public static void main(String[] args) {
long start = System.currentTimeMillis();
//代码调用了1亿次alloc(),如果是分配到堆上,大概需要1GB以上堆空间,如果堆空间小于该值,必然会触发GC。
for (int i = 0; i < 100000000; i++) {
alloc();
}
long end = System.currentTimeMillis();
System.out.println(end - start);
}
//user对象未逃逸出方法alloc()
private static void alloc() {
User user = new User();
user.setId(10);
user.setName("张三");
}
}
-Xmx10m -Xms10m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:+EliminateAllocations
结果打印:
[GC (Allocation Failure) 2048K->887K(9728K), 0.0011626 secs]
[GC (Allocation Failure) 2935K->1031K(9728K), 0.0011772 secs]
6
Process finished with exit code 0
发生了两次GC,可以看作几乎没有发生GC
-Xmx10m -Xms10m -XX:-DoEscapeAnalysis -XX:+PrintGC -XX:+EliminateAllocations
结果打印:
[GC (Allocation Failure) 3312K->1264K(9728K), 0.0002443 secs]
..............................................................
[GC (Allocation Failure) 3312K->1264K(9728K), 0.0002302 secs]
742
Process finished with exit code 0
发生了大量的GC,且耗时很长,是第一种情况的100倍左右
-Xmx10m -Xms10m -XX:+DoEscapeAnalysis -XX:+PrintGC -XX:-EliminateAllocations
结果打印:
[GC (Allocation Failure) 3312K->1264K(9728K), 0.0002443 secs]
..............................................................
[GC (Allocation Failure) 3312K->1264K(9728K), 0.0002302 secs]
734
Process finished with exit code 0
发生了大量的GC,且耗时很长,是第一种情况的100倍左右,与第二种情况一样。
由上面的栈上分配可知,对象如果会逃逸或者对象很大则说明栈上分配不成功,则需要进行堆分配。
/**
* 添加JVM参数:-XX:+PrintGCDetails
**/
public class GCExample {
public static void main(String[] args) {
}
}
打印结果:
Heap
PSYoungGen total 75776K, used 6503K [0x000000076b700000, 0x0000000770b80000, 0x00000007c0000000)
eden space 65024K, 10% used [0x000000076b700000,0x000000076bd59c08,0x000000076f680000)
from space 10752K, 0% used [0x0000000770100000,0x0000000770100000,0x0000000770b80000)
to space 10752K, 0% used [0x000000076f680000,0x000000076f680000,0x0000000770100000)
ParOldGen total 173568K, used 0K [0x00000006c2400000, 0x00000006ccd80000, 0x000000076b700000)
object space 173568K, 0% used [0x00000006c2400000,0x00000006c2400000,0x00000006ccd80000)
Metaspace used 3148K, capacity 4496K, committed 4864K, reserved 1056768K
class space used 343K, capacity 388K, committed 512K, reserved 1048576K
Process finished with exit code 0
程序无任何逻辑,新生代也使用了至少几M内存。
/**
* 添加JVM参数:-XX:+PrintGCDetails
**/
public class GCExample {
public static void main(String[] args) {
byte[] alloc1;
byte[] alloc2;
byte[] alloc3;
byte[] alloc4;
byte[] alloc5;
alloc1 = new byte[59000 * 1024];//大小根据情况调整,使Eden区大小达到100%
}
}
打印结果:可以看出此时Eden区空间使用大小达到100%
Heap
PSYoungGen total 75776K, used 65024K [0x000000076b700000, 0x0000000770b80000, 0x00000007c0000000)
eden space 65024K, 100% used [0x000000076b700000,0x000000076f680000,0x000000076f680000)
from space 10752K, 0% used [0x0000000770100000,0x0000000770100000,0x0000000770b80000)
to space 10752K, 0% used [0x000000076f680000,0x000000076f680000,0x0000000770100000)
ParOldGen total 173568K, used 0K [0x00000006c2400000, 0x00000006ccd80000, 0x000000076b700000)
object space 173568K, 0% used [0x00000006c2400000,0x00000006c2400000,0x00000006ccd80000)
Metaspace used 3237K, capacity 4496K, committed 4864K, reserved 1056768K
class space used 350K, capacity 388K, committed 512K, reserved 1048576K
Process finished with exit code 0
再次模拟放入对象将触发Minor GC:
/**
* 添加JVM参数:-XX:+PrintGCDetails
**/
public class GCExample {
public static void main(String[] args) {
byte[] alloc1;
byte[] alloc2;
byte[] alloc3;
byte[] alloc4;
byte[] alloc5;
//使Eden区大小达到100%
alloc1 = new byte[59000 * 1024];//大小根据情况调整
//再次放入对象,触发Minor GC
alloc2 = new byte[1000 * 1024];
}
}
打印结果:
[GC (Allocation Failure) [PSYoungGen: 64202K->1032K(75776K)] 64202K->60040K(249344K), 0.0343169 secs] [Times: user=0.20 sys=0.03, real=0.03 secs]
Heap
PSYoungGen total 75776K, used 2682K [0x000000076b700000, 0x0000000774b00000, 0x00000007c0000000)
eden space 65024K, 2% used [0x000000076b700000,0x000000076b89ca78,0x000000076f680000)
from space 10752K, 9% used [0x000000076f680000,0x000000076f782020,0x0000000770100000)
to space 10752K, 0% used [0x0000000774080000,0x0000000774080000,0x0000000774b00000)
ParOldGen total 173568K, used 59008K [0x00000006c2400000, 0x00000006ccd80000, 0x000000076b700000)
object space 173568K, 33% used [0x00000006c2400000,0x00000006c5da0010,0x00000006ccd80000)
Metaspace used 3237K, capacity 4496K, committed 4864K, reserved 1056768K
class space used 350K, capacity 388K, committed 512K, reserved 1048576K
放入alloc2对象的时候,此时Eden区满了,放不下alloc2,发生了一次Minor GC,alloc1对象由于Survivor区放不下,所以只好把新生代的对象提前转移到老年代中去(对象动态年龄判断),而老年代足够存放alloc1,所以不会出现Full GC。执行Minor GC后,后面分配的对象如果能够存在Eden区的话,还是会在Eden区分配内存,也就是再次将alloc2放入Eden区。
/**
* 添加JVM参数:-XX:+PrintGCDetails
**/
public class GCExample {
public static void main(String[] args) {
byte[] alloc1;
byte[] alloc2;
byte[] alloc3;
byte[] alloc4;
byte[] alloc5;
//使Eden区大小达到100%
alloc1 = new byte[59000 * 1024];//大小根据情况调整
//再次放入对象,触发Minor GC
alloc2 = new byte[1000 * 1024];
//再次放入对象,看Eden的使用率增加
alloc3 = new byte[1000 * 1024];
alloc4 = new byte[1000 * 1024];
alloc5 = new byte[1000 * 1024];
}
}
打印结果:
[GC (Allocation Failure) [PSYoungGen: 64202K->984K(75776K)] 64202K->59992K(249344K), 0.0473447 secs] [Times: user=0.17 sys=0.03, real=0.05 secs]
Heap
PSYoungGen total 75776K, used 5895K [0x000000076b700000, 0x0000000774b00000, 0x00000007c0000000)
eden space 65024K, 7% used [0x000000076b700000,0x000000076bbcbe70,0x000000076f680000)
from space 10752K, 9% used [0x000000076f680000,0x000000076f776010,0x0000000770100000)
to space 10752K, 0% used [0x0000000774080000,0x0000000774080000,0x0000000774b00000)
ParOldGen total 173568K, used 59008K [0x00000006c2400000, 0x00000006ccd80000, 0x000000076b700000)
object space 173568K, 33% used [0x00000006c2400000,0x00000006c5da0010,0x00000006ccd80000)
Metaspace used 3239K, capacity 4496K, committed 4864K, reserved 1056768K
class space used 350K, capacity 388K, committed 512K, reserved 1048576K
Process finished with exit code 0
由2%增加到7%
设置JVM参数:-XX:PretenureSizeThreshold=500000 (单位是字节) -XX:+UseSerialGC ,再执行上面Eden区放满程序,打印结果如下图所示:
-XX:+PrintGCDetails -XX:PretenureSizeThreshold=500000 -XX:+UseSerialGC

可以看出直接进入了老年代。

堆中几乎放着所有的对象实例,回收堆垃圾对象前第一步需要判断哪些对象已经死亡,也就是不能再被任何途径使用的对象。
给对象添加一个引用计数器每当有一个地方引用它,计数器就加1;当引用失效,计数器就减1;任何时候计数器为0的对象就是不可能再被使用的。此方法实现简单,效率高,由于它很难解决对象之间相互循环引用的问题,所以目前主流的虚拟机中并没有选择这个算法来管理内存。
对象之间相互引用问题如下面代码所示:对象obj1 和 obj2 相互引用对方,再无任何其它引用,这样会导致它们的引用计数器都不为0,于是引用计数算法无法通知 GC 回收器回收他们。
public class ReferenceCount {
Object obj = null;
public static void main(String[] args) {
ReferenceCount obj1 = new ReferenceCount ();//obj1 +1
ReferenceCount obj2 = new ReferenceCount ();//obj2 +1
obj1.obj = obj2;//obj1 +1
obj2.obj = obj1;//obj2 +1
obj1 = null;//obj1 -1 还剩1无法释放
obj2 = null;//obj1 -1 还剩1无法释放
}
}
将“GC Roots” 对象作为起点,从这些节点开始向下搜索引用的对象,找到的节点对象都标记为非垃圾对象,其余未标记的节点对象都是垃圾对象
GC Roots根节点:线程栈的本地变量、静态变量、本地方法栈的变量等
引用类型一般分为四种:强引用、软引用、弱引用、虚引用
指的是普通的变量引用
public static Student stu = new Student();
public static SoftReference<HashMap<String,String>> map = new SoftReference<HashMap<String,String>>(new HashMap<String,String>());
将对象用WeakReference软引用类型的对象包裹,弱引用跟没引用差不多,GC会直接回收掉,很少用
public static WeakReference<Student> student = new WeakReference<Student>(new Student());
PhantomReference
也称为幽灵引用或者幻影引用,属于最弱的一种引用关系,几乎不用
如果在可达性分析算法中分析出不可达的对象,也并非是“非死不可”的,这时候对象暂时处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历再次标记过程;标记的前提是对象在进行可达性分析后发现没有与GC Roots相连接的引用链。
方法区(元空间)主要回收的是无用的类
满足三个条件:
本节介绍的内容主要就是这三大方面:JVM对象创建、对象内存分配、对象内存回收机制。