概述
- 在Java中数据类型分为基本数据类型和引用数据类型,基本数据类型由虚拟机预先定义,引用数据类型则需要进行类的加载
- 按Java虚拟机规范,从class文件加载到内存中的类,到类卸载出内存为止,它的整个生命周期包含以下7个阶段
- 从程序中类的使用过程看:
Loading加载阶段
加载
- 所谓加载,简而主之就是将Java类的字节码文件加载到机器内存中,并在内存中构建出Java类的原型–类模板对象,类模板对象就是Java类在JVM内存中的一个快照,JVM将从字节码文件中解析出常量池,类字段,类方法等信息存储到类模板中,这样JVM在运行期便能通过类模板而获取Java类中的任意信息,能够对Java类的成员变量进行遍历,也能进行Java方法的调用,反射的机制即基于这一基础,如果JVM没有将Java类的声明信息存储起来,则JVM在运行期无法反射
- 加载完成的操作:加载阶段,即查找并加载类的二进制数据,生成Class的实例
- 加载类时,Java虚拟机必须完成3件事情
- 通过类的全名,获取类的二进制数据流
- 解析类的二进制数据流为方法区的数据结构
- 创建java.lang.Class类的实例,表示该类型,作为方法区这个类的各种数据的访问入口
二进制流的获取方式
- 虚拟机可以通过文件系统读入一个class后缀的文件(最常见)
- 读入jar,zip等归档数据包,提取类文件
- 事先存放在数据库的类二进制数据
- 使用类似于HTTP之类的协议通过网络进行加载
- 在运行时生成一段Class的二进制信息等
- 获取到二进制信息后,Java虚拟机会处理这些数据,最终转为一个java.lang.Class实例
- 如输入数据不是ClassFile的结构,则会抛出ClassFormatError
类模型与Class实例位置
- 类模型的位置:加载类在JVM中创建相应的类结构,类结构会存储在方法区(jdk8之前:永久代,jdk8:元空间)
- Class实例的位置:类将.class文件加载至元空间后,会在堆中创建一个java.lang.Class对象,用来封装类位于元空间内的数据结构,该Class对象在加载类的过程中创建的,每个类都对应有一个Class类型的对象
- 图示
- Class类的构造方法是私有的,只有JVM能够创建
- java.lang.Class实例是访问类型元数据的接口,也是实现反射的关键数据、入口。通过Class类提供的接口,可以获得目标类所关联的.class文件中具体的数据结构:方法、字段等信息。
package com.chapter11;
import java.lang.reflect.Method;
import java.lang.reflect.Modifier;
public class MainTest {
public static void main(String[] args) {
try {
Class clazz = Class.forName("java.lang.String");
Method[] ms = clazz.getDeclaredMethods();
for (Method m : ms) {
String mod = Modifier.toString(m.getModifiers());
System.out.print(mod + " ");
String returnType = m.getReturnType().getSimpleName();
System.out.print(returnType + " ");
System.out.print(m.getName() + "(");
Class<?>[] ps = m.getParameterTypes();
if (ps.length == 0) System.out.print(")");
for (int i = 0; i < ps.length; i++) {
char end = (i == ps.length - 1) ? ')' :',';
System.out.print(ps[i].getSimpleName() + end);
}
System.out.println();
}
} catch (Exception e) {
}
}
}
数组类的加载
- 创建数组类的情况有些特殊,数组类本身并不是由类加载器负责创建,而是由JVM在运行时根据需要而直接创建的,但数组的元素类型仍然需要依靠类加载器去创建,创建数组类过程如下:
- 如果数组的元素类型是引用类型,那么就遵循定义的加载过程递归加载和创建数组A的元素类型
- JVM使用指定的元素类型和数组维度来创建新的数组类
- 如果数组的元素类型为引用类型,数组类的可访问性由元素的可访问性决定,否则数组类的可访问性被缺省定义为public
Linking链接阶段
验证Verification
- 保证加载的字节码合法、合理并符合规范的
- 验证步骤比较复杂,实际要验证的项目也很繁多,JVM需要做以下检查,如图所示
- 整体说明:验证的内容则涵盖了类数据信息的格式验证,语义检查,字节码验证及符号引用验证等
- 其中格式验证会和加载阶段一起执行,验证通过后,类加载器才会成功将类的二进制数据加载到方法区
- 格式验证外的验证操作将会在方法区中进行
- 链接阶段的验证虽然拖慢了加载速度,但它避免了在字节码运行时还需要进行各种检查
- 具体说明
- 格式验证:是否以魔数0xCAFEBABE开头,主版本和副版本是否在当前Java虚拟机的支持范围内,数据中每一个项是否都拥有正确的长度等
- Java虚拟机会进行字节码的语义检查,但凡在语义上不符合规范的,虚拟机也不会给予验证通过
- 是否所有的类都有父类存在(除Object,其他类都有父类)
- 是否一些被定义为final的方法或类被重写或继承
- 非抽象类是否实现了所有抽象方法或接口方法
- 是否存在不兼容的方法(如方法的签名除了返回值不同,其他都一样,这种方法会让虚拟机无从下手调度,abstract情况下的方法,就不能是final的)
- Java虚拟机还会进行字节码验证,字节码验证也是验证过程中最为复杂的一个过程,它试图通过对字节码流的分析,判断字节码是否可以被正确执行,如:
- 在字节码执行过程中,是否会跳转到一条不存在的指令
- 函数的调用是否传递了正确类型的参数
- 变量的赋值是不是给了正确的数据类型
- 栈映射帧(StackTable)就是在这个阶段,用于检测在特定的字节码处,其局部变量表和操作数栈是否有着正确的数据类型,100%正确判断一段字节码是否可以被安全执行是无法实现的,因此,该过程只是尽可能地检查出可以预知的明显问题,这个阶段无法通过检查,虚拟机也不会正确装载这个类,但通过这个阶段的检查,也不能说明这个类是完全没有问题的
- 上面检查中,已经排查了文件格式错误,语义错误及字节码的不正确性,但依然不能确保是没有问题的
- 校验器还将进行符号引用验证,Class文件在其常量池会通过字符串记录将要使用的其他类或方法,因此,在验证阶段,虚拟机就会检查这些类或者方法确实是存在的,并且当前类有权限访问这些数据,如果一个需要使用类无法在系统中找到,则会抛出NoClassDefFoundError,如果一个方法无法被找到,则会抛出NoSuchMethodError,此阶段在解析阶段才会执行
准备Preparation
- 不包含基本数据类型的字段用static final修饰的情况,因为final在编译的时候就分配了,准备阶段会显示赋值
- 这里不会为实例变量分配初始化,类变量会分配在方法区,而实例变量是会随着对象一起分配到Java堆
- 这个阶段不会像初始化阶段中那样有初始化或者代码被执行
public class LinkingTest {
private static long id;
private static final int num = 1;
private static final String constStr = "CONST";
private static final String constStr1 = new String("CONST");
}
解析Resolution
- 将类、接口、字段、方法的符号引用转为直接引用
- 具体描述
-
符号引用就是一些字面量的引用和虚拟机的内部数据结构和内存布局无关,比较容易理解的是在Class类文件中,通过常量池进行了大量的符号引用,但在程序实际运行时,只有符号引用是不够的,比如println()方法被调用时,系统要明确知道该方法的位置
-
Java虚拟机为每个类都准备了一张方法表,将其所有的方法都列在表中,当需要调用一个类的方法时,只要知道这个方法表中的偏移量就可以直接调用该方法,通过解析操作,符号引用可以转变为目标方法在类中方法表中的位置,从而使得方法被成功调用
- 解析就是将符号引用转为直接引用,也就是得到类、字段、方法在内存中的指针或者偏移量。因此,如果直接引用存在,那么可以肯定系统中存在该类、方法、字段,但只存在符号引用,不能确定系统中一定存在该结构
- 不过Java虚拟机规范没有明确要求解析阶段一定按顺序执行,在Hotspot中,加载,验证,准备和初始化会按照顺序执行,但链接阶段中的解析操作往往会伴随着JVM在执行完初始化后再执行。
- String在Java虚拟机中的处理,当在Java代码中直接使用字符串常量时,就会在类中出现CONSTANT_String,它表示字符串常量,并且会引用一个CONSTANT_UTF8的常量项,在Java虚拟机内部运行的常量池中,会维护一张字符串拘留表(intern),它会保存所有出现过的字符串常量,并且没有重复项,只要以CONSTANT_String形式出现的字符串也都会在这张表中,使用String.intern()方法可以得到一个字符串在拘留表中的引用,因为该表中没有重复项,所以任何字面相同的字符串的String.intern()方法总是相等的