JVM Java Virtual Machine
JDK Java Development Kit
JRE Java Runtime Environment
看上图官方的介绍讲的很清楚
JVM有2个特别有意思的特性,语言无关性和平台无关性。
语言无关性是指实现了Java虚拟机规范的语言对可以在JVM上运行,如Groovy,和在大数据领域比较火的语言Scala,因为JVM最终运行的是class文件,只要最终的class文件复合规范就可以在JVM上运行。
平台无关性是指安装在不同平台的JVM会把class文件解释为本地的机器指令,从而实现Write Once,Run Anywhere
Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有些区域则依赖用户线程的启动和结束而建立和销毁。Java虚拟机所管理的内存将会包括以下几个运行时数据区域
其中方法区和堆是所有线程共享的数据区。程序计数器,虚拟机栈,本地方法栈是线程隔离的数据区, 画一个逻辑图
程序计数器是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器
为什么要记录当前线程所执行的字节码的行号?直接执行完不就可以了吗?
因为代码是在线程中运行的,线程有可能被挂起。即CPU一会执行线程A,线程A还没有执行完被挂起了,接着执行线程B,最后又来执行线程A了,CPU得知道执行线程A的哪一部分指令,线程计数器会告诉CPU。
虚拟机栈存储当前线程运行方法所需要的数据,指令,返回地址。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧用于存储局部变量表,操作数栈,动态链接,方法出口等信息。每个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
局部变量表
存储存储局部变量,是一个定长为32位的局部变量空间。其中64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用一个。引用类型(new出来的对象)如何存储看下图
public int methodOne(int a, int b) {
Object obj = new Object();
return a + b;
}
如果局部变量是Java的8种基本基本数据类型,则存在局部变量表中,如果是引用类型。如String,局部变量表中存的是引用,而实例在堆中。
假如methodOne方法调用methodTwo方法时, 虚拟机栈的情况如下
当虚拟机栈无法再放下栈帧的时候,就会出现StackOverflowError,演示一下
public class JavaVMStackSOF {
private int stackLength = 1;
public void stackLeak() {
stackLength++;
stackLeak();
}
public static void main(String[] args) throws Throwable {
JavaVMStackSOF oom = new JavaVMStackSOF();
try {
oom.stackLeak();
} catch (Throwable e) {
System.out.println("stack length: " + oom.stackLength);
throw e;
}
}
}
在idea中设置运行时的线程的堆栈大小为如下
-Xss 参数的作用是设置每个线程的堆栈大小
运行输出为
-Xss参数的值越大,打印输出的深度越大
操作数栈
接着解释一下操作数栈,还是比较容易理解的
有如下一个Test类
public class Test {
public int calc() {
int a = 100;
int b = 200;
int c = 300;
return (a + b) * c;
}
public int getSum(int a, int b) {
return a + b;
}
}
用javap反编译一下,看一下getSum的字节码文件内容
javap -v Test
public int getSum(int, int);
descriptor: (II)I
flags: ACC_PUBLIC
Code:
stack=2, locals=3, args_size=3 //操作数栈大小为2,本地变量表大小为3,入参有3个
0: iload_1 // 局部变量1压栈
1: iload_2 // 局部变量2压栈
2: iadd // 栈顶2个元素相加,计算结果压栈
3: ireturn
LineNumberTable: // 指令与代码行数的偏移关系
line 17: 0
LocalVariableTable: // 局部变量表
// 作用域开始位置,作用偏移长度,槽位,变量名,类型描述
Start Length Slot Name Signature
0 4 0 this Lcom/javashitang/jvm/Test;
0 4 1 a I
0 4 2 b I
当Java类编译完成时,操作数栈,本地变量表的大小就已经确定了。
操作数栈的大小为2
本地变量表有3个参数,this,a,b。其中this对象是jvm隐式传递的哈
入参有3个,this(jvm隐式传递),a,b
LineNumberTable和LocalVariableTable我用jclasslib Bytecode viewer插件(查看字节码比较方便,我一般不用javap命令)来解释一下
可以看到Test类的第17行代码对应的是getSum方法指令的第一行
getSum方法有3个局部变量
this,作用范围在[Start PC, Start PC+Length],在局部变量表的第0个位置,类型为Test类
图示如下
假如getSum方法的入参是long,则局部变量表如下(64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用一个)
public long getSum(long a, int b) {
return a + b;
}
注意看局部变量表b的位置从2变为3了,因为a变量从原来占用一个slot变为占用2个slot
以calc方法的执行演示一下程序计数器,操作数栈,局部变量表是如何协同工作的
public int calc() {
int a = 100;
int b = 200;
int c = 300;
return (a + b) * c;
}
calc方法的字节码如下
执行流程图示如下
可能有小伙伴们对指令的作用不太熟悉,我就简单介绍一下
一般情况下,指令的格式有如下2种形式
istore 100 将一个数值从操作数栈存储到局部变量表中的第100位
istore_1 将一个数值从操作数栈存储到局部变量表中的第1位
为什么istore_1不写成istore 1,或者将istore 100写成istore_100
因为将一个数值从操作数栈存储到局部变量表中的第1位这个操作经常发生,如果用istore_1则会占用1个字节,如果用istore 1会占用2个字节,所以用istore_1,可以节省空间。同时一个字节表示的种类数有限(128个,Java中各种操作指令占用1字节),所以istore_这种形式不能表示所有操作类型,只能一少部分指令用istore_,其余的用istore n这种形式
所以你现在理解了上图中指令的偏移量不是连续的原因了吧!
与操作类型相关的指令,会在最开头表明操作的类型
bipush:将一个常量加载到操作数栈
istore:将一个数值从操作数栈存储到局部变量表
iload:将一个局部变量加载到操作栈
iadd:对操作数栈栈顶的2个只进行加法运算,并将结果重新存入操作数栈栈顶
动态链接
Java有些方法,类加载的过程中就能知道具体执行的逻辑,而有些需要在运行的过程中才能确定具体执行的逻辑(多态),这就是动态链接在起作用,具体的实现没太看懂,就不过多分析了。
本地方法栈(Native Method Stack)与虚拟机栈锁发挥的作用是非常相似的,他们之间的区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的Native方法服务。
对于大多数应用来说,Java堆(Java Heap)是Java虚拟机锁管理的内存中最大的一块。Java堆是所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存
方法区(Method Area)与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。
由颜色可以看出,jdk1.8之前,堆内存被分为新生代,老年代,永久带,jdk1.8及以后堆内存被分成了新生代和老年代。新生代的区域又分为eden区,s0区,s1区,默认比例是8:1:1,元空间可以理解为直接的物理内存
官方介绍
[1]https://www.oracle.com/technetwork/java/javase/tech/index.html
[2]https://mp.weixin.qq.com/s/Qh9e3bNTcNRaYOft9n7rvg