JVM就是java virtual machine,java虚拟机
JVM就是将java源文件编译成字节码文件,然后加载到虚拟机,JVM在执行字节码时,最终把字节码解释成具体平台上的机器指令执行。这个就是一次编写,到处运行。
JVM是一种java虚拟机规范,很多厂商进行了实现,可以通过java -version命令查看
当然最常见的就是HotSpot了
docs.oracle.com/javase/8/do… ,JVM在这一层,所以平时我们装了jdk,jvm也自带装好了。
下面是hotspot官网上的架构图
然后我们来依次介绍各个组件
类加载器分为三个过程,Loading,Linking,Initializing。
装载就是找到Class文件所在的全路径,然后装载到内存中,生成一个与之匹配的Class对象。JVM在运行的时候会产生三个类加载器,每一个类加载器加载自己所属范围的架包。用户也可以自定义类加载器。
类加载的时候使用的是双亲委派模式。当加载一个类的时候先检查是否已经装载过了,如果没有的话判断是否存在上层,如果有上层就继续交给上层去装载,直到最顶层。如果找到最顶层都发现没有被装载过,那就自顶向下再加载。
我们点开ClassLoader.java源码发现也是这么一个过程。
那么这么做的一个好处就是安全,当我们自己写了一个java.lang.String的类要装载的时候,由于这样的机制,需要交给顶层Bootstrap ClassLoader去装载,当到达顶层的时候发现已经被装载过了,那么就直接返回,那么自己写的java.lang.String类也就不会被装载进去了,具体的思路流程小伙伴可以结合着ClassLoader.java源码再理解下。
小伙伴们再看下demo,加深下印象。
Linking又分为Verification验证、Preparation准备、Resolution解析三个过程。
验证就是确保Class文件字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身安全。
准备负责为类的类变量(被static修饰的变量)分配内存,并设置默认初始化值。
解析动态地将运行时常量池中的符号引用转变为直接引用。
符号引用长这样:5d85 5849 2f63
直接引用长这样:0x00ab 0x00ba 物理内存地址
对类的静态变量,静态代码块执行初始化操作。
一共有五个区域,方法区,堆,java虚拟机栈,程序计数器,本地方法栈。
Java堆是Java虚拟机所管理内存中最大的一块,在虚拟机启动时创建,被所有线程共享。Java对象实例以及数组都在堆上分配。堆内存空间不足时,就会抛出OOM。
一个Java对象在内存中包括3个部分:对象头、实例数据和对齐填充。
当执行下面这句话的时候,静态成员变量存储在方法区,而new Object()对象存储在堆。
- private static Object obj = new Object();
-
new Object()对象的类信息即类的模板存储在方法区。
堆分为两大块,一个是old区,一个是young区,young区又分为两大块,一个是Survivor区(S0+S1),一块是Eden区,S0和S1一样大,也可以叫From和To。
感受OOM:
首先打开jdk安装目录下的bin目录下的jvisualvm.exe文件,以管理员身份运行。
打开以后点击工具—插件
然后安装一下Visual GC这个插件,重启一下
启动一个Spring Boot项目,JVM的参数设置成-Xmx50M -Xms50M,这样堆的大小就设置成50M。
我们看到已经注册上来了
写一段生成对象的代码
- @RestController
- public class HeapController {
- List
list = new ArrayList(); -
- @GetMapping("/heap")
- public String heap() throws Exception {
- while (true) {
- // Thread.sleep(10);
- list.add(new Worker());
- }
- }
-
- }
-
访问一下,一直在转圈
我们看到VisualVM里old区已经飙升满了
编辑器也报出了OOM的错误信息
感受结束
方法区是一种规范,真正的实现在JDK 8中就是Metaspace元空间,在JDK6或7中就是Perm Space永久代。 方法区是各个线程共享的内存区域,在虚拟机启动时创建。方法区中存储的是类信息、常量、静态变量、即时编译器编译后的代码等数据。当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常,我们同样来感受一下。
先在项目中引用asm的架包,这个是创建类信息的工具
- <dependency>
- <groupId>asmgroupId>
- <artifactId>asmartifactId>
- <version>3.3.1version>
- dependency>
-
然后把方法区的大小也设置成50M
写一个创建类信息的工具类,这个是网上的模板代码
- public class MetaspaceUtil extends ClassLoader {
-
- public static List<Class>> createClasses() {
- List<Class>> classes = new ArrayList<Class>>();
- for (int i = 0; i < 10000000; ++i) {
- ClassWriter cw = new ClassWriter(0);
- cw.visit(Opcodes.V1_1, Opcodes.ACC_PUBLIC, "Class" + i, null,
- "java/lang/Object", null);
- MethodVisitor mw = cw.visitMethod(Opcodes.ACC_PUBLIC, "
" , - "()V", null, null);
- mw.visitVarInsn(Opcodes.ALOAD, 0);
- mw.visitMethodInsn(Opcodes.INVOKESPECIAL, "java/lang/Object",
- "
" , "()V"); - mw.visitInsn(Opcodes.RETURN);
- mw.visitMaxs(1, 1);
- mw.visitEnd();
- MetaspaceUtil test = new MetaspaceUtil();
- byte[] code = cw.toByteArray();
- Class> exampleClass = test.defineClass("Class" + i, code, 0, code.length);
- classes.add(exampleClass);
- }
- return classes;
- }
- }
-
启动下项目
访问下请求非堆的方法
- @RestController
- public class NonHeapController {
-
- List<Class>> list = new ArrayList<Class>>();
-
- @GetMapping("/nonheap")
- public String heap() {
- while (true) {
- list.addAll(MetaspaceUtil.createClasses());
- }
- }
- }
-
看下编辑器已经报错了
感受结束
Java虚拟机栈是线程独有的,里面保存着一个线程中方法的调用状态,它的生命周期是和线程绑定在一起。每一个被线程执行的方法,为该栈中的栈帧,即每个方法对应一个栈帧,调用一个方法,就会向栈中压入一个栈帧;一个方法调用完成,就会把该栈帧从栈中弹出。
当我们运行如下一段代码的时候,压栈出栈的过程是这样的。
- void a(){
- b();
- }
- void b(){
- c();
- }
- void c(){
- }
当我们发生递归的时候,不停的往里面压栈,由于栈的大小是固定的,所以超出以后也会发生OOM。感受一下
- public class StackOverFlowDemo {
-
- public static long count = 0;
-
- public static void method() {
- System.out.println(count++);
- method();
- }
-
- public static void main(String[] args) {
- method();
- }
- }
-
运行一下,报错了
我们看下栈帧里面有哪些东西
返回地址:GOTO JUMP为了让后续的方法能够顺利执行
也是线程独有的,如果线程正在执行Java方法,则计数器记录的是正在执行的虚拟机字节码指令的地址。如果正在执行的是Native方法,则这个计数器为空。
类比java虚拟机栈,我们看下Object类里面的hashCode()方法,这是一个native方法,当调用到java编写的方法的时候可以压入到java虚拟栈,而hashCode是native方法怎么办,则是压入要本地方法栈。
通过动态链接链接过去
我们看到官网上的Execution Engine只有JIT Compiler,这个是编译器,我画的图上会多一个Interpreter,这个是解释器,为什么官网上没画,是因为JDK1.0开始就默认已经有了,而JIT是后面的版本不停的加入的。
什么是编译器,编译器是将源代码编译(翻译)成低级语言的程序,这里的javac就是编译器,javac把Helloworld.java文件编译成Helloworld.class文件,交给JVM运行,因为JVM只能认识class字节码文件。同时在不同的操作系统上安装对应版本的JDK,里面包含了各自屏蔽操作系统底层细节的JVM, 这样同一份class文件就能运行在不同的操作系统平台之上,得益于JVM。这也是Write Once,Run Anywhere的原因所在。javac编译器称为前端编译器。
解释器是直接执行用编程语言编写的指令的程序。只有在执行程序时,才一条一条的解释成机器语言给计算机来执行,使用解释器来运行程序会比直接运行编译过的机器码来得慢。Interpreter就是解释Java字节码文件。
执行引擎有三种执行模式。
混合模式是JVM的默认工作模式,即JVM同时使用解释模式和编译模式。我们可以敲java -version看下是mixed模式。
解释器上面已经介绍了,就是把class文件一行一行的解释成机器语言给电脑执行,那么JIT编辑器的作用就是对于字节码中某个方法或代码块执行特频繁时,将其认定为热点代码,然后将热点代码编译成本地代码,并且会进行优化,以此来提高执行效率(这个也是HotSpot的由来)。而被调用很少(甚至只有一次)的方法在解释模式下执行,从而减少编译和优化成本。使用混合模式可以获得最好的执行效率。
JIT编译器称为后端编译器,与javac编译器不同。 因为javac编译的是java文件,JIT编译的是字节码文件。 虚拟机中内置了两个JIT编译器,client compiler(c1)和server compiler(c2),程序会根据虚拟机运行模式(client模式还是server模式)决定使用哪个编译器。