JVM相关面试题

JVM相关面试题
文章目录
什么是 JVM?

JVM 是Java Virtual Machine (Java虚拟机) 的缩写，是一个可以执行Java字节码的虚拟机进程。是Java实现跨平台的最核心的部分

 Java语言的执行原理？

先编译，后解释执行
Java源文件 --> 编译器 --> class文件（虚拟指令）–> Java虚拟机（JVM）–> 解释为指令执行

 Java的字节码文件结构？
```
ClassFile {
    u4             magic;                        // 魔数，标识类文件的类型。Java类文件固定为0xCAFEBABE。
    u2             minor_version;                // 次版本号，指示Java编译器的版本。
    u2             major_version;                // 主版本号，指示Java编译器的版本。
    u2             constant_pool_count;          // 常量池计数，存储着类文件中使用的字符串、类、字段、方法等常量信息。
    cp_info        constant_pool[constant_pool_count-1]; // 常量池数组，存储着类文件中使用的字符串、类、字段、方法等常量信息。
    u2             access_flags;                 // 访问标志，描述类或接口的访问级别和属性。
    u2             this_class;                   // 当前类的索引，指示该类在常量池中的位置。
    u2             super_class;                  // 父类的索引，指示该类直接父类在常量池中的位置。
    u2             interfaces_count;             // 接口数量，列出该类实现的接口。接口也在常量池中表示。
    u2             interfaces[interfaces_count];// 接口数组，列出该类实现的接口。接口也在常量池中表示。
    u2             fields_count;                 // 字段数量，描述类包含的字段。
    field_info     fields[fields_count];         // 字段数组，描述类包含的字段。
    u2             methods_count;                // 方法数量，描述类中定义的方法。
    method_info    methods[methods_count];       // 方法数组，描述类中定义的方法。
    u2             attributes_count;             // 属性数量，用于存储类、字段和方法的附加信息，如注解、源码行号等。
    attribute_info attributes[attributes_count];// 属性数组，用于存储类、字段和方法的附加信息，如注解、源码行号等。
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
```
前4个字节是固定的魔数，用于标识该文件是否为有效的Java字节码文件

编译就是将Java源文件转化为JVM认识的16进制的class文件格式

 什么是u2,u4?

u2: 代表数据占两个字节
u4: 代表数据占四个字节

 JVM 加载过程都是什么步骤？

首先是加载，将编译好的class文件转为二进制流，将二进制流中类的信息存入方法区中，类对象存入堆中，然后是链接，链接包括三个阶段
第一个阶段是验证，验证加载的类的正确性，是否符合class文件规范，第二个阶段就是准备，在方法区中为静态变量分配空间，并设置初始值，将常量池中的符号引用转为直接引用，接下来是初始化，主要完成静态块执行以及静态变量的赋值

1. 装载
- 获取类的全限定类名，把class文件转化为二进制流
- 把二进制流中类的描述信息存入方法区中。如：创建时间、版本等
- 将java.lang.Class对象存入堆中
2. 链接
- 验证：验证被加载类的正确性：如文件的格式，元数据等。
- 准备：在方法区中为静态变量分配空间，并设置初始值。
- 解析：把类的符号引用转为直接引用。
  - 符号引用：class文件定义的内容
  - 直接引用：JAVA进程中真实的地址
3. 初始化
为类的静态变量设置默认值、执行静态代码块。

什么是类加载器？

类加载器是一个用来加载类文件的类。
在JVM中不同的类加载器加载不同的类
启动类加载器(Bootstrap classLoader): 主要负责加载JAVA中的一些核心类库，主要是位于/lib/rt.jar中。
扩展类加载器(Extension classLoader): 主要加载JAVA中的一些扩展类，位于/lib/ext中，是启动类加载器的子类。
应用类加载器(System classLoader): 主要用于加载CLASSPATH路径下我们自己写的类，是扩展类加载器的子类。

什么是双亲委派模型

如果一个类加载器收到了类加载请求，它并不会自己先去加载，而是把这个请求委托给父类的加载器去执行，如果父类加载器还存在其父类加载器，则继续向上委托，最终到达顶层的启动类加载器。如果父类加载器可以完成加载任务，就成功返回。如果父类加载器无法完成加载任务，子类加载器才会尝试自己去加载

 如何打破双亲委派机制？

自定义类加载器类，继承ClassLoader 类，重写loadClass方法

 什么是 tomcat 类加载机制？

当 tomcat启动时，会创建几种类加载器：
Bootstrap 引导类加载器 加载 JVM启动所需的类，以及标准扩展类（位于 jre/lib/ext 下）
System 系统类加载器 加载 tomcat 启动的类，比如bootstrap.jar，通常在 catalina.bat 或者 catalina.sh 中指定。位于 CATALINA_HOME/bin下。
Common 通用类加载器

什么是JVM内存模型？
- JDK 1.6：有永久代，静态变量存放在永久代上。
- JDK 1.7：有永久代，但已经把字符串常量池、静态变量，存放在堆上。逐渐的减少永久代的使用。
- JDK 1.8：无永久代，运行时常量池、类常量池，都保存在元数据区，也就是常说的元空间。但字符串常量池仍然存放在堆上。
JVM 按照线程是否共享将内存分为两大类

线程独享区
只用当前线程能访问的数据区域，线程之间不能共享
线程独享去随着线程的创建而创建，随着线程的销毁而被回收

线程共享区
所有的线程都可以访问
当线程被销毁的时候，共享区的数据不会被立即回收，需要等待达到垃圾回收的阈值之后才会进行回收

1.程序计数器
当同时进行的线程数超过CPU数或其内核数时，就要通过时间片轮询分派CPU的时间资源，不免发生线程切换。这时，每个线程就需要一属于自己的计数器来记录下一条要运行的指令。如果执行的是JAVA方法，计数器记录正在执行的java字节码地址，如果执行的是native方法，则计数器为空。
较小的内存空间、线程私有，记录当前线程所执行的字节码行号。

2.虚拟机栈
存放当前线程中所声明的变量，包括基本数据类型的数据和引用类型的数据的引用。
引用数据类型的引用存放在虚拟机栈中，而对象存放在堆内存中，引用数据类型占用四个字节存放地址
栈帧
每一个线程都会对应一个虚拟机栈，线程中的每个方法都会创建一个栈帧，存放局部变量，操作数栈，常量数据的引用，方法返回值的地址

虚拟机栈溢出异常
栈帧调用的深度太深，会出现虚拟机栈溢出异常StackOverflowError（SOF异常）。一般手动方法的调用是不会出现这个异常的，如果出现了这个异常，99%是由于递归造成的。
可以通过修改虚拟机栈的内存大小设置栈帧的最大深度，指令为：-Xss虚拟机栈内存大小
一般栈帧的深度达到3000~5000即可
太小：虚拟级栈容易溢出
太大：每个线程占据的内存太大，影响线程数量

3.本地方法栈
与虚拟机栈作用相似。但它不是为Java方法服务的，而是本地方法（C语言）。由于规范对这块没有强制要求，不同虚拟机实现方法不同。

4.堆
线程共享的(所有的线程共享一份). 存放对象的,new 的对象都存储在这个区域.还有就是常量池

5.方法区
在 java8 之后，我们把方法区称之为元空间（MetaSpace），方法区在逻辑上属于堆的一部分，但一些具体机制和堆有所区别，如：一些JVM 的方法区是可以不进行垃圾回收的，关闭 JVM 时才会释放方法区内存。所以方法区还有一个别名叫非堆，目的是和堆分开。方法区会存储类信息、静态变量、常量（JDK8 之后不存放字符串常量）、本地机器指令。

如果加载大量 class 文件，也会造成方法区内存溢出，如一个 tomcat 运行 20~30 个项目

 什么是JVM执行引擎

执行引擎是Java虚拟机核心的组成部分之一。JVM将字节码装载到内存中，但是字节码并不能直接运行在操作系统之上。为了执行内存中的字节码文件指令，执行引擎（Execution Engine）就要将字节码指令解释/编译为对应平台上的本地机器指令。

执行引擎的翻译过程为两种：
1. 通过解释器将字节码文件转化为机器指令执行；
2. 使用即时编译器（JIT）将字节码文件的二进制流编译成机器指令执行
目前市面上主流的JVM采用解释器与即时编译器并存的架构。在Java虚拟机运行时，解释器和即时编译器相互协作，取长补短。

什么是解释器与即时编译器

解释器每次解释都会将字节码文件解释为机器指令。整体效率较低，但当程序启动后，解释器可以马上发挥作用，省去编译的时间，立即执行。

即时编译器则会将字节码文件编译成机器指令，存在方法区，编译完成后直接执行本地机器指令即可。编译器吧代码编译成本地代码需要一定的执行时间，但编译为本地代码后执行效率高。

当Java虚拟机启动时，解释器首先发挥作用，不必等待及时编译器全部编译完成后再执行。随着时间的推移，编译器把越来越多的代码编译成本地代码，此时运行本地机器指令，获得更高的执行效率。

简述Java的对象结构

Java对象在内存中主要有以下几个部分：
对象头
MarkWord：一系列标记位（哈希码、分代年龄、锁标记状态等），在64位系统中占8个字节。
ClassPoint：对象对应的类信息的内存地址，在64位系统中占8字节。
Length：数组对象持有，表示数组长度，占4个字节。

实例数据
包含了对象的所有成员变量，大小由变量类型决定。

类型字节
byte 1 字节
short 2 字节
int 4 字节
long 8 字节
char 2~3 字节
float 4 字节
double 8 字节
boolean 1 字节
引用类型 8 字节

对齐填充
将对象大小填充为8字节的整数倍

 为什么要进行垃圾回收？

如果对象只创建不回收，会造成堆内存溢出OutOfMemoryError（OOM）异常。
可以修改堆内存大小的指令
-Xms10M 初始堆内存大小为10M
-Xmx10M 最大堆内存大小为10M

为什么要进行堆内存分区：
1. 提高搜索垃圾的效率。
2. 垃圾回收后可以更好的利用内存空间，存放大对象。
3. 尽可能减少GC次数
简述一下JVM堆内存的划分

老年代：
对象会优先分配到新生代内存中，每次GC后没有回收的对象年龄加一，年龄到15还没有被回收，对象会存放到老年代内存中；如果对象较大，超过新生代内存的一半，对象也会存放到老年代区域。

新生代
为了减少young去垃圾回收后的空间碎片，新生代有分为Eden区和连个Survivor区，且始终有一个Survivor区保持闲置。对象会先存放到Eden区当中，Eden区空间满了之后会进行young区的垃圾回收，之后将young区所有存活的对象复制到闲置的Survivor区中，并清空Eden区和正在使用的Survivor区。

什么是YoungGC和OldGC

YoungGC

新生代区域的垃圾回收称之为YoungGC，也叫MinorGC，Eden区满后会触发YoungGC

OldGC

老年代区域的垃圾回收称之为OldGC，也叫MajorGC，OldGC非常浪费性能，所以我们的JVM调优要尽可能减少OldGC的次数，OldGC往往伴随着YoungGC。YoungGC+OldGC=FullGC

Survivor区空间并不大，如果满了怎么办？
1. 一般情况下GC会回收95%的对象，且超过15次GC的对象会存放到old区，所以Survivor区不容易满。
2. 如果Survivor区满了，会触发担保机制，提前将对象存入Old区。
为什么需要Survivor区？

为了减少垃圾回收带来的空间碎片，空间碎片过多会频繁触发YoungGC。

为什么需要两块Survivor区？

为了减少Survivor区的空间碎片。

如何判断一个对象是垃圾

引用计数法：
如果操作对象，必须通过引用来进行。如果一个对象没有任何引用与之关联，则说明该对象基本不可能在其他地方被使用到。那么这个对象就成为可被回收的对象了。这种方法实现简单，效率高，但是无法解决循环引用的问题，因此Java中并没有采取这种方式（Python采用的引用计数法）。
可达性分析：
以一个GC Root 对象作为起点进行搜索，如果在GC Roots 和对象之间没有可达路径，则称该对象是不可达的。
GC ROOT 对象：
栈帧中本地变量表引用的对象
方法区中静态属性引用的对象
方法区中常量引用的对象
本地方法栈中引用的对象

 你知道哪些垃圾收集算法？

标记——清除算法： 效率较低，有空间碎片。Old区使用的算法

复制算法: 空间碎片少，但会浪费空间。存活对象较少才会使用的算法。young区使用的算法。

标记——整理算法： 空间碎片少，效率较低。Old区使用的算法。

分代收集算法，“分代收集”（Generational Collection）算法，把Java堆分为新生代和老年代，这样就可以根据各个年代的特点采用最适当的收集算法。

什么是垃圾收集器？如何判断一个垃圾收集器的好坏呢？

垃圾收集器是对垃圾回收算法的实现。
垃圾收集器的执行效率= 吞吐量 / 停顿时间
吞吐量 = 用户代码执行时间 / （用户代码执行事件+停顿时间）

说一下 JVM 有哪些垃圾收集器？

串行收集器： 只有一个垃圾回收线程，在垃圾回收时暂停用户代码线程，如 Serial 和 Serial Old收集器。

并行收集器: 吞吐量优先，多个垃圾收集器线程共同工作, 尽快完成垃圾收集。如 ParNew，Parallel Scanvenge, Parallel Old 收集器

并发收集器: 停顿时间优先，用户线程和垃圾回收线程一同工作，用户代码线程也会完全停止一小段时间，如 CMS，G1 收集器。

CMS收集器

CMS（concurrent mark sweep，并发标记扫描）收集器是并发收集器，是基于标记 ——清理的算法进行垃圾回收，用于 OldGC
优点：并发收集、低停顿
缺点：会产生大量空间碎片，停顿时间虽然短但是不可控。

问：CMS 收集器为什么不进行并发的初始标记？
因为初始标记速度很快，不值得多开线程，开线程也是需要耗费资源的

 G1 收集器

G1（garbage first，垃圾优先）收集器是并发收集器，从 JDK1.7 开始支持，能进行OldGC 和 YoungGC。Old 区采用标记整理算法，Young 区采用复制算法。
G1 收集器没有固定的 Old、Young、Eden、Survivor 区，而是将内存分为一个个大小相等的 Region（格子，1Mb~32Mb)。每次垃圾回收后，Region 的用途可以发生改变，提高了内存的灵活性和利用率。

G1 收集器可以根据开发者设置的参数，停顿时间的期望值，优先筛选回收存活的对象比较少，垃圾对象比较大的区域 Region，可以把更多空余的空间释放出来。

ZGC 收集器

ZGC 从 JDK11 开始支持，目前还是一个实验性版本，原理类似 G1。是目前收集效率最高的垃圾收集器，平均暂停时间为 0.05 毫秒。

如何选择垃圾收集器？

优先让服务器自己来选择
- 如果内存小于 100M，使用串行收集器参数： -XX:+UseSerialGC 。
- 如果服务器是单核，并且没有停顿时间要求，使用串行收集器参数： -XX:+UseSerialGC
- 如果你的应用是“吞吐量”优先的，并且对较长时间的停顿没有什么特别的要求。选择并行收集器是比较好的。参数： -XX:+UseParallelGC
- 如果你的应用对响应时间要求较高，想要较少的停顿。甚至 1 秒的停顿都会引起大量的请求失败，那么选择 G1 、 ZGC 、 CMS 都是合理的。虽然这些收集器的 GC 停顿通常都比较短，但它需要一些额外的资源去处理这些工作，通常吞吐量会低一些。
  参数：
  -XX:+UseConcMarkSweepGC 、
  -XX:+UseG1GC 、
  -XX:+UseZGC 等。
如何设置JVM的参数？

Intellij idea：在运行设置的 VM Option 中设置。
tomcat：进入 Tomcat 的 bin 目录下，打开文件 catalina.bat/catalina.sh，修改如下参数。
```
set "JAVA_OPTS=参数"
1
```
JVM常用命令

jps：查看当前执行的所有 JAVA 进程
jinfo：实时查看 JVM 参数
jinfo -flag InitialHeapSize PID：JAVA 进程堆内存大
jinfo -flag UseG1GC PID：JAVA 进程是否使用 G1GC
jinfo -flag UseParallelGC PID：JAVA 进程是否使用 ParallelG
jstat：虚拟机性能信息
jstat -class PID 1000：每秒查看一次虚拟机中类加载信息
jmap：打印快照
jmap -heap PID：查看堆存储快照
jmap -dump:format=b,file=heap.hprof PID：在出现内存溢出异常时，将堆内存的信息下载到文件中
相关阅读:
OpenHarmony AI框架开发指导
 .NET周刊【11月第1期 2023-11-09】
【Go语言入门教程】Go语言简介
 Locust性能测试 —— 环境搭建及使用
 go语言之不必要的拷贝
 [负载均衡]-LVS
Eotalk Vol.03：结合 API & DaaS，让使用数据更方便
 【验证用户输入的日期格式是否正确——工具类SimpleDateFormat类的使用】
PHPStorm PHP-CS-Fixer
微服务第一章 Java线程池技术应用
原文地址：https://blog.csdn.net/weixin_65180200/article/details/133845303

类型	字节
byte	1 字节
short	2 字节
int	4 字节
long	8 字节
char	2~3 字节
float	4 字节
double	8 字节
boolean	1 字节
引用类型	8 字节

文章目录

什么是 JVM?

Java语言的执行原理？

Java的字节码文件结构？

什么是u2,u4?

JVM 加载过程都是什么步骤？

什么是类加载器？

什么是双亲委派模型

如何打破双亲委派机制？

什么是 tomcat 类加载机制？

什么是JVM内存模型？

JVM 按照线程是否共享将内存分为两大类

什么是JVM执行引擎

什么是解释器与即时编译器

简述Java的对象结构

为什么要进行垃圾回收？

为什么要进行堆内存分区：

简述一下JVM堆内存的划分

什么是YoungGC和OldGC

YoungGC

OldGC

Survivor区空间并不大，如果满了怎么办？

为什么需要Survivor区？

为什么需要两块Survivor区？

如何判断一个对象是垃圾

你知道哪些垃圾收集算法？

什么是垃圾收集器？如何判断一个垃圾收集器的好坏呢？

说一下 JVM 有哪些垃圾收集器？

CMS收集器

G1 收集器

ZGC 收集器

如何选择垃圾收集器？

如何设置JVM的参数？

JVM常用命令