JVM 的全称是 「Java Virtual Machine」,也就是我们耳熟能详的 Java 虚拟机。它能识别 .class后缀的文件,并且能够解析它的指令,最终调用操作系统上的函数,完成我们想要的操作。
C++开发出来的程序,编译成二进制文件后,就可以直接执行了,操作系统是能够识别的。
但是咱们的Java程序就不一样了,使用javac命令编译出来的的.class文件之后,操作系统是不能识别的,需要对应JVM去做一个转换后,操作系统才能识别。
JDK是Sun公司(已被Oracle收购)针对Java开发员的软件开发工具包。自从Java推出以来,JDK已经成为使用最广泛的Java SDK(Software development kit)。
JRE全称Java Runtime Environment,是运行基于Java语言编写的程序所不可缺少的运行环境。也是通过它,Java的开发者才得以将自己开发的程序发布到用户手中,让用户使用。
JVM 就是 Java 虚拟机,它能识别 .class后缀的文件,并且能够解析它的指令,最终调用操作系统上的函数,完成我们想要的操作。
JDK中包含JRE,也包括JDK,而JRE也包括JDK。
范围关系:JDK>JRE>JVM。
1.对象获取。调用person类的父类方法getClaass();
2.类名获取。每个类型(包括基本类型和引用)都有一个静态属性,class;
3.Class类的静态方法获取。forName("字符串的类名")写全名,要带包名。(包名.类名)
负责加载$JAVA_HOME中 jre/lib/rt.jar里所有的class或Xbootclassoath选项指定的jar包。由C++实现,不是ClassLoader子类。
负责加载Java平台中扩展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar或 -Djava.ext.dirs指定目录下的jar包。
负责加载classpath中指定的jar包及 Djava.class.path所指定目录下的类和jar包。
通过java.lang.ClassLoader的子类自定义加载class,属于应用程序根据自身需要自定义的ClassLoader,如tomcat、jboss都会根据j2ee规范自行实现ClassLoader。
用户根据需求自己定义的。需要继承自ClassLoader,重写方法findClass()。
如果想要编写自己的类加载器,只需要两步:
**ClassLoader**超类的loadClass方法用于将类的加载操作委托给其父类加载器去进行,只有当该类尚未加载并且父类加载器也无法加载该类时,才调用findClass方法。如果要实现该方法,必须做到以下几点:
1.为来自本地文件系统或者其他来源的类加载其字节码。2.调用ClassLoader超类的defineClass方法,向虚拟机提供字节码。
可以使用虚拟机参数-Xss 选项来设置线程的最大栈空间,栈的大小直接决定了函数调用的最大可达深度;
-Xss size
如果在栈帧中有一个变量,类型为引用类型,比如
- package com.tian.my_code.test;
-
- public class JvmCodeDemo {
- public Object testGC(){
- int op1 = 10;
- int op2 = 3;
- Object obj = new Object();
- Object result=obj;
- return result;
- }
- }
这时候就是典型的栈中元素obj指向堆中的Object对象,result的指向和obj的指向为同一个对象。
使用命令
javac -g:vars JvmCodeDemo.java
进行编译,然后再使用
javap -v JvmCodeDemo.class >log.txt
然后打开log.txt文件
方法区中会存放静态变量,常量等数据。
如果是下面这种情况,就是典型的方法区中元素指向堆中的对象。【「红线」】
方法区中会包含类的信息,对象保存在堆中,创建一个对象的前提是有对应的类信息,这个类信息就在方法区中。
一个Java对象在内存中包括3个部分:对象头、实例数据和对齐填充。
还可能问你:请说一下Minor/Major/Full GC分别发送在哪个区域。
❝
Minor GC:发生在年轻代的 GC Major GC:发生在老年代的 GC。Full GC:新生代+老年代,比如 Metaspace 区引起年轻代和老年代的回收。
❞
1)调用System.gc时,系统建议执行Full GC,但是不必然执行;
2)老年代空间不足;
3)方法去空间不足;
4)通过Minor GC后进入老年代的平均大小 > 老年代的可用内存;
5)由Eden区、From Space区向To Space区复制时,对象大小大于To Space可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小。即老年代无法存放下新年代过度到老年代的对象的时候,会触发Full GC。
如果没有Survivor,Eden区每进行一次Minor GC ,并且没有年龄限制的话, 存活的对象就会被送到老年代。这样一来,老年代很快被填满,触发Major GC(因为Major GC一般伴随着Minor GC,也可以看做触发了Full GC)。老年代的内存空间远大于新生代,进行一次Full GC消耗的时间比Minor GC长得多。
执行时间长有什么坏处?频发的Full GC消耗的时间很长,会影响大型程序的执行和响应速度。
可能你会说,那就对老年代的空间进行增加或者较少咯。
假如增加老年代空间,更多存活对象才能填满老年代。虽然降低Full GC频率,但是随着老年代空间加大,一旦发生Full GC,执行所需要的时间更长。
假如减少老年代空间,虽然Full GC所需时间减少,但是老年代很快被存活对象填满,Full GC频率增加。
所以Survivor的存在意义,就是减少被送到老年代的对象,进而减少Full GC的发生,Survivor的预筛选保证,只有经历16 次Minor GC还能在新生代中存活的对象,才会被送到老年代。
最大的好处就是解决了碎片化。
假设现在只有一个Survivor区,我们来模拟一下流程:
刚刚新建的对象在Eden中,一旦Eden满了,触发一次Minor GC,Eden中的存活对象就会被移动到Survivor区。这样继续循 环下去,下一次Eden满了的时候,问题来了,此时进行Minor GC,Eden和Survivor各有一些存活对象,如果此时把Eden区的 存活对象硬放到Survivor区,很明显这两部分对象所占有的内存是不连续的,也就导致了内存碎片化。
永远有一个Survivor space是空的,另一个非空的Survivor space无碎片。
新生代中的可用内存:复制算法用来担保的内存为9:1,所以只会造成 10% 的空间浪费。可用内存中Eden:S1区为8:1 即新生代中Eden:S1:S2 = 8:1:1
这个比例,是由参数 -XX:SurvivorRatio 进行配置的(默认为 8)。
给对象添加一个引用计数器,每当一个地方引用它object时计数加1,引用失去以后就减1,计数为0说明不再引用
- public class A {
- public B b;
- }
- public class B {
- public C c;
- }
- public class C {
- public A a;
- }
- public class Test{
-
- private void test(){
- A a = new A();
- B b = new B();
- C c = new C();
-
- a.b=b;
- b.c=c;
- c.a=a;
- }
- }
当一个对象到GC Roots没有引用链相连,即就是GC Roots到这个对象不可达时,证明对象不可用。
GC Roots种类:
❝
Java 线程中,当前所有正在被调用的方法的引用类型参数、局部变量、临时值等。也就是与我们栈帧相关的各种引用。所有当前被加载的 Java 类。Java 类的引用类型静态变量。运行时常量池里的引用类型常量(String 或 Class 类型)。JVM 内部数据结构的一些引用,比如 sun.jvm.hotspot.memory.Universe 类。用于同步的监控对象,比如调用了对象的 wait() 方法。
❞
- public class Test{
- private void test(C c){
- A a = new A();
- B b = new B();
- a.b=b;
- //这里的a/b/c都是GC Root;
- }
- }
这个方法就有点类似:某个人被判了死刑,但是不一定会死。
即使在可达性分析算法中不可达的对象,也并非一定是“非死不可”的,这时候他们暂时处于“缓刑”阶段,真正宣告一个对象死亡至少要经历两个阶段:
1、如果对象在可达性分析算法中不可达,那么它会被第一次标记并进行一次筛选,刷选的条件是是否需要执行finalize()方法(当对象没有覆盖finalize()或者finalize()方法已经执行过了(对象的此方法只会执行一次)),虚拟机将这两种情况都会视为没有必要执行)。
2、如果这个对象有必要执行finalize()方法会将其放入F-Queue队列中,稍后GC将对F-Queue队列进行第二次标记,如果在重写finalize()方法中将对象自己赋值给某个类变量或者对象的成员变量,那么第二次标记时候就会将它移出“即将回收”的集合。
第一步:就是找出活跃的对象。我们反复强调 GC 过程是逆向的, 根据 GC Roots 遍历所有的可达对象,这个过程,就叫作标记。
第二步:除了上面标记出来的对象以外,其余的都清楚掉。
新生代使用,新生代分中Eden:S0:S1= 8:1:1,其中后面的1:1就是用来复制的。
当其中一块内存使用完了,就将还存活的对象复制到另外一块上面,然后把已经使用过的内存空间一次 清除掉。
一般对象分配都是进入新生代的eden区,如果Minor GC还存活则进入S0区,S0和S1不断对象进行复制。对象存活年龄最大默认是15,大对象进来可能因为新生代不存在连续空间,所以会直接接入老年代。任何使用都有新生代的10%是空着的。
它的主要思路,就是移动所有存活的对象,且按照内存地址顺序依次排列,然后将末端内存地址以后的内存全部回收。 但是需要注意,这只是一个理想状态。对象的引用关系一般都是非常复杂的,我们这里不对具体的算法进行描述。我们只需要了解,从效率上来说,一般整理算法是要低于复制算法的。这个算法是规避了内存碎片和内存浪费。
让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
从上面的三个算法来看,其实没有绝对最好的回收算法,只有最适合的算法。
Serial收集器是最基本、发展历史最悠久的收集器,曾经(在JDK1.3.1之前)是虚拟机新生代收集的唯一选择。
它是一种单线程收集器,不仅仅意味着它只会使用一个CPU或者一条收集线程去完成垃圾收集工作,更重要的是其在进行垃圾收集的时候需要暂停其他线程。
❝
优点:简单高效,拥有很高的单线程收集效率 缺点:收集过程需要暂停所有线程 算法:复制算法 应用:Client模式下的默认新生代收集器
❞
收集过程:
可以把这个收集器理解为Serial收集器的多线程版本。
❝
优点:在多CPU时,比Serial效率高。缺点:收集过程暂停所有应用程序线程,但CPU时比Serial效率差。算法:复制算法 应用:运行在Server模式下的虚拟机中首选的新生代收集器
❞
收集过程:
Parallel Scavenge收集器是一个新生代收集器,它也是使用复制算法的收集器,又是并行的多线程收集 器,看上去和ParNew一样,但是Parallel Scanvenge更关注 系统的吞吐量 ;
❝
吞吐量 = 运行用户代码的时间 / (运行用户代码的时间 + 垃圾收集时间)
比如虚拟机总共运行了120秒,垃圾收集时间用了1秒,吞吐量=(120-1)/120=99.167%。
若吞吐量越大,意味着垃圾收集的时间越短,则用户代码可以充分利用CPU资源,尽快完成程序的运算任务。
❞
可设置参数:
- -XX:MaxGCPauseMillis控制最大的垃圾收集停顿时间,
- -XX:GC Time Ratio直接设置吞吐量的大小。
-
「特点」:最短回收停顿时间,
「回收算法」:标记-清除
「回收步骤」:
「缺点」:对CPU资源非常敏感,CPU少于4个时,CMS对用户程序的影响可能变得很大,有此虚拟机提供了“增量式并发收集器”;无法回收浮动垃圾;采用标记清除算法会产生内存碎片,不过可以通过参数开启内存碎片的合并整理。
收集过程:
Serial Old收集器是Serial收集器的老年代版本,也是一个单线程收集器,不同的是采用"标记-整理算 法",运行过程和Serial收集器一样。
「适用场景」:JDK1.5前与Parallel Scanvenge配合使用,作为CMS的后备预案;
收集过程:
Parallel Old收集器是Parallel Scavenge收集器的老年代版本,使用多线程和"标记-整理算法"进行垃圾 回收,吞吐量优先;
「回收算法」:标记-整理
「适用场景」:为了替代serial old与Parallel Scanvenge配合使用
收集过程:
从 JDK 9 开始,JVM 的默认垃圾回收器就从 Parallel GC 调整为 G1,并且开始全面废除 CMS 。
限制或者减少 GC 停顿时间相比系统吞吐量而言更加重要,从 PGC 切换至低延迟的 G1 能够为大部分用户带来更好的体验。G1 的性能在 JDK 8 以及后续的 release 版本都得到了极大的优化,G1 是一个具备所有 GC 特性的垃圾回收器,因此将 G1 设置为 JVM 默认的 GC。
根据 JEP-291 中的说明,为了减轻 GC 代码的维护负担以及加速新功能开发,决定在 JDK 9 中废弃 CMS GC。
从 Java 9 开始,如果您使用 -XX:+UseConcMarkSweepGC(激活 CMS GC 算法的参数)参数启动应用程序,则会在下面显示警告消息:
- Java HotSpot(TM) 64-Bit Server VM warning: Option UseConcMarkSweepGC was deprecated in version 9.0 and will likely be removed in a future release.
-
如果你想知道当前应用对应的 JVM 版本,你可以使用以下命令进行查询:
G1将整个JVM堆划分成多个大小相等的独立区域regin,跟踪各个regin里面的垃圾堆积的价值大小,在后台维护一个优先列表,每次根据允许的收集时间,有线回收最大的regin,芮然还保留有新生代和老年代的概念,但新生代和老年代不在是物理隔离了,他们都是一部分regin集合。
内存“化整为零”的思路:在GC根节点的枚举范围汇总加入remembered set 即可保证不对全堆扫面也不会遗漏。
「回收步骤」:
G1收集器优势
「并行与并发」:G1能充分利用多CPU、多核环境下的硬件优势,使用多个CPU来缩短Stop-The-World停顿时间。部分收集器原本需要停顿Java线程来执行GC动作,G1收集器仍然可以通过并发的方式让Java程序继续运行。
「分代收集」:G1能够独自管理整个Java堆,并且采用不同的方式去处理新创建的对象和已经存活了一段时间、熬过多次GC的旧对象以获取更好的收集效果。
「空间整合」:G1运作期间不会产生空间碎片,收集后能提供规整的可用内存。
「可预测的停顿」:G1除了追求低停顿外,还能建立可预测的停顿时间模型。能让使用者明确指定在一个长度为M毫秒的时间段内,消耗在垃圾收集上的时间不得超过N毫秒。
收集过程:
G1的回收过程主要分为 3 类:
(1)G1“年轻代”的垃圾回收,同样叫 Minor G1,这个过程和我们前面描述的类似,发生时机就是 Eden 区满的时候。
(2)老年代的垃圾收集,严格上来说其实不算是收集,它是一个“并发标记”的过程,顺便清理了一点点对象。
(3)真正的清理,发生在“混合模式”,它不止清理年轻代,还会将老年代的一部分区域进行清理。
ZGC(Z Garbage Collector)是一款由Oracle公司研发的,以低延迟为首要目标的一款垃圾收集器。它是基于「动态Region」内存布局,(暂时)「不设年龄分代」,使用了「读屏障」、「染色指针」和「内存多重映射」等技术来实现「可并发的标记-整理算法」的收集器。
在JDK 11新加入,还在实验阶段,主要特点是:「回收TB级内存(最大4T),停顿时间不超过10ms」。
「优点」:低停顿,高吞吐量,ZGC收集过程中额外耗费的内存小
「缺点」:浮动垃圾
目前使用的非常少,真正普及还是需要写时间的。
「新生代收集器」:Serial、ParNew、Parallel Scavenge
「老年代收集器」:CMS、Serial Old、Parallel Old
「整堆收集器」:G1,ZGC(因为不涉年代不在图中)
选择建议:
从上面这些出发点来看,我们平常的 Web 服务器,都是对响应性要求非常高的。选择性其实就集中在 CMS、G1、ZGC上。而对于某些定时任务,使用并行收集器,是一个比较好的选择。
X或者XX开头的都是非转标准化参数
意思就是说准表化参数不会变,非标准化参数可能在每个JDK版本中有所变化,但是就目前来看X开头的非标准化的参数改变的也是非常少。
- 格式:-XX:[+-]<name> 表示启用或者禁用name属性。
- 例子:-XX:+UseG1GC(表示启用G1垃圾收集器)
-
-Xms 初始堆大小,ms是memory start的简称 ,等价于-XX:InitialHeapSize-Xmx 最大堆大小,mx是memory max的简称 ,等价于参数-XX:MaxHeapSize
❝
注意:在通常情况下,服务器项目在运行过程中,对空间会不断的收缩与扩张,势必会造成不必要的系统压力。所以在生产环境中,JVM的Xms和Xmx要设置成一样的,能够避免GC在调整堆大小带来的不必要的压力。
❞
-XX:NewSize=n 设置年轻代大小-XX:NewRatio=n 设置年轻代和年老代的比值。如:-XX:NewRatio=3,表示年轻代与年老代比值为1:3,年轻代占整个年轻代年老代和的1/4,默认新生代和老年代的比例=1:2。-XX:SurvivorRatio=n 年轻代中Eden区与两个Survivor区的比值。注意Survivor区有两个,默认是8,表示
Eden:S0:S1=8:1:1
如:-XX:SurvivorRatio=3,表示Eden:Survivor=3:2,一个Survivor区占整个年轻代的1/5。
-XX:MaxPermSize=n 设置持久代大小
-XX:MetaspaceSize 设置元空间大小
-XX:+UseSerialGC 设置串行收集器-XX:+UseParallelGC 设置并行收集器-XX:+UseParalledlOldGC 设置并行年老代收集器-XX:+UseConcMarkSweepGC 设置并发收集器
-XX:+PrintGC-XX:+PrintGCDetails-XX:+PrintGCTimeStamps-Xloggc:filenameGC日志输出到文件里filename,比如:-Xloggc:/gc.log
-XX:ParallelGCThreads=n 设置并行收集器收集时使用的CPU数。并行收集线程数。
-XX:MaxGCPauseMillis=n 设置并行收集最大暂停时间
-XX:GCTimeRatio=n 设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)
-XX:MaxGCPauseMillis=n设置并行收集最大暂停时间
-XX:+CMSIncrementalMode 设置为增量模式。适用于单CPU情况。-XX:ParallelGCThreads=n 设置并发收集器年轻代收集方式为并行收集时,使用的CPU数。并行收集线程数。
-XX:+PrintCommandLineFlags查看当前JVM设置过的相关参数
-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath
堆内存出现OOM的概率是所有内存耗尽异常中最高的,出错时的堆内信息对解决问题非常有帮助,所以给JVM设置这个参数(-XX:+HeapDumpOnOutOfMemoryError),让JVM遇到OOM异常时能输出堆内信息,并通过(-XX:+HeapDumpPath)参数设置堆内存溢出快照输出的文件地址,这对于特别是对相隔数月才出现的OOM异常尤为重要。
- -Xms10M -Xmx10M -Xmn2M -XX:SurvivorRatio=8 -XX:+HeapDumpOnOutOfMemoryError
- -XX:HeapDumpPath=D:\study\log_hprof\gc.hprof
-
-XX:OnOutOfMemoryError
表示发生OOM后,运行jconsole.exe程序。这里可以不用加“”,因为jconsole.exe路径Program Files含有空格。利用这个参数,我们可以在系统OOM后,自定义一个脚本,可以用来发送邮件告警信息,可以用来重启系统等等。
- -XX:OnOutOfMemoryError="C:\Program Files\Java\jdk1.8.0_151\bin\jconsole.exe"
-
- java -Xmx3550m -Xms3550m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m -XX:MaxTenuringThreshold=0
-
-Xmx3500m 设置JVM最大可用内存为3550M。
-Xms3500m 设置JVM促使内存为3550m。此值可以设置与-Xmx相同,以避免每次垃圾回收完成后JVM重新分配内存。-Xmn2g 设置年轻代大小为2G。
❝
整个堆大小=年轻代大小 + 年老代大小 + 方法区大小
❞
-Xss128k 设置每个线程的堆栈大小。JDK1.5以后每个线程堆栈大小为1M,以前每个线程堆栈大小为256K。根据应用的线程所需内存大小进行调整。在相同物理内存下,减小这个值能生成更多的线程。但是操作系统对一个进程内的线程数还是有限制的,不能无限生成,经验值在3000~5000左右。
-XX:NewRatio=4 设置年轻代(包括Eden和两个Survivor区)与年老代的比值(除去持久代)。设置为4,则年轻代与年老代所占比值为1:4,年轻代占整个堆栈的1/5 。
-XX:SurvivorRatio=4 设置年轻代中Eden区与Survivor区的大小比值。设置为4,则两个Survivor区与一个Eden区的比值为2:4,一个Survivor区占整个年轻代的1/6 -XX:MaxPermSize=16m 设置持久代大小为16m。
-XX:MaxTenuringThreshold=0 设置垃圾最大年龄。如果设置为0的话,则年轻代对象不经过Survivor区,直接进入年老代。对于年老代比较多的应用,可以提高效率。如果将此值设置为一个较大值,则年轻代对象会在Survivor区进行多次复制,这样可以增加对象在年轻代的存活时间,增加在年轻代即被回收的概论。
另外还准备了大厂面试题:
资料已整理成文档,需要获取的小伙伴可以直接转发+关注后私信(学习)即可获取哦