• JVM(Java Virtual Machine)内存模型篇


    前言

    本文是JVM系列的内存模型篇参考资料为《深入理解Java虚拟机》,本文章将会以HotSpot 虚拟机为介绍基础。

    本系列其他文章链接:
    JVM(Java Virtual Machine)垃圾收集算法篇
    JVM(Java Virtual Machine)垃圾收集器篇
    JVM(Java Virtual Machine)G1收集器篇

    1.JVM简单介绍

    Java Virtual Machine是运行Java程序的基础,JVM基于C、C++实现,JVM有很多种类,但是这些虚拟机都必须按照《Java虚拟机规范》来进行实现。目前JDK使用的是HotSpot虚拟机。

    2.JVM内存模型

    根据《Java虚拟机规范》的规定,Java虚拟机所管理的内存将会包括以下几个运行时数据区域

    • 程序计数器
    • Java虚拟机栈
    • 本地方法栈
    • 方法区

    分布如下图:
    在这里插入图片描述

    3.程序计数器

    程序计数器是Java中占用内存比较少的一个区域,他的作用是记录当前线程所执行的字节码的行号指令,通俗的理解就是代码执行到哪里了

    我们很容易思考到,在多线程中,是发生线程切换这种情况的,那么一个线程被切换后,它的状态就需要被记录到上下文中,方便线程能正确执行到原来的位置,那么为了记录这个位置,就需要程序计数器来进行实现

    为了线程切换后能恢复到正确的执行位置,每个线程都需要一个独立程序计数器,各个线程之间计数器互不影响,独立存储。因此它也是“线程私有”的内存

    这片区域也是唯一一个在《Java虚拟机规范》中没有任何OutOfMemoryError情况的区域。

    4.Java虚拟机栈

    Java虚拟机栈,以“栈”命名的,在内存模型中,基本都是用来处理方法的,所以Java虚拟机栈是用来处理Java语言实现的方法的。同理的,这个栈也是线程私有的。他的生命周期与线程生命周期一样长。

    一个线程在调用方法的时候,会在虚拟机栈中,创建一个栈帧,这个栈帧会存放局部变量表、操作数栈、动态连接、方法出口等信息。
    在这里插入图片描述
    栈帧包含以下内容:

    • 局部变量表: 栈帧用于存储方法的局部变量,表中存放了编译期可知的基本数据类型和对象引用(对象引用指针或者句柄)。这些局部变量在方法调用时分配内存空间,并在方法调用结束后被释放。

    • 操作数栈: 栈帧还包含一个操作数栈,用于存储方法执行时的操作数。当方法需要进行计算或操作时,操作数会被入栈或出栈。

    • 动态链接: 栈帧包含指向运行时常量池中当前方法引用的指针,用于在方法中访问其他类或方法。

    • 方法出口: 当方法调用完成后,程序需要返回到方法调用的地方继续执行。栈帧包含方法返回地址,用于记录返回的位置。

    额外提一嘴的是当Java虚拟机栈的深度被方法调用填满的时候,就会出现StackOverFlowError;如果栈的大小动态扩展到没办法扩展的时候,会报OOM(OutOfMemoryError)的错误。

    5.本地方法栈

    这个栈和Java虚拟机栈是一样的功能,但是作用的对象不一样,Java虚拟机栈对应的是Java方法,而本地方法栈对应的是被Native标志的方法,这类方法一般都是C、C++代码。其他东西基本和Java虚拟机栈一致。

    6.方法区

    方法区与Java堆一样,是各个线程共享的内存区域,这块区域是用来存储已经被加载的类元信息,这些信息包含:类型信息、常量、静态变量、即使编译后的代码缓存等信息。

    6.1永久代与元空间

    早在JDK1.8以前,方法区使用的永久代的实现方式,而在1.8后才正式确定使用元空间。那么二者实现上有什么区别呢????

    最大的区别就是前者是使用的虚拟机内存,后者使用了直接内存,也就是说永久代的内存大小受JVM限制,而元空间内存大小受真实机子内存大小限制,明显后者内存大小更大,前者更容易OOM。

    在方法区使用元空间后,字符串常量池也从方法区移动到了堆内存中。

    6.2运行时常量池

    提到方法区,就不得不提到一个叫运行时常量池的东西,它也是方法区的一部分。

    一个Class文件除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池表,用于存放编译期生成的各种字面量符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。

    7.堆

    堆内存是整个虚拟机中最大的一块,这块区域是被线程共享的,这块对象就是用来在程序执行时,大部分对象存放的地方(还有极小一部分可能会发生逃逸分析,在栈上创建和销毁)。

    堆这块区域,也是最容易发生OOM的地方,原因可想而知,公共的地方,大家都来这里放东西,时间一长,没有空间也很正常,所以这块区域也是发生GC(Garbage Collected)频率最高的一个场所。(具体GC流程,下篇文章会详细介绍)

    7.1 对象创建

    堆中的对象(普通对象)创建过程也是比较讲究的,下面我们带着问题,一步一步理解这个过程

    首先,如何创建?

    很简单的,new关键字

    那么问题又来了,对象创建依赖的信息从哪里来?

    当Java遇到一条字节码new指令的时候,首先将去检测这个指令能否在常量池中定位到一个类的符号引用,并检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那么必须先执行相应的类加载(双亲委派模型)。

    对象依赖信息得到后,内存大小该如何划分分配?

    当一个类被加载之后,相应的对象创建所需的内存大小也就能被确定了。那么要在堆中创建对象,就需要划分空间,JVM中有两种划分空间的方式,分别是“指针碰撞”和“空闲列表”

    • 指针碰撞
      假设Java堆中内存分配绝对规整,使用过的和未使用的分成两边,只需要在边界设置指针,这个指针只需要挪动和对象大小一样的距离即可,这种就是指针碰撞
    • 空闲列表
      假如Java堆内存并不规整,使用过的和未使用的都混在一起,这种情况,要分配内存就只能维护一个列表,这个列表记录了哪些内存可以使用,分配内存就需要在表中查找到足够到的区间进行分配即可,这就是空闲列表

    并发下,对象创建的内存分配安全如何得到保证?

    为我们所知的,堆内存是一个线程共享的,这就意味着,我们堆在划分内存大小的时候,可能会出现线程安全问题。可能出现线程1在给A分配大小的时候,还没来得及修改指针,但是线程2在创建B时,使用了这个指针,就导致了内存数据被改写了。解决这个问题有两个方式

    • 加锁同步
      实际实现中虚拟机是采用CAS+失败重试的方式保证更新操作的原子性
    • TLAB(Thread Local Allocation Buffer,本地缓冲区),也和ThreadLocal一样,给每个线程各自划分好区域,线程要创建对象,就在这个区域内创建就行,如果TLAB使用完了才需要进行同步锁定分配对象。如果JVM要使用TLAB,可以通过-XX:+/-UseTLAB参数来设定

    实际上,内存分配成功之后,虚拟机还会对分配到的内存空间(不包括对象头)进行初始化工作,零值处理。这步操作是为了保证对象实例字段在Java代码中可以不赋值就能直接使用。

    经历以上步骤,对象创建后,对象还需要设置什么?

    需要设置“对象属于哪个类的实例”、“类的元数据信息“”、“对象hash码(实际调用Object::hashCode才会生成)”、“GC分代年龄”,这些信息都被描述在对象头中

    最终

    在上面工作都完成后,看似一个对象已经被创建了,但实际上,整个生命过程还差一步,即初始化,构造函数中的初始化工作还没有被真正执行,也就是 < init > ()方法,所以值都是默认为零值的,所以当构造函数执行完成后,一个对象就被完成创建了。

    7.2 对象的内存布局

    在了解一个对象的创建过程后,我们来看看,一个对象内部布局是如何的,直接看下图:
    在这里插入图片描述
    对象头:这部分包含了两部分信息

    • 第一部分:HashCode、GC分代年龄、锁状态标记、线程持有的锁、偏向锁ID、偏向锁时间戳等信息等,这部分信息官方称之为:Mark Word,这部分数据在32位和64位虚拟机(未开启指针压缩)中分别占用32bit和64bit。
    • 第二部分:类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定这个对象是哪个类的实例。如果是数组对象,对象头中还会记录数组长度,如果不是则无记录。

    实例数据:这部分数据是对象真正存储的有效信息

    对齐填充:这部分的内容不是必然存在的,也没有特殊含义,这部分的主要作用就是保证这个对象大小是8字节的整数倍,差多少,尽可能补多少。

    JVM执行流程

    在这里插入图片描述

    • 代码编译:Java源代码通过Java编译器(javac)编译成字节码文件(.class文件)。

    • 类加载:JVM的类加载器将字节码文件加载到内存中,并进行校验、准备、解析等处理。

    • 内存分配:JVM为加载的类分配内存,包括方法区、堆、栈等。

    • 初始化:JVM对类进行初始化,包括静态变量的赋值、静态代码块的执行等。

    • 执行:JVM开始执行字节码指令,逐行读取字节码文件并执行。这个执行过程交给执行引擎将字节码翻译成CPU指令交给操作系统去执行

    END
    以上是本文全部内容,希望对你有所帮助
  • 相关阅读:
    方法的重写(override / overwrite)
    人工智能数学课高等数学线性微积分数学教程笔记(1. 数学内容概述)
    小学生python游戏编程arcade----可旋转的坦克的发射子弹
    应用在脉冲变压器中的光电耦合器
    STM32 TIM(一)定时中断
    QCC51XX---GATT
    IShellFolder2::GetDetailsOf第二个参数(UINT iColumn)数值对应详细信息的项
    SpringBoot集成Tomcat服务
    互斥锁(mutex)
    谈谈从DAMA、DCMM和DGI三大数据治理框架详细了解数据战略规划的关键要素
  • 原文地址:https://blog.csdn.net/weixin_59216829/article/details/133903217