• 3、深入理解synchronized



    synchronized基础

    Java内存模型带来的线程安全问题

    线程安全问题示例

    思考: 两个线程对初始值为 0 的静态变量一个做自增,一个做自减,各做5000 次,结果是 0 吗?

    @Slf4j
    public class SyncDemo {
        private static volatile int counter = 0;
        public static void increment() {
            counter++;
        }
        public static void decrement() {
            counter--;
        }
        public static void main(String[] args) throws InterruptedException {
            Thread t1 = new Thread(() -> {
                for (int i = 0; i < 50000; i++) {
                    increment();
                }
            }, "t1");
            Thread t2 = new Thread(() -> {
                for (int i = 0; i < 50000; i++) {
                    decrement();
                }
            }, "t2");
            t1.start();
            t2.start();
            t1.join();
            t2.join();
            log.info("counter={}", counter);
        }
    }
    //多次运行结果
    20:42:45.773 [main] INFO com.example.demo.seven_two_six.concurrent.sync.SyncDemo - counter=-2518
    20:43:28.323 [main] INFO com.example.demo.seven_two_six.concurrent.sync.SyncDemo - counter=-1177
    20:43:36.257 [main] INFO com.example.demo.seven_two_six.concurrent.sync.SyncDemo - counter=97
    20:43:50.251 [main] INFO com.example.demo.seven_two_six.concurrent.sync.SyncDemo - counter=1103
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32

    原因分析

    由于 Java 中对静态变量的自增,自减并不是原子操作,因此可能存在多个线程在执行自增和自减时,顺序不一致问题,导致不同的线程覆盖之前线程写入内存的数据
    我们可以查看 i++和 i–(i 为静态变量)的 JVM 字节码指令:

    i++字节码指令
    0 getstatic #2 <com/example/demo/seven_two_six/concurrent/sync/SyncDemo.counter : I> // 获取静态变量i的值
    3 iconst_1 //将int常量1压入操作数栈
    4 iadd //自增
    5 putstatic #2 <com/example/demo/seven_two_six/concurrent/sync/SyncDemo.counter : I> //将修改后的值存入静态变量i
    
    • 1
    • 2
    • 3
    • 4

    字节码截图:

    在这里插入图片描述

    i–字节码指令
    0 getstatic #2 <com/example/demo/seven_two_six/concurrent/sync/SyncDemo.counter : I>// 获取静态变量i的值
    3 iconst_1 //将int常量1压入操作数栈
    4 isub //自减
    5 putstatic #2 <com/example/demo/seven_two_six/concurrent/sync/SyncDemo.counter : I> //将修改后的值存入静态变量i
    
    • 1
    • 2
    • 3
    • 4

    字节码截图:

    在这里插入图片描述


    如果是单线程以上 8 行代码是顺序执行(不会交错)没有问题
    但多线程下这 8 行代码可能交错运行:

    在这里插入图片描述

    临界区(Critical Section)

    • 一个程序运行多个线程本身是没有问题的
    • 问题出在多个线程访问共享资源
      • 多个线程读共享资源其实也没有问题
      • 在多个线程对共享资源读写操作时发生指令交错,就会出现问题

    一段代码块内如果存在对共享资源的多线程读写操作,称这段代码块为临界区,其共享资源为临界资源

    //临界资源
    private static volatile int counter = 0;
    //临界区
    public static void increment() {
    	counter++;
    }
    //临界区
    public static void decrement() {
    	counter--;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    竞态条件(Race Condition )

    多个线程在临界区内执行,由于代码的执行序列不同而导致结果无法预测,称之为发生了竞态条件
    为了避免临界区的竞态条件发生,有多种手段可以达到目的:

    • 阻塞式的解决方案:synchronized,Lock
    • 非阻塞式的解决方案:原子操作变量

    虽然 java 中互斥和同步都可以采用 synchronized 关键字来完成,但它们还是有区别的:

    • 互斥是保证临界区的竞态条件发生,同一时刻只能有一个线程执行临界区代码
    • 同步是由于线程执行的先后、顺序不同、需要一个线程等待其它线程运行到某个点

    synchronized的使用

    synchronized 同步块是 Java 提供的一种原子性内置锁,Java 中的每个对象都可以把它当作一个同步锁来使用,这些 Java 内置的使用者看不到的锁被称为内置锁,也叫作监视器锁

    加锁方式

    在这里插入图片描述

    解决之前的共享问题

    方式一
    @Slf4j
    public class SyncDemo1 {
        private static int counter = 0;
        public static synchronized void increment() {
            counter++;
        }
        public static synchronized void decrement() {
            counter--;
        }
        public static void main(String[] args) throws InterruptedException {
            Thread t1 = new Thread(() -> {
                for (int i = 0; i < 5000; i++) {
                    increment();
                }
            }, "t1");
            Thread t2 = new Thread(() -> {
                for (int i = 0; i < 5000; i++) {
                    decrement();
                }
            }, "t2");
            t1.start();
            t2.start();
            t1.join();
            t2.join();
            log.info("counter={}", counter);
        }
    }
    //运行结果:
    21:05:56.493 [main] INFO com.example.demo.seven_two_six.concurrent.sync.SyncDemo1 - counter=0
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29

    方式二
    @Slf4j
    public class SyncDemo2 {
        private static int counter = 0;
        private static final String lock = "";
        public static void increment() {
            synchronized (lock){
                    counter++;
            }
        }
        public static void decrement() {
            synchronized (lock) {
                counter--;
            }
        }
        public static void main(String[] args) throws InterruptedException {
            Thread t1 = new Thread(() -> {
                    for (int i = 0; i < 5000; i++) {
                        increment();
                    }
            }, "t1");
            Thread t2 = new Thread(() -> {
                for (int i = 0; i < 5000; i++) {
                    decrement();
                }
            }, "t2");
            t1.start();
            t2.start();
            t1.join();
            t2.join();
            log.info("counter={}", counter);
        }
    }
    //运行结果:
    21:06:44.572 [main] INFO com.example.demo.seven_two_six.concurrent.sync.SyncDemo2 - counter=0
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34

    synchronized 实际是用对象锁保证了临界区内代码的原子性

    在这里插入图片描述

    synchronized进阶

    synchronized底层原理

    synchronized是JVM内置锁,基于Monitor机制实现,依赖底层操作系统的互斥原语Mutex(互斥量),它是一个重量级锁,性能较低。当然,JVM内置锁在1.5之后版本做了重大的优化,如锁粗化(
    Lock Coarsening)、锁消除(Lock Elimination)、轻量级锁(LightweightLocking)、偏向锁(Biased Locking)、自适应自旋(Adaptive Spinning)等技术来减少锁操作的开销,内置锁的并发性能已经基本与Lock持平
    同步方法是通过方法中的access_flags中设置ACC_SYNCHRONIZED标志来实现;同步代码块是通过monitorenter和monitorexit来实现。两个指令的执行是JVM通过调用操作系统的互斥原语mutex来实现,被阻塞的线程会被挂起、等待重新调度,会导致“用户态和内核态”两个态之间来回切换,对性能有较大影响

    查看synchronized的字节码指令序列

    同步方法字节码指令

    在这里插入图片描述


    Method access and property flags:

    在这里插入图片描述


    同步代码块字节码指令

    在这里插入图片描述

    Monitor(管程/监视器)

    Monitor,直译为“监视器”,而操作系统领域一般翻译为“管程”。管程是指管理共享变量以及对共享变量操作的过程,让它们支持并发。在Java 1.5之前,Java语言提供的唯一并发语言就是管程,Java 1.5之后提供的SDK并发包也是以管程为基础的。除了Java之外,C/C++、C#等高级语言也都是支持管程的。synchronized关键字和wait()、notify()、notifyAll()这三个方法是Java中实现管程技术的组成部分

    MESA模型

    在管程的发展史上,先后出现过三种不同的管程模型,分别是Hasen模型、Hoare模型和MESA模型。现在正在广泛使用的是MESA模型。下面我们便介绍MESA模型:

    在这里插入图片描述


    管程中引入了条件变量的概念,而且每个条件变量都对应有一个等待队列。条件变量和等待队列的作用是解决线程之间的同步问题

    wait()的正确使用姿势

    对于MESA管程来说,有一个编程范式

    while(条件不满足) {
         wait();
    }
    
    • 1
    • 2
    • 3

    唤醒的时间和获取到锁继续执行的时间是不一致的,被唤醒的线程再次执行时可能条件又不满足了,所以循环检验条件。MESA模型的wait()方法还有一个超时参数,为了避免线程进入等待队列永久阻塞

    notify()和notifyAll()分别何时使用

    满足以下三个条件时,可以使用notify(),其余情况尽量使用notifyAll():

    1. 所有等待线程拥有相同的等待条件;
    2. 所有等待线程被唤醒后,执行相同的操作;
    3. 只需要唤醒一个线程

    Java语言的内置管程synchronized

    Java 参考了 MESA 模型,语言内置的管程(synchronized)对 MESA 模型进行了精简。MESA模型中,条件变量可以有多个,Java 语言内置的管程里只有一个条件变量。模型如下图所示:

    在这里插入图片描述

    Monitor机制在Java中的实现

    java.lang.Object 类定义了 wait(),notify(),notifyAll() 方法,这些方法的具体实现,依赖于 **ObjectMonitor **实现,这是 JVM 内部基于 C++ 实现的一套机制
    ObjectMonitor其主要数据结构如下(hotspot源码ObjectMonitor.hpp):

    ObjectMonitor() {
    	_header = NULL; //对象头 markOop
    	_count = 0;
    	_waiters = 0,
    		_recursions = 0; // 锁的重入次数
    	_object = NULL; //存储锁对象
    	_owner = NULL; // 标识拥有该monitor的线程(当前获取锁的线程)8 _WaitSet = NULL; // 等待线程(调用wait)组成的双向循环链表,_WaitSet是第一个节点
    	_WaitSetLock = 0 ;
    	_Responsible = NULL ;
    	_succ = NULL ;
    	_cxq = NULL ; //多线程竞争锁会先存到这个单向链表中 (FILO栈结构)
    	FreeNext = NULL ;
    	_EntryList = NULL ; //存放在进入或重新进入时被阻塞(blocked)的线程 (也是存竞争锁失败的线程)
    	_SpinFreq = 0 ;
    	_SpinClock = 0 ;
    	OwnerIsThread = 0 ;
    	_previous_owner_tid = 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    基于monitor加锁方式如下图:

    在这里插入图片描述

    synchronized非公平锁的原因

    在获取锁时,是将当前线程插入到cxq的头部,而释放锁时,默认策略(QMode=0)是:如果EntryList为空,则将cxq中的元素按原有顺序插入到EntryList,并唤醒第一个线程,也就是当EntryList为空时,是后来的线程先获取锁。_EntryList不为空,直接从_EntryList中唤醒线程

    对象的内存布局

    Hotspot虚拟机中,对象在内存中存储的布局可以分为三块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)

    • 对象头:比如 hash码,对象所属的年代,对象锁,锁状态标志,偏向锁(线程)ID,偏向时间,数组长度(数组对象才有)等
    • 实例数据:存放类的属性数据信息,包括父类的属性信息
    • 对齐填充:由于虚拟机要求对象起始地址必须是8字节的整数倍。填充数据不是必须存在的,仅仅是为了字节对齐

    在这里插入图片描述


    对象头详解
    HotSpot虚拟机的对象头包括:

    • Mark Word

    用于存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等,这部分数据的长度在32位和64位的虚拟机中分别为32bit和64bit,官方称它为“Mark Word”,长度为8个字节

    • Klass Pointer

    对象头的另外一部分是klass类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。 32位4字节,64位开启指针压缩或最大堆内存<32g时4字节,否则8字节。jdk1.8默认开启指针压缩后为4字节,当在JVM参数中关闭指针压缩(-XX:-UseCompressedOops)后,长度为8字节

    • 数组长度(只有数组对象有)

    如果对象是一个数组, 那在对象头中还必须有一块数据用于记录数组长度。 长度为4字节

    在这里插入图片描述

    使用JOL工具查看内存布局

    查看new出来的一个java对象的内部布局,以及一个普通的java对象占用多少字节
    引入依赖:

    
    <dependency>
        <groupId>org.openjdk.jolgroupId>
        <artifactId>jol-coreartifactId>
        <version>0.9version>
        <scope>providedscope>
    dependency>
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    测试:

    public class JOLSample {
        public static void main(String[] args) {
            ClassLayout layout = ClassLayout.parseInstance(new Object());
            System.out.println(layout.toPrintable());
            System.out.println();
            ClassLayout layout1 = ClassLayout.parseInstance(new int[]{});
            System.out.println(layout1.toPrintable());
            System.out.println();
            ClassLayout layout2 = ClassLayout.parseInstance(new A());
            System.out.println(layout2.toPrintable());
        }
    
        public static class A {
            int id;
            String name;
            byte b;
            Object o;
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19

    运行结果:

    java.lang.Object object internals:
    OFFSET SIZE TYPE DESCRIPTION VALUE
    0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
    4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    8 4 (object header) e5 01 00 f8 (11100101 00000001 00000000 11111000) (-134217243)
    12 4 (loss due to the next object alignment)
    Instance size: 16 bytes
    Space losses: 0 bytes internal + 4 bytes external = 4 bytes total

    [I object internals:
    OFFSET SIZE TYPE DESCRIPTION VALUE
    0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
    4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    8 4 (object header) 6d 01 00 f8 (01101101 00000001 00000000 11111000) (-134217363)
    12 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    16 0 int [I. N/A
    Instance size: 16 bytes
    Space losses: 0 bytes internal + 0 bytes external = 0 bytes total

    com.example.demo.seven_two_six.jvm.JOLSample$A object internals:
    OFFSET SIZE TYPE DESCRIPTION VALUE
    0 4 (object header) 05 00 00 00 (00000101 00000000 00000000 00000000) (5)
    4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    8 4 (object header) 63 cc 00 f8 (01100011 11001100 00000000 11111000) (-134165405)
    12 4 int A.id 0
    16 1 byte A.b 0
    17 3 (alignment/padding gap)
    20 4 java.lang.String A.name null
    24 4 java.lang.Object A.o null
    28 4 (loss due to the next object alignment)
    Instance size: 32 bytes
    Space losses: 3 bytes internal + 4 bytes external = 7 bytes total

    根据上面的测试可知:

    1. 利用jol查看64位系统java对象(空对象),默认开启指针压缩,总大小显示16字节,前12字节为对象头

    在这里插入图片描述

    1. OFFSET:偏移地址,单位字节
    2. SIZE:占用的内存大小,单位为字节
    3. TYPE DESCRIPTION:类型描述,其中object header为对象头
    4. VALUE:对应内存中当前存储的值,二进制32位
    5. 关闭指针压缩后,对象头为16字节:­XX:­UseCompressedOops
      在这里插入图片描述


    思考: 下面例子中obj对象占多少个字节

    public class ObjectTest {
    	public static void main(String[] args) throws InterruptedException {
    		//jvm延迟偏向
    		Thread.sleep(5000);
    		Object obj = new Test();
    		//查看对象内部信息
    		System.out.println(ClassLayout.parseInstance(obj).toPrintable());
    	}
    }
    class Test {
    	private long p;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    运行结果:

    com.example.demo.seven_two_six.concurrent.sync.Test object internals:
    OFFSET SIZE TYPE DESCRIPTION VALUE
    0 4 (object header) 05 00 00 00 (00000101 00000000 00000000 00000000) (5)
    4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    8 4 (object header) 43 c1 00 f8 (01000011 11000001 00000000 11111000) (-134168253)
    12 4 (alignment/padding gap)
    16 8 long Test.p 0
    Instance size: 24 bytes
    Space losses: 4 bytes internal + 0 bytes external = 4 bytes total

    Mark Word的结构

    Hotspot通过markOop类型实现Mark Word,具体实现位于markOop.hpp文件中。由于对象需要存储的运行时数据很多,考虑到虚拟机的内存使用,markOop被设计成一个非固定的数据结构,以便在极小的空间存储尽量多的数据,根据对象的状态复用自己的存储空间
    简单点理解就是:MarkWord 结构搞得这么复杂,是因为需要节省内存,让同一个内存区域在不同阶段有不同的用处

    • hash: 保存对象的哈希码。运行期间调用System.identityHashCode()来计算,延迟计算,并把结果赋值到这里
    • age: 保存对象的分代年龄。表示对象被GC的次数,当该次数到达阈值的时候,对象就会转移到老年代
    • biased_lock: 偏向锁标识位。由于无锁和偏向锁的锁标识都是 01,没办法区分,这里引入一位的偏向锁标识位
    • lock: 锁状态标识位。区分锁状态,比如11时表示对象待GC回收状态, 只有最后2位锁标识(11)有效
    • JavaThread*: 保存持有偏向锁的线程ID。偏向模式的时候,当某个线程持有对象的时候,对象这里就会被置为该线程的ID。 在后面的操作中,就无需再进行尝试获取锁的动作。这个线程ID并不是JVM分配的线程ID号,和Java Thread中的ID是两个概念
    • epoch: 保存偏向时间戳。偏向锁在CAS锁操作过程中,偏向性标识,表示对象更偏向哪个锁
    • ptr_to_lock_record:轻量级锁状态下,指向栈中锁记录的指针。当锁获取是无竞争时,JVM使用原子操作而不是OS互斥,这种技术称为轻量级锁定。在轻量级锁定的情况下,JVM通过CAS操作在对象的Mark Word中设置指向锁记录的指针
    • ptr_to_heavyweight_monitor:重量级锁状态下,指向对象监视器Monitor的指针。如果两个不同的线程同时在同一个对象上竞争,则必须将轻量级锁定升级到Monitor以管理等待的线程。在重量级锁定的情况下,JVM在对象的ptr_to_heavyweight_monitor设置指向Monitor的指针
    32位JVM下的对象结构描述

    在这里插入图片描述

    64位JVM下的对象结构描述

    在这里插入图片描述

    Mark Word中锁标记枚举

    enum {
        locked_value = 0, //00 轻量级锁
        unlocked_value = 1, //001 无锁
        monitor_value = 2, //10 监视器锁,也叫膨胀锁,也叫重量级锁
        marked_value = 3, //11 GC标记
        biased_lock_pattern = 5 //101 偏向锁
    };
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    直观理解为:

    在这里插入图片描述

    偏向锁

    偏向锁是一种针对加锁操作的优化手段,经过研究发现,在大多数情况下,锁不仅不存在多线程竞争,而且总是由同一线程多次获得,因此为了消除数据在无竞争情况下锁重入(CAS操作)的开销而引入偏向锁。对于没有锁竞争的场合,偏向锁有很好的优化效果

    偏向锁延迟偏向

    偏向锁模式存在偏向锁延迟机制:HotSpot 虚拟机在启动后有个 4s 的延迟才会对每个新建的对象开启偏向锁模式。JVM启动时会进行一系列的复杂活动,比如装载配置,系统类初始化等等。在这个过程中会使用大量synchronized关键字对对象加锁,且这些锁大多数都不是偏向锁。为了减少初始化时间,JVM默认延时加载偏向锁

    偏向延迟

    //关闭延迟开启偏向锁XX:BiasedLockingStartupDelay=0
    //禁止偏向锁XX:UseBiasedLocking
    //启用偏向锁XX:+UseBiasedLocking
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    偏向锁撤销之调用对象HashCode

    调用锁对象的obj.hashCode()或System.identityHashCode(obj)方法会导致该对象的偏向锁被撤销。因为对于一个对象,其HashCode只会生成一次并保存,偏向锁是没有地方保存hashcode的

    • 轻量级锁会在锁记录中记录 hashCode
    • 重量级锁会在 Monitor 中记录 hashCode
    • 当对象处于可偏向(也就是线程ID为0)和已偏向的状态下,调用HashCode计算将会使对象再也无法偏向
    • 当对象可偏向时,MarkWord将变成未锁定状态,并只能升级成轻量锁
    • 当对象正处于偏向锁时,调用HashCode将使偏向锁强制升级成重量锁

    偏向锁撤销之调用wait/notify

    偏向锁状态执行obj.notify() 会升级为轻量级锁,调用obj.wait(timeout) 会升级为重量级锁

    测试

    测试示例偏向锁实现:

    public class ObjectTest {
        public static void main(String[] args) throws InterruptedException {
            //jvm延迟偏向
            Thread.sleep(5000);
            Object obj = new Test();
            //查看对象内部信息
            System.out.println(ClassLayout.parseInstance(obj).toPrintable());
            new Thread(() -> {
                synchronized (obj) {
                    System.out.println(Thread.currentThread().getName() + "\n" + ClassLayout.parseInstance(obj).toPrintable());
                }
                System.out.println(Thread.currentThread().getName() + "释放锁\n" + ClassLayout.parseInstance(obj).toPrintable());
                try {
                    Thread.sleep(100000);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
            }, "Thread1").start();
        }
    }
    class Test {
        private boolean flag;
        private long p;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24

    运行结果:

    com.example.demo.seven_two_six.concurrent.sync.Test object internals:
    OFFSET SIZE TYPE DESCRIPTION VALUE
    0 4 (object header) 05 00 00 00 (00000101 00000000 00000000 00000000) (5)
    4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    8 4 (object header) 43 c1 00 f8 (01000011 11000001 00000000 11111000) (-134168253)
    12 1 boolean Test.flag false
    13 3 (alignment/padding gap)
    16 8 long Test.p 0
    Instance size: 24 bytes
    Space losses: 3 bytes internal + 0 bytes external = 3 bytes total

    Thread1
    com.example.demo.seven_two_six.concurrent.sync.Test object internals:
    OFFSET SIZE TYPE DESCRIPTION VALUE
    0 4 (object header) 05 d0 8d 20 (00000101 11010000 10001101 00100000) (546164741)
    4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    8 4 (object header) 43 c1 00 f8 (01000011 11000001 00000000 11111000) (-134168253)
    12 1 boolean Test.flag false
    13 3 (alignment/padding gap)
    16 8 long Test.p 0
    Instance size: 24 bytes
    Space losses: 3 bytes internal + 0 bytes external = 3 bytes total

    Thread1释放锁
    com.example.demo.seven_two_six.concurrent.sync.Test object internals:
    OFFSET SIZE TYPE DESCRIPTION VALUE
    0 4 (object header) 05 d0 8d 20 (00000101 11010000 10001101 00100000) (546164741)
    4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    8 4 (object header) 43 c1 00 f8 (01000011 11000001 00000000 11111000) (-134168253)
    12 1 boolean Test.flag false
    13 3 (alignment/padding gap)
    16 8 long Test.p 0
    Instance size: 24 bytes
    Space losses: 3 bytes internal + 0 bytes external = 3 bytes total

    上面测试中可以得出,都是偏向锁

    在这里插入图片描述


    当JVM启用了偏向锁模式(jdk6默认开启),新创建对象的Mark Word中的Thread Id为0,说明此时处于可偏向但未偏向任何线程,也叫做匿名偏向状态(anonymously biased)

    在这里插入图片描述


    测试示例偏向延迟实现

    @Slf4j
    public class LockEscalationDemo{
        public static void main(String[] args) throws InterruptedException {
            log.debug(ClassLayout.parseInstance(new Object()).toPrintable());
            //HotSpot 虚拟机在启动后有个 4s 的延迟才会对每个新建的对象开启偏向锁模式
            Thread.sleep(4000);
            log.debug(ClassLayout.parseInstance(new Object()).toPrintable());
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    运行结果:

    22:19:20.632 [main] DEBUG com.example.demo.seven_two_six.concurrent.sync.LockEscalationDemo - java.lang.Object object internals:
    OFFSET SIZE TYPE DESCRIPTION VALUE
    0 4 (object header) 01 00 00 00 (00000001 00000000 00000000 00000000) (1)
    4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    8 4 (object header) e5 01 00 f8 (11100101 00000001 00000000 11111000) (-134217243)
    12 4 (loss due to the next object alignment)
    Instance size: 16 bytes
    Space losses: 0 bytes internal + 4 bytes external = 4 bytes total

    22:19:25.640 [main] DEBUG com.example.demo.seven_two_six.concurrent.sync.LockEscalationDemo - java.lang.Object object internals:
    OFFSET SIZE TYPE DESCRIPTION VALUE
    0 4 (object header) 05 00 00 00 (00000101 00000000 00000000 00000000) (5)
    4 4 (object header) 00 00 00 00 (00000000 00000000 00000000 00000000) (0)
    8 4 (object header) e5 01 00 f8 (11100101 00000001 00000000 11111000) (-134217243)
    12 4 (loss due to the next object alignment)
    Instance size: 16 bytes
    Space losses: 0 bytes internal + 4 bytes external = 4 bytes total

    4s后偏向锁为可偏向或者匿名偏向状态

    在这里插入图片描述

    轻量级锁

    倘若偏向锁失败,虚拟机并不会立即升级为重量级锁,它还会尝试使用一种称为轻量级锁的优化手段,此时Mark Word 的结构也变为轻量级锁的结构。轻量级锁所适应的场景是线程交替执行同步块的场合,如果存在同一时间多个线程访问同一把锁的场合,就会导致轻量级锁膨胀为重量级锁

    锁对象状态转换(总结)

    在这里插入图片描述

    锁升级的原理分析

    synchronized轻量级锁加、解锁源码分析
    synchronized重量级锁加、解锁源码分析

    synchronized优化

    偏向锁批量重偏向&批量撤销

    从偏向锁的加锁解锁过程中可看出,当只有一个线程反复进入同步块时,偏向锁带来的性能开销基本可以忽略,但是当有其他线程尝试获得锁时,就需要等到safe point时,再将偏向锁撤销为无锁状态或升级为轻量级,会消耗一定的性能,所以在多线程竞争频繁的情况下,偏向锁不仅不能提高性能,还会导致性能下降。于是,就有了批量重偏向与批量撤销的机制

    原理

    • 以class为单位,为每个class维护一个偏向锁撤销计数器,每一次该class的对象发生偏向撤销操作时,该计数器+1,当这个值达到重偏向阈值(默认20)时,JVM就认为该class的偏向锁有问题,因此会进行批量重偏向
    • 每个class对象会有一个对应的epoch字段,每个处于偏向锁状态对象的Mark Word中也有该字段,其初始值为创建该对象时class中的epoch的值。每次发生批量重偏向时,就将该值+1,同时遍历JVM中所有线程的栈,找到该class所有正处于加锁状态的偏向锁,将其epoch字段改为新值。下次获得锁时,发现当前对象的epoch值和class的epoch不相等,那就算当前已经偏向了其他线程,也不会执行撤销操作,而是直接通过CAS操作将其Mark Word的Thread Id 改成当前线程Id
    • 当达到重偏向阈值(默认20)后,假设该class计数器继续增长,当其达到批量撤销的阈值后(默认40),JVM就认为该class的使用场景存在多线程竞争,会标记该class为不可偏向,之后,对于该class的锁,直接走轻量级锁的逻辑

    应用场景

    • 批量重偏向(bulk rebias)机制是为了解决:一个线程创建了大量对象并执行了初始的同步操作,后来另一个线程也来将这些对象作为锁对象进行操作,这样会导致大量的偏向锁撤销操作
    • 批量撤销(bulk revoke)机制是为了解决:在明显多线程竞争剧烈的场景下使用偏向锁是不合适的

    参数设置

    查看jvm当前参数

    设置JVM参数-XX:+PrintFlagsFinal,在项目启动时即可输出JVM的默认参数值
    intx BiasedLockingBulkRebiasThreshold = 20 //默认偏向锁批量重偏向阈值
    intx BiasedLockingBulkRevokeThreshold = 40 //默认偏向锁批量撤销阈值
    
    • 1
    • 2
    • 3

    注意:

    • 当撤销偏向锁阈值超过 40 次后,jvm 会认为不该偏向,于是整个类的所有对象都会变为不可偏向的,新建的对象也是不可偏向的
    • 时间-XX:BiasedLockingDecayTime=25000ms范围内没有达到40次,撤销次数清为0,重新计时
    设置参数

    -XX:BiasedLockingBulkRebiasThreshold//批量重定向
    -XX:BiasedLockingBulkRevokeThreshold//批量撤销

    总结

    1. 批量重偏向和批量撤销是针对类的优化,和对象无关
    2. 偏向锁重偏向一次之后不可再次重偏向
    3. 当某个类已经触发批量撤销机制后,JVM会默认当前类产生了严重的问题,剥夺了该类的新实例对象使用偏向锁的权利

    自适应自旋优化

    重量级锁竞争的时候,还可以使用自旋来进行优化,如果当前线程自旋成功(即这时候持锁线程已经退出了同步块,释放了锁),这时当前线程就可以避免阻塞

    • 自旋会占用 CPU 时间,单核 CPU 自旋就是浪费,多核 CPU 自旋才能发挥优势
    • 在 Java 6 之后自旋是自适应的,比如对象刚刚的一次自旋操作成功过,那么认为这次自旋成功的可能性会高,就多自旋几次;反之,就少自旋甚至不自旋,比较智能
    • Java 7 之后不能控制是否开启自旋功能

    注意:自旋的目的是为了减少线程挂起的次数,尽量避免直接挂起线程(挂起操作涉及系统调用,存在用户态和内核态切换,这才是重量级锁最大的开销)

    锁粗化

    假设一系列的连续操作都会对同一个对象反复加锁及解锁,甚至加锁操作是出现在循环体中的,即使没有出现线程竞争,频繁地进行互斥同步操作也会导致不必要的性能损耗。如果JVM检测到有一连串零碎的操作都是对同一对象的加锁,将会扩大加锁同步的范围(即锁粗化)到整个操作序列的外部
    例如:
    对于StringBuffer进行连续多个append方法的调用,如果JVM检测到有一连串的对同一个对象加锁和解锁的操作,就会将其合并成一次范围更大的加锁和解锁操作,即在第一次append方法时进行加锁,最后一次append方法结束后进行解锁

    锁消除

    锁消除即删除不必要的加锁操作。锁消除是Java虚拟机在JIT编译期间,通过对运行上下文的扫描,去除不可能存在共享资源竞争的锁,通过锁消除,可以节省毫无意义的请求锁时间
    例如:
    StringBuffer的append是个同步方法,但是append方法中的 StringBuffer 属于一个局部变量,不可能从该方法中逃逸出去,因此其实这过程是线程安全的,可以将锁消除

    逃逸分析(Escape Analysis)

    逃逸分析,是一种可以有效减少Java 程序中同步负载和内存堆分配压力的跨函数全局数据流分析算法。通过逃逸分析,Java Hotspot编译器能够分析出一个新的对象的引用的使用范围从而决定是否要将这个对象分配到堆上。逃逸分析的基本行为就是分析对象动态作用域

    方法逃逸(对象逃出当前方法)

    当一个对象在方法中被定义后,它可能被外部方法所引用,例如作为调用参数传递到其他地方中

    线程逃逸((对象逃出当前线程)

    这个对象甚至可能被其它线程访问到,例如赋值给类变量或可以在其它线程中访问的实例变量
    使用逃逸分析,编译器可以对代码做如下优化:

    1. 同步省略或锁消除(Synchronization Elimination)。如果一个对象被发现只能从一个线程被访问到,那么对于这个对象的操作可以不考虑同步
    2. 将堆分配转化为栈分配(Stack Allocation)。如果一个对象在子程序中被分配,要使指向该对象的指针永远不会逃逸,对象可能是栈分配的候选,而不是堆分配
    3. 分离对象或标量替换(Scalar Replacement)。有的对象可能不需要作为一个连续的内存结构存在也可以被访问到,那么对象的部分(或全部)可以不存储在内存,而是存储在CPU寄存器中

    jdk6开始引入该技术,jdk7开始默认开启逃逸分析。在Java代码运行时,可以通过JVM参数指定是否开启逃逸分析

  • 相关阅读:
    生鲜蔬果社区团购商城小程序的作用是什么
    SQL Server 2022 安装及使用
    iOS开发Swift-8-类的继承,方法重写,构造器,枚举类型,可选类型,强制解包,可选绑定,隐式可选类型...
    利用百度API进行视频翻译制作
    CSS网页标题图案和LOGO SEO优化
    Docker的架构描述与安装部署
    Unity的碰撞检测(总结篇)
    nodejs+vue+elementui在线音乐分享网站管理系统
    NewStarCTF2023 Reverse Week3 EzDLL WP
    一行命令找出 Linux 中所有真实用户
  • 原文地址:https://blog.csdn.net/weixin_41381248/article/details/127641045