• 当Synchronized遇到这玩意儿,有个大坑,要注意


    前几天在某技术平台上看到别人提的关于 Synchronized 的一个用法问题,我觉得挺有意思的,这个问题其实也是我三年前面试某公司的时候遇到的一个真题,当时不知道面试官想要考什么,没有回答的特别好,后来研究了一下就记住了。

    所以看到这个问题的时候觉得特别亲切,准备分享给你一起看看:

    首先为了方便你看文章的时候复现问题,我给你一份直接拿出来就能跑的代码,希望你有时间的话也把代码拿出来跑一下:

    1. public class SynchronizedTest {
    2. public static void main(String[] args) {
    3. Thread why = new Thread(new TicketConsumer(10), "why");
    4. Thread mx = new Thread(new TicketConsumer(10), "mx");
    5. why.start();
    6. mx.start();
    7. }
    8. }
    9. class TicketConsumer implements Runnable {
    10. private volatile static Integer ticket;
    11. public TicketConsumer(int ticket) {
    12. this.ticket = ticket;
    13. }
    14. @Override
    15. public void run() {
    16. while (true) {
    17. System.out.println(Thread.currentThread().getName() + "开始抢第" + ticket + "张票,对象加锁之前:" + System.identityHashCode(ticket));
    18. synchronized (ticket) {
    19. System.out.println(Thread.currentThread().getName() + "抢到第" + ticket + "张票,成功锁到的对象:" + System.identityHashCode(ticket));
    20. if (ticket > 0) {
    21. try {
    22. //模拟抢票延迟
    23. TimeUnit.SECONDS.sleep(1);
    24. } catch (InterruptedException e) {
    25. e.printStackTrace();
    26. }
    27. System.out.println(Thread.currentThread().getName() + "抢到了第" + ticket-- + "张票,票数减一");
    28. } else {
    29. return;
    30. }
    31. }
    32. }
    33. }
    34. }

    程序逻辑也很简单,是一个模拟抢票的过程,一共 10 张票,开启两个线程去抢票。

    票是共享资源,且有两个线程来消费,所以为了保证线程安全,TicketConsumer 的逻辑里面用了 synchronized 关键字。

    这是应该是大家在初学 synchronized 的时候都会写到的例子,期望的结果是 10 张票,两个人抢,每张票只有一个人能抢到。

    但是实际运行结果是这样的,我只截取开始部分的日志:

    截图里面有三个框起来的部分。

    最上面的部分,就是两个人都在抢第 10 张票,从日志输出上看也完全没有任何毛病,最终只有一个人抢到了票,然后进入到第 9 张票的争夺过程。

    但是下面被框起来的第 9 张票的争夺部分就有点让人懵逼了:

    1. why抢到第9张票,成功锁到的对象:288246497
    2. mx抢到第9张票,成功锁到的对象:288246497

    为什么两个人都抢到了第 9 张票,且成功锁到的对象都一样的?

    这玩意,超出认知了啊。

    这两个线程怎么可能拿到同一把锁,然后去执行业务逻辑呢?

    所以,提问者的问题就浮现出来了。

    • 1.为什么 synchronized 没有生效?

    • 2.为什么锁对象 System.identityHashCode 的输出是一样的?

    为什么没有生效?

    我们先来看一个问题。

    首先,我们从日志的输出上已经非常明确的知道,synchronized 在第二轮抢第 9 张票的时候失效了。

    经过理论知识支撑,我们知道 synchronized 失效,肯定是锁出问题了。

    如果只有一把锁,多个线程来竞争同一把锁,synchronized 绝对是不会有任何毛病的。

    但是这里两个线程并没有达成互斥的条件,也就是说这里绝对存在的不止一把锁。

    这是我们可以通过理论知识推导出来的结论。

    先得出结论了,那么我怎么去证明“锁不止一把”呢?

    能进入 synchronized 说明肯定获得了锁,所以我只要看各个线程持有的锁是什么就知道了。

    那么怎么去看线程持有什么锁呢?

    jstack 命令,打印线程堆栈功能,了解一下?

    这些信息都藏在线程堆栈里面,我们拿出来一看便知。

    在 idea 里面怎么拿到线程堆栈呢?

    这就是一个在 idea 里面调试的小技巧了,我之前的文章里面应该也出现过多次。

    首先为了方便获取线程堆栈信息,我把这里的睡眠时间调整到 10s:

    跑起来之后点击这里的“照相机”图标:

    点击几次就会有对应点击时间点的几个 Dump 信息:

    由于我需要观察前两次锁的情况,而每次线程进入锁之后都会等待 10s 时间,所以我就在项目启动的第一个 10s 和第二个 10s 之间各点击一次就行。

    为了更直观的观察数据,我选择点击下面这个图标,把 Dump 信息复制下来:

    复制下来的信息很多,但是我们只需要关心 why 和 mx 这两个线程即可。

    这是第一次 Dump 中的相关信息:

    mx 线程是 BLOCKED 状态,它在等待地址为 0x000000076c07b058 的锁。

    why 线程是 TIMED_WAITING 状态,它在 sleeping,说明它抢到了锁,在执行业务逻辑。而它抢到的锁,你说巧不巧,正是 mx 线程等待的 0x000000076c07b058。

    从输出日志上来看,第一次抢票确实是 why 线程抢到了:

    从 Dump 信息看,两个线程竞争的是同一把锁,所以第一次没毛病。

    好,我们接着看第二次的 Dump 信息:

    这一次,两个线程都在 TIMED_WAITING,都在 sleeping,说明都拿到了锁,进入了业务逻辑。

    但是仔细一看,两个线程拿的锁是不相同的锁。

    mx 锁的是 0x000000076c07b058。

    why 锁的是 0x000000076c07b048。

    由于不是同一把锁,所以并不存在竞争关系,因此都可以进入 synchronized 执行业务逻辑,所以两个线程都在 sleeping,也没毛病。

    然后,我再把两次 Dump 的信息放在一起给你看一下,这样就更直观了:

    如果我用“锁一”来代替 0x000000076c07b058,“锁二”来代替 0x000000076c07b048。

    那么流程是这样的:

    why 加锁一成功,执行业务逻辑,mx 进入锁一等待状态。

    why 释放锁一,等待锁一的 mx 被唤醒,持有锁一,继续执行业务。

    同时 why 加锁二成功,执行业务逻辑。

    从线程堆栈中,我们确实证明了 synchronized 没有生效的原因是锁发生了变化。

    同时,从线程堆栈中我们也能看出来为什么锁对象 System.identityHashCode 的输出是一样的。

    第一次 Dump 的时候,ticket 都是 10,其中 mx 没有抢到锁,被 synchronized 锁住。

    why 线程执行了 ticket-- 操作,ticket 变成了 9,但是此时 mx 线程被锁住的 monitor 还是 ticket=10 这个对象,它还在 monitor 的 _EntryList 里面等着的,并不会因为 ticket 的变化而变化。

    所以,当 why 线程释放锁之后,mx 线程拿到锁继续执行,发现 ticket=9。

    而 why 也搞到一把新锁,也可以进入 synchronized 的逻辑,也发现 ticket=9。

    好家伙,ticket 都是 9, System.identityHashCode 能不一样吗?

    按理来说,why 释放锁一后应该继续和 mx 竞争锁一,但是却不知道它在哪搞到一把新锁。

    那么问题就来了:锁为什么发生了变化呢?

    谁动了我的锁?

    经过前面一顿分析,我们坐实了锁确实发生了变化,当你分析出这一点的时候勃然大怒,拍案而起,大喊一声:是哪个瓜娃子动了我的锁?这不是坑爹吗?

    按照我的经验,这个时候不要急着甩锅,继续往下看,你会发现小丑竟是自己:

    抢完票之后,执行了 ticket-- 的操作,而这个 ticket 不就是你的锁对象吗?

    这个时候你把大腿一拍,恍然大悟,对着围观群众说:问题不大,手抖而已。

    于是大手一挥,把加锁的地方改成这样:

    synchronized (TicketConsumer.class)
    

    利用 class 对象来作为锁对象,保证了锁的唯一性。

    经过验证也确实没毛病,非常完美,打完收工。

    但是,真的就收工了吗?

    其实关于锁对象为什么发生了变化,还隔了一点点东西没有说出来。

    它就藏在字节码里面。

    我们通过 javap 命令,反查字节码,可以看到这样的信息:

    Integer.valueOf 这是什么玩意?

    让人熟悉的 Integer 从 -128 到 127 的缓存。

    也就是说我们的程序里面,会涉及到拆箱和装箱的过程,这个过程中会调用到 Integer.valueOf 方法。具体其实就是 ticket-- 的这个操作。

    对于 Integer,当值在缓存范围内的时候,会返回同一个对象。当超过缓存范围,每次都会 new 一个新对象出来。

    这应该是一个必备的八股文知识点,我在这里给你强调这个是想表达什么意思呢?

    很简单,改动一下代码就明白了。

    我把初始化票数从 10 修改为 200,超过缓存范围,程序运行结果是这样的:

    很明显,从第一次的日志输出来看,锁都不是同一把锁了。

    这就是我前面说的:因为超过缓存范围,执行了两次 new Integer(200) 的操作,这是两个不同的对象,拿来作为锁,就是两把不一样的锁(注意这里的程序是去掉了static)。

    再修改回 10,运行一次,你感受一下:

    从日志输出来看,这个时候只有一把锁,所以只有一个线程抢到了票。

    因为 10 是在缓存范围内的数字,所以每次是从缓存中获取出来,是同一个对象。

    我写这一小段的目的是为了体现 Integer 有缓存这个知识点,大家都知道。但是当它和其他东西揉在一起的时候因为这个缓存会带来什么问题,你得分析出来,这比直接记住干瘪的知识点有效一点。

    但是...

    我们的初始票是 10, ticket-- 之后票变成了 9,也是在缓存范围内的呀,怎么锁就变了呢?

    如果你有这个疑问的话,那么我劝你再好好想想。

    10 是 10,9 是 9。

    虽然它们都在缓存范围内,但是本来就是两个不同的对象,构建缓存的时候也是 new 出来的:

    为什么我要补充这一段看起来很傻的说明呢?

    因为我在网上看到其他写类似问题的时候,有的文章写的不清楚,会让读者误认为“缓存范围内的值都是同一个对象”,这样会误导初学者。

    总之一句话: 请别用 Integer 作为锁对象,你把握不住。

    但是...

    stackoverflow

    但是,我写文章的时候在 stackoverflow 上也看到了一个类似的问题。

    这个哥们的问题在于:他知道 Integer 不能做为锁对象,但是他的需求又似乎必须把 Integer 作为锁对象。

    https://stackoverflow.com/questions/659915/synchronizing-on-an-integer-value
    

    我给你描述一下他的问题。

    首先看标号为 ① 的地方,他的程序其实就是先从缓存中获取,如果缓存中没有则从数据库获取,然后再放到缓存里面去。

    非常简单清晰的逻辑。

    但是他考虑到并发的场景下,如果有多个线程同一时刻都来获取同一个 id,但是这个 id 对应的数据并没有在缓存里面,那么这些线程都会去执行查询数据库并维护缓存的动作。

    对应查询和存储的动作,他用的是 fairly expensive 来形容。

    就是“相当昂贵”的意思,说白了就是这个动作非常的“重”,最好不要重复去做。

    所以只需要让某一个线程来执行这个 fairly expensive 的操作就好了。

    于是他想到了标号为 ② 的地方的代码。

    用 synchronized 来把 id 锁一下,不幸的是,id 是 Integer 类型的。

    在标号为 ③ 的地方他自己也说了:不同的 Integer 对象,它们并不会共享锁,那么 synchronized 也没啥卵用。

    其实他这句话也不严谨,经过前面的分析,我们知道在缓存范围内的 Integer 对象,它们还是会共享同一把锁的,这里说的“共享”就是竞争的意思。

    但是很明显,他的 id 范围肯定比 Integer 缓存范围大。

    那么问题就来了:这玩意该咋搞啊?

    我看到这个问题的时候想到的第一个问题是:上面这个需求我好像也经常做啊,我是怎么做的来着?

    想了几秒恍然大悟,哦,现在都是分布式应用了,我特么直接用的是 Redis 做锁呀。

    根本就没有考虑过这个问题。

    如果现在不让用 Redis,就是单体应用,那么怎么解决呢?

    在看高赞回答之前,我们先看看这个问题下面的一个评论:

    开头三个字母:FYI。

    看不懂没关系,因为这个不是重点。

    但是你知道的,我的英语水平 very high,所以我也顺便教点英文。

    FYI,是一个常用的英文缩写,全称是 for your information,供参考的意思。

    所以你就知道,他后面肯定是给你附上一个资料了,翻译过来就是:Brian Goetz 在他的 Devoxx 2018 演讲中提到,我们不应该把 Integer 作为锁。

    你可以通过这个链接直达这一部分的讲解,只有不到 30s秒的时间,随便练练听力:https://www.youtube.com/watch?v=4r2Wg-TY7gU&t=3289s

    那么问题又来了?

    Brian Goetz 是谁,凭什么他说的话看起来就很权威的样子?

    Java Language Architect at Oracle,开发 Java 语言的,就问你怕不怕。

    同时,他还是我多次推荐过的《Java并发编程实践》这本书的作者。

    好了,现在也找到大佬背书了,接下来带你看看高赞回答是怎么说的。

    前部分就不详说了,其实就是我们前面提到的那一些点,不能用 Integer ,涉及到缓存内、缓存外巴拉巴拉的...

    关注划线的部分,我加上自己的理解给你翻译一下:

    如果你真的必须用 Integer 作为锁,那么你需要搞一个 Map 或 Integer 的 Set,通过集合类做映射,你就可以保证映射出来的是你想要的明确的一个实例。而这个实例,就可以拿来做锁。

    然后他给出了这样的代码片段:

    就是用 ConcurrentHashMap 然后用 putIfAbsent 方法来做一个映射。

    比如多次调用 locks.putIfAbsent(200, 200),在 map 里面也只有一个值为 200 的 Integer 对象,这是 map 的特性保证的,无需过多解释。

    但是这个哥们很好,为了防止有人转不过这个弯,他又给大家解释了一下。

    首先,他说你也可以这样写:

    但这样一来,你就会多产生一个很小成本,就是每次访问的时候,如果这个值没有被映射,你都会创建一个 Object 对象。

    为了避免这一点,他只是把整数本身保存在 Map 中。这样做的目的是什么?这与直接使用整数本身有什么不同呢?

    他是这样解释的,其实就是我前面说的“这是 map 的特性保证的”:

    当你从 Map 中执行 get() 时,会用到 equals() 方法比较键值。

    两个相同值的不同 Integer 实例,调用 equals() 方法是会判定为相同的 。

    因此,你可以传递任何数量的 "new Integer(5)" 的不同 Integer 实例作为 getCacheSyncObject 的参数,但是你将永远只能得到传递进来的包含该值的第一个实例。

    就是这个意思:

    汇总一句话:就是通过 Map 做了映射,不管你 new 多少个 Integer 出来,这多个 Integer 都会被映射为同一个 Integer,从而保证即使超出  Integer 缓存范围时,也只有一把锁。

    除了高赞回答之外,还有两个回答我也想说一下。

    第一个是这个:

    不用关心他说的内容是什么,只是我看到这句话翻译的时候虎躯一震:

    skin this cat ???

    太残忍了吧。

    我当时就觉得这个翻译肯定不太对,这肯定是一个小俚语。于是考证了一下,原来是这个意思:

    免费送你一个英语小知识,不用客气。

    第二个应该关注的回答排在最后:

    这个哥们叫你看看《Java并发编程实战》的第 5.6 节的内容,里面有你要寻找的答案。

    巧了,我手边就有这本书,于是我翻开看了一眼。

    第 5.6 节的名称叫做“构建高效且可伸缩的结果缓存”:

    好家伙,我仔细一看这一节,发现这是宝贝呀。

    你看书里面的示例代码:

    不就和提问题的这个哥们的代码如出一辙吗?

    都是从缓存中获取,拿不到再去构建。

    不同的地方在于书上把 synchronize 加在了方法上。但是书上也说了,这是最差的解决方案,只是为了引出问题。

    随后他借助了 ConcurrentHashMap、putIfAbsent 和 FutureTask 给出了一个相对较好的解决方案。

    你可以看到完全是从另外一个角度去解决问题的,根本就没有在 synchronize 上纠缠,直接第二个方法就拿掉了 synchronize。

    看完书上的方案后我才恍然大悟:好家伙,虽然前面给出的方案可以解决这个问题,但是总感觉怪怪的,又说不出来哪里怪。原来是死盯着 synchronize 不放,思路一开始就没打开啊。

    书里面一共给出了四段代码,解决方案层层递进,具体是怎么写的,由于书上已经写的很清楚了,我就不赘述了,大家去翻翻书就行了。

    没有书的直接在网上搜“构建高效且可伸缩的结果缓存”也能搜出原文。

    我就指个路,看去吧。

    好了,那本文的技术部分就到这里啦。

    下面这个环节叫做[荒腔走板],技术文章后面我偶尔会记录、分享点生活相关的事情,和技术毫无关系。我知道看起来很突兀,但是我喜欢,因为这是一个普通博主的生活气息。

  • 相关阅读:
    10_上传漏洞_代码审计&文件命名
    Spring Boot MyBatis Plus 配置数据源详解
    GB28181协议-SDP详解
    洛谷 P5682 [CSP-J2019 江西] 次大值
    解析java的Scanner类中next()方法和nextLine()的区别和联系
    docker安装elasticsearch7.8和kibana7.8
    搜索winform中的textbox
    C++ STL进阶与补充(set/multiset容器)
    Spring ApplicationContext 容器
    一道任务编排服务面试题解析
  • 原文地址:https://blog.csdn.net/JavaMonsterr/article/details/126034330