• 记一次生产jvm oom问题


    前言

            jvm添加以下参数,发生OOM时自动导出内存溢出文件

    -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/opt

      内存分析工具: MAT, 下载地址:Eclipse Memory Analyzer Open Source Project | The Eclipse Foundation, 注意工具地址要跟你的jdk匹配,至少你的jdk要比MAT的需要的高

    参考使用地址:JVM 内存分析工具 MAT 的深度讲解与实践——入门篇 - 掘金

    生产业务简单描述

            小程序注册用户推送,需要发布一个注册事件进行上报处理,逻辑需要设备的数据,而这部分数据发生在用户注册以后才会生成,可能隔个几秒才会出来,所以才需要借助延时队列进行处理。10s后再进行发布

            之所以会有这种并发问题是因为这个小程序在有广告投放的时候会瞬间很多流量打进来,从而引起这种问题。

    分析dump文件

    主界面如下

    Histogram方式

    然后选择如下信息

    可以看到byte[]的第一个引用是com.zxc.movie.main.bo.movie.ScheaTest$ZxcUser,到此就能找到源头了,可以全局搜索该类的引用情况

    dominator_tree方式

    也可以很容易定位到com.zxc.movie.main.bo.movie.ScheaTest$ZxcUser引用的问题

    模拟代码如下

    1. package com.zxc.movie.main.bo.movie;
    2. import java.util.concurrent.ScheduledThreadPoolExecutor;
    3. import java.util.concurrent.TimeUnit;
    4. public class ScheaTest {
    5. public static void main(String[] args) throws Exception{
    6. ScheduledThreadPoolExecutor executor = new ScheduledThreadPoolExecutor(1);
    7. // TimeUnit.SECONDS.sleep(20);
    8. System.out.println("come");
    9. while (true) {
    10. Thread.sleep(100);
    11. executor.schedule(new ZxcRunner(), 1000, TimeUnit.SECONDS);
    12. }
    13. }
    14. public static class ZxcRunner implements Runnable {
    15. private ZxcUser zxcUser = new ZxcUser();
    16. public ZxcUser getZxcUser() {
    17. return zxcUser;
    18. }
    19. @Override
    20. public void run() {
    21. System.out.println(zxcUser);
    22. }
    23. }
    24. public static class ZxcUser {
    25. private byte[] bytes = new byte[1024 * 1024];
    26. }
    27. }

    确实是com.zxc.movie.main.bo.movie.ScheaTest$ZxcUser出现了问题

    总结

            这里是我模拟的一个情况,可能比较好定位,真实的业务情况可能稍微复杂点,但是业务就是这么个事,延时任务里面对象一瞬间过多导致内存溢出

    解决方案

                真实的业务情况不会推迟1000s才执行任务,大概在10s内就可以发出去了,这里只是为了更好的看到这个问题,也就是说生产上在10s内进入了很多事件,导致发生了OOM的问题,改进如下

    1. package com.zxc.movie.main.bo.movie;
    2. import java.util.concurrent.ScheduledThreadPoolExecutor;
    3. import java.util.concurrent.TimeUnit;
    4. public class ScheaTest {
    5. public static void main(String[] args) throws Exception{
    6. ScheduledThreadPoolExecutor executor = new ScheduledThreadPoolExecutor(1);
    7. // TimeUnit.SECONDS.sleep(20);
    8. while (true) {
    9. Thread.sleep(100);
    10. if(executor.getQueue().size() < 5) {
    11. executor.schedule(new ZxcRunner(), 1000, TimeUnit.SECONDS);
    12. } else {
    13. System.out.println("队列满了,待释放");
    14. }
    15. }
    16. }
    17. public static class ZxcRunner implements Runnable {
    18. private ZxcUser zxcUser = new ZxcUser();
    19. public ZxcUser getZxcUser() {
    20. return zxcUser;
    21. }
    22. @Override
    23. public void run() {
    24. System.out.println(zxcUser);
    25. }
    26. }
    27. public static class ZxcUser {
    28. private byte[] bytes = new byte[1024 * 1024];
    29. }
    30. }

    改为了判断队列的大小超过指定值就不放进去了,这样生产10s出现很多内容也不会有问题了,解决完效果如下

    当队列小于指定的大小便可以正常加入,超出的时候就把任务丢了,防止内存异常,这里把任务丢了是因为业务允许,如果业务不允许那么就需要把这部分任务给存储起来后续再进行操作

    备注

            之所以这样做是因为生产这方面的数据是允许丢失的,如果你的数据比较重要的话那可以先临时存到其他地方,然后再拿出来去处理,或者数据不要用这种内存的方式来异步了,可以借助MQ的延时队列去处理

  • 相关阅读:
    2022阿里巴巴全球数学竞赛 第4题 虎虎生威(盲盒问题、集卡问题)解决思路
    房屋差价能否作为非违约方的损失
    Django反向解析函数reverse与resolve
    螯合物前体肽c(RGD)环肽:DOTA-c(RGDfK)
    Python 基础入门指南,干货分享来啦!
    机器视觉在虚拟现实与增强现实中的作用
    向指定文件夹创建文件,并且写入信息
    MySQL之查询性能优化(十三)
    Linux SSH免密登录
    如何让 Source Insight 识别 AUTOSAR 宏定义 FUNC
  • 原文地址:https://blog.csdn.net/zxc_user/article/details/136274966