• SpringBootAdmin 超时踩坑必备


    起因:矜矜业业的替老板省钱,新用户半价购买了服务器。分布式项目迁移到新服务器后出现了服务掉线超时的情况,实际上是SpringBootAdmin 掉线,nacos中是存在的。

    1. java.util.concurrent.TimeoutException: Did not observe any item or terminal signal within 60000ms in 'map' (and no fallback has been configured)
    2. at reactor.core.publisher.FluxTimeout$TimeoutMainSubscriber.handleTimeout(FluxTimeout.java:295)
    3. Suppressed: reactor.core.publisher.FluxOnAssembly$OnAssemblyException:
    4. Error has been observed at the following site(s):
    5. |_ checkpoint ⇢ Request to GET health [DefaultWebClient]
    6. Stack trace:
    7. at reactor.core.publisher.FluxTimeout$TimeoutMainSubscriber.handleTimeout(FluxTimeout.java:295)
    8. at reactor.core.publisher.FluxTimeout$TimeoutMainSubscriber.doTimeout(FluxTimeout.java:280)
    9. at reactor.core.publisher.FluxTimeout$TimeoutTimeoutSubscriber.onNext(FluxTimeout.java:419)
    10. at reactor.core.publisher.FluxOnErrorResume$ResumeSubscriber.onNext(FluxOnErrorResume.java:79)
    11. at reactor.core.publisher.MonoDelay$MonoDelayRunnable.propagateDelay(MonoDelay.java:271)
    12. at reactor.core.publisher.MonoDelay$MonoDelayRunnable.run(MonoDelay.java:286)
    13. at reactor.core.scheduler.SchedulerTask.call(SchedulerTask.java:68)
    14. at reactor.core.scheduler.SchedulerTask.call(SchedulerTask.java:28)
    15. at java.util.concurrent.FutureTask.run(FutureTask.java:266)
    16. at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180)
    17. at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293)
    18. at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    19. at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    20. at java.lang.Thread.run(Thread.java:750)

    经过了长达半个月(加班找方案,加班加的人都要凉了)的不断摸索与尝试终于找到了答案:

    Springbootadmin每隔一段时间就会检查消费者的健康接口,如果返回结果超时,就会掉线。健康接口会检查邮箱,redis服务。这些服务可能会导致延迟。邮箱的校验是比较特殊的,不能够随时返回结果,偶尔会发现出现超高延迟的现象,从而阻塞进程,导致健康接口无法返回数据。获取不到返回结果的Springbootadmin会判定该消费者为离线状态。我的问题就是邮箱校验导致的。换个服务器邮箱校验就会频繁掉线,醉了。

    解决方案:
    消费者中添加如下配置 
    management: 
      health: 
        mail:
          enabled: false

    以下是尝试过的其他方案,虽然没有解决问题,留给后来者参考,避免查阅大量无用资料。

    原因1.SpringbootAdmin版本问题,据说2.6.1有这个bug,在后期的版本修复。笔者调整为2.6.6

    原因2.监控健康的超时时间默认是5S,修改一下,在Springbootadmin所在项目的配置文件中增加

    spring:
      boot:
        admin:
          monitor:
            default-timeout: 30000
            status-interval: 15000
            status-lifetime: 15000

    原因3:cpu休眠导致的返回超时,这个具体解决请百度,笔者没尝试。

    原因4:不正确的使用线程池导致进程阻塞,查看日志文件,寻找相应的代码即可

    原因5:服务使用内存超过上线,需要增加服务器内存。会有相应的内存溢出报错,所以很好排查

    结语:千万不要给老板省钱,老板只会记住给你发的钱,不会记住你给他省的钱。

    你加班付出的心血,他不会懂!绝对不会!!!

    8500的工资多吗?我加班换服务器直接给他省了1W多,气死我了。

    你干的越多,老板越欺负

  • 相关阅读:
    学生HTML个人网页作业作品:HTML绿色的化妆品静态网站(web前端网页制作课作业)
    Spring面试题21:说一说Spring的@Required注解和@Qualifier注解
    Splunk的转发器扮演什么角色?
    美团2025春招第一次笔试题
    SpringBoot框架SpEL表达式注入漏洞复现与原理分析
    机器人制作开源方案 | 桌面级全向底盘--机器视觉
    教你在批量将视频逆时针旋转90度的同时添加马赛克
    (六)算法基础——动态规划
    Go语言sync.Map
    Vue.js+Node.js全栈开发教程:Vue.js指令修饰符详解
  • 原文地址:https://blog.csdn.net/u014685642/article/details/128201165