• SpringBootAdmin 超时踩坑必备


    起因:矜矜业业的替老板省钱,新用户半价购买了服务器。分布式项目迁移到新服务器后出现了服务掉线超时的情况,实际上是SpringBootAdmin 掉线,nacos中是存在的。

    1. java.util.concurrent.TimeoutException: Did not observe any item or terminal signal within 60000ms in 'map' (and no fallback has been configured)
    2. at reactor.core.publisher.FluxTimeout$TimeoutMainSubscriber.handleTimeout(FluxTimeout.java:295)
    3. Suppressed: reactor.core.publisher.FluxOnAssembly$OnAssemblyException:
    4. Error has been observed at the following site(s):
    5. |_ checkpoint ⇢ Request to GET health [DefaultWebClient]
    6. Stack trace:
    7. at reactor.core.publisher.FluxTimeout$TimeoutMainSubscriber.handleTimeout(FluxTimeout.java:295)
    8. at reactor.core.publisher.FluxTimeout$TimeoutMainSubscriber.doTimeout(FluxTimeout.java:280)
    9. at reactor.core.publisher.FluxTimeout$TimeoutTimeoutSubscriber.onNext(FluxTimeout.java:419)
    10. at reactor.core.publisher.FluxOnErrorResume$ResumeSubscriber.onNext(FluxOnErrorResume.java:79)
    11. at reactor.core.publisher.MonoDelay$MonoDelayRunnable.propagateDelay(MonoDelay.java:271)
    12. at reactor.core.publisher.MonoDelay$MonoDelayRunnable.run(MonoDelay.java:286)
    13. at reactor.core.scheduler.SchedulerTask.call(SchedulerTask.java:68)
    14. at reactor.core.scheduler.SchedulerTask.call(SchedulerTask.java:28)
    15. at java.util.concurrent.FutureTask.run(FutureTask.java:266)
    16. at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$201(ScheduledThreadPoolExecutor.java:180)
    17. at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:293)
    18. at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    19. at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    20. at java.lang.Thread.run(Thread.java:750)

    经过了长达半个月(加班找方案,加班加的人都要凉了)的不断摸索与尝试终于找到了答案:

    Springbootadmin每隔一段时间就会检查消费者的健康接口,如果返回结果超时,就会掉线。健康接口会检查邮箱,redis服务。这些服务可能会导致延迟。邮箱的校验是比较特殊的,不能够随时返回结果,偶尔会发现出现超高延迟的现象,从而阻塞进程,导致健康接口无法返回数据。获取不到返回结果的Springbootadmin会判定该消费者为离线状态。我的问题就是邮箱校验导致的。换个服务器邮箱校验就会频繁掉线,醉了。

    解决方案:
    消费者中添加如下配置 
    management: 
      health: 
        mail:
          enabled: false

    以下是尝试过的其他方案,虽然没有解决问题,留给后来者参考,避免查阅大量无用资料。

    原因1.SpringbootAdmin版本问题,据说2.6.1有这个bug,在后期的版本修复。笔者调整为2.6.6

    原因2.监控健康的超时时间默认是5S,修改一下,在Springbootadmin所在项目的配置文件中增加

    spring:
      boot:
        admin:
          monitor:
            default-timeout: 30000
            status-interval: 15000
            status-lifetime: 15000

    原因3:cpu休眠导致的返回超时,这个具体解决请百度,笔者没尝试。

    原因4:不正确的使用线程池导致进程阻塞,查看日志文件,寻找相应的代码即可

    原因5:服务使用内存超过上线,需要增加服务器内存。会有相应的内存溢出报错,所以很好排查

    结语:千万不要给老板省钱,老板只会记住给你发的钱,不会记住你给他省的钱。

    你加班付出的心血,他不会懂!绝对不会!!!

    8500的工资多吗?我加班换服务器直接给他省了1W多,气死我了。

    你干的越多,老板越欺负

  • 相关阅读:
    Redis6 十:使用Jedis连接Redis、使用redis完成手机验证码功能案例
    【三年面试五年模拟】算法工程师的独孤九剑秘籍(第七式)
    java 单例模式
    网站的静态资源怎么获取?
    实际应用效果不佳?来看看提升深度神经网络泛化能力的核心技术(附代码)
    java毕业设计——基于java+JDBC+sqlserver的物业管理系统设计与实现(毕业论文+程序源码)——物业管理系统
    elementui <el-autocomplete> querySearchAsync 搜索手机号码,补全信息
    Go :测试浮点文字语法(附完整源码)
    android.app.RemoteServiceException: can‘t deliver broadcast
    yolov8 c++进行部署
  • 原文地址:https://blog.csdn.net/u014685642/article/details/128201165