• Spring Cloud Netflix微服务组件-Hystrix


    目录

    Hystrix的主要功能

    传统容错手段

    超时机制

    应用容错三板斧

    超时机制

    舱壁隔离

    熔断降级

    侵入式Command用法

    改进版一:ribbon与hystrix组合

    改进版二:feign与hystrix组合

    Hystrix三态转换图

    源码分析

    流程图

    核心逻辑流程图

    核心实现流程图

    入口

    HystrixCircuitBerakerConfiguration

    如何做功能增强?

    @HystrixCommand注解的切面逻辑

    CommandExecutor#execute()

    HystrixCommand#execute()

    applyHystrixSemantics()(熔断器核心逻辑)

    流程图

    熔断器打开时

    熔断器关闭时

    线程隔离有两种隔离模式

    信号量隔离逻辑

    线程池隔离逻辑

    线程池隔离原理

    熔断器源码

    滑动时间窗口


    Hystrix的主要功能

    • 线程池隔离、
    • 熔断降级、
    • 超时降级、
    • 宕机降级 

    传统容错手段

    超时机制

    是设置RestTemplate的连接超时和读取超时,这是我们在没有使用hytrix这些辅助的分布式工具时的做法

    af9f3d20e9624a65a69a73bf57990fba.png

    全局异常处理器

    6268a3a00e164877b6971f89825f5a0a.png控制器中,捕获超时异常,封装成统一的自定义异常并再次抛出,让全局异常处理器来进行处理

    ead32e620ec441af8160f4c075aa91e6.png

    上面这种,就是传统的容错的处理套路

    应用容错三板斧

    超时机制

    以前没有hytrix的时候,就是直接给RestTemplate设置一个超时时间,RestTemplate调用超时时会抛出TimeoutException,然后我们直接catch到此异常,就直接把同步阻塞的调用线程掐死

    d07b46c11d16419185f97469cd5a5caf.png

    舱壁隔离

    说白了就是资源隔离,比如线程池隔离

    1d008450df664fd38b8ecc24c3c2e3cc.png

    熔断降级

    b747210f7ebe40e288f40787051edfdb.png

    当一段时间内失败次数达到一定阈值,那么熔断器就会打开,此时主业务线程就不会再去调用真正的远程的业务方法,而是直接调用本地早已写好的“降级方法”,返回一个可预知的结果。也就是说:熔断是结果,降级是处理的手段

    侵入式Command用法

    我们只会下单、支付、调库存等核心高频接口,才需要进行降级,才需要自己在本地写降级方法

    d0f200c4915b4cd7b35fa3629f093035.png

    这样当前端看到返回的订单的订单号为-1时,就可以给客户展示一个友好的页面,比如当前系统开了小差之类的

    1c3650ee063c441e8df6c0cb11911d44.png

    原始的hytrix API处理熔断降级时,就需要这样的强侵入式写法

    改进版一:ribbon与hystrix组合

    a1e2ddbc9f0042a8815baf91f95edba0.png

    c553f1776c4248d2a1152aa5da4b383b.png

    这里可以配置线程池

    改进版二:feign与hystrix组合

    feign调用时,通过hystrix进行降级

    8b1d6400aae7438e8b4021fa00188559.png

    a28c1c082bc448b2a7b44348416796df.png85b1a561201347998fa2ff648db99e46.png

    Hystrix的默认配置跳闸阈值

    60511a68b2974cd8a97c7fbecdf23b72.png

    上面就是可能会发生降级的三种情况,分别是:宕机降级、超时降级、异常降级

    aff49a154fb946e6a1ddfd02ff2a0a82.png

    生产上上面的配置一般不动,使用默认的配置值

    Hystrix三态转换图

    ba72e4fc930b4ce481d7a20086a8d48d.png

    • 熔断时间窗口结束后,熔断器状态就从打开转换到半开状态,此时会放过一条请求去请求真正的远程业务方法,如果此次调用成功,则熔断器状态就转成关闭状态,如果此次调用任失败,那么熔断器就又会回到打开状态
    • 什么叫调用失败?客户端去调用服务端接口API,服务端抛了异常并且没有catch直接抛了出来、服务器宕机、服务端接口业务执行耗时太多导致客户端等待接口返回超时
    • 半开状态存在的意义就是为了,让熔断器有机会回到关闭状态(也就是回到能正常去远程调用的状态)

    94ee31ab676d4bb09cf6cdcdf72c7132.png这个就是工作中需要配置的ribbon的超时时间,配置了ribbon的超时时间,那么restTemplate也自动跟随ribbon的超时时间了 

    3205ac1ae96c4db28441a4752a390430.png

    这些参数的设置,就供学习,平时生产大多使用默认参数

    如何关闭hystrix对feign的支持

    e5046c45db234927a16c0ea4dec95085.png

    5a7a49d96ceb45f89157caf024977855.png

    这里需要hystrix的超时时间需要设置为6000

    生产上需要:

    hystrix的超时时间  >  (本次调用次数 1 + 出现异常时对当前实例的重试次数 1 + 切换实例后的重试次数 1) * ribbon的超时时间 = 3 * ribbon的超时时间

    因为hystrix要保证所有的ribbon调用重试都结束后,hystrix再去插断主线程的调用并给主线程返回降级结果

    a81263e29709429b94c0fe57c8a5841e.png

    第89行,把总体的熔断机制的打开

    第92行,可以开始选择某一个方法关闭熔断机制(剩下的,就是局部开启的)

    注意上面参数赋值用等号=

    源码分析

    流程图

    核心逻辑流程图

    25a08fd56ba94003854bb627590de25f.png

    核心实现流程图

    727cdd94a9974a69b472e737179a5120.png

    入口

    a1e2ddbc9f0042a8815baf91f95edba0.png

    通过框架的启动注解开始,实际上这个注解内部就是通过@Import注解,去加载spring.factories中以EnableCircuitBreaker为key的“普通配置类

    这个ImportSelector的作用,就是去找Netflix-core.jar下的spring.factories中以EnableCircuitBreaker为key的键值对,将该key对应的值为一个普通配置类HystrixCircuitBerakerConfiguration,将它注入到ioc容器中来

    5579727128fc44cfb255e01905fd97fb.png

    • 因为Springboot默认的自动配置类读取功能,仅仅只是读取所有jar包下spring.factories中以EnableAutoConfigurationr为key的“自动配置类
    • 各个第三方组件自定义的一些key下所属的“普通配置类”,Springboot是不负责读取的,需要各个第三方组件自己开发针对该key的加载功能
    • 普通配置类以XxxxxConfiguration命名,自动配置类以XxxxxAutoConfiguration命名

    aa36fba3588b4251a4107eed4f168bbc.png

    业务系统首先引入这个starter-netflix-hystrix,这个starter相当于一个聚合器,内部聚合了很多别的功能jar包

    这些带有spring-cloud-开头的,就是spring cloud官方为了整合Netflix hystrix组件而开发的自动装配包 

    a6be69e2eca344fcaa6ca4cfe0db0436.png

    优先看与核心功能相关的配置类,比如这里就优先看HystrixCircuitBreakerConfiguration类,像这种HystrixSecurityAutoConfiguration一看就是与安全有关的,非主功能,我们就先不看,这些都是看源码的技巧

    a17a3d923a8748d08caf48fe30714d87.png

    HystrixCircuitBerakerConfiguration

    dc842cda3f6b4bd282315c899228074d.png

    如何做功能增强?

    • 无非就是用代理AOP,横切拦截
    • 或者加待增强对象所拥有的拦截器链中加一个拦截器/过滤器

    @HystrixCommand注解的切面逻辑

    这一段切面逻辑,也就是每一个被@HystrixCommand注解修饰的方法,在被调起之前,都会先走一遍这个切面增强逻辑。而这一段切面增强逻辑,实际上也就是Hystrix熔断器起作用的逻辑

    注意,这都是在客户端执行的代码,也就是请求发起方,此时还没有到接口提供方(服务端)

    第90行,同时会拦截@HystrixCommand,还有合并请求的@HystrixCollapser

    a501741b16ee4475ab7ed415ca235e1b.png

    第96行,会创建一个HystrixInvokable,如下是第96行的create()逻辑:

    GenericCommand命令模式对象中有两个核心方法,一个就是run()也就是正常的业务逻辑方法,另一个就是getFallback()也就是降级方法,getFallback()内部会通过反射调用@HystrixCommand中配置的fallBackMethod方法

    从这里也知道,返回的HystrixInvokable,实际上就是一个GenericCommand

    截止以上的流程图

    CommandExecutor#execute()

    ed746f165f754663abde6a574e3ba8e7.png

    HystrixCommand#execute()

    44dd515ea8834875b42e7a8d6b889eca.png

    queue()返回一个Future凭证,从这里开始就是一堆的响应式变成了,各种定义监听与事件响应执行来串起整个执行流程

    e5b66dce859b49cbb95e1ac1d1441e84.png

    上述流程对应的流程图

    23e414e6eb5e4371a1599d1a28727d53.png

    响应式编程的定义语法(rxJava响应式编程框架,手机上用的比较多)响应式编程说白了就是一堆的观察者模式,zookeeper里面的节点内容变化也会触发监听器执行,这都是观察者模式

    1ad7482a56a2483eb75394e422c21921.png

    总体原理就是:Observable是被观察者,Observer是观察者,当被观察者发生变化时就会回调观察者

    231bae12dbaf48d28b4e33c140165e7f.png

    这里就把34行就当做定义了一个观察者,45行就定义了一个被观察者

    e255c77d8950426886a7cfb81592e41c.png

    这里把观察者,注册绑定到被观察者上,以后被观察者发生不同事件,就会回调不同的观察者的call()方法

    这里就是被@HystrixCommand注解修饰的方法,在发起一次调用时,如果调用的方法正常返回

    90b6f66a318a40c599acedbe835ec41d.png

    这里就出现了一个核心观察者applyHystrixSemantics()

    applyHystrixSemantics()(熔断器核心逻辑)

    流程图

    59fe487e352c42cf84e096c55fbf1c19.png

    熔断器打开时

    当发现当前熔断器是打开状态,则调用FallBack方法,也就是调用GenericCommand的getFallBack()方法,getFallBack()方法会去找到@HystrixCommand中配置的fallBackMethod方法,并执行这个fallBackMethod方法方法(最终,就是通过方法名,通过反射来调用到fallBackMethod方法的)

    第523行,判断当前熔断器状态,是否为打开状态

    第523行,判断当前熔断器状态是关闭状态,则走524行开始的逻辑,如果判断熔断器当前是打开状态,则走557行的FallBack逻辑,也就是调用降级逻辑

    判断当前熔断器状态,是否为打开状态

    熔断器可以强制配置为关闭,但是这里代码写的有点难理解,与正常思维判断逻辑是个反的

    熔断器关闭时

    线程隔离有两种隔离模式
    • 一种是信号量的隔离模式,信号量计数器满了以后也会走降级逻辑
    • 一种是线程池的隔离模式,线程池满了以后也会走降级逻辑

    信号量隔离逻辑

    20ce1659ed3740fa984cef7fd0707ff4.png

    信号量的隔离模式下,如果542行获取信号量失败,则执行554行的信号量拒绝FallBack,但是现实中基本都用线程池隔离模式

    线程池隔离逻辑

    这是在没有配置信号量策略时

    如果没有配置信号量,那么下面的第542行会一直返回true,从而进入真正的线程池隔离的逻辑

    executeCommandAndObserve()

    8c423d78cbad4f4db36b5b16ec32801f.png

    a95e8cb47c144c2dbe5b961e9bc86f00.png 51898b7ff86240e7bd055ee2390f5510.pnggetUserExecutionObservable()方法中就有监听回调方法,回调方法内部,就会通过线程池线程调用GenericCommand的run()

    9a2f55bdaeb5400b8b06cba1f4abe077.png

    281d0e8871044e6190b85915dd8f7f7f.png

    线程池隔离原理

    783298f47a0e4bd885138e8787a1093d.png

    a17a3d923a8748d08caf48fe30714d87.png

    大体流程:用户在调用findById()方法时,hystrix写的AOP切面类会拦截这个注解,拦截这个注解后会初始化一个GenericCommand命令,在初始化这个GenericCommand命令内部,就会通过这些线程池的配置,来初始化该命令特有的执行线程池

    562dfa7125f646ff9a28cbf4cb4daae5.png

    上上图@HystrixCommand注解中的所有信息,默认就会被保存在这个元信息MetaHolder中去,Spring的代码都是很统一的,这种注解的元数据一般都是用MetaXxxxx来保存的 

    这里就通过注解的元信息来构造了一个GenericCommand命令。GenericCommand是AbstractCommand的子类

    AbstractCommand

    bd4b1e58197a4554ae38dfdf061fbbe6.png

    1b3dce52d5f4438ab58389b6242ead16.png

    @HystrixCommand注解中的所有信息,默认就会被保存在这个元信息MetaHolder中,从这些元信息中,就能获得到threadPoolProperties信息

    这里就会用到threadPoolKey,

    所以,这里就实现了有多少key就会初始化出来多少个线程池,也就实现了通过key的不同来实现不同粒度的隔离 

    如果有多个业务方法配置了相同的key,那么也就实现了多个hystrix方法公用了同一个线程池

    线程池缓存的技术

    以后线程池隔离执行时,就是把当前的GenericCommand#run()方法,丢进这个threadPool中去执行的

    7cab0163d1eb48208bae5ad7e08b5369.png

    a17a3d923a8748d08caf48fe30714d87.png

    利用线程池缓存的技术,实现多个用户方法公用同一个线程池的目的,只需要多个方法,配置相同的commandKey和threadPoolKey

    e2b53d88285d425783f08eceae9343c7.png

    熔断器源码

    1045ba63705243618b16100246307868.png

    滑动时间窗口

    7624b9ac37844b40aedc4670e14da1d0.png

    0125ddc9307044f0b3c12912c00e2a3d.png

    b69dfc79552047d9a789caed7c7c7ad5.png

    numbuckets就是为了调整时间的统计粒度,统计粒度越细则熔断器对于网络堵塞等异常状态的感应就更加灵敏

    滑动窗口触发熔断的最小请求数,这个是整个时间窗口内的,这是一种兜底策略

    4a074565e8fe45818b18e32397ed6f04.png

    a430ba81d2e248dfb0cd27fb4e3544e5.png

    e6d503accd26406e89da63e9dda2cc77.png

    上图画反了,下图是对的

    8153d225447a40bb8b2078b6dee113b1.png

    对应源码如下:

    681dc88592334b31bfb50019f66a012e.png

    每次请求,都会走上面的判断逻辑

    15861c844e9f404e8e5a2063844c707d.png

    每次请求调用成功没有抛异常,就会调用这个回调方法,这个回调方法内部就会调用断路器进行调用数据上报

    0b6c20fbd56e4c16b97a48de7e80bd4c.png

    206行是上报本次调用数据

  • 相关阅读:
    代码随想录二刷day27
    Failed to start mysql.service Unit mysql.service not found
    CI/CD简介
    07 hdfs 集群搭建
    Shell 函数详解(函数定义、函数调用)
    计算题概念算法
    信息安全结业复习题(选择 + 填空 + 简答 + 计算 + 设计 )含历年考题
    镜像站制作 centos8
    Git(七).git 文件夹瘦身,GitLab 永久删除文件
    【附源码】计算机毕业设计JAVA研究生入学考试备考辅助系统
  • 原文地址:https://blog.csdn.net/iNiBuBian/article/details/134448727