Sentinel系列(4)-服务雪崩效应及容错方案

╰半夏微凉° 2023-10-10 11:41 117阅读 0赞

雪崩效应

雪崩
一种自然现象,当山坡积雪内部的内聚力抗拒不了它所受到的重力拉引时,便向下滑动,引起大量雪体崩塌。
雪崩效应广泛应用于各种领域,比如密码学术语、管理学、商业等。
服务雪崩
在软件架构体系中,分布式或者微服务,将系统拆分为独立服务,通过HTTP或者RPC进行通信,相互协作。但是由于网络或者其他不稳定因素,总会发生某个服务延迟或者不可用,无法保证100%不出故障。当某个服务发生故障时,势必会导致其他关联服务出现网络延迟,如果此时大量请求涌入,形成阻塞,其他服务也会导致故障出现,这种在软件中,由于一个服务发生问题,进而导致整个系统不可用或瘫痪的问题叫做服务雪崩效应
在这里插入图片描述

形成原因(摘自网络)

服务雪崩的过程可以分为三个阶段:

  • 服务提供者不可用;
  • 重试加大请求流量;
  • 服务调用者不可用;

服务雪崩的每个阶段都可能由不同的原因造成,总结如下:
在这里插入图片描述
应对策略:
在这里插入图片描述

容错方案

常见的容错思路有隔离、超时、限流、熔断、降级等
1. 隔离
它是指将系统按照一定的原则划分为若干个服务模块,各个模块之间相对独立,无强依赖。当有故 障发生时,能将问题和影响隔离在某个模块内部,而不扩散风险,不波及其它模块,不影响整体的 系统服务。常见的隔离方式有:线程池隔离和信号量隔离。
2. 超时
在上游服务调用下游服务的时候,设置一个最大响应时间,如果超过这个时间,下游未作出反应, 就断开请求,释放掉线程。
3.限流
限流就是限制系统的输入和输出流量已达到保护系统的目的。为了保证系统的稳固运行,一旦达到 的需要限制的阈值,就需要限制流量并采取少量措施以完成限制流量的目的。
4. 熔断
在互联网系统中,当下游服务因访问压力过大而响应变慢或失败,上游服务为了保护系统整体的可用性,可以暂时切断对下游服务的调用。这种牺牲局部,保全整体的措施就叫做熔断。
5.降级
降级其实就是为服务提供一个托底方案,一旦服务无法正常调用,就使用托底方案。

常见的容错组件

Hystrix
Hystrix是由Netflix开源的一个延迟和容错库,用于隔离访问远程系统、服务或者第三方库,防止 级联失败,从而提升系统的可用性与容错性。
Resilience4J
Resilicence4J一款非常轻量、简单,并且文档非常清晰、丰富的熔断工具,这也是Hystrix官方推荐的替代产品。不仅如此,Resilicence4j还原生支持Spring Boot 1.x/2.x,而且监控也支持和prometheus等多款主流产品进行整合。
Sentinel
Sentinel 是阿里巴巴开源的一款断路器实现,本身在阿里内部已经被大规模采用,非常稳定。
对比:
在这里插入图片描述

发表评论

表情:
评论列表 (有 0 条评论,117人围观)

还没有评论,来说两句吧...

相关阅读

    相关 雪崩效应

    ![70][] 如果在A的链路上某个或几个被调用的子服务不可用或延迟较高,则会导致调用A服务的请求被堵住。 堵住的请求会消耗占用掉系统的线程、io等资源,当该类请求越来越