Spring-Cloud 学习笔记-（5）熔断器Hystrix

Spring-Cloud 学习笔记-（5）熔断器Hystrix
Spring-Cloud 学习笔记-（5）熔断器Hystrix
目录
1、前言
- 上个章节我们做了什么？
  
  上个章节我们使用了Ribbon实现了服务之间调用的负载均衡，具体可以分为三个步骤
  1. 引ribbon依赖
  2. 在启动类中的RestTemplate 加注解@LoadBalanced
  3. 把serviceId直接写在RestTemplate 请求的url中调用
  并且我们针对ribbon底层实现原理，走了一遍源码。
- 这个章节我们会做什么？
  
  熔断器Hystrix
2、Hystrix介绍

2.1、简介

Hystrix，英文翻译是豪猪，是一种保护机制，Netflix公司的一款组件。

主页：https://github.com/Netflix/Hystrix/

Hystix是Netflix开源的一个延迟和容错库，用于隔离访问远程服务、第三方库，防止出现级联失败。

2.2、雪崩问题

上一章我们服务的调用方（order-service）调用了服务的提供方（user-serivce）查询用户的方法，我们可以称order-service依赖于user-service，一旦我们user-service不可用，也会导致了order-service也不可用，类似这种级联的失败，我们可以称作雪崩。

2.2.1、雪崩效应产生原因
1. 服务的级联失败：就是刚刚说的A服务依赖B服务，B服务失败了，倒是A服务也挂了，如果还有服务依赖A服务，这样它也会挂了，就这样一直延伸下去导致整个项目的不可用。
2. 服务连接数被耗尽：失败的服务占用了连接数，倒是正常的服务依旧访问不了。
描述的详细一点可以这么理解（图片来自于：https://github.com/Netflix/Hystrix/wiki）

2.2.2、Hystrix如何解决雪崩问题
1. 服务的熔断和降级：
  
  熔断：当用户的请求调用一个服务，这个服务挂了，阻塞了，我们设置一个超时时常，如果超过这个时间，我们会快速的返回一个失败的友好提示给客户端。
  
  降级：以前访问一个功能，我们可以提供所有的服务，但是现在我们有个地方有点问题，我们只能给你提供核心服务，不重要的暂时就访问不了了。
2. 线程的隔离：
  
  比如我们Tomcat线程有500个，一个用户的请求来了调用5个服务，我们分一个线程给他，让这个线程去调用服务，调用成功返回结果，也就是说以前所有的服务都可以用这500个线程，这样500个线程用完了，这个项目就挂了，现在的做法是什么呢，我们有针对性的给这些服务分配线程，比如一个服务分配100个线程，这样就算有一个服务挂了，就算服务I不可用，那只会阻塞这个100个线程，其余的400个线程还是正常，依旧可以调用其他正常的服务，我们把这种把不同的服务请求，用不同的线程池去隔离，就算你资源耗尽，仅仅会消耗当前线程池的连接数叫做线程的隔离。
  
  官网对线程的隔离图解
当服务繁忙时，如果服务出现异常，不是粗暴的直接报错，而是返回一个友好的提示，虽然拒绝了用户的访问，但是会返回一个结果。

这就好比去买鱼，平常超市买鱼会额外赠送杀鱼的服务。等到逢年过节，超时繁忙时，可能就不提供杀鱼服务了，这就是服务的降级。

系统特别繁忙时，一些次要服务暂时中断，优先保证主要服务的畅通，一切资源优先让给主要服务来使用，在双十一、618时，京东天猫都会采用这样的策略。

3、服务的降级和线程隔离

3.1、代码：

在服务的调用方（order-service）

3.1.1、引依赖：
```

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
```
3.1.2、加注解
```
@SpringBootApplication
@EnableCircuitBreaker//开启服务的熔断
public class OrderApplication {

    public static void main(String[] args) {
        SpringApplication.run(OrderApplication.class);
    }

    /**
     * 把RestTemplate注入到Spring容器中
     */
    @Bean
    @LoadBalanced //让RestTemplate内置一个负载均衡器
    public RestTemplate restTemplate(){
        return new RestTemplate();
    }
}
```
其实我们作为Eureka的服务端需要加注解@EnableEurekaServer，同样我们作为eureka的客户端也需要加一个注解

@EnableDiscoveryClient，只是我们Eureka比较智能，如果你有spring-cloud-starter-netflix-eureka-client

这个依赖，eureka就会默认你是一个eureka客户端，所以@EnableDiscoveryClient可以不用加。所以一个正常的springcloud微服务，基本上都会有三个注解，@SpringBootApplication、@EnableDiscoveryClient、@EnableCircuitBreaker，所以springcloud很人性化的把这三个注解合成一个注解SpringCloudApplication，所以大家嫌麻烦可以直接加一个SpringCloudApplication注解就可以了。
```
@Target({ElementType.TYPE})
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
@SpringBootApplication//启动类
@EnableDiscoveryClient//eureka客户端
@EnableCircuitBreaker//熔断
public @interface SpringCloudApplication {
}
```
3.1.2、修改代码：

上面说过，如果服务失败，我们快速返回一个失败信息，所以现在我们要做的是写一个快速失败的处理。

在OrderController中
```
//OrderController类


@RequestMapping("{user_id}")
//开启服务的线程合理和降级处理，并指定失败后调用的方法↓
@HystrixCommand(fallbackMethod = "findUserByIdFallbace")
public BaseData findUserById(@PathVariable("user_id")int id){
    Order order = orderService.findById(id);
    return new BaseData(order);
}


/**     findUserById失败后调用的方法
 *     方法参数和返回值要和上面的完全一样
 */
public BaseData findUserByIdFallbace(int id){
    return new BaseData("服务器拥挤，请稍后再试！",null);
}
```
3.1.4、模拟服务调用异常

UserServiceImpl中
```
//UserServiceImpl类


/**
 * 根据id查询用户基本信息
 * @param id  用户id
 * @return 用户对象
 */
@Override
public User findById(int id) {
    //模拟服务器延迟
    try {
        //休眠两秒
        TimeUnit.SECONDS.sleep(2L);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    User user = userMap.get(id);
    user.setPort(port);
    return user;
}
```
3.1.5、测试

启动服务，访问 http://localhost:8781/api/v1/order/2

3.2、升级版

刚刚我们是针对某一个类写了一个降级方法，但是如果Controller中有很多方法我们就要写很多的降级方法。所以我们可以针对一个类所有方法降级

3.1、代码

3.1.1、注解修改
```
@RestController
@RequestMapping("api/v1/order")
@DefaultProperties(defaultFallback = "defaultFallback") //为整个类开启服务的熔断
public class OrderController {

//....

    @RequestMapping("{user_id}")
    //开启服务的线程合理和降级处理
    @HystrixCommand
    public BaseData findUserById(@PathVariable("user_id")int id){
        Order order = orderService.findById(id);
        return new BaseData(order);
    }
```
3.1.2、降级方法修改：
```
/**     
 *     方法参数为空
 */
public BaseData defaultFallback(){
    return new BaseData("服务器拥挤，请稍后再试！",null);
}
```
3.1.3、测试

3.3、配置修改

3.3.1、单一方法Hystrix配置

打开控制台（F12），这里我们看的出来，虽然user-service我们设置了睡眠时间是2秒，但是每次一秒就返回结果了，说明Hytrix默认的超时时长是1秒，但是由于业务逻辑需要，比如发送邮件、银行转账、等我们超时时长都可以稍微设置长一点，一些简单查询可以超时时长可以设置稍微短一点。

3.3.1.1、注解修改
```
//OrderController类


@RequestMapping("{user_id}")
/**
*commandProperties，中我们可以配置一些属性，可以配置多个。
*但是这些配置的nama 和value 是什么呢...我们看源码，这些配置都在HystrixCommandProperties类中
*/
@HystrixCommand(commandProperties = {
    @HystrixProperty(name = "",value = "")
})
public BaseData findUserById(@PathVariable("user_id")int id){
    Order order = orderService.findById(id);
    return new BaseData(order);
}
```
```
//HystrixCommandProperties类

//执行 超时时长 单位毫秒  我们ctrl+f 搜索一下default_executionTimeoutInMilliseconds，看看这个配置的key是什么...
private static final Integer default_executionTimeoutInMilliseconds = 1000;
```
```
//找到配置 key:execution.isolation.thread.timeoutInMilliseconds

this.executionTimeoutInMilliseconds = getProperty(propertyPrefix, key, "execution.isolation.thread.timeoutInMilliseconds", builder.getExecutionIsolationThreadTimeoutInMilliseconds(), default_executionTimeoutInMilliseconds);
```
所以我们要修改某一个方法熔断配置，可以在@HystrixProperty中配置对于的name和value，比如我们配置超时时长为3秒，我们就可以
```
//OrderController类

@RequestMapping("{user_id}")
//开启服务的线程合理和降级处理，并指定失败后调用的方法
@HystrixCommand(commandProperties = {
        @HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds",value = "3000")
})
public BaseData findUserById(@PathVariable("user_id")int id){
    Order order = orderService.findById(id);
    return new BaseData(order);
}
```
3.3.1.2、测试

返回成功

3.3.2、全局配置

修改配置文件application.yml文件
```
#hystrix超时时长配置
hystrix:
  command:
    default:
      execution.isolation.thread.timeoutInMilliseconds: 3000
```
我们删除之前的方法上的超时配置，重启一下order-service测试一下

依旧没有问题。

4、服务的熔断

4.1、熔断的原理
1. 一个请求过来，如果是关闭状态，那请求继续。
2. 如果请求失败超过一定的阈值（默认最近的20次请求有50%以上的请求失败）则熔断器打开。
3. 后续请求发现熔断器是开启状态，将直接返回错误信息，不会等待。
4. 从熔断器打开时候开始计时，熔断器会经过一个休眠时间窗（默认5秒），超过5秒后熔断器会进入半开状态。
5. 半开状态的熔断器会放一定量的请求通过进行尝试，如果依旧超时，熔断器继续进入关闭状态，然后在经历休眠，如此反复，直到半开状态的熔断器放过去的请求成功了，熔断器会继续进入关闭状态。
  
  这些默认值也是在
```
//HystrixCommandProperties类

//打开熔断器的最小请求次数
private static final Integer default_circuitBreakerRequestVolumeThreshold = 20;
//休眠时间窗
private static final Integer default_circuitBreakerSleepWindowInMilliseconds = 5000;
//设置打开熔断并启动回退逻辑的错误比率
private static final Integer default_circuitBreakerErrorThresholdPercentage = 50;
```
4.2、测试

修改代码便于测试
1. 把user-service中的睡眠时间删除
2. 修改OrderController代码
```
//OrderController类

@RequestMapping("{user_id}")
//开启服务的线程合理和降级处理
@HystrixCommand(
    commandProperties = {
        @HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "10"),
        @HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value = "5000"),
        @HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value = "60")
    }
)
public BaseData findUserById(@PathVariable("user_id")int id){
    //手动控制请求成功失败 技术
    if(id%2==0){
        throw new RuntimeException("");
    }
    Order order = orderService.findById(id);
    return new BaseData(order);
}
```
1. 测试
  
  访问：http://localhost:8781/api/v1/order/1 成功
  
  访问：http://localhost:8781/api/v1/order/2 失败
  
  如果我们一直访问http://localhost:8781/api/v1/order/2 一直失败
  
  根据上面我们的配置在最近的10次请求中，如果失败超过60%，这个时候熔断器就会开启，就算我们访问http://localhost:8781/api/v1/order/1 成功的请求也会立即返回失败信息，这个时候会经历休眠时间窗5秒，超过5秒熔断器进入半开状态，我们访问http://localhost:8781/api/v1/order/1，成功。
相关阅读:
vue 短期时间
 使用moment.js写一个倒计时
 使用moment.js
js 共用文件内容应用
 什么是闭包？闭包的优缺点？
卧龙阶段
 音阶
 初步理解1=C
认识简谱的构造，唱名，音名
 画
原文地址：https://www.cnblogs.com/bigfly277/p/10162604.html

Spring-Cloud 学习笔记-（5）熔断器Hystrix

Spring-Cloud 学习笔记-（5）熔断器Hystrix

1、前言

2、Hystrix介绍

2.1、简介

2.2、雪崩问题

2.2.1、雪崩效应产生原因

2.2.2、Hystrix如何解决雪崩问题

3、服务的降级和线程隔离

3.1、代码：

3.1.1、引依赖：

3.1.2、加注解

3.1.2、修改代码：

3.1.4、模拟服务调用异常

3.1.5、测试

3.2、升级版

3.1.1、注解修改

3.1.2、降级方法修改：

3.1.3、测试

3.3、配置修改

3.3.1、单一方法Hystrix配置

3.3.1.1、注解修改

3.3.1.2、测试

3.3.2、全局配置

4、服务的熔断

4.1、熔断的原理

4.2、测试