1. 前言
在 spring cloud 各种组件中,我最早接触的就是 open feign,但从来没有讲过它。原因是因为觉得它简单,无非就是个服务调用,在代码层面上也很简单,没有啥可说的。
但为什么今天来讲呢:
- 服务调用看起来简单,但实则是微服务治理中很重要的一环。我们现在微服务有上百个,如何提高微服务之间调用的稳定性,是老大难的问题。网络或高并发等原因,几乎每天都有个别报错是 feign 调用的。
- open feign 其实是封装了负载均衡、熔断等其他组件的,掌握它是有难度的。
1. feign 与 openfeign
feign
是 netflix 公司写的,是 spring cloud 组件中的一个轻量级 RESTful 的 HTTP 服务客户端,是 spring cloud 中的第一代负载均衡客户端。后来 netflix 讲 feign 开源给了 spring cloud 社区,也随之停更。
openfeig
是 spring cloud 自己研发的,在 feign
的基础上支持了 spring MVC 的注解,如 @RequesMapping 等等。是 spring cloud中的第二代负载均衡客户端。
虽然 feign 停更了,之前我也介绍过 dobbo 这类替代产品。但在服务调用这个领域,open feign 还是有它的一席之地。
2. spring cloud 版本更迭
先讲讲 spring cloud 的版本迭代吧。在2020年之前,spring cloud 等版本号是按照伦敦地铁站号命名的(ABCDEFGH):
- Angle
- Brixton
- Camden
- Dalston
- Edgware
- Finchley
- GreenWich
- Hoxton
但从2020年开始,版本号开始以年份命名,如:2020.0.1。
spring cloud 与 spring boot 版本的对应关系如下:
spring cloud 版本 | spring boot 版本 |
---|---|
2022.x | 3.0 |
2021.x | 2.6.x、2.7.x(2021.0.3+) |
2020.x | 2.4.x、2.5.x(2020.0.3+) |
Hoxton | 2.2.x、2.3.x(SR5+) |
GreenWich | 2.1.x |
Finchley | 2.0.x |
Edgware | 1.5.x |
Dalston | 1.5.x |
3. open feign 版本更迭
在 2020.x 版本之前,open feign 默认依赖了 hystrix、ribbon。
但从 2020.x 版本开始,open feign 就不再依赖 hystrix、ribbon了。
- 熔断:可以自己选择熔断组件,不过需要额外引入依赖,如:resilience4j、sentinel。
- 负载均衡:该用 spring cloud loadbalancer 替代 ribbon。
2. 示例代码
本着实践出真知的原则,我们还是创建个项目试验一下。这一章节就是把示例代码的核心代码列出来。代码还是以 openfeign 的低版本为主,spring cloud 版本为 Hoxton。
示例代码是个多模块的项目,为了构建一个简单的 feign 服务调用的场景,构建下面3个子模块:
- eureka-server:为 feign 服务调用提供注册中心。
- demo1-app:http服务,对外提供接口,供 demo2-app 调用。
- demo2-app:http服务,对外提供接口,该接口调用 demo1-app 的接口。
2.1. parent
pom.xml
4.0.0
org.springframework.boot
spring-boot-starter-parent
2.3.2.RELEASE
pers.kerry
feign-service
${revision}
feign-service
feign-service
pom
0.0.1-SNAPSHOT
8
Hoxton.SR8
2.3.2.RELEASE
1.2.7
1.18.24
0.13.2
eureka-server
demo1-app
demo2-app
org.springframework.cloud
spring-cloud-dependencies
${spring-cloud.version}
pom
import
org.springframework.boot
spring-boot-starter-web
${spring-boot-starter.version}
org.projectlombok
lombok
${lombok.version}
org.springframework.boot
spring-boot-maven-plugin
org.codehaus.mojo
flatten-maven-plugin
${flatten-maven-plugin.version}
true
clean
flatten
process-resources
flatten
flatten-clean
clean
clean
2.2. eureka-server
1. pom.xml
4.0.0
pers.kerry
feign-service
${revision}
../pom.xml
pers.kerry
eureka-server
eureka-server
eureka-server
org.springframework.boot
spring-boot-starter-web
org.springframework.cloud
spring-cloud-starter-netflix-eureka-server
org.springframework.boot
spring-boot-maven-plugin
2. EurekaServerApplication
@SpringBootApplication
@EnableEurekaServer
public class EurekaServerApplication {
public static void main(String[] args) {
SpringApplication.run(EurekaServerApplication.class, args);
}
}
3. application.yml
server:
port: 8000
spring:
application:
name: eureka-server
eureka:
instance:
hostname: localhost
client:
register-with-eureka: false
fetch-registry: false
2.3. demo1-app
1. pom.xml
4.0.0
pers.kerry
feign-service
${revision}
../pom.xml
pers.kerry
demo1-app
demo1-app
demo1-app
org.springframework.boot
spring-boot-starter-web
org.springframework.cloud
spring-cloud-starter-netflix-eureka-client
org.projectlombok
lombok
org.springframework.boot
spring-boot-maven-plugin
2. Demo1AppApplication
@SpringBootApplication
@EnableDiscoveryClient
public class Demo1AppApplication {
public static void main(String[] args) {
SpringApplication.run(Demo1AppApplication.class, args);
}
}
3. DemoController
@RestController
@RequestMapping
@Slf4j
public class DemoController {
@GetMapping("hello")
public String hello(@RequestParam Integer seconds) {
if (seconds < 0) {
throw new RuntimeException("时间不能为负数");
}
try {
Thread.sleep(seconds * 1000);
} catch (InterruptedException e) {
throw new RuntimeException(e);
}
log.info("app1: 你好!");
return "hello";
}
}
4. application.yml
server:
port: 8001
spring:
application:
name: app1
eureka:
client:
service-url:
defaultZone: http://localhost:8000/eureka
2.4. demo2-app
1. pom.xml
4.0.0
pers.kerry
feign-service
${revision}
../pom.xml
pers.kerry
demo2-app
demo2-app
demo2-app
org.springframework.boot
spring-boot-starter-web
org.springframework.cloud
spring-cloud-starter-openfeign
org.springframework.cloud
spring-cloud-starter-netflix-eureka-client
org.projectlombok
lombok
org.springframework.boot
spring-boot-maven-plugin
2. Demo2AppApplication
@SpringBootApplication
@EnableFeignClients
@EnableDiscoveryClient
public class Demo2AppApplication {
public static void main(String[] args) {
SpringApplication.run(Demo2AppApplication.class, args);
}
}
3. DemoController
@RestController
@RequestMapping("feign")
@AllArgsConstructor
@Slf4j
public class DemoController {
private final HelloFeign helloFeign;
@GetMapping("hello")
public String hello(@RequestParam Integer seconds) {
log.info("app2: 你好!");
return helloFeign.hello(seconds);
}
}
4. HelloFeign
@FeignClient(name = "app1")
public interface HelloFeign {
@GetMapping("hello")
String hello(@RequestParam Integer seconds);
}
5. application.yml
server:
port: 8002
spring:
application:
name: app2
eureka:
client:
service-url:
defaultZone: http://localhost:8000/eureka
3. feign 超时、重试
3.1. feign 超时
1. 设置
当我们在 demo2-app 的 application.yml 文件中仅添加 feign 的配置:
server:
port: 8002
spring:
application:
name: app2
eureka:
client:
service-url:
defaultZone: http://localhost:8000/eureka
feign:
client:
config:
default:
connect-timeout: 1000
read-timeout: 2500
spring 配置类中注册bean:
@Bean
public Retryer retryer(){
return new Retryer.Default(100,1000,3);
}
feign 的重试是通过 retryer
属性实现的,但如果需要自定义重试策略,则需要写代码注册 bean。
按照 Retryer 类构造方法中参数顺序依次为:
period
: 初始重试间隔 ,默认实现值是 100 msmaxPeriod
: 最大重试间隔 ,默认实现值是 1000 msmaxAttempts
: 最大重试次数,初始调用算一次,默认实现值是 5
2. 测试用例1
调用接口:(GET) http://localhost:8002/feign/h...
执行结果按照时间顺序是:
- app1 打印1次数(“app1: 你好!”)
- app2 成功返回 “hello”
3. 测试用例2
调用接口:(GET) http://localhost:8002/feign/h...
执行结果按照时间顺序是:
- app1 打印3次数(“app1: 你好!”)后
- app2 接口报错。错误:
feign.RetryableException
4. 分析
在配置中,我们设置请求处理时间(readTimeout)为2.5秒,失败后重试2次(减去初始调用的1次)。
在测试用例1中,因为设置 app1 处理时间在2秒,没有超过2.5秒,所以正常请求成功,app1只打印了1次。
在测试用例2中,因为设置 app1 处理时间在3秒,超过了2.5秒,单次请求失败,触发了失败重试机制。首次执行了1次,又重试了2次,所以一共有3次调用,app1 共打印了3次。
5. feign配置
connect-timeout
: 请求连接的超时时间(毫秒)read-timeout
: 请求处理的超时时间(毫秒)retryer
: 重试的实现类(如:feign.Retryer.Default)。如果不配置,则默认不重试
6. 局部配置
其实正常的配置前缀应该叫 feign.config.client.${feignName}
。可以针对不同的 feign 调用服务(@FeignClient 中的 name 属性值),配置不同的策略。上述的 feign.config.client.default
是设置默认配置。
如下列可针对 app1、appx 配置不同策略:
feign:
client:
config:
app1:
connect-timeout: 1000
read-timeout: 2500
retryer: feign.Retryer.Default
appx:
connect-timeout: 1000
read-timeout: 4500
retryer: pers.kerry.demo2app.config.AppXRetryer
3.2. feign 重试(retryer)
1. 全局配置
上述中在 配置类(@Configuration) 中注册 Retryer Bean,就是全局配置,所有服务都走这同一个策略。如下:
@SpringBootConfiguration
public class AppFeignConfig {
@Bean
public Retryer retryer(){
return new Retryer.Default(100,1000,3);
}
}
要注意的是,一旦在注册了 bean,就算 feign.config.client.${feignName}.retryer
为空,也不会关闭重试策略,依然生效。所以这种方式要慎重!
2. 局部配置(指定Bean配置类)
和上面的例子很像,同样在类中声明 Retryer Bean,但并非在配置类中,只是作为 feign client 指定的逻辑上“配置类”。如下:
public class AppFeignConfig {
@Bean
public Retryer retryer(){
return new Retryer.Default(100,1000,3);
}
}
然后在 HelloFeign.java 中指定配置类:
@FeignClient(name = "app1",configuration = AppFeignConfig.class)
public interface HelloFeign {
@GetMapping("hello")
String hello(@RequestParam Integer seconds);
}
此时 feign.config.client.${feignName}.retryer
可以为空,因为读的是 @FeignClient 的配置了。
3. 局部配置(指定类路径)
可自定义类继承 Retryer默认类(feign.Retryer.Default),可通过设置默认构造方法,来定义重试规则,如下:
pers.kerry.demo2app.config.AppXRetryer.java
public class AppXRetryer extends Retryer.Default {
private static final int maxAttempts = 2;
private static final long period = 100;
private static final long maxPeriod = 1500;
public AppXRetryer() {
super(period, maxPeriod, maxAttempts);
}
@Override
public Retryer clone() {
return new AppXRetryer();
}
}
其在 application.yml 上配置的方式是:
feign:
client:
config:
default:
connect-timeout: 1000
read-timeout: 1500
retryer: pers.kerry.demo2app.config.AppXRetryer
4. ribbon 超时、重试
1. 设置
当我们在 demo2-app 的 application.yml 文件中仅添加 ribbon 的配置:
server:
port: 8002
spring:
application:
name: app2
eureka:
client:
service-url:
defaultZone: http://localhost:8000/eureka
feign:
hystrix:
enabled: false
ribbon:
ConnectTimeout: 1000
ReadTimeout: 2500
MaxAutoRetries: 3
MaxAutoRetriesNextServer: 0
2. 测试用例1
调用接口:(GET) http://localhost:8002/feign/h...
执行结果按照时间顺序是:
- app1 打印1次数(“app1: 你好!”)
- app2 成功返回 “hello”
3. 测试用例2
调用接口:(GET) http://localhost:8002/feign/h...
执行结果按照时间顺序是:
- app1 打印4次数(“app1: 你好!”)后
- app2 接口报错。错误:
feign.RetryableException
4. 分析
在配置中,我们设置请求处理时间(ReadTimeout)为2.5秒,失败后重试3次。
在测试用例1中,因为设置 app1 处理时间在2秒,没有超过2.5秒,所以正常请求成功,app1只打印了1次。
在测试用例2中,因为设置 app1 处理时间在3秒,超过了2.5秒,单次请求失败,触发了失败重试机制。因为首次执行了1次,又重试了3次,所以一共有4次调用,app1 共打印了4次。
5. ribbon 配置
ConnectTimeout
: 请求连接的超时时间(毫秒)ReadTimeout
: 请求处理的超时时间(毫秒)MaxAutoRetries
: 同一实例最大重试次数,不包括首次调用。默认值为0MaxAutoRetriesNextServer
: 同一个服务其他实例的最大重试次数,不包括第一次调用的实例。默认值为1OkToRetryOnAllOperations
: 是否所有操作都允许重试。默认值为false,即只在GET协议上重试所有错误ServerListRefreshInterval
: Ribbon更新服务注册列表的频率(毫秒)
6. 局部配置
可针对不用的 feign 调用服务(@FeignClient 中的 name 属性值),配置不同的策略。如,下列可针对 app1、appx 配置不同策略:
app1:
ribbon:
ConnectTimeout: 1000
ReadTimeout: 2500
MaxAutoRetries: 3
MaxAutoRetriesNextServer: 0
appn:
ribbon:
ConnectTimeout: 1000
ReadTimeout: 4500
MaxAutoRetries: 0
MaxAutoRetriesNextServer: 3
5. feign、ribbon 比较
1. 比较
feign 的配置策略更丰富,至少 idea 会有提示。
但在失败重试的方向上,ribbon功能更强大。不仅是配置起来更简单,而且支持跨服务重试,这个在实际应用中很重要。毕竟当某个服务因高并发而短暂阻塞时,最好的解决方法就是引流到其他服务上重试。
2. 优先级
当上述 application 文件中,feign、ribbon 同时开启配置如下:
feign:
hystrix:
enabled: false
client:
config:
default:
connect-timeout: 1000
read-timeout: 1500
retryer: pers.kerry.demo2app.config.AppXRetryer
ribbon:
ConnectTimeout: 1000
ReadTimeout: 2500
MaxAutoRetries: 3
MaxAutoRetriesNextServer: 0
在测试时发现无论超时还是重试,当前生效的只有 feign 的配置。
可见默认情况下,feign 配置的优先级要高于 ribbon。
因为有一个 feign.client.default-to-properties
的属性,其作用是初始化对象获取属性的优先级顺序。因为默认值为true,即 feign配置的优先级最高。如果手动设置为 false,则可以以 ribbon 的配置生效。
6. 熔断 hystrix(feign低版本)
hystrix 是由 netflix 开源的一款容错框架,包含隔离(线程池隔离、信号量隔离)、熔断、降级回退和缓存容错、缓存、批量处理请求、主从分担等常用功能。
feign本身支持 hystrix,默认是关闭 hystrix 的,需要在配置文件中开启 feign.hystrix.enabled=true
,默认值为 false。
6.1. hystrix 测试
因为 feign 默认就引入了 hystrix,在开启 feign.hystrix 后,只需要设置 hystrix 的配置就可以了。如下面的配置,再测试一下:
feign:
client:
config:
default:
connect-timeout: 1000
read-timeout: 1500
retryer: pers.kerry.demo2app.config.AppXRetryer
default-to-properties: true
hystrix:
enabled: true
hystrix:
command:
default:
execution:
timeout:
enabled: true
isolation:
strategy: THREAD
thread:
timeoutInMilliseconds: 2500
1. 测试用例1
调用接口:(GET) http://localhost:8002/feign/h...
执行结果按照时间顺序是:
- app1 打印1次数(“app1: 你好!”)
- app2 成功返回 “hello”
2. 测试用例2
调用接口:(GET) http://localhost:8002/feign/h...
执行结果按照时间顺序是:
- app1 打印2次数(“app1: 你好!”)后
- app2 接口报错。错误:
com.netflix.hystrix.exception.HystrixRuntimeException
3. 测试用例3
调用接口:(GET) http://localhost:8002/feign/h...
执行结果按照时间顺序是:
- app1 打印1次数(“app1: 你好!”)
- app2 接口报错。错误:
com.netflix.hystrix.exception.HystrixRuntimeException
- app1 再打印1次数(“app1: 你好!”)
如果不考虑 hystrix 的因素,当请求 seconds 值为3时,应该是和值为2时一样,在重试1次后再中断请求报错。
但由于3大于 hystrix 设置的超时时间2.5,在第一次请求时就触发了熔断报错。不过由于 feign 的重试机制,依然再重试了1次,但属于无效的重试,毕竟app2接口的http请求已经终结了。
所以如果需要开启 hystrix 熔断,各自超时时间的值,需要好好搭配一下。
6.2. hystrix 配置
当开启 feign.hystrix
后,可参考下列默认配置。
hystrix:
command:
default:
execution:
timeout:
enabled: true # 开启超时熔断
isolation:
strategy: THREAD
semaphore:
maxConcurrentRequests: 100 # 默认最大100个信号量并发,业务可根据具体情况调整(strategy=semaphore时生效)
thread:
timeoutInMilliseconds: 10000 # 默认熔断时间10秒,需要大于ribbon的retry*timeout
#熔断策略
circuitBreaker:
enabled: true # 启用熔断
requestVolumeThreshold: 20 # 度量窗口内请求量阈值,熔断前置条件,默认20
errorThresholdPercentage: 50 # 错误阈值比例,超过则触发熔断,默认50%
sleepWindowInMilliseconds: 5000 # 等待时间后重新检查请求,默认5秒
threadpool:
default:
coreSize: 10 # 核心数量,默认10,可根据实际业务调整
maximumSize: 10 # 最大数量,默认10,可根据实际业务调整
allowMaximumSizeToDivergeFromCoreSize: true # 是否允许从coreSize扩充到maximumSize
maxQueueSize: 1000 # 队列最大数量,不支持动态配置
queueSizeRejectionThreshold: 500 # 队列数量阈值,可动态配置
keepAliveTimeMinutes: 2
实际的配置项可看 hystrix 官方文档。本文要特别强调的是:
hystrix 超时时长 > (ribbon 超时时长 ribbon 重试次数) or (feign 超时时长 feign 重试次数 )