SpringCloud、SpringCloudAlibaba、SpringBoot版本选择。为了避免各种千奇百怪的bug,我们还是采用官方推荐的毕业版本。
server:
port: 8882
# 为了模拟高并发请求,将tomcat最大并发数修改为10
tomcat:
threads:
max: 10
<dependency>
<groupId>junitgroupId>
<artifactId>junitartifactId>
<version>4.7version>
<scope>testscope>
dependency>
<dependency>
<groupId>org.databenegroupId>
<artifactId>contiperfartifactId>
<version>2.1.0version>
<scope>testscope>
dependency>
@RequestMapping("/thread")
public String thread() throws InterruptedException {
TimeUnit.SECONDS.sleep(2);
return "Cloud2OrderApp thread";
}
public class ContiPerfTest {
@Rule
public ContiPerfRule i = new ContiPerfRule();
// invocations 并发数 threads 线程数
@Test
@PerfTest(invocations = 100, threads = 200)
// @Required(max = 100000, average = 250, totalTime = 100000)
public void test1() throws Exception {
RestTemplate restTemplate = new RestTemplate();
String result = restTemplate.getForObject("http://localhost:8882/thread", String.class);
System.out.println(result);
}
}
这里同时我们在浏览器去请求该地址,响应会变得很慢
测试结论:此时会发现由于thread接口囤积大量请求,导致index方法访问出现问题,这就是服务雪崩的雏形。
当一个接口高频访问耗费完资源会影响到其他接口的正常访问,这个场景扩展到不同的微服务会导致服务雪崩
由于服务与服务之间的依赖性,故障会传播,对整个微服务系统早长城灾难性的严重后果,这就是故障的雪崩效应。
雪崩发生的原因是多样的,可能是设计的容量不合理,或者是高并发下某一个方法相应很慢,或者某台机器的资源消耗殆尽。我们无法完全杜绝雪崩源头的发生,只有做好足够的容错机制,保证在一个服务发生问题,不会影响其他服务的正常运作。
要防止雪崩扩散,就要做好服务的容错机制。
常见的容错思路:隔离、超时、限流、熔断、降级
上有服务调用下游服务的时候,设置一个最大响应时间,如果超时,下游未做出响应则自动断开请求,释放线程。
限制系统输入输出流量以达到保护系统目的。为了保证系统稳定运行,一旦达到阈值,就需要限流采取措施来完成限流目的。
当下游服务因为访问压力过大而响应变慢或者失败,上游服务为保证系统整体可用,暂时切断对下游服务调用。牺牲局部来保证整体可用性。
熔断一般有三种状态:
降级就是给服务提供一个最低的兜底方案,一旦服务无法正常调用,则使用该兜底方案。
Hystrix:Netflix开源的延迟容错库。隔离访问远程系统、服务,防止级联失败,提高系统可用性与容错性。
Resilience4J:轻量、简单、文档清晰、丰富的熔断工具。Hystrix官方推荐替代方案。支持SpringBoot1/2,支持Prometheus监控。
Sentinel:alibaba开源断路器实现。稳定。分布式系统的流量防卫兵。
一套用于服务容错的综合性解决方案。以流量为切入点,从流量控制、熔断降级、系统负载保护等多维度来保护系统稳定性。
<dependency>
<groupId>com.alibaba.cloudgroupId>
<artifactId>spring-cloud-starter-alibaba-sentinelartifactId>
<version>${spring-cloud-alibaba.version}version>
dependency>
spring:
cloud:
sentinel:
transport:
port: 8719 # 与控制台交流的端口,随意指定一个未使用的端口即可
dashboard: localhost:8080 # 指定控制台服务的地址
下载安装包:https://github.com/alibaba/Sentinel/releases/tag
sentinel-dashboard-2.0.0-alpha-preview.jar :https://github.com/alibaba/Sentinel/releases/tag/2.0.0-alpha
# 直接使用java -jar命令启动项目(控制台本身是一个SpringBoot项目)
# -Dserver.port=8080 指定端口。
# -Dcsp.sentinel.dashboard.server=localhost:8080 指定控制台地址和端口,会自动向该地址发送心跳包。地址格式为:hostIp:port 配置成localhost:8080即监控自己
# -Dproject.name=sentinel-dashboard 指定Sentinel控制台程序显示名称
java -Dserver.port=8080 -Dcsp.sentinel.dashboard.server=localhost:8080 -Dproject.name=sentinel-dashboard -jar sentinel-dashboard.jar
资源名称:唯一名称,默认是请求路径,可以自定义
针对来源:针对哪个微服务进行限流,默认default不区分,全部限制
是否集群:
阈值类型/单机阈值:
流控规则、降级规则、热点规则、系统规则、授权规则
流量控制的原理:监控应用流量的QPS或并发线程数等指标,当达到指定阈值时对流量进行控制,以避免被瞬时流量高峰冲垮,从而保证应用的高可用。
数据库读写操作相互影响。如果写操作过多,会造成读的性能下降。
或者比如下单接口后调用支付接口,如果下单访问过多占用支付接口性能。
链路流控模式是指,当某个接口过来的资源达到限流条件时,开启限流。
spring:
cloud:
sentinel:
transport:
web-context-unify: false
下面配置表示在1秒内超过5个请求,且这些请求中的响应时间大于最大RT时间的10%就触发熔断。在接下来的10秒内都不调用真实方法处理。直接走降级方法。
下面配置表示在1秒内有超过1个请求的10%就触发熔断,熔断时间间隔5秒。
下面配置表示1秒内5个请求中,有三次异常就触发熔断。熔断间隔时间5秒。
热点是指经常访问的数据。很多时候我们希望统计某个热点数据中访问频次最高的top n条数据,并推起进行访问控制。
如:统计一段时间内最常购买的商品ID并进行限制。对一段时间内频繁访问的用户ID进行限制。防止刷赞等。
热点参数限流会统计传入参数中的热点参数,并根据配置的限流阈值与模式,对包含热点参数
很多时候,需要根据调用来源来判断你请求是否允许放行,这时候可以使用sentinel的来源访问控制(黑白名单)功能。来源访问控制根据资源的请求(origin)限制资源是否通过,若配置白名单则只有请求来源位于白名单内时可以通过,若配置黑名单,则请求来源位于黑名单时不通过,其余可以通过。
当前面设定规则没有满足,可以自定义异常返回。
package com.hx.sentinel.error;
import com.alibaba.csp.sentinel.adapter.spring.webmvc.callback.BlockExceptionHandler;
import com.alibaba.csp.sentinel.slots.block.BlockException;
import com.alibaba.csp.sentinel.slots.block.authority.AuthorityException;
import com.alibaba.csp.sentinel.slots.block.degrade.DegradeException;
import com.alibaba.csp.sentinel.slots.block.flow.FlowException;
import com.alibaba.csp.sentinel.slots.block.flow.param.ParamFlowException;
import com.alibaba.csp.sentinel.slots.system.SystemBlockException;
import com.alibaba.fastjson.JSON;
import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;
import org.apache.commons.lang.CharSet;
import org.apache.http.Consts;
import org.apache.http.entity.ContentType;
import org.springframework.stereotype.Component;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.nio.charset.Charset;
/**
* @author Huathy
* @date 2023-04-04 23:58
* @description
*/
@Component
public class SentinelExceptionHandler implements BlockExceptionHandler {
@Override
public void handle(HttpServletRequest request, HttpServletResponse response, BlockException e) throws Exception {
Result result = null;
if (e instanceof FlowException) {
result = new Result(500101, "接口限流");
} else if (e instanceof DegradeException) {
result = new Result(500102, "接口降级");
} else if (e instanceof ParamFlowException) {
result = new Result(500101, "接口参数限流");
} else if (e instanceof AuthorityException) {
result = new Result(500101, "授权异常");
} else if (e instanceof SystemBlockException) {
result = new Result(500101, "系统负载异常");
} else {
result = new Result(500101, e.getMessage());
}
response.setCharacterEncoding(Consts.UTF_8.name());
response.setContentType(ContentType.APPLICATION_JSON.getMimeType());
response.getWriter().write(JSON.toJSONString(result));
}
@Data
@AllArgsConstructor
@NoArgsConstructor
class Result {
int code;
String msg;
}
}
用于定义资源,并提供可选的异常处理和fallback配置项。
@RestController
public class AnnoController {
// 需求:当触发流控规则后,默认向抛出异常。
// 此时业务需要在抛出异常前,进行额外业务处理。或返回默认参数
@RequestMapping("/anno1")
@SentinelResource(value = "/anno1", blockHandler = "anno1BlockHandler", fallback = "anno1Fallback")
public Map<String, Object> anno1(String pm) {
if(pm == null || "".equals("")){
throw new RuntimeException("参数为空!");
}
Map<String, Object> res = new HashMap<>();
res.put("code", 200);
res.put("msg", "请求成功");
res.put("param", pm);
return res;
}
/**
* 当触发流控规则之后,立即触发该方法。
* 需要注意该handler方法的参数列表要与原方法一致,并在最后加上异常参数BlockException ex
*/
public Map<String, Object> anno1BlockHandler(String param, BlockException e) {
System.out.println("anno1 流控触发");
Map<String, Object> res = new HashMap<>();
res.put("code", 403);
res.put("msg", "触发流控默认返回方法");
res.put("param", param);
res.put("exception", e);
return res;
}
/**
* 当anno1方法执行报错的时候,立即触发该方法
* @param param
* @param e
* @return
*/
public Map<String, Object> anno1Fallback(String param, Throwable e) {
Map<String, Object> res = new HashMap<>();
res.put("code", 500);
res.put("msg", "处理出错,默认返回");
res.put("param", param);
res.put("exception", e);
return res;
}
}
feign:
sentinel:
enabled: true
@Component
public class ProductFallService implements ProductService {
@Override
public String index() {
return "熔断降级了!";
}
}
@FeignClient(value = "cloud2-product-server", fallback = ProductFallService.class)
public interface ProductService {
@GetMapping("/")
String index();
}