Alibaba Sentinel的四种限流策略

前面两篇文章分别介绍了Sentinel怎么用,QPS怎么计算,接下来介绍下Sentinel限流策略
Alibaba Sentinel限流功能
Alibaba Sentinel与滑动时间窗口

Sentinel限流策略接口定义在 TrafficShapingController中,核心方法canPass,实现是否将流量放行的逻辑。

public interface TrafficShapingController {
   
    boolean canPass(Node node, int acquireCount, boolean prioritized);

    boolean canPass(Node node, int acquireCount);
}

其有四种实现,分别是基于QPS绝对值的DefaultController,基于频率的RateLimiterController,以及在这两大类之上构建出的,考虑冷启动问题的WarmUpController,WarmUpRateLimiterController

DefaultController

DefaultController是Sentinel默认的策略,核心逻辑是计算出当前时间窗口的count,满足qps要求就放行,不满足(prioritized=true)可以借未来时间窗口的quota,如果都不ok,则直接拒绝,详见下述代码注释1,2,3

public boolean canPass(Node node, int acquireCount, boolean prioritized) {
        //1.计算当前窗口计数之和
        int curCount = avgUsedTokens(node);
        //2.比较当前流量与规则限制
        if (curCount + acquireCount > count) {
            //3.即使超限,如果prioritized设为true,则认为是重要业务,可以尝试让业务线程sleep到下一个窗口,借用下一个窗口的计数
            if (prioritized && grade == RuleConstant.FLOW_GRADE_QPS) {
                long currentTime;
                long waitInMs;
                currentTime = TimeUtil.currentTimeMillis();
                waitInMs = node.tryOccupyNext(currentTime, acquireCount, count);
                if (waitInMs < OccupyTimeoutProperty.getOccupyTimeout()) {
                    node.addWaitingRequest(currentTime + waitInMs, acquireCount);
                    node.addOccupiedPass(acquireCount);
                    sleep(waitInMs);

                    // PriorityWaitException indicates that the request will pass after waiting for {@link @waitInMs}.
                    throw new PriorityWaitException(waitInMs);
                }
            }
            return false;
        }
        return true;
    }

RateLimiterController

这是一种基于频率的限流策略,DefaultController关注的是QPS的绝对值,而RateLimiterController关注的是流量进来的间隔时间,如果定义QPS阈值为10,使用DefaultController的策略,无论流量在一秒内的某个ms单位时间点同时进来,还是均匀的每100ms进来一个请求,都是一视同仁的,都可以通过。使用RateLimiterControlle策略,则要求每一个请求,距离上一次请求通过的间隔,必须大于等于100ms,才可以放行,否则必须sleep一段时间,直到间隔大于等于100ms,否则拒绝。可以认为这是一种基于固定频率的限流机制。
见代码

public boolean canPass(Node node, int acquireCount, boolean prioritized) {
        long currentTime = TimeUtil.currentTimeMillis();
        // Calculate the interval between every two requests.
        long costTime = Math.round(1.0 * (acquireCount) / count * 1000);

        // Expected pass time of this request.
        long expectedTime = costTime + latestPassedTime.get();
        //比如预期下一个请求在1500ms之后到来,currentTime已经在1600ms,表名系统其实是闲着的,直接通过即可。
        if (expectedTime <= currentTime) {
            // Contention may exist here, but it's okay.
            latestPassedTime.set(currentTime);
            return true;
        } else {//计算需要等的时间
            long waitTime = costTime + latestPassedTime.get() - TimeUtil.currentTimeMillis();
            //等待时间过长,直接拒绝
            if (waitTime > maxQueueingTimeMs) {
                return false;
            } else {//等的时间ok,考虑放行,去抢占更新latestPassedTime
                long oldTime = latestPassedTime.addAndGet(costTime);
                try {
                    waitTime = oldTime - TimeUtil.currentTimeMillis();
                    //说明抢占失败了,而且新的等待时间无法接受,则回滚更新,拒绝
                    if (waitTime > maxQueueingTimeMs) {
                        latestPassedTime.addAndGet(-costTime);
                        return false;
                    }
                    //sleep之后放行。
                    if (waitTime > 0) {
                        Thread.sleep(waitTime);
                    }else{
                       System.out.print("waitTime <=0 "+waitTime);
                    }

                    return true;
                } catch (InterruptedException e) {
                }
            }
        }
        return false;
    }

WarmUpController

部分业务系统,当启动完毕,或者长期处于低负荷状态运行时,会因为资源初始化(比如数据库建立连接,远程网络连接)的问题,无法应对突如其来的大流量。WarmUpController提供的限流策略,支持系统在一个时间段,以一个曲线爬坡,逐步增加系统QPS限制,达到WarmUp的效果。warmup完毕之后,其限流策略与DefaultController相似。

public boolean canPass(Node node, int acquireCount, boolean prioritized) {
        long passQps = (long) node.passQps();

        long previousQps = (long) node.previousPassQps();
        syncToken(previousQps);

        // 开始计算它的斜率
        // 如果进入了警戒线,开始调整他的qps
        long restToken = storedTokens.get();
        // 这种情况相当于冷状态
        if (restToken >= warningToken) {
            long aboveToken = restToken - warningToken;
            // 消耗的速度要比warning快,但是要比慢
            // current interval = restToken*slope+1/count
            double warningQps = Math.nextUp(1.0 / (aboveToken * slope + 1.0 / count));
            if (passQps + acquireCount <= warningQps) {
                return true;
            }
        } else {// 这种情况相当于热状态

            if (passQps + acquireCount <= count) {
                return true;
            }
        }
        return false;
    }

这种策略将限流器模拟为token桶,QPS如果限制为20,则认为每秒自动往桶里加20个token,每通过一个请求,从桶里拿走一个token。

这种WarmUp策略的关键逻辑有两个:
1.判断系统怎么样算冷状态。
2.warmUp爬坡的坡度。

相关的公式见下。WarmUpController默认的coldFactor=3,如果定义冷启动时间10s,最大QPS为20。则可以得出warningToken=100,maxToken= 200 slope = 0.001
通俗的讲,在这种定义下,流量进来拿token的速度如果很慢,桶里剩余token大于等于100,则认为是冷状态,走冷状态的爬坡限流机制,会从6.66QPS在10s钟的时间内爬升到20QPS的流控限制。

warningToken = (int)(warmUpPeriodInSec * count) / (coldFactor - 1);

maxToken = warningToken + (int)(2 * warmUpPeriodInSec * count / (1.0 + coldFactor));

slope = (coldFactor - 1.0) / count / (maxToken - warningToken);

WarmUpRateLimiterController

这种策略可以认为是基于频率限流RateLimiterController的WarmUp版,也是以一个较低初始频率,逐步爬坡到目标频率。其实现类继承自WarmUpController,各种指标计算公式完成复用的,只是把WarmUpController计算得出的qps转换成频率进行限流。比如冷启动时间10s,最大QPS为20的配置下,WarmUpController会把QPS逐步从6.66QPS在10s的时间内爬升到20QPS,相应的,RateLimiterController会将这个间隔从150ms逐步降低到50ms。

if (restToken >= warningToken) {
            long aboveToken = restToken - warningToken;

            // current interval = restToken*slope+1/count
            double warmingQps = Math.nextUp(1.0 / (aboveToken * slope + 1.0 / count));
            costTime = Math.round(1.0 * (acquireCount) / warmingQps * 1000);
        } else {
            costTime = Math.round(1.0 * (acquireCount) / count * 1000);
        }

你可能感兴趣的:(Alibaba Sentinel的四种限流策略)