常见性能优化手段——以AB分流接口为例

接口性能问题,对于从事后端开发的同学来说,是一个绕不开的话题。想要优化一个接口的性能,需要从多个方面着手。

本文将会接着接口性能优化这个话题,从实战的角度出发,聊聊我是如何优化一个慢查询接口的。

AB分流接口是对C端用户进行AB分流实验,支持不同用户标签的人看到不同信息流,帮助业务和产品同事进行信息流精准营销。

由于C端用户量通常很大,所以在针对活动做AB实验时,请求量是特别大,而且流量有可能暴增,所以AB分流的性能就特别重要,不能因此而影响到正常业务。

通常公司内在每天都会发一封线上慢查询接口汇总邮件,邮件中会展示接口地址、调用次数、最大耗时、平均耗时和traceId、慢sql等信息。

1、数据库优化:索引优化,数据清理,分库分表

遇到慢接口,或者慢sql,通常第一步是优化sql,省时省力,如果要修改别的,改动点大的话,可能需要大量的测试。

SQL优化、索引优化:慢sql优化思路及使用规范
数据清理:对于高并发接口,如果查询的数据量还特别大,那就要注意及时清理数据,把过期的,没用的数据清理掉,没意义的数据直接都删除,有意义但是没少用到的数据,可以存到hive数据仓库中。
分库分表:如果数据量超过1000万,就可以考虑分库分表,把大表通过拆分成多个小表。

比如,推送时,最早的所有的推送都是一张表,后续优化时,拆分成 短信 邮件 公众号 APP 等多张表;
积分商城,在订单数据量打到1200万以上后,把订单表根据userId拆分为分片表。

2、缓存优化:hotkey优化、bigkey优化、批量处理

通常的高并发接口,我们肯定会用redis缓存,但是在高并发接口中使用redis,很容易遇到的问题就是hotkey和bigkey。

hotkey:业务中,常有一些配置信息(比如开关,兜底信息),每次查询都要去redis中获取,这些key也许并不大,但是由于高并发接口请求量太大,在redis形成 hotkey,从而导致流量倾斜,在流量突增时,很容易导致接口平均耗时上升。

优化方案:

    1. 拆分key:由于value并不大,所以可以把key复制多份(根据redis集群节点数,最好是<= redis集群节点数-2),每次查询时,先随机获取一个key,然后再去查询redis,通过redis集群多节点分担流量,降低单节点流量倾斜的风险;
    1. 内存缓存:也可以直接把这些配置信息缓存到内存中,只要能保证数据一致性,从内存中获取的性能是从redis获取的数十倍;
bigkey:一般接口中,我们认为几百kb的value才会认为是bigkey,但是高并发接口中,六七十kb的value都可能导致bigkey,从而导致网络阻塞。

优化方案:

  • 1、优化value数据结构
    只存必要的字段,非必要字段可以不存;对于字段特别多的,用数组代替json,这样有可能节省一半大小;

  • 2、优化key数据结构
    如果bigkey是hash结构,可以改成string结构;或者把一个hash改为多个hash结构,然后根据需要多次获取;

  • 3、内存缓存
    如果上面两种方法都行不通,那就只能内存缓存,但是一定要做好数据一致性处理;

Pipeline(管道)批量处理

在高并发时,如果要不断跟redis交互,那也会消耗很多时间,这时候可能通过Pipeline来进行批处理,节省每次和redis服务端的创建时间。

Pipeline的介绍和使用见这篇文章:
Redis(九):Pipeline(管道)VS Lua(脚本)

3、代码优化:批量处理,同步改为异步,多线程

批量处理,减少网络调用

接口入参从单查询改为批量查询,让上游调用尽量使用批量查询,减少网络调用,
同时如果调用别的微服务,一个微服务只调用一次,

同步改为异步,解耦

对于一些部分业务,如果上游调用方不需要知道执行结果,那我们可以通过引入中间件kafka把同步操作改为异步操作,在同步处理完必要的业务后,推送kafka信息,然后就直接返回。
剩余的业务在监听到kafka消息后再处理

多线程 CompleteFuture

如果业务中有多个微服务要调用,而这些接口调用又没有顺序关系,那我们可以通过CompleteFuture 来并发执行。

4、JVM优化

一般的JVM优化,实际上意义并不大,最有效的其实是扩节点,从8个节点扩大12个 16个,从4核8G扩到8核16G,对于性能提升是极大的。
但是对于一些特殊的业务,比如计算量很大的业务,在压测时,就会发现其性能瓶颈在CPU(直观表现就是CPU 100%,而内存却只用了 40-50%),这种在扩容时,可以CPU核数多扩点,内存少扩一点,比容从4核8G 扩容到 8核12G;

而对于一些需要大量使用内部缓存的业务来说,可以内存多扩一点,比容从4核8G 扩容到 6核16G;

5、流控优化:sentinel流控

在执行了上面的这些优化方案后,基本上接口是可以满足上游调用方需求的。
但是,还是有一些特殊情况,比如流量突然增加了十倍,这种突然暴涨的流量,可能把业务接口拖垮,从而造成线上故障。

为了避免这种情况,我们可以引入sentinel 做限流 熔断,在流量暴涨时,直接限流使其执行兜底方案,同时告警,然后研发 运维介入,通过扩节点来分流处理。

通过以上这些优化方案,AB分流接口压测单机QPS从280上升720,生产平均耗时从43ms下降到8.5ms ,P95耗时从126ms下降到22ms,耗时小于1000ms >99.99%。

你可能感兴趣的:(常见性能优化手段——以AB分流接口为例)