软件系统有三个追求:高性能、高并发、高可用,俗称三高
。本篇讨论高并发,从高并发是什么到高并发应对的策略、缓存、限流、降级等。
高并发背景
互联网行业迅速发展,用户量剧增,系统面临巨大的并发请求压力。
高并发对系统的挑战
性能下降、资源竞争和稳定性问题等。
高并发是指系统或应用程序在同一时间段内接收到大量并发请求的能力。具体来说,高并发环境下系统需要能够同时处理大量的请求,而不会出现性能问题或响应延迟。
大量请求:高并发场景下,系统需要同时处理大量的请求,这些请求可能来自于不同的用户或客户端。
同时访问:这些请求几乎同时到达系统,需要在短时间内进行处理和响应。
资源竞争:由于大量请求同时到达,系统的资源(如CPU
、内存、网络带宽等)可能会面临竞争和争夺。
响应时间要求高:高并发场景通常对系统的响应速度有较高的要求,用户期望能够快速获取响应结果。
高并发场景广泛应用于热门网站、电商平台、社交媒体等互联网应用中。例如,在电商平台上有大量用户同时浏览、搜索商品,提交订单等操作;社交媒体平台上有大量用户同时发布、点赞、评论等操作。这些场景需要系统能够同时处理大量请求,并保证系统的性能、可用性和用户体验。
简介
在网站或APP
的开发中,缓存机制是一个不可或缺的环节,可以提高网站或APP
的访问速度,降低数据库压力。在高并发环境下,缓存机制的作用更加明显,不仅可以有效减轻数据库的负载,还可以提高系统的稳定性和性能,从而给用户带来更好的体验。
工作原理
缓存的工作原理是先从缓存中获取数据,如果有数据则直接返回给用户,如果没有数据则从慢速设备上读取实际数据并且将数据放入缓存。
简介
浏览器缓存是指将网页中的资源(如HTML、CSS、JavaScript、图像等
)存储在用户的浏览器内部,以便在后续请求同一资源时可以直接从本地缓存中获取,而无需再次从服务器下载。
适用场景
浏览器缓存适用于那些静态内容变化较少的网页和静态资源,可以显著提升网站性能和用户体验,并减少服务器的负载。
常见用法
使用浏览器缓存可以通过设置响应头中的Expires
和Cache-Control
字段来控制缓存的行为。
Expires
字段:Expires
字段指定了缓存的过期时间,是一个具体的日期和时间。服务器可以在响应头中添加Expires
字段,告诉浏览器在该时间之前可以直接从缓存中获取资源,而无需再向服务器发起请求。例如:Expires: Mon, 28 Feb 2024 23:59:59 GMT
。Cache-Control
字段:Cache-Control
字段提供了更灵活的缓存控制选项。可以通过设置max-age
指令来指定缓存的最大有效时间,单位是秒。例如:Cache-Control: max-age=3600
表示资源可以在1小时内直接从缓存中获取。还可以使用其他指令,如no-cache
表示缓存但不使用缓存、no-store
表示禁止缓存等。注意事项
浏览器缓存存储实时性不敏感的数据,如商品框架、商家评分、评价和广告词。它有过期时间,并通过响应头进行控制。实时性要求高的数据不适合使用浏览器缓存。
简介
客户端缓存是将数据存储在浏览器中,以提高访问速度和减少服务器请求。
适用场景
在大促期间,为了防止服务端承受瞬间的高流量压力,可以提前将一些素材(如js/css/image
等)下发到客户端进行缓存,避免在大促期间再次请求这些素材。此外,还可以将一些兜底数据或样式文件存放在客户端缓存中,以确保在服务端异常或网络异常的情况下,保持app
的正常运行。
简介
CDN(Content Delivery Network)
是建立在承载网之上的分布式网络,由分布在不同区域的边缘节点服务器组成。
CDN
缓存通常用于存放静态页面数据、活动页面、图片等数据。它有两种缓存机制:推送机制(将数据主动推送到CDN
节点)和拉取机制(首次访问时从源服务器获取数据并存储在CDN
节点)。
适用场景
CDN
缓存可以提高网站访问速度,适用于网站访问量大、访问速度慢、数据变化不频繁的场景。
常用工具以及用法
常见的CDN
缓存工具包括Cloudflare、Akamai、Fastly
和AWS CloudFront
等。这些工具提供了全球分布的CDN
网络,以加速内容传输和提升性能。它们提供了控制台和API
,用于配置CDN
缓存规则、管理缓存内容、刷新和更新缓存等。
简介
反向代理缓存是指在反向代理服务器上对请求的响应进行缓存,以提高服务的性能和用户体验。它将经常请求的静态内容缓存在代理服务器上,当有用户请求同样的内容时,代理服务器会直接返回缓存的响应,而无需再次向源服务器请求。
适用场景
适用于访问外部服务速度比较慢,但是数据变化不频繁的场景。
常用工具以及用法
Nginx
:一款高性能的反向代理服务器,支持反向代理缓存功能,可通过配置文件进行缓存策略的设置。Nginx
代理层缓存主要以Http
模块与proxy_cacahe
模块进行配置即可。Varnish
:一个专门用于反向代理缓存的开源软件,可以高效地缓存并提供快速的响应。Squid
:一款功能强大的缓存代理服务器,支持反向代理缓存和正向代理缓存。简介
本地缓存是将数据或资源存储在客户端的存储介质中,如硬盘、内存或数据库。它可以是临时的,只在应用程序运行期间有效,或者可以是持久的,即在不同的应用程序会话中保持有效。
适用场景
本地缓存适用于频繁访问数据、离线访问、减少带宽消耗和提升用户体验的场景。
常用工具以及用法
一般分为磁盘缓存、CPU
缓存、应用缓存
CPU
缓存:位于处理器内部的高速存储器,用于暂时存储频繁访问的数据或指令,提高计算机的性能。简介
分布式缓存是将缓存数据分散存储在多台服务器上的缓存解决方案。
适用场景
高并发读取、数据共享和协同处理、提供弹性和可扩展性、降低后端请求次数等场景。
常用工具以及用法
Redis
:Redis
是一种高性能的键值存储系统,支持丰富的数据类型和灵活的缓存策略。可以使用Redis
搭建分布式缓存集群,利用其快速的读写能力和一致性哈希算法实现数据分片和负载均衡。Memcached
:Memcached
是一种简单而快速的分布式内存对象缓存系统,用于减轻数据库负载和加速动态Web
应用程序。它采用分布哈希算法进行数据分片和分布式存储。缓存穿透
关键词:强调缓存和数据库都没有数据+并发访问
缓存穿透是指数据库和缓存都没有的数据,每次都要经过缓存去访问数据库,大量的请求有可能导致DB
宕机。
应对策略
Bloom Filter
):布隆过滤器是一种快速判断元素是否存在的数据结构,它可以在很小的内存占用下,快速判断一个元素是否在一个集合中。将所有可能存在的数据哈希到一个足够大的位数组中,当一个请求过来时,先经过布隆过滤器判断是否存在于缓存中,如果不存在,则直接返回,避免对数据库的查询压力。缓存击穿
关键词:强调单个热点Key过期+并发访问
缓存击穿是指数据库有,缓存没有的热点数据,大量请求访问这个缓存不存在的数据,最后请求打到DB
可能导致DB
宕机。
应对策略
缓存雪崩
关键词:强调批量Key过期+并发访问
缓存雪崩指的是在同一时段大量的缓存键(key
)同时失效,导致大量请求打到数据库,最后请求打到DB
可能导致DB
宕机。
应对策略
缓存一致性指的是缓存与DB
之间的数据一致性,我们需要通过各种手段来防止缓存与DB
不一致,我们要保证缓存与DB
的数据一致或者数据最终一致。
应对策略
针对缓存一致性问题,可以从不同的层次来应对:
数据库层:
缓存层:
应用层:
监控和报警:
综合使用以上层次的策略,可以有效地应对缓存一致性问题,保证数据的一致性和系统的稳定性。不同层次的策略可以相互配合,形成一个完善的缓存一致性解决方案。
缓存的好处我们非常受益,用户的每一次请求都伴随着无数缓存的诞生,但是缓存同时也给我们带来了不小的挑战,比如在上面提到的一些疑难课题:缓存穿透、缓存击穿、缓存雪崩和缓存一致性。
除此之外,我们还会涉及到其他的一些缓存难题,如:缓存倾斜、缓存阻塞、缓存慢查询、缓存主从一致性问题、缓存高可用、缓存故障发现与故障恢复、集群扩容收缩、大Key
热Key
…
简介
再强大的系统,也怕流量短时间内集中爆发,就像银行怕挤兑一样,所以,高并发另一个必不可少的模块就是限流。
限流是一种通过控制请求的速率或数量来保护系统免受过载的技术。流控的精髓是限制单位时间内的请求量,最大程度保障系统的可靠性及可用性。
作用
限流是在高并发环境下,为了保护系统的稳定性和可用性而引入的一种策略。通过限制并发请求的数量或频率,可以防止系统被过多的请求压垮或耗尽资源。
限流算法
常见的流控算法包括:固定窗口、滑动窗口、漏桶、令牌桶、滑动日志等算法。
简介
降级是在高并发或异常情况下舍弃非关键业务或简化处理的一种技术手段。
按类型可分为有感降级,无感降级
。
有感降级
主要是通过一定的监控感知到异常出现或即将出现,对调用服务进行快速失败返回或者进行切换,在指标回正的时候恢复服务调用,这个也可以称为熔断
。
无感降级
系统不作感知,在调用服务出现异常则自动忽略,进行空返回或无操作。降级的本质为作为服务调用方去规避提供方带来的风险。
缓存、限流和降级是应对高并发的三大利器,能够提升系统性能、保护资源和保证核心功能。
组合使用缓存、限流和降级策略,根据具体场景灵活调整和优化。
在高并发环境下,综合使用三大利器是应对挑战的有效策略。