ff00yo

Redis 布隆过滤器实战「缓存击穿、雪崩效应」

本文作者：卢玮，掌阅资深后端工程师
为什么引入
我们的业务中经常会遇到穿库的问题，通常可以通过缓存解决。
如果数据维度比较多，结果数据集合比较大时，缓存的效果就不明显了。
因此为了解决穿库的问题，我们引入Bloom Filter。
开源项目地址：github.com/luw2007/blo…
我们先看看一般业务缓存流程：

先查询缓存，缓存不命中再查询数据库。
然后将查询结果放在缓存中即使数据不存在，也需要创建一个缓存，用来防止穿库。这里需要区分一下数据是否存在。
如果数据不存在，缓存时间可以设置相对较短，防止因为主从同步等问题，导致问题被放大。
这个流程中存在薄弱的问题是，当用户量太大时，我们会缓存大量数据空数据，并且一旦来一波冷用户，会造成雪崩效应。
对于这种情况，我们产生第二个版本流程:redis过滤冷用户缓存流程

我们将数据库里面中命中的用户放在redis的set类型中，设置不过期。
这样相当把redis当作数据库的索引，只要查询redis，就可以知道是否数据存在。
redis中不存在就可以直接返回结果。
如果存在就按照上面提到一般业务缓存流程处理。
聪明的你肯定会想到更多的问题：

redis本身可以做缓存，为什么不直接返回数据呢？
如果数据量比较大，单个set，会有性能问题？
业务不重要，将全量数据放在redis中，占用服务器大量内存。投入产出不成比例？

问题1需要区分业务场景，结果数据少，我们是可以直接使用redis作为缓存，直接返回数据。
结果比较大就不太适合用redis存放了。比如ugc内容，一个评论里面可能存在上万字，业务字段多。
redis使用有很多技巧。bigkey 危害比较大，无论是扩容或缩容带来的内存申请释放，
还是查询命令使用不当导致大量数据返回，都会影响redis的稳定。这里就不细谈原因及危害了。
解决bigkey 方法很简单。我们可以使用hash函数来分桶，将数据分散到多个key中。
减少单个key的大小，同时不影响查询效率。
问题3是redis存储占用内存太大。因此我们需要减少内存使用。
重新思考一下引入redis的目的。
redis像一个集合，整个业务就是验证请求的参数是否在集合中。

这个结构就像洗澡的时候用的双向阀门：左边热水，右边冷水。
大部分的编程语言都内置了filter。
拿python举例，filter函数用于过滤序列，
过滤掉不符合条件的元素，返回由符合条件元素组成的列表。
我们看个例子：
$ python2
Python 2.7.10 (default, Oct 6 2017, 22:29:07)
[GCC 4.2.1 Compatible Apple LLVM 9.0.0 (clang-900.0.31)] on darwin
Type “help”, “copyright”, “credits” or “license” for more information.

s = {2, 4}
filter(lambda x:x in s, [0, 1, 2])
[2]
复制代码
集合s中存在 2，4两个数字，我们需要查询 0，1，2 那些在集合s中。
lambda x:x in s构造一个匿名函数，判断入参x是否在集合s中。
过滤器filter依次对列表中的数字执行匿名函数。最终返回列表[2]。
redis中实现set用了两种结构：intset和hash table。
非数字或者大量数字时都会退化成hash table。
那么是否好的算法可以节省hash table的大小呢？
其实早在1970年由Burton Howard Bloom提出的布隆过滤器（英语：Bloom Filter）。
它实际上是一个很长的二进制向量和一系列随机映射函数。
布隆过滤器可以用于检索一个元素是否在一个集合中。
它的优点是空间效率和查询时间都远远超过一般的算法，
缺点是有一定的误识别率和删除困难。
BloomFilter原理
我们常见的将业务字段拼接之后md5，放在一个集合中。
md5生成一个固定长度的128bit的串。
如果我们用bitmap来表示，则需要
2**128 = 340282366920938463463374607431768211456 bit
复制代码判断一个值在不在，就变成在这个bitmap中判断所在位是否为1。
但是我们全世界的机器存储空间也无法存储下载。
因此我们只能分配有限的空间来存储。
比如:
import crc32

def BloomFilter(sample, size, hash_size=1):
# 构造一个hash函数，将输入数据散列到size一个位置上
hash = lambda x:crc32(str(x).encode())%size
collision, s = 0, set()
for i in range(sample):
k = set()
for j in range(hash_size):
k.add(hash(i+j*size/hash_size))
# 只有所有散列结果k都在s中，才认为i重复
if not k - s:
collision += 1
continue
# 将散列结果k更新到集合s中
s |= k
return collision
复制代码当只有一个hash函数时：很容易发生冲突。

可以看到上面1和2的hash结果都是7，发生冲突。
如果增加hash函数，会发生什么情况？

我们使用更多的hash函数和更大的数据集合来测试。得到下面这张表

由此可以看到当增加hash方法能够有效的降低碰撞机率。
比较好的数据如下：

但是增加了hash方法之后，会降低空间的使用效率。当集合占用总体空间达到25%的时候，
增加hash 的效果已经不明显

上面的使用多个hash方法来降低碰撞就是BloomFilter的核心思想。
适合的场景

数据库防止穿库
Google Bigtable，Apache HBase和Apache Cassandra以及Postgresql 使用BloomFilter来减少不存在的行或列的磁盘查找。避免代价高昂的磁盘查找会大大提高数据库查询操作的性能。
如同一开始的业务场景。如果数据量较大，不方便放在缓存中。需要对请求做拦截防止穿库。

缓存宕机
缓存宕机的场景，使用布隆过滤器会造成一定程度的误判。原因是除了Bloom Filter 本身有误判率，宕机之前的缓存不一定能覆盖到所有DB中的数据，当宕机后用户请求了一个以前从未请求的数据，这个时候就会产生误判。当然，缓存宕机时使用布隆过滤器作为应急的方式，这种情况应该也是可以忍受的。

WEB拦截器
相同请求拦截防止被攻击。用户第一次请求，将请求参数放入BloomFilter中，当第二次请求时，先判断请求参数是否被BloomFilter命中。可以提高缓存命中率

恶意地址检测
chrome 浏览器检查是否是恶意地址。
首先针对本地BloomFilter检查任何URL，并且仅当BloomFilter返回肯定结果时才对所执行的URL进行全面检查（并且用户警告，如果它也返回肯定结果）。

比特币加速
bitcoin 使用BloomFilter来加速钱包同步。

算法优点：

数据空间小，不用存储数据本身。

算法本身缺点：

元素可以添加到集合中，但不能被删除。
匹配结果只能是“绝对不在集合中”，并不能保证匹配成功的值已经在集合中。
当集合快满时，即接近预估最大容量时，误报的概率会变大。
数据占用空间放大。一般来说，对于1％的误报概率，每个元素少于10比特，与集合中的元素的大小或数量无关。
- 查询过程变慢，hash函数增多，导致每次匹配过程，需要查找多个位（hash个数）来确认是否存在。

对于BloomFilter的优点来说，缺点都可以忽略。毕竟只需要kN的存储空间就能存储N个元素。空间效率十分优秀。
如何使用BloomFilter
BloomFilter 需要一个大的bitmap来存储。鉴于目前公司现状，最好的存储容器是redis。
从github topics: bloom-filter中经过简单的调研。
redis集成BloomFilter方案：

原生python 调用setbit 构造 BloomFilter
lua脚本
Rebloom - Bloom Filter Module for Redis (注：redis Module在redis4.0引入)
使用hiredis 调用redis pyreBloom

原生python 方法太慢，lua脚本和module 部署比较麻烦。于是我们推荐使用pyreBloom，底层使用。
pyreBloom:master λ ls
Makefile bloom.h bloom.pxd murmur.c pyreBloom.pyx
bloom.c bloom.o main.c pyreBloom.c
复制代码从文件命名上可以看到bloom 使用c编写。pyreBloom 使用cython编写。
bloom.h 里面实现BloomFilter的核心逻辑，完成与redis server的交互；hash函数；添加，检查和删除方法的实现。
int init_pyrebloom(pyrebloomctxt * ctxt, char * key, uint32_t capacity, double error, char* host, uint32_t port, char* password, uint32_t db);
int free_pyrebloom(pyrebloomctxt * ctxt);

int add(pyrebloomctxt * ctxt, const char * data, uint32_t len);
int add_complete(pyrebloomctxt * ctxt, uint32_t count);

int check(pyrebloomctxt * ctxt, const char * data, uint32_t len);
int check_next(pyrebloomctxt * ctxt);

int delete(pyrebloomctxt * ctxt);
复制代码pyreBloom.pyx
import math
import random

cimport bloom

class pyreBloomException(Exception):
‘’‘Some sort of exception has happened internally’’’
pass

cdef class pyreBloom(object):
cdef bloom.pyrebloomctxt context
cdef bytes key

property bits:
	def __get__(self):
		return self.context.bits

property hashes:
	def __get__(self):
		return self.context.hashes

def __cinit__(self, key, capacity, error, host='127.0.0.1', port=6379,
	password='', db=0):
	self.key = key
	if bloom.init_pyrebloom(&self.context, self.key, capacity,
		error, host, port, password, db):
		raise pyreBloomException(self.context.ctxt.errstr)

def __dealloc__(self):
	bloom.free_pyrebloom(&self.context)

def delete(self):
	bloom.delete(&self.context)

def put(self, value):
	if getattr(value, '__iter__', False):
		r = [bloom.add(&self.context, v, len(v)) for v in value]
		r = bloom.add_complete(&self.context, len(value))
	else:
		bloom.add(&self.context, value, len(value))
		r = bloom.add_complete(&self.context, 1)
	if r < 0:
		raise pyreBloomException(self.context.ctxt.errstr)
	return r

def add(self, value):
	return self.put(value)

def extend(self, values):
	return self.put(values)

def contains(self, value):
	# If the object is 'iterable'...
	if getattr(value, '__iter__', False):
		r = [bloom.check(&self.context, v, len(v)) for v in value]
		r = [bloom.check_next(&self.context) for i in range(len(value))]
		if (min(r) < 0):
			raise pyreBloomException(self.context.ctxt.errstr)
		return [v for v, included in zip(value, r) if included]
	else:
		bloom.check(&self.context, value, len(value))
		r = bloom.check_next(&self.context)
		if (r < 0):
			raise pyreBloomException(self.context.ctxt.errstr)
		return bool(r)

def __contains__(self, value):
	return self.contains(value)

def keys(self):
	'''Return a list of the keys used in this bloom filter'''
	return [self.context.keys[i] for i in range(self.context.num_keys)]

复制代码原生pyreBloom方法:

cdef class pyreBloom(object):

cdef bloom.pyrebloomctxt context
cdef bytes

property bits:

property hashes:
// 使用的hash方法数

def delete(self):
// 删除，会在redis中删除

def put(self, value):
// 添加 底层方法, 不建议直接调用

def add(self, value):
// 添加单个元素，调用put方法

def extend(self, values):
// 添加一组元素，调用put方法

def contains(self, value):
// 检查是否存在，当`value`可以迭代时，返回`[value]`, 否则返回`bool`

def keys(self):
// 在redis中存储的key列表

复制代码由于pyreBloom使用hiredis库，本身没有重连等逻辑，于是错了简单的封装。

# coding=utf-8
'''
bloom filter 基础模块

可用方法:
extend, keys, contains, add, put, hashes, bits, delete

使用方法:
>>> class TestModel(BaseModel):
...    PREFIX = "bf:test"
>>> t = TestModel()
>>> t.add('hello')
1
>>> t.extend(['hi', 'world'])
2
>>> t.contains('hi')
True
>>> t.delete()
'''
import logging
from six import PY3 as IS_PY3
from pyreBloom import pyreBloom, pyreBloomException

from BloomFilter.utils import force_utf8


class BaseModel(object):
    '''
    bloom filter 基础模块
    参数：
        SLOT: 可用方法类型
        PREFIX: redis前缀
        BF_SIZE: 存储最大值
        BF_ERROR: 允许的出错率
        RETRIES: 连接重试次数
        host: redis 服务器IP
        port: redis 服务器端口
        db: redis 服务器DB
        _bf_conn: 内部保存`pyreBloom`实例
    '''
    SLOT = {'add', 'contains', 'extend', 'keys', 'put', 'delete',
            'bits', 'hashes'}
    PREFIX = ""
    BF_SIZE = 100000
    BF_ERROR = 0.01
    RETRIES = 2

    def __init__(self, redis=None):
        '''
        初始化redis配置
        :param redis: redis 配置
        '''
        # 这里初始化防止类静态变量多个继承类复用，导致数据被污染
        self._bf_conn = None

        self._conf = {
            'host': '127.0.0.1', 'password': '',
            'port': 6379, 'db': 0
        }

        if redis:
            for k, v in redis.items():
                if k in self._conf:
                    self._conf[k] = redis[k]
        self._conf = force_utf8(self._conf)

    @property
    def bf_conn(self):
        '''
        初始化pyreBloom
        '''
        if not self._bf_conn:
            prefix = force_utf8(self.PREFIX)
            logging.debug(
                'pyreBloom connect: redis://%s:%s/%s, (%s %s %s)',
                self._conf['host'], self._conf['port'], self._conf['db'],
                prefix, self.BF_SIZE, self.BF_ERROR,
            )
            self._bf_conn = pyreBloom(
                prefix, self.BF_SIZE, self.BF_ERROR, **self._conf)
        return self._bf_conn

    def __getattr__(self, method):
        '''调用pyrebloom方法
        没有枚举的方法将从`pyreBloom`中获取
        :param method:
        :return: pyreBloom.{method}
        '''
        # 只提供内部方法
        if method not in self.SLOT:
            raise NotImplementedError()

        # 捕获`pyreBloom`的异常, 打印必要的日志
        def catch_error(*a, **kwargs):
            '''多次重试服务'''
            args = force_utf8(a)
            kwargs = force_utf8(kwargs)
            for _ in range(self.RETRIES):
                try:
                    func = getattr(self.bf_conn, method)
                    res = func(*args, **kwargs)
                    # python3 返回值和python2返回值不相同，
                    # 手工处理返回类型
                    if method == 'contains' and IS_PY3:
                        if isinstance(res, list):
                            return [i.decode('utf8') for i in res]
                    return res
                except pyreBloomException as error:
                    logging.warn(
                        'pyreBloom Error:  %s %s', method, str(error))
                    self.reconnect()
                    if _ == self.RETRIES:
                        logging.error('pyreBloom Error')
                        raise error

        return catch_error

    def __contains__(self, item):
        '''跳转__contains__方法
        :param item: 查询元素列表/单个元素
        :type item: list/basestring
        :return: [bool...]/bool
        '''
        return self.contains(item)

    def reconnect(self):
        '''
        重新连接bloom
        `pyreBloom` 连接使用c driver，没有提供timeout参数，使用了内置的timeout
        同时为了保证服务的可靠性，增加了多次重试机制。
        struct timeval timeout = { 1, 5000 };
        ctxt->ctxt = redisConnectWithTimeout(host, port, timeout);
        del self._bf_conn 会调用`pyreBloom`内置的C的del方法，会关闭redis连接
        '''
        if self._bf_conn:
            logging.debug('pyreBloom reconnect')
            del self._bf_conn
            self._bf_conn = None
            _ = self.bf_conn

复制代码进阶：计数过滤器(Counting Filter)
提供了一种在BloomFilter上实现删除操作的方法，而无需重新重新创建过滤器。在计数滤波器中，阵列位置（桶）从单个位扩展为n位计数器。实际上，常规布隆过滤器可以被视为计数过滤器，其桶大小为一位。
插入操作被扩展为递增桶的值，并且查找操作检查每个所需的桶是否为非零。然后，删除操作包括递减每个桶的值。
存储桶的算术溢出是一个问题，并且存储桶应该足够大以使这种情况很少见。如果确实发生，则增量和减量操作必须将存储区设置为最大可能值，以便保留BloomFilter的属性。
计数器的大小通常为3或4位。因此，计算布隆过滤器的空间比静态布隆过滤器多3到4倍。相比之下， Pagh，Pagh和Rao（2005）以及Fan等人的数据结构。（2014）也允许删除但使用比静态BloomFilter更少的空间。
计数过滤器的另一个问题是可扩展性有限。由于无法扩展计数布隆过滤器表，因此必须事先知道要同时存储在过滤器中的最大键数。一旦超过表的设计容量，随着插入更多密钥，误报率将迅速增长。
Bonomi等人。（2006）引入了一种基于d-left散列的数据结构，它在功能上是等效的，但使用的空间大约是计算BloomFilter的一半。此数据结构中不会出现可伸缩性问题。一旦超出设计容量，就可以将密钥重新插入到双倍大小的新哈希表中。
Putze，Sanders和Singler（2007）的节省空间的变体也可用于通过支持插入和删除来实现计数过滤器。
Rottenstreich，Kanizo和Keslassy（2012）引入了一种基于变量增量的新通用方法，该方法显着提高了计算布隆过滤器及其变体的误报概率，同时仍支持删除。与计数布隆过滤器不同，在每个元素插入时，散列计数器以散列变量增量而不是单位增量递增。要查询元素，需要考虑计数器的确切值，而不仅仅是它们的正面性。如果由计数器值表示的总和不能由查询元素的相应变量增量组成，则可以将否定答案返回给查询。

原文链接

https://juejin.im/post/5c9442ae5188252d77392241

服务推荐

蜻蜓代理
代理ip
微信域名拦截检测
微信域名检测api

延迟任务的11种实现方式（下）！！架构文摘JGWZ 学习后端 Java 编程语言
接上文：Redisson的RDelayedQueueRedisson他是Redis的儿子（Redisson），基于Redis实现了非常多的功能，其中最常使用的就是Redis分布式锁的实现，但是除了实现Redis分布式锁之外，它还实现了延迟队列的功能。先来个demo引入pom org.redisson redisson 3.13.1封装了一个RedissonDelayQueue类@
HarmonyOS NEXT开发实战（5.0版）List和Scroller从简单到复杂列表布局场景代码老出BUG OpenHarmony 鸿蒙开发 HarmonyOS harmonyos 华为鸿蒙系统鸿蒙性能优化 android 前端
鸿蒙NEXT开发实战往期必看文章：HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）场景描述在多列表页面开发中，数据展示往往有联动关系，场景一：单列表布局多长列
鸿蒙5.0实战案例：关于图像撕裂、掉帧等异常现象的原理以及优化方案敢嗣先锋鸿蒙开发 HarmonyOS 移动开发 harmonyos 鸿蒙开发 openharmony 移动开发 ArkUI 性能优化
往期推文全新看点（文中附带全新鸿蒙5.0全栈学习笔录）✏️鸿蒙（HarmonyOS）北向开发知识点记录~✏️鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~✏️鸿蒙应用开发与鸿蒙系统开发哪个更有前景？✏️嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~✏️对于大前端开发来说，转鸿蒙开发究竟是福还是祸？✏️鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？✏️记录一场鸿蒙开发岗位面
[从零开始的 Vue3 系列]：第四章——Vue3 中常用组件通信全解析花信少年plus 从零开始的vue3 系列 vue.js javascript 前端
前言本系列将从零开始，系统性地介绍Vue3的常用API，逐步深入每个核心概念与功能模块。通过详尽的讲解与实战演示，帮助大家掌握Vue3的基础与进阶知识，最终具备独立搭建完整Vue3项目的能力。vue3中的组件通信Vue3提供了多种方式来进行组件之间的通信。根据场景的不同，开发者可以选择最合适的方式进行数据的传递与事件的处理。1.通过Props传递数据（父->子）父组件：importChildCom
《Spring实战》读书笔记-第3章高级装配 2401_89790580 spring oracle 数据库
Spring表达式语言在上一章中，我们看到了一些最为核心的bean装配技术。你可能会发现上一章学到的知识有很大的用处。但是，bean装配所涉及的领域并不仅仅局限于上一章所学习到的内容。Spring提供了多种技巧，借助它们可以实现更为高级的bean装配功能。在本章中，我们将会深入介绍一些这样的高级技术。本章中所介绍的技术也许你不会天天都用到，但这并不意味着它们的价值会因此而降低。3.1环境与prof
Scrapy分布式爬虫系统 ivwdcwso 开发运维 scrapy 分布式爬虫 python 开发
一、概述在这篇博文中,我们将介绍如何使用Docker来部署Scrapy分布式爬虫系统,包括Scrapyd、Logparser和Scrapyweb三个核心组件。这种部署方式适用于Scrapy项目和Scrapy-Redis分布式爬虫项目。需要安装的组件:Scrapyd-服务端,用于运行打包后的爬虫代码,所有爬虫机器都需要安装。Logparser-服务端,用于解析爬虫日志,配合Scrapyweb进行实时
使用Python抓取新闻媒体网站的最新头条与相关内容：深入的爬虫开发与数据分析实战 Python爬虫项目 2025年爬虫实战项目 python 爬虫数据分析数据挖掘人工智能开发语言
引言在互联网时代，新闻媒体网站是人们获取信息和了解世界的重要渠道。随着新闻的即时更新，获取最新头条并进行数据分析成为许多行业领域（如媒体、广告、舆情监测等）的重要需求。通过抓取新闻媒体网站的内容，我们不仅能获取各类新闻文章，还能为后续的数据分析、情感分析、舆情监控等提供基础数据。本篇博客将详细讲解如何使用Python编写一个爬虫，抓取新闻媒体网站的最新头条及其相关内容。我们将使用最新的技术栈，包括
16、《SpringBoot+MyBatis集成（4） - 性能优化 - 事务与缓存机制剖析》 wolf犭良 SpringBoot spring boot mybatis 性能优化
SpringBoot+MyBatis集成-深度解析事务机制与缓存性能优化实践一、架构整合核心原理剖析1.1事务控制底层实现SpringBoot通过@EnableTransactionManagement激活声明式事务管理，其核心在于DataSourceTransactionManager与MyBatis的整合。当使用@Transactional注解时：通过AOP代理创建事务边界使用ThreadLo
redis常用迭代方法zscan,sscan,hscan,scan 飞升不如收破烂~ 数据库
redisClient.sscan和redisClient.zscan都是Redis的命令，用于扫描集合或有序集合中的元素。区别在于：sscan用于扫描集合中的元素，集合是无序的，所以sscan返回的元素也是无序的。zscan用于扫描有序集合中的元素，有序集合是按照分数(score)排序的，所以zscan返回的元素是按照分数排序的。另外，sscan和zscan都支持分批次扫描，可以通过指定游标(c
使用AI自动写代码，DeepSeek+CLine+VSCode实战教程，主打一个便宜实惠用得起！ AI程序猿人人工智能 AI编程 vscode DeepSeek AI AI大模型 Dify
0前言最近DeepSeek火了起来，各个媒体都在宣传，那DeekSeek到底是个啥？从程序员角度来看：DeepSeek一个人工智能助手，可以帮助我们解决代码知识点疑问，以及某个晦涩难懂的知识点问题，处理生活中的一些文本信息问题等。其实这些能力早在数年前ChatGPT也已经具备了，那么为什么最近DeepSeek这么火呢？一个原因就是因为它是国产的，那必须得支持。还有一个原因就是它实惠呀，便宜！目测目
欢迎来到《探索HarmonyOS(鸿蒙应用开发)入门到实战》专栏！沉默的闪客 harmonyos 华为
各位小伙伴国产纯血鸿蒙系统来了。了解鸿蒙技术的小伙伴都知道，鸿蒙技术一直在持续更新，越来越多的鸿蒙开发者都开始投入鸿蒙技术的开发。为了更容易和快速的入手鸿蒙开发，闪客专门做了一个鸿蒙应用开发入门到实战课程。热情的开发者们，是否已经准备好加入革命性的物联网和智能设备的行列，创造差异化的用户体验和未来派的智能解决方案？《探索HarmonyOS(鸿蒙应用开发)入门到实战》是专为您定制的技术探索指南，它将
QT+FFmpeg如何使用GPU加速解码？ bug菌¹ 全栈Bug调优(实战版)qt ffmpeg 开发语言 c++
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！全文目录：问题描述解决方案1.确保FFmpeg和CUDA的支持2.正确选择硬件解码器设置硬件解码器3.初始化CUDA硬件设备4.硬件解码流程解码帧并处理硬件帧5.检查FF
如何在公司项目中使用 WebSocket— 入门实战指南 vivo互联网技术 javascript 前端 websocket
本文从WebSocket基础概念出发，介绍在实际开发中从本地联调到部署上线的流程以及注意事项，让WebSocket小白以最小成本应用到项目中。一、WebSocket基础1、什么是WebSocketWebSocket是一种网络传输协议，可在单个TCP连接上进行全双工通信2、对比http两者都位于应用层，都依赖TCP协议WebSocket协议一般以ws://或wss://开头HTTP不支持全双工通信，
Windows网络编程之选择模型详解和舒貌 windows 网络选择模型
Windows网络编程之选择模型详解目录网络编程模型概述Select模型原理与实现WSAAsyncSelect模型详解WSAEventSelect模型剖析完成端口模型(IOCP)简介各模型性能对比与应用场景实战案例：高并发服务器设计常见问题与解决方案总结与展望一、网络编程模型概述1.1同步阻塞模型的局限在传统同步阻塞模型中，每个socket连接都需要独立的线程处理，当并发量上升时会产生：线程资源消
Python爬虫实战：获取笔趣阁图书信息，并做数据分析 ylfhpy 爬虫 python 爬虫数据分析
注意：以下内容仅供技术研究，请遵守目标网站的robots.txt规定，控制请求频率避免对目标服务器造成过大压力！1.环境准备与反爬策略pythonimportrequestsfrombs4importBeautifulSoupimportpandasaspdimportreimporttimeimportrandomfromfake_useragentimportUserAgent#需安装：pip
力扣每日一题【算法学习day.128】南宫生算法 #动态规划 leetcode 学习算法 java
前言###我做这类文章一个重要的目的还是记录自己的学习过程，我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！习题1.区间内查询数字的频率题面:2080.区间内查询数字的频率-力扣（LeetCode）题面:分析:缓存每个数字的下标集合，然后通过二分快速算出满足区间的下标个数附上灵神代码:classRangeFreqQuery{privatefinal
2025年项目管理软件TOP10：选对工具，效率翻倍！
——从行业大咖视角拆解核心逻辑与避坑指南项目管理工具如同团队协作的“导航系统”，选错可能导致资源浪费、进度失控，而选对则能让效率翻倍。作为从业十年的项目管理顾问，我将结合实战经验，为你拆解2025年工具选择的底层逻辑，并推荐10款国内外优秀软件，助你避开90%的常见误区。一、工具选型的核心逻辑：4大维度决定成败选择工具不是“功能越多越好”，而是“适配度越高越好”。以下是核心决策框架（附对比表格）：
.NET 6应用程序适配国产银河麒麟V10系统随记虚幻私塾 python .net 计算机
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统最近想在麒麟系统上运行.NET6程序，经过一番折腾最终完成了，简单记录一下。目标系统:CPU:aarch64架构（ARM6
2025高效项目管理指南：10款顶级软件工具系统解析与实战技巧
作为拥有多年项目管理实战经验的从业者，我深知一款优秀的工具对项目成败的影响。2025年，随着远程协作和敏捷开发的普及，项目管理软件的功能和适用场景更加细分。本文将从工具核心价值、适用场景、使用技巧三个维度，盘点10款国内外优秀工具，并附上对比表格与实战建议，助你快速找到最适合团队的解决方案。一、为什么你需要专业的项目管理软件？根据《IT行业项目管理调查报告》，75%的项目延期源于任务分配不清和进度
2025年项目管理软件TOP10：选对工具，效率翻倍！
——从行业大咖视角拆解核心逻辑与避坑指南项目管理工具如同团队协作的“导航系统”，选错可能导致资源浪费、进度失控，而选对则能让效率翻倍。作为从业十年的项目管理顾问，我将结合实战经验，为你拆解2025年工具选择的底层逻辑，并推荐10款国内外优秀软件，助你避开90%的常见误区。一、工具选型的核心逻辑：4大维度决定成败选择工具不是“功能越多越好”，而是“适配度越高越好”。以下是核心决策框架（附对比表格）：
2024年Python最新联邦学习实战-2-用FATE从零实现横向逻辑回归，面试阿里巴巴客服 2401_84138785 程序员 python 逻辑回归面试
学好Python不论是就业还是做副业赚钱都不错，但要学会Python还是要有一个学习规划。最后大家分享一份全套的Python学习资料，给那些想学习Python的小伙伴们一点帮助！一、Python所有方向的学习路线Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、学习软件工欲善其
基于自动化发布流程，运用多个工具实现高效运维实战罗伯特之技术屋运维自动化
【摘要】生产部署曾经是一件令运维极为头痛的事，充满着大量沟通和手动操作，自动化发布完全解决了过去发布的痛点。而在经济大环境的影响下，很多企业都需要降本增效，Serverless正在被越来越多的引入到生产环境上来。目前在对于云上的发布的流程基本上是，Terraform部署基础架构->Jenkins类的CICD工具发布应用->无服务化部署定时和事件触发的作业。本文将从如何建设自动化发布流程的原理入手，
Jenkins 拉取 Git 分支代码问题排查与解决指南码农阿豪@新空间包罗万象疑难杂症解决方案 git 运维 jenkins
个人名片作者简介：java领域优质创作者个人主页：码农阿豪工作室：新空间代码工作室（提供各种软件服务）个人邮箱：[2435024119@qq.com]个人微信：15279484656个人导航网站：www.forff.top座右铭：总有人要赢。为什么不能是我呢？专栏导航：码农阿豪系列专栏导航面试专栏：收集了java相关高频面试题，面试实战总结️Spring5系列专栏：整理了Spring5重要知识点与
如何利用Python爬虫获取淘宝分类详情：实战案例指南数据小爬虫@ python 爬虫开发语言
在电商领域，淘宝作为中国最大的电商平台之一，其分类详情数据对于市场分析、竞争策略制定以及电商运营优化具有极高的价值。通过Python爬虫技术，我们可以高效地获取这些数据，为电商从业者提供强大的数据支持。本文将详细介绍如何利用Python编写爬虫程序，快速获取淘宝分类详情数据。一、准备工作（一）环境搭建确保你的开发环境中已经安装了以下必要的库：requests：用于发送HTTP请求。Beautifu
MySQL深入原理 yourkin666 数据库 mysql adb 数据库
MySQL深入原理索引、事务、日志原理、InnoDB引擎、缓存、锁有4个数据库是属于MySQL自带的系统数据库：mysqlMySQL系统自带的核心数据库，它存储了MySQL的用户账户和权限信息，一些存储过程、事件的定义信息，一些运行过程中产生的日志信息，一些帮助信息以及时区信息等information_schemaMySQL系统自带的数据库，这个数据库保存着MySQL服务器维护的所有其他数据库的信
HTTP. yourkin666 计网八股 http 网络协议网络
HTTP主要讲一下状态码和缓存机制1xx类状态码属于提示信息，是协议处理中的一种中间状态，如http升级为websocket，会提示1xx2xx类状态码表示服务器成功处理了客户端的请求「200OK」是最常见的成功状态码「204NoContent」也是常见的成功状态码，但没返回任何数据「206PartialContent」服务器成功处理了部分请求，并返回了资源的一部分（HTTP分块下载或断点续传）3
Spring生态圈的概要说明志大洋 #开发 Java生态圈 spring 模块说明
《SpringCloud与Docker微服务架构实战》大多数Spring项目都是以“主版本号·次版本号·增量版本号·里程碑版本号”的形式命名版本号的。例如SpringFramework稳定版本4.3.5.RELEASE、里程碑版本5.0.0.M4等。其中，主版本号表示项目的重大重构；次版本号表示新特性的添加和变化；增量版本号一般表示Bug修复；里程碑版本号表示某版本号的里程碑。以下摘抄自《Spri
Git工作流程实战：开发用户登录功能全记录佩珀军士孤独心 git 前端后端
Git工作流程实战：开发用户登录功能全记录本实战将模拟团队开发场景，演示从功能开发到代码合并的全过程。我们将以「用户登录页面开发」为例，完整走通Git标准工作流程。场景设定项目仓库：https://github.com/team-project/auth-system任务目标：在main分支基础上开发登录页面开发周期：1天完整操作流程步骤1：克隆仓库gitclonehttps://github.c
Redis在实际应用中的最佳实践：缓存加速、分布式锁与消息队列一碗黄焖鸡三碗米饭 Redis技术全景解析 redis java 后端架构微服务
Redis在实际应用中的最佳实践：缓存加速、分布式锁与消息队列Redis作为一个高性能的内存数据库，凭借其高吞吐量、低延迟的特性，已成为开发者在构建现代应用时的首选技术之一。无论是在缓存加速、分布式锁，还是消息队列等多个应用场景中，Redis都展现出了卓越的性能。本文将围绕这三个核心场景，深入探讨Redis的最佳实践，帮助开发者更好地理解和应用Redis，在生产环境中提高系统的响应速度、稳定性与可
Redis基础笔记 JustGopher redis 笔记 java
一、基础知识连接方式CLI(CommandLineInterface)API(ApplicationProgrammingInterface)GUI(GraphicalUserInterface)启动redis-server连接到Redis（RedisCLIClient）redisredis-clitelnet127.0.0.16379退出quit/exit查看过期时间TTLkey设置过期时间ex
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

Redis 布隆过滤器实战「缓存击穿、雪崩效应」

原文链接

服务推荐

你可能感兴趣的:(Redis 布隆过滤器实战「缓存击穿、雪崩效应」)