binbinxyz

Bloom过滤器

一、概述
二、原理
三、优缺点
- 1. 优点
- 2.缺点
四、Bloom过滤器在比特币中的应用
五、项目应用步骤
- 1. pom.xml引入依赖
- 2. 样例代码
六、Java版简易实现

一、概述

Bloom过滤器是一个允许用户描述特定的关键词组合而不必精确表述的基于概率的过滤方法。它能让用户在有效搜索关键词的同时保护他们的隐私。
1970年，它由布隆提出的。实际上它是由一个很长的二进制向量和一系列随意映射函数组成。它是一种基于概率的数据结构，主要用来判断某个元素是否在集合内，它具有运行速度快（时间效率），占用内存小的优点（空间效率），但是有一定的误识别率和删除困难的问题。它能够告诉你某个元素一定不在集合内或可能在集合内。
在比特币简单支付验证节点（SPV节点）里，这一方法被用来向对等节点发送交易信息查询请求，同时交易地址不会被暴露。
在设计网络爬虫时，我们用它来判断一个网址是否已经被访问过。
反垃圾邮件时，用它来判断一个邮件地址是否在数十亿个垃圾邮件黑名单列表中。
它还被用于解决缓存穿透问题……

比特币节点小故事

打个比方来说，每个全节点就像是一个在陌生城市里的游客，他带着一张包含每条街道、每个地址的详细地图。
相比之下，SPV节点就像是这名陌生城市里的游客只知道一条主干道的名字，通过随机询问该城市的陌生人来获取分段道路指示。
虽然两种游客都可以通过实地考察来验证一条街是否存在，但没有地图的游客不知道每个小巷中有哪些街道，也不知道附近还有什么其他街道。没有地图的游客在“教堂街23号”的前面，并不知道这个城市里是否还有其他若干条“教堂街23号”，也不知道面前的这个是否是要找的那个。
对他来说，最好的方式就是向足够多的人问路，并且希望其中一部分人不是要试图抢劫他。

二、原理

Bloom过滤器的实现是由一个可变长度（N）的二进制数组（N位二进制数构成一个位域）和数量可变（M）的一组哈希函数组成。这些哈希函数的输出值始终在1和N之间，该数值与二进制数组相对应。并且该函数为确定性函数，也就是说任何一个使用相同Bloom过滤器的节点通过该函数都能对特定输入得到同一个的结果。Bloom过滤器的准确性和私密性能通过改变长度（N）和哈希函数的数量（M）来调节。
下面，我用一个小型的十六位数组和三个哈希函数来演示Bloom过滤器的应用原理。

Bloom过滤器数组里的每一个数的初始值为零。关键词被加到Bloom过滤器中之前，会依次通过每一个哈希函数运算一次。该输入经第一个哈希函数运算后得到了一个在1和N之间的数，它在该数组（编号依次为1至N）中所对应的位被置为1，从而把哈希函数的输出记录下来。接着再进行下一个哈希函数的运算，把另外一位置为1；以此类推。当全部M个哈希函数都运算过之后，一共有M个位的值从0变成了1，这个关键词也被“记录”在了Bloom过滤器里。

增加第二个关键词就是简单地重复之前的步骤。关键词依次通过各哈希函数运算之后，相应的位变为1，Bloom过滤器则记录下该关键词。需要注意的是，当Bloom过滤器里的关键词增加时，它对应的某个哈希函数的输出值的位可能已经是1。这种情况下，该位不会再次改变。也就是说，随着更多的关键词指向了重复的位，Bloom过滤器随着位1的增加而饱和，准确性也因此降低了。该过滤器之所以是基于概率的数据结构，就是因为关键词的增加会导致准确性的降低。准确性取决于关键字的数量以及数组大小（N）和哈希函数的多少（M）。更大的数组和更多的哈希函数会记录更多的关键词以提高准确性。而小的数组及有限的哈希函数只能记录有限的关键词从而降低准确性。

为测试某一关键词是否被记录在Bloom过滤器中，我们将该关键词逐一代入各哈希函数中运算，并将所得的结果与原数组进行对比。如果所有的结果对应的位都变为了1，则表示这个关键词有可能已被该过滤器记录。之所以这一结论并不确定，是因为这些字节1也有可能是其他关键词运算的重叠结果。简单来说，Bloom过滤器正匹配代表着“可能是”。

上图是一个验证关键词“X”是否在前述Bloom过滤器中的图例。相应的比特位都被置为1，所以这个关键词很有可能是匹配的。
另一方面，如果我们代入关键词计算后的结果某位为0，说明该关键词并没有被记录在过滤器里。负匹配的结果不是可能，而是一定。也就是说，负匹配代表着“一定不是”。

上图是一个验证关键词“Y”是否存在于简易Bloom过滤器中的图例。图中某个结果字段为0，该字段一定没有被匹配。
比特币改进协议BIP0037里已经对Bloom过滤器的实现有所描述。具体请参见GitHub。

三、优缺点

1. 优点

常用的数据结构，如hashmap，set，bit array都能用来快速测试一个元素是否存在于一个集合中，相对于这些数据结构，Bloom过滤器有什么优势呢？
相比于哈希表、链表等数据结构，其空间和时间的优势明显。而且Bloom过滤器的插入、查询时间都是常数O(k)，也就是说每次想要插入或查询一个元素是否在集合中时，只需要使用k个哈希函数对元素求值，并将对应的比特位标记或检查对应的比特位即可。
另外, 哈希函数相互之间没有关系，方便由硬件并行实现。Bloom过滤器不需要存储元素本身，在某些对保密要求非常严格的场合有优势。

对于hashmap，其本质上是一个指针数组，一个指针的开销是sizeof(void *)，在64bit的系统上是64个bit，如果采用开链法处理冲突的话，又需要额外的指针开销，而对于Bloom过滤器来讲，返回可能存在的情况中，如果允许有1%的错误率的话，每个元素大约需要10bit的存储空间，整个存储空间的开销大约是hashmap的15%左右（数据来自维基百科）
对于set，如果采用hashmap方式实现，情况同上；如果采用平衡树方式实现，一个节点需要一个指针存储数据的位置，两个指针指向其子节点，因此开销相对于hashmap来讲是更多的
对于bit array，对于某个元素是否存在，先对元素做hash，取模定位到具体的bit，如果该bit为1，则返回元素存在，如果该bit为0，则返回此元素不存在。可以看出，在返回元素存在的时候，也是会有误判的，如果要获得和Bloom过滤器相同的误判率，则需要比Bloom过滤器更大的存储空间

Bloom过滤器可以表示全集，其它任何数据结构都不能；

全量存储但是不存储数据本身，适合有保密要求的场景
空间复杂度为O(m)，不会随着元素增加而增加，占用空间少
插入和查询时间复杂度都是 O(k), 不会随着元素增加而增加，远超一般算法。

2.缺点

Bloom过滤器的缺点和优点一样明显。误判率是其中之一。随着存入的元素数量增加，误判率随之增加。但是如果元素数量太少，则使用散列表足矣。

另外，一般情况下不能从Bloom过滤器中删除元素。我们很容易想到把位数组变成整数数组，每插入一个元素相应的计数器加1, 这样删除元素时将计数器减掉就可以了。然而要保证安全地删除元素并非如此简单。首先我们必须保证删除的元素的确在Bloom过滤器里面，而Bloom过滤器只能给出可能在集合中或者一定不在集合中的回复，无法给出是否一定在集合中的回复。这一点单凭这个过滤器是无法保证的。另外计数器回绕也会造成问题。

相对于hashmap和set，Bloom过滤器在返回元素可能存在的情况中，有一定的误判率，这时候，调用者在误判的时候，会做一些不必要的工作，而对于hashmap和set，不会存在误判情况
对于bit array，Bloom过滤器在插入和查找元素是否存在时，需要做多次hash，而bit array只需要做一次hash，实际上，bit array可以看做是Bloom过滤器的一种特殊情况。

在降低误算率方面，有不少工作，使得出现了很多布隆过滤器的变种。

存在误算率，数据越多，误算率越高
一般情况下无法从过滤器中删除数据
二进制数组长度和 hash 函数个数确定过程复杂

四、Bloom过滤器在比特币中的应用

比特币中Bloom过滤器是在BIP-0037中提到。下面通过“SPV节点如何知道有多少钱”的问题来介绍Bloom过滤器在比特币中的应用。这个问题其实就是“SPV节点如何知道有多少UTXO”

在比特币网络中主要的两种节点类型：

全节点：存放所有区块数据和交易
SPV节点：只下载区块头和交易相关部分的局部视图

我们假设，SPV节点最开始只存储了私钥，没有任何其他数据。那么它要获取跟自己地址相关的UTXO，只能向比特币网络中相邻的全节点询问。询问的方式有三种：

下载完整的区块链账本，自己查找
这种方法很简单，也能隐藏用户的隐私（全节点无法知道SPV节点关联的钱包的地址）。但是在手机端是不现实的，每次用户需要下载上百G的区块链数据，才能知道自己钱包有多少钱，虽然保护了用户隐私，但是浪费了存储空间和带宽。所以这种方法不行，而这也是为什么有SPV的概念存在，中本聪也是考虑到移动支付的场景的。
直接告诉全节点自己钱包的所有地址，全节点返回所有跟钱包地址相关的UTXO
这种方法直接等于是泄露了用户隐私，其他全节点就知道SPV节点所关联的钱包地址。但是好处是所要下载的数据少了很多，也更精确了。
告诉全节点部分自己钱包的地址信息，全节点返回可能相关的UTXO
这种方法实际上就是采用Bloom过滤器的方法隐藏用户隐私，从而做到即保护用户隐私，又节省存储空间和带宽。我们知道布隆过滤器的两个特点：只能告诉你某个元素可能存在集合中以及某个元素一定不存在集合中。这里可以简单理解Bloom过滤器用来过滤不属于钱包的UTXO。

SPV节点会以Bloom过滤器的形式告诉相邻全节点自己地址信息，那么根据Bloom过滤器的特性，会有两种结果：

没有通过Bloom过滤器过滤出来的UTXO，就【一定】不属于钱包地址
通过Bloom过滤器过滤出来的UTXO，【可能】属于钱包地址
这种方法在一定程度上保护用户隐私，节省了存储空间和带宽。但是根据Bloom过滤器的特点，随着钱包交易的UTXO越多，布隆过滤器误报率会越高，也就是相邻全节点返回正确的UTXO概率越低。

五、项目应用步骤

Bloom过滤器只是一个工具，不需要自己实现。本着有车轮就直接拿来用的原则，我们可以使用谷歌帮我们实现的BloomFilter，它封装的非常好，使用起来也非常简洁方便。

1. pom.xml引入依赖


<dependency>
    <groupId>com.google.guavagroupId>
    <artifactId>guavaartifactId>
    <version>27.0.1-jreversion>
dependency>

由于存在漏洞，不推荐使用该版本，请自行升级为最新版本。
当前最新版本为33.0.0-jre，由于网络不好，暂时没有拉取。

2. 样例代码

import com.google.common.hash.BloomFilter;
import com.google.common.hash.Funnels;

/**
 * BloomFilter 测试
 *
 * @author Bin
 * @version 1.0
 * 2023/12/23
 */
public class BloomFilterTest {
    public static void main(String[] args) {
        int size = 100_0000;
        BloomFilter<Integer> filter = BloomFilter.create(Funnels.integerFunnel(), size);
//        filter = BloomFilter.create(Funnels.integerFunnel(), size, 0.01);
//        filter = BloomFilter.create(Funnels.integerFunnel(), size, 0.0001);

        System.out.println("初始化Bloom过滤器，添加[1-" + size + "]中的数据到过滤器中");
        for (int i = 1; i <= size; i++) {
            filter.put(i);
        }

        test(filter, 1, size);
        test(filter, size + 1, size * 2);
    }

    private static void test(BloomFilter<Integer> filter, int start, int end) {
        int exist = 0;
        int exclude = 0;
        for (int i = start; i <= end; i++) {
            if(filter.mightContain(i)) {
                exist ++;
            } else {
                exclude ++;
            }
        }

        String str = "逐个判断[%d - %d]中的数据，被判为存在和不存在的个数分别是：%d / %d\r\n";
        System.out.printf(str, start, end, exist, exclude);
    }
}

六、Java版简易实现

虽说车轮不用重复造，但是想了解底层除了看源码，还就是自己造轮子。

Talk Is Cheap, Show Me The Code.


import java.util.BitSet;

/**
 * 简易版本Bloom Filter
 *
 * @author Bin
 * @version 1.0
 * 2023/12/23
 */
public class BloomFilter {
    /** 二进制数组 */
    private final BitSet bits;
    /** 二进制向量（数组）的位数 */
    private final int size;
    /** 用于生成信息指纹的随机数 */
    private final int[] seeds;

    public BloomFilter() {
        this(Integer.MAX_VALUE, new int[]{2, 3, 5, 7, 11}); // 默认大小为全部整数，种子为质数
    }

    public BloomFilter(int size, int[] seeds) {
        if (size < 1) {
            throw new IllegalArgumentException("Size must be greater than zero");
        }
        this.size = size;
        this.seeds = seeds;
        this.bits = new BitSet(size);
    }

    public void add(int item) {
        add(Integer.toString(item));
    }

    public void add(String item) {
        for (int seed : seeds) {
            int hash = hashFunction(seed, item);
            int index = hash % size;
            bits.set(index, true);
        }
    }

    public boolean contains(int item) {
        return contains(Integer.toString(item));
    }

    public boolean contains(String item) {
        if (item == null) {
            return false;
        }
        boolean result = true;
        for (int seed : seeds) {
            int hash = hashFunction(seed, item);
            int index = hash % size;
            result &= bits.get(index);
        }
        return result;
    }

    private int hashFunction(int seed, String item) {
        int hash = 0;
        for (char c : item.toCharArray()) {
            hash += seed * c;
        }
        return Math.abs(hash);
    }

    public static void main(String[] args) {
        BloomFilter filter = new BloomFilter();
        // 存入数据
        int size = 1000_0000;
        for (int i = 0; i < size; i++) {
            filter.add(i);
        }

        // 查看已有数据是否存在情况
        int count = 0;
        for (int i = 0; i < size; i++) {
            if(filter.contains(i)) {
                count ++;
            }
        }
        System.out.println("count=" + count);

        // 查看其它数据是否存在情况
        count = 0;
        for (int i = size; i < size * 2; i++) {
            if(filter.contains(i)) {
                count ++;
            }
        }
        System.out.println("count=" + count);
    }
}

Spring Security静态资源过滤（11）小黑屋说YYDS spring
在一个实际项目中，并非所有的请求都需要经过SpringSecurity过滤器，有一些特殊的请求，例如静态资源等，一般来说并不需要经过SpringSecurity过滤器链，用户如果访问这些静态资源，直接返回对应的资源即可。回顾关于WebSecurity的讲解，提到它里边维护了一个ignoredRequests变量,该变量，记录的就是所有需要被忽略的请求，这些被忽略的请求将不再经过SpringSecu
Spring Security定义多个过滤器链（10）小黑屋说YYDS spring
在SpringSecurity中可以同时存在多个过滤器链，一个WebSecurityConfigurerAdapter的实例就可以配置一条过滤器链。我们来看如下一个案例：@ConfigurationpublicclassSecurityConfig{@BeanUserDetailsServiceus(){InMemoryUserDetailsManagerusers=newInMemoryUser
Pyorch中 nn.Conv1d 与 nn.Linear 的区别迪三 #NN_Layer 神经网络
即一维卷积层和全联接层的区别nn.Conv1d和nn.Linear都是PyTorch中的层，它们用于不同的目的，主要区别在于它们处理输入数据的方式和执行的操作类型。nn.Conv1d通过应用滑动过滤器来捕捉序列数据中的局部模式，适用于处理具有时间或序列结构的数据。nn.Linear通过将每个输入与每个输出相连接，捕捉全局关系，适用于将输入数据作为整体处理的任务。1.维度与输入nn.Conv1d（一
springcloud — 微服务鉴权管理Spring Security原理解析(二) RachelHwang springcloud spring java spring security oauth2 springcloud
引言：回顾之前介绍的OAuth2简单分析与介绍，微服务鉴权管理之OAuth2原理解析(一)，前面的部分，我们关注了SpringSecurity是如何完成认证工作的，但是另外一部分核心的内容：过滤器，一直没有提到，我们已经知道SpringSecurity使用了springSecurityFilterChain作为了安全过滤的入口，这一节主要分析一下这个过滤器链都包含了哪些关键的过滤器，并且各自的使命
常用类库 Guava 简介豆瑞瑞 java
简介GoogleGuava是一个由Google开发的Java开源函数库。前身是GoogleCollectionsLibrary，提供了许多简化工具，如缓存、连接器、过滤器、关联数组等仓库代码GitCode-全球开发者的开源社区,开源代码托管平台参考https://github.com/google/guavahttps://github.com/google/guava/wikiRedisStre
Stream 流根据对象属性去重 abments jdk1.8新特性 python pandas 数据分析
目录前言一、实现原理二、实现过程三、filter过滤器的原理总结前言这篇文章介绍一种通过stream流对集合中的对象根据key值去重的简便方法。一、实现原理通过Stream流中的filter方法实现对数据的去重，具体操作是构造一个Predict对象，在Predict中通过检查数据是否存在返回断言中的布尔值。二、实现过程代码如下：publicstaticPredicatedistinctPredic
自定义布隆过滤器解决缓存穿透暗金烂狗缓存
什么是缓存穿透以及常见解决方案缓存穿透是指客户端请求的数据在缓存中和数据库中都不存在，这样缓存永远不会生效，这些请求都会打到数据库，导致数据库压力提高，造成宕机。缓存穿透就是指用户访问那些在数据库和Redis中都不存在的数据，例如我们知道id采用自增策略，那么就不可能出现负数id，而如果不法分子使用负数id进行查询，那么这些请求都会穿过Redis直接向数据库发送请求，从而导致数据库压力骤增，导致数
Interceptor拦截器+JWT令牌实现登陆验证 wy08success Interceptor springboot java 登陆验证
一、背景与过滤器的作用类似，不过拦截器是spring中的组件，只能拦截进入spring的请求；过滤器则可以拦截所有从前端页面发送来的请求。*拦截器和过滤器选一就可以实现登陆验证，过滤器的实现在以下这篇博客中，有需要可以自取：Filter过滤器+JWT令牌实现登陆验证-CSDN博客二、分析定义拦截器，实现HanderInterceptor接口，并重写其所有方法。注册拦截器三、实现1、目录结构：2、L
登录校验，会话技术，Cookie，Session，JWT令牌，统一拦截技术，过滤器FIlter，拦截器Interceptor，全局异常处理器暖阳爱学计算机 springboot spring boot web java
目录1登录校验2会话技术2.1会话技术介绍2.2Cookie2.2Session2.4令牌技术2.5JWT令牌2.5.1介绍2.5.2生成和校验2.5.3登录下发令牌3统一拦截技术3.1过滤器Filter3.1.1过滤器的使用步骤3.1.2代码实现3.1.3细节3.2拦截器Interceptor3.2.1拦截器的使用步骤3.2.2代码实现3.2.3细节4登录功能具体实现步骤5异常处理5.1异常的解
Cookie & Session & JWT认证 & Filter & Interceptor aDreamerOutOfTheSky java spring spring boot
文章目录前言一、Cookie和Session二、JWT1.三部分2.使用3.另外一种使用3.1引入依赖3.1定义工具类三、Filter过滤器3.1实现Filter接口，并且增加@WebFilter注解3.2启动类上增加注解3.3Filter过滤实现登陆校验3.4拦截器实现登陆校验总结前言本文介绍了Cookie，Session，JWT，过滤器，拦截器的相关知识一、Cookie和Session浏览器请
Spring Boot整合Spring Security+JWT+OAuth 2.0 实现认证鉴权登录（框架介绍）星空下夜猫子 spring spring boot 数据库
简介SpringSecurity框架描述SpringSecurity是一个基于Spring框架的安全性框架，可以为Web应用程序提供身份验证（Authentication）、授权（Authorization）、攻击防御等安全功能。SpringSecurity框架提供了一整套的身份验证、授权、ACL（访问控制列表）等模块和类库，还提供了一系列的安全过滤器、安全标签等，可以方便地实现常见的安全性控制。
Spring Boot中配置图片资源通常涉及到静态资源的管理脚大江山稳 spring boot hive 后端
在SpringBoot中配置图片资源通常涉及到静态资源的管理。SpringBoot默认支持静态资源的映射，你可以通过以下步骤来配置图片资源：配置需要拦截和放行的beanHttpInterceptorConfig配置拦截器HttpSampleInterceptor过滤器ReplaceStreamFilter封装Request数据进行多次读取RequestWrapper放置图片资源：将图片资源放在sr
请远离这些人，生活才能更美好指尖的宇宙
大多数人都有这样的社交体验:与志同道合的人相处，如沐春风。你说的，她能懂，你的沉默不语，她一样能准确接收到你的信息。遇到感兴趣的话题，同个磁场能够发出共鸣，难过低落时，她能感同身受你的不易跟悲伤，及时给你送上心坎上的安慰跟心灵鸡汤。但有的人一开口就让人犹如开口心口堵石头，避不了与她们相处，自己就不得不戴上虚伪的面具，生活实在补易，过日子需要过滤器，去除负能量的粉末，也需要远离让你感觉不适的人群。1
Spring Cloud Gateway的使用介绍与随笔阳爱铭 Spring组件专栏 spring
文章目录第一章API网关相关知识介绍前言1API网关相关知识介绍1.1什么是API网关1.2API网关的组成1.2.1路由转发1.2.2过滤器1.3SpringCloud中的网关解决方案1.3.1SpringCloudNetflixZuul1.3.2SpringCloudGateway前言在微服务架构之下，服务被拆的非常零散，降低了耦合度的同时也给服务的统一管理增加了难度。在旧的服务治理体系之下，
【Python】PyPandoc：批量文件格式转换 T0uken #Python全栈开发 python 开发语言
Pandoc是一个强大的文档转换工具，它可以将各种标记语言（如Markdown、HTML、LaTeX）转换为不同的格式（如PDF、DOCX、EPUB等）。Pandoc支持多种输入和输出格式，并允许用户添加自定义样式、模板和过滤器。Pandoc的主要功能格式转换：将不同的标记语言转换为多种输出格式。最常见的格式包括Markdown、HTML、LaTeX、PDF、DOCX、EPUB等。样式和模板支持：
深入理解Redis原理：缓存雪崩/击穿/穿透/预热/降级 Hey 锡瑞 Redis 缓存
目录1、缓存雪崩1.1、什么是缓存雪崩1.2、解决缓存雪崩2、缓存击穿2.1、什么是缓存击穿2.2、解决缓存击穿3、缓存穿透3.1、什么是缓存穿透3.2、解决缓存穿透3.3、基于RedisBloom实现布隆过滤器4、缓存预热4.1、什么是缓存预热4.2、解决缓存预热5、缓存降级5.1、什么是缓存降级下一篇：redis5种数据结构及底层实现原理1、缓存雪崩1.1、什么是缓存雪崩如果缓在某一个时刻出现
【译】Swift算法俱乐部-布隆过滤器 Andy_Ron
Swift算法俱乐部本文是对SwiftAlgorithmClub翻译的一篇文章。SwiftAlgorithmClub是raywenderlich.com网站出品的用Swift实现算法和数据结构的开源项目，目前在GitHub上有18000+⭐️，我初略统计了一下，大概有一百左右个的算法和数据结构，基本上常见的都包含了，是iOSer学习算法和数据结构不错的资源。andyRon/swift-algori
iPhone 16和iPhone 16 Pro将发布时缺少这一关键功能 AI小夏 iphone ios
苹果针对GoogleGemini和三星GalaxyAI的回答不会在iPhone16系列发布时一同推出。虽然新的iPhone将从9月20日开始上架销售，但它们将在没有备受期待的AppleIntelligence的情况下发货。公司已经确认其AI将从下个月开始以beta版推出。要等到该功能的稳定版本发布，才能在您的新iPhone上使用。这一消息是一个出乎意料的举动，正如Bloomberg的MarkGur
08-web3j过滤器与事件 jection
文章是本人学习过程翻译，原文来自官方文档：https://web3j.readthedocs.io/en/latest/#官网：https://web3j.io/官方GitHub：https://github.com/web3j/web3j官方demo：https://github.com/web3j/web3j/tree/master/integration-tests文档版本v3.4.0。过滤
系统架构风格 Vincer_DB 软考
所有架构风格汇总如下：类别架构风格名常考关键字及实例简介数据流批处理传统编译器，每个阶段产生的结果作为下一阶段的输入，区别在于整体。一个接一个，以整体为单位管道-过滤器一个接一个，前一个输出是后一个输入。调用/返回主/子程序显式调用，主程序直接调用子程序面向对象对象是构件，通过对象调用封装的方法和属性层次结构分层，每层最多影响其上下两层，有调用关系独立构件进程通信进程间独立消息传递，同步异步事件驱
asp.net core 自定义过滤器注入的几种方式和实现彭小彭~ .net core .net core
在ASP.NETCore中，过滤器（Filters）是一种在MVC应用程序中运行代码的方法，可以在操作（Actions）执行之前或之后运行。过滤器可以应用于控制器（Controllers）或特定的操作方法。过滤器可以用来实现跨切面的逻辑，比如异常处理、授权、缓存、日志等。有几种类型的过滤器：授权过滤器（Authorizationfilters）资源过滤器（Resourcefilters）操作过滤器
LLAMA Factory: 简洁高效的大语言模型训练平台俞纬鉴Joshua
LLAMAFactory:简洁高效的大语言模型训练平台LLaMA-Factory易于使用的LLM微调框架（LLaMA,BLOOM,Mistral,百川，Qwen,ChatGLM）。项目地址:https://gitcode.com/gh_mirrors/ll/LLaMA-Factory项目介绍LLaMAFactory定位为一款简洁、高效的大规模语言模型训练和微调平台。其设计初衷在于让用户无需编码即可
用正则表达式过滤logcat中的多个tag的日志 fc82bb084ee7
在AndroidStudio中,在过滤器的byLogTag选项中配置.我配置了2个tagfilter方便开发,1.multi-tag-filter2.ignore-multi-tag-filter.过滤出指定tag的日志信息^(?:Watchdog|InputReader|ahking)Watchdog忽略指定tag的日志信息^(?!WifiMonitor|WifiHW)有些tag的无用log非常
Redis缓存机制(详解) 就是有缘人 redis 缓存数据库
1.Redis是什么?*redis是*一个运行在内存上的key-value存储系统。是NoSQL数据库之一2.缓存穿透,缓存击穿,缓存雪崩/**缓存穿透*/它会先查询Redis,Redis没有会查询数据库,数据库也没有这就是缓存穿透业界主流解决方案:布隆过滤器布隆过滤器的使用步骤布隆过滤器的使用步骤:1.针对现有所有数据,生成布隆过滤器2.在业务逻辑层,判断Redis之前先检查这个id是否在布隆过
MQTT (Message Queuing Telemetry Transport)遥测消息传输协议 weixin_30653097 网络
最近在AIOT和筑联开发平台，其传输方式都是MQTT！它这么重要，一定要做个笔记，以免看过的又忘记了！MQTT是在TCP之上的协议，和HTTP一样，都属于应用层协议！下面的都是边看边记录来源于：MTQQ协议中文手册术语：网络连接、应用消息、客户端、服务端、订阅、主题名、主题过滤器、会话、控制报文数据表示：二进制位、整数数值、UTF-8编码字符串、编辑约定MTT控制报文格式：前8位固定格式7-4位表
API网关-Gateway笔记天`南 gateway spring cloud eureka
一、API网关1.什么是API网关？API网关就是把各个服务对外提供的API汇聚起来，让外界看起来是一个统一的接口。同时也可以在网关中提供额外的功能。总结：网关就是所有项目的一个统一入口。2.网关的组成网关=路由转发（转发规则）+过滤器（额外功能）3.SpringCloudGateway介绍Gateway是SpringCloud的一个二级子项目，提供了微服务网关功能，包含：权限安全、监控/指标、谓
《二规教言论》-02 万万老师
是故凡自知事始，悉为美名而奔走。哎呀美名虽悦意，然愈追逐愈远离。从小到大，我们都在不断的去追求美名，即使再好，如果无福消受也会越来越远。有了钱想着权，有了权有盼望着名，最近的东哥事件也说明这一点，行为不高尚，即使有名，一下子也可以一落千丈，被世人唾弃，所以，有名与否不要苛求，还是应该静观自己的内心，让自己生起高尚的行为。彼之理由此宣说，往昔福报浅薄故，犹如汉茶过滤器，留住垢秽漏精华。说来说去还是自
UNIX IPC方法的分类常敲代码手不生 Linux 操作系统 unix 服务器 java tcp/ip 信息与通信 linux
和单进程程序一样，简单的就是最好的。在使用更复杂、更晚出现的技法前，应该通过实证所有出现更早的，更简单的技法都不管用了1、管道、重定向和过滤器管道是对"做单件事情并做好“的哲学理念的践行；约定：每个程序一开始（至少）有两个I/O数据流可用：从标准输入和标准输出（文件描述符数字分别为0和1）。许多程序都可以写作过滤器，从标准输入顺序读取数据，并且只向标准输出写数据。通常，这些数据流分别和用户键盘和显
vue 过滤器王玉伟的伟
过滤器Vue.js允许自定义过滤器，可被用于一些常见的文本格式化。过滤器可以用在两个地方：双花括号插值和v-bind表达式。过滤器应该被添加在JavaScript表达式的尾部，由“管道”符号指示支持级联操作过滤器不改变真正的data，而只是改变渲染的结果，并返回过滤后的版本全局注册时是filter，没有s的。而局部过滤器是filters，是有s的{{msg|upper}}{{msg|upper|l
【无标题】XSS安全防护：responseBody （输入流可重复读）配置 syfjava RuoYi-Vue-Plus 学习 RuoYi-Vue-Plus
接上文：配置XSS过滤器XXS安全防护：拦截器+注解实现校验-CSDN博客XSS（跨站脚本）攻击是一种网络安全威胁，允许攻击者注入恶意脚本到看似安全的网站。当用户浏览这些被注入恶意代码的网页时，恶意脚本会在用户的浏览器环境中执行，这可能导致多种安全问题，如窃取敏感数据、劫持用户会话等。这些攻击利用了应用程序对用户输入处理不当的问题。预防方法包括输入验证、输出编码等。https://blog.csd
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

Bloom过滤器

Bloom过滤器

一、概述

二、原理

三、优缺点

1. 优点

2.缺点

四、Bloom过滤器在比特币中的应用

五、项目应用步骤

1. pom.xml引入依赖

2. 样例代码

六、Java版简易实现

你可能感兴趣的:(BloomFilter,Bloom,过滤器)