多加点辣也没关系

Java-布隆过滤器的实现

文章目录

前言
一、概述
二、误差率
三、hash 函数的选择
四、手写布隆过滤器
五、guava 中的布隆过滤器

前言

如果想要判断一个元素是不是在一个集合里，一般想到的是将所有元素保存起来，然后通过比较确定。链表，树等等数据结构都是这种思路，但是随着集合中元素的增加，我们需要的存储空间越来越大，检索速度也越来越慢 (O(n)，O(logn))。不过世界上还有一种叫作散列表（又叫哈希表，Hash table）的数据结构。它可以通过一个 Hash 函数将一个元素映射成一个位阵列（Bit array）中的一个点。这样一来，我们只要看看这个点是不是 1 就可以知道集合中有没有它了。于是乎，布隆过滤器便应运而生了。

一、概述

布隆过滤器（Bloom Filter）是 1970 年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。

主要作用：用于检索一个元素是否在一个集合中。

优点：

时间复杂度低，增加及查询元素的时间复杂度都是 O(k)，k 为 Hash 函数的个数
占用存储空间小，布隆过滤器相对于其他数据结构（如Set、Map）非常节省空间

缺点：

存在误判，只能证明一个元素一定不存在或者可能存在，返回结果是概率性的，但是可以通过调整参数来降低误判比例
删除困难，一个元素映射到 bit 数组上的 x 个位置为 1，删除的时候不能简单的直接置为 0，可能会影响到其他元素的判断

原理：

布隆过滤器由长度为 m 的位向量和 k个随机映射函数组成。

假设 bit array 的长度 m=10，哈希函数的个数 k=3，默认情况下 bit array 中每个坐标的值均为 0

当一个元素被加入集合时，通过多个 hash 函数计算得到多个 hash 值，以这些 hash 值作为数组的坐标，将这些坐标位置上的值设置为 1

当查询该元素是否存在于集合中时，以同样的方法通过多个 hash 函数计算出对应的 hash 值，再查看这些 hash 值所对应的坐标是否均为 1，如果均为 1 则表示已存在，否则不存在

二、误差率

布隆过滤器的误差率（false positive rate）是指由于 hash 冲突，导致原本不再布隆过滤器中的数据，查询时显示在里面

哈希冲突是指当两个或多个不同的输入产生相同的哈希值时，就会发生哈希冲突

比如说有三个元素经过 k=3 个 hash 函数计算得到的哈希值分别是 [1,6,9]，[2,5,9]，[3,4,8]

由上图可见 element_1 和 element_2 经过 hash_3 函数时得到的值均为 9，这就是 hash 冲突，虽然可能发生哈希冲突，但是由于每个元素是通过多个 hash 值来判断是否存在，所以在插入上述三个元素时均会判断出该元素不存在，此时 bit array 如下：

如果再插入第四个元素时，经过这 k=3 个 hash 函数计算后的结果是 [5,6,8]，而 5,6,8 这三个坐标在 bit array 中值均为 1，此时就会判定 element_4 已存在，实际上并没有存在，这就是布隆过滤器会存在误判的原因

随着数据量增加， bit array 中每个位置的值为 1 的比率也会增加，误判的可能性也会随之增加

那如何减少这种因为 hash 冲突而导致的误判呢？可以用公式进行推导

假设 hash 函数以等概率条件选择并设置 bit array 中的某一位，m 是该位数组的大小，k 是 hash 函数的个数，那么位数组中某一特定的位在进行元素插入时的 hash 操作中没有被置为 1 的概率是：
$1-\frac{1}{m}$
那么在所有 k 次 hash 操作后该位没有被置为 1 的概率是：
$(1-\frac{1}{m})^{k}$
如果插入了 n 个元素，那么某一位仍然是 0 的概率是：
$(1-\frac{1}{m})^{kn}$
因而该位为 1 的概率是：
$1-(1-\frac{1}{m})^{kn}$
现在检测某一元素是否在该集合中，标明某个元素是否在集合中所需的 k 个位置都按照如上的方法设置为 1 ，但是该方法可能会使算法错误的认为某一原本不在集合中的元素却被检测为在该集合中（误差 False Positives），该概率由以下公式确定：
$(1-(1-\frac{1}{m})^{kn})^{k}\approx (1-e^{-kn/m})^{k}$

推导过程： $(1-(1-\frac{1}{m})^{kn})^{k}= (1-(1+\frac{1}{-m})^{-m\frac{-kn}{m}})^{k}$
由自然常数定义： $\lim_{n \to \infty} (1+\frac{1}{n})^{n}$
可知，当 n 趋近于无穷大时： $(1+\frac{1}{n})^{n}$
所以： $(1-(1+\frac{1}{-m})^{-m\frac{-kn}{m}})^{k}= (1-e^{-kn/m})^{k}$
即： $(1-(1-\frac{1}{m})^{kn})^{k}\approx (1-e^{-kn/m})^{k}$

由此可见，随着 m（位数组大小）的增加，误差（False Positives）的概率会下降，同时随着插入元素个数 n 的增加，误差（False Positives）的概率又会上升

对于给定的 m、n，如何选择 hash 函数个数 k？由以下公式确定：
$k=\frac{m}{n}ln2\approx 0.7\frac{m}{n}$

推导过程：

k 为何值时可以使得误判率最低？设误判率为 k 的函数：
$f(k)= (1-e^{-kn/m})^{k}$
令： $b=e^{\frac{n}{m}}$
则： $f(k)=(1-b^{-k})^{k}$
两边取对数： $lnf(k)=k\cdot ln(1-b^{-k})$
两边对 k 进行求导：
$\frac{1}{f(k)}\cdot f'(k)=ln(1-b^{-k})+k\cdot \frac{1}{1-b^{-k}}\cdot (-b^{-k})\cdot (-1)\cdot lnb =ln(1-b^{-k})+k\cdot \frac{b^{-k}\cdot lnb}{1-b^{-k}}$
等式左边，常量的导数为 0，所以： $ln(1-b^{-k})+k\cdot \frac{b^{-k}\cdot lnb}{1-b^{-k}}=0$
$(1-b^{-k})\cdot ln(1-b^{-k})=-k\cdot b^{-k}\cdot lnb$
因为： $-k\cdot lnb = lnb^{-k}$
所以： $(1-b^{-k})\cdot ln(1-b^{-k})=b^{-k}\cdot lnb^{-k}$
因为， b^-k 恒小于 1，所以： $ln(1-b^{-k}) = lnb^{-k}$
则等式化简为： $1-b^{-k}=b^{-k}$
$b^{-k}=\frac{1}{2}$
转化 b 得： $e^{-\frac{kn}{m}}=\frac{1}{2}$
$-\frac{kn}{m}=ln2$
则误判率最低时，得出 k 的值为： $k=ln2\cdot \frac{m}{n} \approx 0.7 \frac{m}{n}$

此时误差（False Positives）的概率为：
$2^{-k}\approx 0.6185^{\frac{m}{n}}$

推导过程：

由上述推导过程可知，当： $e^{-\frac{kn}{m}}=\frac{1}{2}$
时函数 f(k) （即误差率）的值最小，所以：
$f(error)=(1-e^{-kn/m})^{k}=(1-\frac{1}{2})^{k}=2^{-k}=2^{-ln2\cdot \frac{m}{n}}\approx 0.6185^{\frac{m}{n}}$

而对于给定的误差（False Positives）概率 p，如何选择最优的数组大小 m 呢？
$-\frac{nlnp}{(ln2)^{2}}$

推导过程：

由上述推导过程误差率得： $p=2^{-ln2\cdot \frac{m}{n}}$
两边取对数： $lnp=ln2\cdot (-ln2)\cdot \frac{m}{n}$
则： $m=-\frac{n\cdot lnp}{(ln2)^{2}}$

三、hash 函数的选择

前面提到 hash 冲突是导致布隆过滤产生误差的主要原因，所以选择一个合适的 hash 函数是非常重要的，哈希函数的选择会影响到布隆过滤器的性能和准确性。

以下是选择哈希函数时需要考虑的一些因素：

均匀分布：一个好的哈希函数应该能够将输入数据均匀地分布到布隆过滤器的位数组中，以最大限度地减少碰撞的可能性
可扩展性：随着数据集的增加，布隆过滤器的大小也需要相应地扩展。因此，选择的哈希函数应该易于扩展，以便在增加数据集时有效地调整布隆过滤器的大小
稳定性：在某些情况下，如果哈希函数对输入数据的变化过于敏感，可能会导致布隆过滤器中的大量位被频繁地置为 1 或 0，这会影响布隆过滤器的性能和准确性，因此，选择一个相对稳定的哈希函数可能更为合适
易于实现：在选择哈希函数时，还需要考虑其实施的难易程度和可移植性。易于实现和移植的哈希函数可以减少布隆过滤器的实现和维护成本

常见的 hash 函数：

MD5：MD5（Message Digest Algorithm 5）是一种广泛使用的密码哈希函数，它将任意长度的 “字节串” 映射为一个 128 位的大数。尽管 MD5 在许多安全应用中已经不再被视为安全的哈希函数，但在某些情况下，它仍然可以用于布隆过滤器
SHA-1：SHA-1（Secure Hash Algorithm 1）是美国国家安全局设计，并由美国国家标准和技术研究所（NIST）发布的一系列密码散列函数。SHA-1 可以生成一个被称为消息摘要的 160 位（ 20 字节）哈希值。尽管 SHA-1 的安全性也受到一定质疑，但在某些场景下仍可用于布隆过滤器
SHA-256：SHA-256 是 SHA-2 家族中的一种哈希函数，它生成一个 256 位（32字节）的哈希值。SHA-256 提供了比 SHA-1 更高的安全性，并且在实际应用中被广泛使用
MurmurHash：MurmurHash 是一种非加密型哈希函数，适用于一般数据检索应用。它能够提供较好的分布性和性能，因此在布隆过滤器中也被考虑使用

四、手写布隆过滤器

目前 MurmurHash 函数作为布隆过滤器的 hash 函数是使用得比较多的，所以以下内容也会采用这种函数

Google Guava 库：Guava 是一个广泛使用的 Java 库，其中包含了 MurmurHash 的实现，可以使用其中的 Hashing.murmur3_128() 方法来创建 MurmurHash 实例。


<dependency>
    <groupId>com.google.guavagroupId>
    <artifactId>guavaartifactId>
    <version>33.0.0-jreversion>
dependency>

通过以上内容，就可以手写布隆过滤器了，代码如下：

import com.google.common.base.Charsets;
import com.google.common.hash.Hashing;
import com.mike.common.core.utils.ArithmeticUtils;

import java.util.BitSet;

/**
 * 布隆过滤器
 */
public class MyBloomFilter {

    // 位数组，使用BitSet实现
    private final BitSet bits;
    // 位数组大小
    private final int bitSize;
    // 哈希函数的个数
    private final int hashFunctionCount;

    // 预期要存放的数据量
    private final int dataCount;
    // 期望的误判率
    private final double falsePositiveRate;

    /**
     * 构造方法私有
     */
    private MyBloomFilter(int dataCount, double falsePositiveRate) {
        // 设置预期要存放的数据量
        this.dataCount = dataCount;
        // 实则期望的误判率（如果期望的误判率为 0，则取 double 的最小值）
        this.falsePositiveRate = falsePositiveRate == 0? Double.MIN_VALUE: falsePositiveRate;
        // 计算所需的数组大小
        this.bitSize = getBitSize();
        // 计算所需 hash 函数的个数
        this.hashFunctionCount = getHashFunctionCount();
        // 创建位数组
        this.bits = new BitSet(this.bitSize);
    }

    /**
     * 创建布隆过滤器
     * @param dataCount 预期要存放的数据量
     * @param falsePositiveRate 期望的误判率
     * @return 自定义布隆过滤器
     */
    public static MyBloomFilter create(int dataCount, double falsePositiveRate) {
        return new MyBloomFilter(dataCount, falsePositiveRate);
    }

    /**
     * 获取 bit 数组的大小
     */
    private int getBitSize() {
        /*
         * 计算公式：
         *          m = -1 * (n*ln(p))/(ln(2)*ln(2))
         *
         *          m：数组大小
         *          n：预估要存的数据量
         *          p：误判率
         */
        return (int) (-this.dataCount * Math.log(this.falsePositiveRate) / (Math.log(2) * Math.log(2)));
        // 注意：Math.log(n) 就是求以自然数 e 为底 n 的对数
    }

    /**
     * 获取 hash 函数的数量
     */
    private int getHashFunctionCount() {
        /*
         * 计算公式：
         *          k = ln(2)*(m/n)
         *
         *          k：hash 函数的个数
         *          m：bitSize 数组的大小
         *          n：预估要存的数据量
         */
        return Math.max(1, (int) Math.round((double) this.bitSize / this.dataCount * Math.log(2)));
    }

    /**
     * 往布隆过滤器中添加数据
     * @param data 数据
     * @return 结果：true 表示插入成功，false 表示插入失败
     */
    public boolean add(String data) {
        // 先假设插入失败
        boolean insert = false;
        // 计算 hash 值
        long murmurHash = Hashing.murmur3_128().hashString(data, Charsets.UTF_8).asLong();
        int hash1 = (int)murmurHash;
        int hash2 = (int)(murmurHash >>> 32);
        for (int i = 1; i <= hashFunctionCount; i++) {
            // 通过 murmurHash 与哈希函数个数的序号得到一个新的 hash 值
            int hash = hash1 + i * hash2;
            if (hash < 0) {
                // 如果 hash 小于 0，则进行取反操作
                hash =~hash;
            }
            // 获取更新为 1 的数组坐标位置（取 % 可以让得到的数不超过数组的大小）
            int index = hash % bitSize;
            // 通过该坐标值判定该位置是否已被设置为 1
            boolean exist = bits.get(index);
            if (!exist) {
                // 未已设置过则进行更新
                bits.set(index, true);
                // 设置已插入
                insert = true;
            }
        }
        return insert;
    }

    /**
     * 检查数据是否存在
     */
    public boolean exist(String data) {
    	// 逻辑和 add 方法类似
        long murmurHash = Hashing.murmur3_128().hashString(data, Charsets.UTF_8).asLong();
        int hash1 = (int)murmurHash;
        int hash2 = (int)(murmurHash >>> 32);
        for (int i = 1; i <= this.hashFunctionCount; i++) {
            int hash = hash1 + i * hash2;
            if (hash < 0) {
                hash =~hash;
            }
            int index = hash % bitSize;
            if (!bits.get(index)) {
            	// 有一个数组位上没有被设置过，则表示不存在
                return false;
            }
        }
        return true;
    }
}

测试代码：

public class BloomFilterDemo {

    public static void main(String[] args) {
        // 预期存放十万个数据
        int dataCount = 1000000;
        // 预期误差率为 0.01
        double falsePositiveRate = 0.01;
        // 创建布隆过滤器
        MyBloomFilter bloomFilter = MyBloomFilter.create(dataCount, falsePositiveRate);

        // 添加数据
        for (int i = 0; i < dataCount; i++) {
            String data = String.valueOf(i);
            bloomFilter.add(data);
        }

        // 添加从 dataCount 起后 100000 个数据
        int falsePositiveCount = 0;
        for (int i = dataCount; i < dataCount+100000; i++) {
            String data = String.valueOf(i);
            if (bloomFilter.exist(data)) {
                // 如果判断存在，则表示误判了，统计
                falsePositiveCount++;
            }
        }

        System.out.println("误差个数：" + falsePositiveCount);
    }
}

运行 main() 方法，控制台信息如下：

可以看到误差率也是接近前面预设的 0.01%

五、guava 中的布隆过滤器

上面内容我们通过布隆过滤器的原理和一些推导公式，实现了布隆过滤器，不过一般也不会自己去手写布隆过滤器，因为有些包中已经实现了布隆过滤器，比如： guava

在前面布隆过滤器的实现中，有些代码我也是参考了 guava 中的 BloomFilter 去实现的

那如何使用 guava 给的布隆过滤器呢？

导入 guava 依赖（就是第四部分导入的依赖）：


<dependency>
    <groupId>com.google.guavagroupId>
    <artifactId>guavaartifactId>
    <version>33.0.0-jreversion>
dependency>

我们可以使用 BloomFilter 中的 create() 方法来创造布隆过滤器

比如：创建一个针对存储字符串类型的布隆过滤器

        // 创建布隆过滤器
        BloomFilter<String> bloomFilter = BloomFilter.create(
                // 过滤器只存储字符串类型的数据，字符集为 uft-8
                Funnels.stringFunnel(Charsets.UTF_8),
                // 预期存放数据量
                dataCount, 
                // 预期误差率
                falsePositiveRate);

使用 put() 方法添加元素，mightContain() 方法判断元素是否存在

上述测试代码用 guava 的布隆过滤器可改写为：

package com.mike.spider;

import com.google.common.base.Charsets;
import com.google.common.hash.BloomFilter;
import com.google.common.hash.Funnels;

public class BloomFilterDemo {

    public static void main(String[] args) {
        // 预期存放十万个数据
        int dataCount = 1000000;
        // 预期误差率为 0.01
        double falsePositiveRate = 0.01;
        // 创建布隆过滤器
        BloomFilter<String> bloomFilter = BloomFilter.create(
                // 过滤器只存储字符串类型的数据，字符集为 uft-8
                Funnels.stringFunnel(Charsets.UTF_8),
                // 预期存放数据量
                dataCount,
                // 预期误差率
                falsePositiveRate);
        // 添加数据
        for (int i = 0; i < dataCount; i++) {
            String data = String.valueOf(i);
            bloomFilter.put(data);
        }

        // 添加从 dataCount 起后 100000 个数据
        int falsePositiveCount = 0;
        for (int i = dataCount; i < dataCount+100000; i++) {
            String data = String.valueOf(i);
            if (bloomFilter.mightContain(data)) {
                // 如果判断存在，则表示误判了，统计
                falsePositiveCount++;
            }
        }

        System.out.println("误差个数：" + falsePositiveCount);
    }
}

参考文章：

Java实现布隆过滤器的几种方式：https://blog.csdn.net/weixin_43888891/article/details/131407465

布隆过滤器(一)：https://hardcore.feishu.cn/docs/doccntUpTrWmCkbfK1cITbpy5qc

布隆过滤器（Bloom Filter）- 原理、实现和推导：https://blog.csdn.net/hlzgood/article/details/109847282

布隆过滤器讲解及基于Guava BloomFilter案例：https://blog.csdn.net/weixin_42675423/article/details/130025590

你可能感兴趣的:(算法学习,日常积累,java,开发语言)

JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
JAVA 高频八股文 Day03 Conqueror675 java 开发语言
12.TCP和Http的区别是什么TCP是传输层协议，负责建立可靠的点对点连接，确保数据有序、完整地传输（如铁路轨道）；HTTP是应用层协议，基于TCP构建，定义了Web服务交互的报文格式和规则（如货运订单）。TCP关注数据如何可靠送达，通过三次握手建立连接、流量控制等机制保证传输；HTTP关注传输内容的意义，提供请求/响应语义（GET/POST等）和无状态通信。补充：说一下什么是三次握手四次挥手
JVM字节码加载与存储中的细节
问题引出：为什么Java定义int型变量为32767时使用的是bipush32767，而定义int型变量为32768时使用的是ldc#4？在Java中，如果这样定义int型变量：publicclassTest{publicstaticvoidmain(String[]args){inti=0;intj=5;intk=6;intm=32768;intn=32767;}}变量对应的字节码文件内容是这样
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
Java中的Tomcat，开启Web应用腾飞【基础版】
目录一、Tomcat初登场：揭开神秘面纱（一）啥是Tomcat（二）为啥要有Tomcat二、Tomcat的安装与启动：开启第一步（一）下载Tomcat（二）启动Tomcat三、Tomcat的目录结构：探秘内部布局（一）核心目录介绍（二）目录间的协同工作四、部署JavaWeb应用到Tomcat：让应用上线（一）打包Web应用为WAR文件（二）部署WAR文件到Tomcat五、Tomcat的配置优化：让
Java Web 之 Session 详解艾伦~耶格尔 java 开发语言后端前端 session
在JavaWeb开发中，Session就像网站的专属记忆管家，为每个用户保管着重要的信息和状态，确保用户在网站的旅程顺畅无阻。场景一：想象你去一家大型超市购物，推着购物车挑选商品。这个购物车就如同Session，它记录了你的购物信息，方便你在结账时一次性结算。场景二：你在玩一个在线游戏，登录账号后，你的游戏进度、等级、装备等信息都会被保存在Session中，即使你中途关闭游戏，下次登录时依然可以继
JavaScript之DOM操作与事件处理详解 AA-代码批发V哥 JavaScript javascript
JavaScript之DOM操作与事件处理详解一、DOM基础：理解文档对象模型二、DOM元素的获取与访问2.1基础获取方法2.2集合的区别与注意事项三、DOM元素的创建与修改3.1创建与插入元素3.2修改元素属性与样式3.2.1属性操作3.2.2样式操作3.3元素内容的修改四、DOM元素的删除与替换4.1删除元素4.2替换元素五、事件处理：实现页面交互5.1事件绑定的三种方式5.1.1HTML属性
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理