不能再留遗憾了

【高阶数据结构】位图&布隆过滤器

文章目录

1. 位图
- 1.1什么是位图
- 1.2为什么会有位图
- 1.3 实现位图
- 1.4 位图的应用
2. 布隆过滤器
- 2.1 什么是布隆过滤器
- 2.2 为什么会有布隆过滤器
- 2.3 布隆过滤器的插入
- 2.4 布隆过滤器的查找
- 2.5 布隆过滤器的模拟实现
- 2.6 布隆过滤器的优点
- 2.7 布隆过滤器缺陷
3. 海量数据面试题
- 3.1 哈希切割
- 3.2 位图
- 3.3 布隆过滤器

1. 位图

1.1什么是位图

位图（Bitmap）是一种基于位操作的数据结构，用于表示一组元素的集合信息。它通常是一个仅包含0和1的数组，其中每个元素对应集合中的一个元素。位图中的每个位（或者可以理解为数组的元素）代表一个元素是否存在于集合中。当元素存在时，对应位的值为1；不存在时，对应位的值为0。

位图常用于判断某个元素是否属于某个集合，或者对多个集合做交集、并集或差集等集合运算。它的优点在于速度快，内存空间占用小，能表示大范围的数据。由于它的高效性和节省空间的特性，位图在很多场景中都有广泛的应用。

1.2为什么会有位图

给大家举个例子，假设存在 40 亿个不重复的无符号整数，也就是正数，没排过序，那么给一个无符号的整数，如何判断这个数是否在那 40 亿个数之中呢？

很多人第一想法就是直接遍历这 40 亿个整数，时间复杂度为 O(N)，每次遍历都判断是否等于这个给定的整数就可以了，这个想法对于少量数据是可实行的，但是这里数据有 40 亿个整数，换算成内存就是：40亿 * 4 = 160亿个字节，160亿 * 8 = 1240亿个比特位，1240亿 / 1024 / 1024 / 1024 ≈ 16GB，也就是说通过遍历这 40 亿个整数的话需要使用 16 GB的内存，那么这对于运行内存大的勉强可以实现，对于我们普通的电脑来说，几乎是不可能的。所以通过遍历这 40 亿个整数然后查找的想法是行不通的。

那么又有人会说了，我先将这 40 亿个数字进行排序，然后查找的时候使用二分查找的方式来查询不就可以了吗？我们来看看排序后再而二分查找的时间复杂度为多少：排序的时间复杂度为 O(NlogN)，二分查找的时间复杂度为 O(logN)，总体时间复杂度为 O((N+1)logN)，也就接近于 O(N)，所以这个也是行不通的。

而通过我们的位图实现的话，因为一个数字是否存在只需要使用一个比特位就可以实现，那么这 40 亿个数字总共需要：40亿 / 8 / 1024 / 1024 ≈ 512MB，这样就极大的节省了内存空间。

1.3 实现位图

首先我们的位图类中需要存在一个字节数组和计数器用来计算数组中的元素：

public class MyBitSet {
    private byte[] elem;
    private int usedSize;

    public MyBitSet() {
        //默认给一个字节
        elem = new byte[1];
    }

    public MyBitSet(int n) {
        //根据给定的整数的最大值来创建数组
        elem = new byte[n/8 + 1];  //这里只开辟n/8个字节是不够的，需要多一个
    }
}

然后就是插入操作，我们应该如何标记指定位置为 1 呢？因为一个字节的大小是 8 个比特位，所以数组的下标就可以用 n/8 来表示，这是知道了该元素在数组的哪个下标，再通过 n%8 可以知道该元素在该字节的哪一个比特位。假设我们要存储 13，13 / 8 = 1，那么该元素就存储在数组的 1 下标处，然后将一个字节从右开始的第 13 % 8 = 5 个位置设置为 1，也就是 arr[13/8] |= (1<<(13%8))。

public void set(int val) {
    //如果给的数字为负数的话，我们这里直接抛出异常
    //这里也可以不抛出异常，如果我们知道给定的数据中的最小的负数，那么我们可以在插入的时候每个数都加上一个值
    //使得每个数字都是正数
    if (val < 0) throw new ArrayIndexOutOfBoundsException();
    int arrayIndex = val/8;
    int bitIndex = val%8;
    elem[arrayIndex] |= (1<<bitIndex);
    usedSize++;
}

当查看指定数据是否存在的时候，还是通过相同的方法，查看 arr[arrIndex]位置的从右往左的第 bitIndex 上的位置是否为 1：

public boolean get(int val) {
    if (val < 0) throw new ArrayIndexOutOfBoundsException();
    int arrayIndex = val/8;
    int bitIndex = val%8;
    if ((elem[arrayIndex] & (1<<bitIndex)) != 0) return true;
    return false;
}

如果我们想要将已经插入的数据删除的话，也是将对应的比特位设置为 0 就可以了：

public void reSet(int val) {
    if (val < 0) throw new ArrayIndexOutOfBoundsException();
    int arrayIndex = val/8;
    int bitIndex = val%8;
    elem[arrayIndex] &= ~(1<<bitIndex);
    usedSize--;
}

查看当前位图存在多少数据：

public int getUsedSize() {
        return this.usedSize;
    }

上面是我们自己实现的位图，其实 Java 为我们提供了位图 BitSet：

只不过，我们这里数组使用的是 byte，而 BitSet 使用的是 Long：

这里的初始化，数组中元素的个数也是1：

1.4 位图的应用

快速查找某个数据是否在一个集合中
排序 + 去重
求两个集合的交集、并集等
操作系统中磁盘块标记

局限性：位图只能操作整数，对于小数的字符串无法处理，所以就出现了布隆过滤器。

2. 布隆过滤器

2.1 什么是布隆过滤器

布隆过滤器（Bloom Filter）是1970年由布隆提出的，它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多，缺点是有一定的误识别率和删除困难。

布隆过滤器的基本原理是将一个元素通过多个哈希函数映射到一个位数组中的多个位置，然后将这些位置置为1。在查询时，检查这些位置是否都是1，如果是，则认为元素可能存在于集合中。需要注意的是，布隆过滤器有可能产生误判（false positive），即认为某个元素存在于集合中，但实际上并不存在；但不会产生误判（false negative），即认为某个元素不存在于集合中，但实际上存在。

布隆过滤器的应用场景包括但不限于防止垃圾邮件、搜索引擎、数据库缓存、数据安全等。例如，在Redis数据库中，可以使用布隆过滤器解决缓存穿透问题，即当查询一个不存在的数据时，直接返回空，而不是再次从数据库中查询。这样可以避免对数据库的过多压力，提高系统的性能和稳定性。

2.2 为什么会有布隆过滤器

对于海量数据的处理，使用普通的方法是无法做到的，虽然位图可以处理大量的数据，但是位图只能处理整数，对于一些字符串，位图是无法处理的，那么有人就会想到使用哈希表来存储，哈希表虽然可以存储多种数据类型的数据，但是存储在哈希表中也需要占用大量的空间。那么如何做到即可以存储整数之外的数据类型，也可以节省空间呢？那就是布隆过滤器，布隆过滤器结合了位图和哈希表，使得布隆过滤器可以应用多种场景。

2.3 布隆过滤器的插入

布隆过滤器的插入其实和位图的插入类似，只不过在布隆过滤器插入之前，会通过多个哈希函数来得到不同的结果，为什么会需要多个哈希函数呢？我们都知道哈希冲突，当我们进行哈希操作的时候，很容易就会发生哈希冲突，通过多个哈希函数计算出来的哈希函数可以大大降低哈希冲突。

2.4 布隆过滤器的查找

布隆过滤器的查找就是将需要查找的元素，通过多个哈希函数的计算，然后根据计算的值去位图中寻找，如果计算的多个哈希值中某一个位置为 0，那么该元素一定不存在，但是如果所有位置都为 1，也不能一定确定该元素就在布隆过滤器中。假设 baidu 通过哈希函数计算出来的哈希值为1、3、7，tencent 计算出来的哈希值为3、4、8，alibaba 计算出来的哈希值为 2、5、6，而我们要查找的 zijietiaodong 计算出来的哈希值为 1、4、6，那么就不能说 zijietiaodong 一定存在于布隆过滤器中。

2.5 布隆过滤器的模拟实现

首先我们需要构建出几个哈希函数，那么构建多少个哈希函数才合适呢？这里有公式：

设bitarray大小为m，样本数量为n，失误率为p
使用样本数量n和失误率p可以算出m，公式为：
所使用哈希函数个数k可以由以下公式求得：
通过 bitarray 的大小m和哈希函数的个数可以计算出失误率p：

public class SimpleHash {
    //容量
    private int cap;
    //随机种子
    private int seed;

    public SimpleHash(int cap, int seed) {
        this.cap = cap;
        this.seed = seed;
    }

    /**
     * 将当前的字符串转换为哈希值
     * @param val
     * @return
     */
    public int hash(String val) {
        int result = 0;
        for (int i = 0; i < val.length(); i++) {
            result = seed * result + val.charAt(i);
        }
        return (cap - 1) & result;
    }
}

布隆过滤器的初始化：

public class BloomFilter {
    private static final int DEFAULT_SIZE = 1 << 24;
    private static final int[] seeds = new int[]{5,7,11,13,31,37,61};
    private BitSet bitSet;  //位图用来存储元素
    private SimpleHash[] func;  //存放多个哈希函数
    private int size;

    public BloomFilter() {
        bitSet = new BitSet(DEFAULT_SIZE);
        func = new SimpleHash[seeds.length];
        for (int i = 0; i < seeds.length; i++) {
            func[i] = new SimpleHash(DEFAULT_SIZE,seeds[i]);
        }
    }
}

布隆过滤器的插入：

/**
 * 布隆过滤器的插入
 * @param val
 */
public void set(String val) {
    if (val == null) return;
    for (SimpleHash f : func) {
        bitSet.set(f.hash(val));
    }
    size++;
}

布隆过滤器的查找：

/**
 * 布隆过滤器中查找某个元素是否存在
 * @param val
 * @return
 */
public boolean contains(String val) {
    if (val == null) return false;
    for (SimpleHash f : func) {
        if (!bitSet.get(f.hash(val))) return false;
    }
    return true;  //有误判
}

布隆过滤器不建议进行删除操作，因为在删除一个元素的时候可能会影响其他元素。

2.6 布隆过滤器的优点

增加和查询元素的时间复杂度为：O(K)（K为哈希函数的个数，一般比较小），与数据量大小无关
哈希函数相互之间没有关系，方便硬件进行并行运算
布隆过滤器不需要存储元素本身，在某些对于保密要求比较严格的场合有很大优势
在能够承受一定误判时，布隆过滤器比其他数据结构有很大的空间优势
数据量很大时，布隆过滤器可以表示全集，其他数据结构不能
使用同一组散列函数的布隆过滤器可以进行交、并、差集运算

2.7 布隆过滤器缺陷

误判率：这是布隆过滤器最主要的缺陷。由于哈希函数的随机性和冲突的可能性，即使位数组中的某些位置被置为1，也不一定表示元素一定存在于集合中。因此，布隆过滤器有可能产生误判（false positive），即认为某个元素存在于集合中，但实际上并不存在。
不能删除元素：一旦将元素加入布隆过滤器中，就不能将其删除。这是因为删除操作会破坏位数组中已经记录的信息，导致查询的准确性下降。这也是布隆过滤器的一个主要限制。
不能获取元素本身
如果采用计数

3. 海量数据面试题

3.1 哈希切割

1. 给定一个超过 100G 大小的log file，log 中存着 IP 地址，设计算法找到出现次数最多的 IP 地址，同样那如果是出现次数 topK 的IP呢？

如果忽略大小的话，我们可以使用模型来统计每个 IP 出现的次数，但问题就是这里的数据非常多，使用模型的话，一次性是无法都加载到内存当中的。那么我们将这个大文件分成多个小文件不就可以了？可以是可以，可是如何划分呢？有人会说均分不就可以了？均分可以吗？均分不可以，因为你均分之后，你其中一个文件中的出现次数最多的 IP 地址并不是所有文件中 IP 地址出现次数最多的，那么我们应如何将 IP 地址相同的划分到一个文件呢？

因为 IP 地址本质上也是一个字符串，所以我们可以使用哈希函数先将 IP 地址转换为一个整数，然后将得到的一样的哈希值给放到一个文件中，那么这样相同的 IP 地址最终就会被分到同一个文件中，这种思路叫做哈希分割

当完成哈希分割之后，我们统计每个文件中 IP 地址出现的次数，最后得到出现次数最多的 IP 地址。

3.2 位图

1. 给定100亿个整数，设计算法找到只出现一次的整数。

这道题目有两种思路：

哈希切割
位图

首先是哈希切割，我们将出现的所有的相同的整数给分割到一个文件中，然后遍历每个文件，统计文件中整数出现的整数的次数，最终得到只出现了一次的整数。

然后第二种思路就是通过位图来解决。但是位图不是只能判断某一个元素是否存在吗？这道题目不是要求出现了一次的整数吗？那么使用位图该如何解决呢？

是的，一个位图只能判断某个元素是否存在，但是两个位图就可以判断某个元素出现的次数了，两个位图的相同位置可能的结果是 00、01、10和11，我们使用 00 表示该元素未出现，01 表示该元素出现了一次，10 表示出现了两次，11表示出现的次数超过 2 次。

这是使用了两位位图的情况，如果我就想只用一个位图解决可以吗？可以的，之前位图一个比特位表示一个元素，这里我们可以使用两个比特位来表示一个元素。一个字节之前可以表示 8 个元素，现在我只表示 4 个元素，那么 arrIndex 就为 n / 4，bitIndex 就为 2*(n % 4)，这样每两个比特位可以表示的结果就有 00、01、10、11，这样就可以判断出只出现了一次的整数了。

2. 给定两个文件，分别有 100亿个整数，我们只有一个 G 的内存，如何找到两个文件的交集？

同样是两种思路：

哈希切割
位图

我们两个文件都使用相同的哈希函数对文件中的数据进行切割，切割完成之后，分别遍历两个相同下标的文件，看这两个文件中是否有相同的元素。

第二种思路，使用位图，分别使用一个位图，只用 0 和 1 标识某个元素是否存在，都存入位图之后，再分别遍历这两个位图，如果相同位置上的数据都为 1 的话，该位置表示的整数就是两个文件中的交集。

3.3 布隆过滤器

给两个文件，分别有 100亿个query，我们只有 1G 内存，如何找到两个文件的交集？分别给出精确算法近似算法。

既然提到精确算法和近似算法，那么这个问题就有两种思路可以解决：

哈希切割（精确算法）
布隆过滤器（近似算法）

这个做法和上面类似，分别遍历两个文件，将文件分割成 n 个大小的文件，然后再分别遍历对应的文件，找两个文件中存在的 query。

第二种思路是布隆过滤器，先遍历一个文件，将该文件中的 query 通过哈希函数映射到布隆过滤器中，然后再遍历第二个文件，遍历的同时，在布隆过滤器中看该元素是否存在，存在则为交集。

队列的两种实现方式---数组+链表 @烟雨倾城ゝ趣味算法数据结构与算法链表数据结构算法
1、什么是队列？队列是一个线性的数据结构，并且这个数据结构只允许在一端进行插入，另一端进行删除，禁止直接访问除这两端以外的一切数据，且队列是一个先进先出的数据结构。队列存储结构的实现有以下两种方式：①顺序队列：在顺序表的基础上实现的队列结构②链队列：在链表的基础上实现的队列结构2、数组实现队列（1）实现步骤实现思路：定义一个数组，数组中定义三个属性：头指针front，尾指针rear和长度maxSi
数据结构---数组与链表 GOV_D 数据结构数据结构
文章目录一、数组二、链表三、数组和链表的选择四、链表的基本使用和算法一、数组数组的特点1.在内存中，数组是一块连续的区域2.数组需要预留空间，在使用前需要提前申请所占内存的大小，不知道需要多大的空间，可能会浪费内存空间，即数组空间利用率低3.在数组起始位置处，插入数据和删除数据效率低。插入数据时，待插入位置的的元素和它后面的所有元素都需要向后搬移删除数据时，待删除位置后面的所有元素都需要向前搬移4
数据结构----线性结构----多维数组和广义表 XUPT 数据结构与算法链表数据结构算法 java
学习时间2021-01-20学习内容多维数组和广义表可以看作线性表的扩展，即他们的数据元素构成线性表，而数据元素本身又是一个线性结构。多维数组多维数组是一维数组的扩展，也就是数组的数组，例如二维数组可以看作是一维数组作为数据元素构成的一维数组，三维数组可以看作二维数组作为元素构成的一维数组。数组一旦被定义，他的维数和维界就不再改变。因此，除了数组的初始化和销毁之外，数组的操作只有获得特定位置的元素
SpringBoot中运行Yolov5程序 eqa11 spring boot YOLO 后端
文章目录SpringBoot中运行Yolov5程序一、引言二、环境搭建1、SpringBoot项目创建2、YOLOv5环境配置三、SpringBoot与YOLOv5集成1、创建Python服务2、SpringBoot调用Python服务四、使用示例1、创建控制器五、总结SpringBoot中运行Yolov5程序一、引言在人工智能领域，目标检测是一个热门且实用的技术。YOLOv5作为目标检测算法中的
Java中运行Python程序 eqa11 python java 开发语言
文章目录Java中运行Python程序一、引言二、使用Jython运行Python程序1、Jython简介1.1、添加Jython依赖2、编写Java代码调用Python三、使用进程间通信运行Python程序1、原理2、编写Python脚本3、编写Java代码四、使用JNI运行Python程序1、JNI简介2、编写JNI代码3、编写Python脚本4、在Java中调用JNI库五、使用示例六、总结J
数据结构--数组链表 ToToBe 算法数据结构
数据结构--数组链表1.数组（顺序存储）2.链表（链式存储）3.环形数组技巧1.数组（顺序存储）「静态数组」就是一块连续的内存空间，我们可以通过索引来访问这块内存空间中的元素，这是数组的原始形态。「动态数组」是编程语言为了方便我们使用，在静态数组的基础上帮我们添加了一些常用的API，比如push,insert,remove等，这些API可以让我们更方便地操作数组元素，不用自己去写代码实现这些操作。
模型架构选择：从传统NLP到Transformer AI天才研究院 AI大模型应用入门实战与进阶大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
模型架构选择：从传统NLP到Transformer关键词：自然语言处理(NLP),模型架构,传统NLP,Transformer,RNN,CNN,预训练模型文章目录模型架构选择：从传统NLP到Transformer1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.1.1传统NLP模型3.1.2RNN模型3.1.
开源 CSS 框架 Tailwind CSS v4.0 timer_017 人工智能
开源CSS框架TailwindCSSv4.0于1月22日正式发布，除了显著提升性能、简化配置体验外，还增强了功能特性，具体如下1：性能提升采用全新的高性能引擎Oxide，带来了构建速度的巨大飞跃：全量构建速度提升超3.5倍。增量构建速度提升超8倍。无新CSS的增量构建速度提升182倍。配置优化CSS优先配置：从JavaScript配置文件改为直接在CSS文件中使用@theme指令进行配置，简化了项
基于matlab的GPS信号捕获仿真 Simuworld MATLAB仿真案例 matlab GPS信号捕获
目录1.算法概述2.仿真效果3.MATLAB仿真源码1.算法概述全球定位系统gps是一种可以在全球范围内为用户全天候提供实时、连续、高精度的位置、速度和时间信息的卫星导航系统，其主要终端设备是gps接收机。gps信号捕获是gps接收机的关键技术之一，它直接影响着后续对信号的跟踪和定位数据的解算，决定着接收机的性能。现有的gps接收机c/a码捕获方法主要有两种：一种是基于时域的串行搜索捕获法，该方法
如何让RocketMQ保证消息的顺序消费？思维导图代码示例（java 架构) 用心去追梦 java-rocketmq rocketmq java
保证消息的顺序消费在某些业务场景中非常重要，例如金融交易、库存管理等。RocketMQ提供了有序消息（FIFO消息）的支持，确保消息按照发送的顺序被消费。为了实现这一点，RocketMQ采用了一些特定的机制和配置来确保消息的顺序性。RocketMQ顺序消费思维导图建议顺序消费原理单队列模式每个Topic下的每个队列只由一个消费者线程处理确保消息按序处理分区有序对于有多个分区的Topic，可以通过设
Transformer架构的GPU并行和之前的NLP算法并行有什么不同？ AI大模型学习不迷路 transformer 自然语言处理大模型深度学习 NLP LLM 大语言模型
1.什么是GPU并行计算？GPU并行计算是一种利用图形处理单元（GPU）进行大规模并行数据处理的技术。与传统的中央处理单元（CPU）相比，GPU拥有更多的核心，能够同时处理数千个线程，这使得GPU在处理高度并行的任务时表现出色。在深度学习中，GPU并行计算被广泛应用于训练神经网络，加速模型训练过程。在2017年之前，自然语言处理（NLP）领域的研究者们通常会从头开始训练模型，那时能够利用GPU进行
垃圾回收机制 Louis yeap 算法 python go
系列文章目录文章目录目录系列文章目录文章目录前言一、垃圾回收算法二、golang垃圾回收算法三、python垃圾回收算法前言垃圾回收（GarbageCollection,GC）是一种自动管理内存的技术，用于动态分配内存的编程语言中。当程序运行时，会创建大量的对象和变量，这些对象占用内存。在程序的某些阶段，一些对象不再被需要，或者不再被引用，这些对象占用的内存就可以被释放，以便其他对象使用。垃圾回收
Linux服务器中指定版本jdk运行java项目 Louis yeap java 持续部署 linux
Linux中指定版本jdk运行java项目文章目录Linux中指定版本jdk运行java项目一、Linux中下载jdk（已下载跳过步骤一）二、配置环境变量（之前配过不影响）三、工作服务器跑项目（后台长期运行）总结一、Linux中下载jdk（已下载跳过步骤一）要在Linux系统上下载并安装JavaDevelopmentKit(JDK)，可以按照以下步骤进行操作。以下示例是基于OpenJDK，这是一个
贪心算法--加油站、公路问题我不叫喂！我叫楚雨荨贪心算法算法 C++贪心算法算法
题目来自洛谷-P9749，传送门题目描述小苞准备开着车沿着公路自驾。公路上一共有nnn个站点，编号为从111到nnn。其中站点iii与站点i+1i+1i+1的距离为viv_ivi公里。公路上每个站点都可以加油，编号为iii的站点一升油的价格为aia_iai元，且每个站点只出售整数升的油。小苞想从站点111开车到站点nnn，一开始小苞在站点111且车的油箱是空的。已知车的油箱足够大，可以装下任意多的
无重复字符的最长子串不停留 150道经典算法面试习题 javascript 开发语言 ecmascript
hello大家好！今天开写一个新章节，每一天一道算法题。让我们一起来学习算法思维吧！functionlengthOfLongestSubstring(s){//用于存储字符及其在字符串中最新出现的索引constcharIndexMap=newMap();//记录最长无重复字符子串的长度letmaxLength=0;//滑动窗口的起始位置letstart=0;//遍历字符串，end作为滑动窗口的结束
长度最小的子数组不停留 150道经典算法面试习题 javascript 数据结构算法
hello大家好！今天开写一个新章节，每一天一道算法题。让我们一起来学习算法思维吧！functionminSubArrayLen(target,nums){constn=nums.length;//初始化最小子数组长度为一个较大的值，用于后续比较更新letminLength=Infinity;//初始化当前子数组的起始位置letstart=0;//初始化当前子数组的元素总和letsum=0;//遍
算法-三数之和不停留 150道经典算法面试习题算法 javascript 数据结构
hello大家好！今天开写一个新章节，每一天一道算法题。让我们一起来学习算法思维吧！functionthreeSum(nums){//用于存储最终结果的数组constresult=[];//首先对数组进行排序，方便后续操作nums.sort((a,b)=>a-b);constn=nums.length;//遍历数组，将当前元素作为三元组的第一个元素for(leti=0;i0&&nums[i]===
java cap理论_架构设计之「 CAP 定理」 Can Li java cap理论
点击上方“Java知音”，选择“置顶公众号”技术文章第一时间送达！作者：奎哥来源：不止思考在计算机领域，如果是初入行就算了，如果是多年的老码农还不懂CAP定理，那就真的说不过去了。CAP可是每一名技术架构师都必须掌握的基础原则啊。现在只要是稍微大一点的互联网项目都是采用分布式结构了，一个系统可能有多个节点组成，每个节点都可能需要维护一份数据。那么如何维护各个节点之间的状态，如何保障各个节点之间数据
Feign介绍及使用阿柒爱吃鱼笔记 java spring cloud
菜单Feign介绍Feign基本使用1.导入依赖2.启用Feign3.编写StoreClient接口4.调用FeignClientFeign自定义配置配置文件中配置java代码中配置Feign配置超时重试配置超时时间重试机制Feigh切换Client使用OkHttp配置超时重试1.引入okhttp依赖2.OkHttp配置类3.开启okhttpFeign介绍Feign是一个声明式的Web服务客户端，
定时任务之Quartz Listen·Rain 定时任务 spring boot java quartz
定时任务之Quartz1.Quartz简介2.Quartz核心概念3.Quartz的工作流程4.Quartz的应用场景5.Springboot集成Quartz5.1.添加依赖5.2创建任务类5.3配置JobDetail和Trigger5.4运行应用1.Quartz简介定义：Quartz是一个灵活的、开源的作业调度库，用于在Java应用程序中根据时间间隔或特定条件来调度作业的执行。特点：强大的调度功
27.useFetch @大迁世界 php react.js javascript react native 开发语言
在React应用开发中，处理网络请求是一个常见而重要的任务。虽然JavaScript的fetchAPI提供了一种现代化的方式来进行网络请求，但在React组件中使用它可能会变得复杂。useFetch钩子提供了一种声明式的方法来处理网络请求，简化了错误处理、加载状态管理和请求取消等复杂操作。以下是如何实现和使用这个自定义钩子：const useFetch = (url, options) => {
代码随想录算法训练营第三十九天|198.打家劫舍、 jinshengqile 算法 leetcode 动态规划
题目链接：198.打家劫舍-力扣（LeetCode）思路：因为隔一家才能取，所以当前最大的价值要么是dp[i-2]+nums[i]或者是dp[i-1]classSolution(object):defrob(self,nums):""":typenums:List[int]:rtype:int"""dp=[0]*len(nums)if(len(nums)==1):returnnums[0]dp[0
C语言经典贪心算法之加油站问题（详解）鸿蒙Next C语言算法算法 c语言贪心算法数据结构程序人生
文章目录一、贪心算法二、加油站问题一、贪心算法贪心算法暗示一种不追求最优解，只希望找到较为满意解的方法。贪心算法省去了为找最优解要穷尽所有可能而必须耗费大量时间，因此它一般可以快速得到较为满意的答案。贪心算法常常以当前情况为基础做最优选择，而不考虑各种的整体情况，所以贪心算法不需要回溯。二、加油站问题1、问题一辆汽车加满油后可以行驶n千米，旅途中有若干个加油站（加油站是已经确定好的），为了使沿途加
Selenium自动化测试框架入门与使用 Future_yzx selenium 测试工具
目录1.Selenium简介2.使用Selenium2.1Java使用Selenium2.2Python使用Selenium2.3支持的浏览器及WebDriver3.ChromeDriver的安装3.1查看本机Chrome版本3.2匹配对应的ChromeDriver并下载3.3配置ChromeDriver路径3.4在服务器（如CentOS）上安装ChromeJava中使用Selenium的代码示例
代码随想录算法训练营第三十九天-动态规划-198. 打家劫舍 taoyong001 算法动态规划 c++leetcode
动规五部曲dp[i]表示在下标为i的房间偷或不偷与前面所偷之和所能获得的最大价值递推公式：dp[i]=std::max(dp[i-2]+nums[i],dp[i-1])初始化：要给dp[0]与dp[1]来给定初始值，因为递推公式有-1与-2。dp[0]=nums[0],dp[1]=std::max(nums[0],nums[1]);其它下标值，初始成任意值都可以，因为其值是由前面元素推导出来的遍历
Haproxy入门学习二 DawnEillen 学习运维
一、Haproxy的算法1.haproxy通过固定参数balance指明对后端服务器的调度算法，其中balance参数可以配置在listen或backend选项中2.haproxy的调度算法分为静态和动态调度算法，其中有些算法可以根据参数在静态和动态算法中相互转换3.静态算法：按照事先定义好的规则轮询公平调度不关心后端服务器的当前负载、连接数和响应速度等并且不可以实时修改权重，只能靠重启hapro
Django 静态文件配置实战指南 ivwdcwso django sqlite python 开发
静态文件（如CSS、JavaScript、图片等）是Django项目中构建用户界面的重要组成部分。然而，静态文件的配置问题常常导致开发和生产环境中的404NotFound错误。本文将详细介绍如何正确配置Django静态文件，结合最佳实践，帮助你解决常见的静态文件问题，并确保项目在不同环境中正常运行。©ivwdcwso(ID:u012172506)1.静态文件的基本概念1.1什么是静态文件？静态文件
Java实现FIFO缓存策略实战 smart_ljh 缓存策略 java 缓存开发语言 FIFO 策略模式
实现FIFO模型选择FIFO模型实现过程FIFO模型完整代码下面看一下先进先出的示例过程总结FIFO（FirstInFirstOut，先进先出）策略是一种基本的数据处理和存储管理方法，在Java中，这种策略通常用于管理那些需要按照顺序处理的数据项，比如任务的队列、数据的传输缓冲区等。在Java中，java.util.Queue接口以及实现了这个接口的类，比如LinkedList和PriorityQ
WAS 日志分析（websphere application server) Change is good websphere application server 服务器 jvm deployment
关键字:websphere日志WebSphereApplicationServer是一个基于Java的Web应用程序服务器，它构建在开放标准的基础之上，能帮助您部署与管理从简单的Web站点到强大的电子商务解决方案的诸多应用程序。它遵循J2EE并为Java组件、XML和Web服务提供了一个可移植的Web部署平台，这个平台能够与数据库交互并提供动态Web内容。随着WebSphereApplicatio
final 到底有啥用？99% 的开发者可能只知道一半！软件求生 #工作建议运维数据库 java 架构微服务
小伙伴们，你有过这样的经历吗？早晨喝了一杯奶茶，兴致勃勃地去面试，面试官却冷不丁地问了一句：“final在Java中有什么作用？”我的天哪！我当时脑子一片空白，只能挤出一句：“用来修饰变量吧。”看着面试官点了点头，但眉头却微微一皱，我就知道，完了……不怕！今天咱们就从头到尾，搞清楚final的所有用途，让你下次遇到这个问题，自信到能现场开课！什么是final？简单来说，final是Java中的一个
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb