秃头哥编程

从一道高大上的面试题来学习位图算法BitMap

今天我偶然刷到了一篇文章，“华为二面：一个文件里面有5亿个数据，一行一个，没有重复的，进行排序”。不知道又是哪个无良媒体瞎起的标题，夺人眼球。

不过说归说，这题听着就很高大上，5亿个数据排序，想想就很爽。常用的内排序算法有很多，比如我们熟悉的冒泡排序、插入排序、快速排序等等。所谓内排序，意思就是在内存里进行排序，不需要占用外存。

对于内部排序算法，在数据量比较小的情况下，还是可以玩玩的，但像上面说的，5亿个数据，先不说时间要多少，来算算需要多少空间存储这些数据 5 * 10 ^ 8 * 32 = (1.6 * 10 ^ 10)bit = (1.6 * 10 ^ 10) / (1024 * 1024 * 8) = 1920M = 1.875G，快接近2G了，面试官就是这么坏，他只给你1G的内存，那玩个毛啊，内存都不够，连数据都装不下，何来排序。

这时候就有必要学习一下位图法（BitMap）了。

1、什么是位图算法

1.1 基本思想

BitMap的核心思想就是用一个bit位来记录0和1两种状态，将具体数据映射到比特数组的具体某一位上，这个bit位设置为0表示该数不存在，设置为1表示该数存在。由于BitMap使用bit来记录数据，所以大大节省了存储空间，比如上面5亿个数据，如果使用bit来记录，只需要(1.875 / 32)G不到60兆内存即可。

利用这个特性，BitMap可以用来处理大量数据的排序、查询以及去重等，BitMap在用户群做交集和并集运算的时候也有极大的便利。

举个栗子，比如对于数列[2, 3, 6, 4, 1]，在BitMap里是如何存储的呢？

（1）先申请1字节(8 bit)的空间，这样就可以表示8个数，下标范围从0 ~ 7。

（2）然后根据数列将对应的bit位进行设置。对于2，则把下标为2的bit设置为1，依次类推，最终结果如下

这样如果我们需要得到有序数组的话，只需要从下标0开始遍历，如果bit位的值为1，则把下标输出，即可得到有序数列。

那如果数据很大呢？比如50，那0 ~ 7的下标肯定不够，这时候就需要扩充了，算起来好像需要8个这样的bit数组才行，50应该存放在第8个bit数组下标为0的地方。那中间岂不是还剩下6个空着没用？这是后面要讨论的问题了。注意：即使你只需要用到一个bit，也要至少申请8个bit，这是为了内存对齐。

1.2 Map映射

从上面的介绍可以知道，BitMap的思想还是挺简单的，关键就是如何确定10进制到2进制的关系映射图。因为你可以用int(32bit)或者long(64bit)来进行映射。

如果使用int进行映射，假设我们要排序的数有N个，那么需要申请的内存空间大小就是int[(N - 1) / 32 + 1]，映射关系如下：

a[0]：0 ~ 31

a[1]：32 ~ 63

a[2]：64 ~ 95

…

1.3 数据和下标的转换

搞定了数据结构，接下来就是怎么把数据转换到我们申请的bit数组中。我们用“三步走”战略

（1）确定数据在对应数组a中的下标

十进制数0 - 31，对应于数组元素a[0]，十进制数32 - 63在数组元素a[1]中，所以可以很容易的知道，一个数num在数组a[num / 32]中，即下标为num / 32。

（2）确定数据在对应数字a[i]中的下标

十进制数1在a[0]的下标为1，十进制数31在a[0]中下标为31，十进制数32在a[1]中下标为0。在十进制0-31就对应0-31，而32-63则对应也是0-31，即给定一个数num可以通过模32求得在对应数组a[i]中的下标 num % 32。

（3）存放

经过上面两步，我们知道一个数num存放在a[num / 32]的num % 32下标上。我可以通过移位操作将对应位置1

a[n >> 5] |= 1 << (n & 0x1F)

n >> 5不用多解释，大家都会，n & 0x1F 保留n的后五位，相当于 n % 32。

1.4 实现一个简单的BitMap

具备了上面的知识，我们可以很容易的实现一个简陋的BitMap

import java.util.Arrays;

public class BitSet {
    private int[] bits;

    private final static int ADDRESS_BITS_PER_WORD = 5;
    private final static int BITS_PER_WORD = 1 << ADDRESS_BITS_PER_WORD;

    /**
     * 无参构造器
     * 默认构造容量为32bit的数组，即数组长度为1
     */
    public BitSet() {
        bits = new int[(BITS_PER_WORD - 1) >> ADDRESS_BITS_PER_WORD + 1];
    }

    /**
     * 有参构造器
     * @param nbits 数字的个数
     */
    public BitSet(int nbits) {
        bits = new int[(nbits - 1) >> ADDRESS_BITS_PER_WORD + 1];
    }

    public int[] getBits() {
        return bits;
    }

    /**
     * 把num映射到bits数组中
     * @param num
     */
    public void set(int num) {
        // num在数组中的下标
        int index = num >> ADDRESS_BITS_PER_WORD;
        // TODO：要检查数组是否需要扩容
        bits[index] |= 1 << (num & 0x1F);
    }

    /**
     * 判断bits数组中对应位的值
     * @param bitIndex
     * @return
     */
    public boolean get(int bitIndex) throws Exception {
        if (bitIndex < 0) {
            throw new Exception();
        }
        // 把输入的下标进行转换，对应数组某个值的某个位置
        int index = bitIndex >> ADDRESS_BITS_PER_WORD;
        return (bitIndex < bits.length) && ((bits[index] & (1 << (bitIndex & 0x1F))) != 0);
    }

    public static void main(String[] args) throws Exception {
        // 5亿个数
        BitSet bitSet = new BitSet(1_0000_0000);
        // 目标数组
        int[] arr = {2, 98, 76, 56, 100, 762, 16, 95};
        Arrays.stream(arr).forEach(num -> {
            bitSet.set(num);
        });

        // 判断某个数在数组中是否存在
        System.out.println(bitSet.get(100));  // true
        System.out.println(bitSet.get(200));  // false
        System.out.println(bitSet.get(762));  // true

        // 输出排序后的数组
        int[] res = bitSet.getBits();
        int count = 0;
        for (int i = 0; i < res.length; i++) {
            // 按位输出
            for (int j = 0; j < 32; j++) {
                // 为1表示该数存在
                if (((res[i] >> j) & 1) == 1) {
                    arr[count++] = i * 32 + j;
                }
            }
        }
        // 2 16 56 76 95 98 100 762
        Arrays.stream(arr).forEach(System.out::println);
    }
}

我们可以输出看看它的内部怎么存储的

bits[0][0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
bits[1][0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
bits[2][0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1]
bits[3][0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
bits[4][0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
    ......

那么位图算法有没有一些对应的开源实现呢？毕竟自己写肯定不如大神写的好啊，答案是有。JDK的BitSet和Google的EWAHCompressedBitmap，Redis里也提供了类似的一些命令，主要有以下几个：SETBIT， GETBIT， BITCOUNT， BITOP， BITPOS，BITFIELD。

BitSet从JDK1.0开始就存在，是对BitMap算法的简单实现，而EWAHCompressedBitmap对BitMap的存储空间做了优化。比如我要存储的两个数1和100000，按照上面的思路，1和100000中间空了好多位置，但为了存储100000，必须要开足够长的数组才行，那么中间就会浪费很多位置。在这种数据分布极度不均匀的情况下BitMap的空间利用率是很低的。EWAHCompressedBitmap实现就对这种情况作了优化。

这篇文章先不分析JDK的BitSet和Google的EWAHCompressedBitmap的源码，放到下篇文章来。扯远了，现在还是回到面试题吧。：)

2、面试题怎么解决

其实通过上一节的学习，对于5亿个数据如何进行排序已经显而易见了。别说5亿个，50亿个都没问题。

3、BitMap的应用

由以上内容可得知，在数据量越大的情况下，BitMap节省空间的效果就越显著。所以BitMap很适合用来进行大量数据的排序、去重、查找，包括在线活跃用户的统计，用户签到等。

对5亿个没有重复元素的数据进行排序

上面代码里就有这个例子，只需要把数装进Bit数组里，然后按顺序输出即可，美得一批。但要注意是没有重复元素的情况下。

在5亿个数中找出重复/不重复整数的个数，限制内存不足以容纳5亿个整数

这种情况需要使用2-BitMap来解决，即用两个bit来表示一个数，定义00表示该数没有出现，01表示出现一次，11表示出现多次。

那么在存入的时候，如果是对应位是00，则变为01，01则变为11，11不变。全部存入完毕后，遍历，如果是11说明该数重复。

统计不同电话号码的个数

如果电话号码是8位数，则范围0 - 99999999，每个数对应一个bit位，大约只需要1.2M即可。

交集、并集的运算

因为BitMap使用位来存储数据，所以自然位具有高效位运算的特性。比如在统计用户兴趣标签的时候，一个bits1数组代表兴趣a，所以存储的就是对a感兴趣的用户，一个bits2数组代表兴趣b，存储的是对b感兴趣的用户。那么如果你想知道既对a感兴趣也对b感兴趣的用户，那么只需要两个数组进行&运算即可。如果想知道对a或对b感兴趣的用户，那么只需要两个数组进行|运算即可。

4、BitMap的优缺点

4.1 优点

（1）运算效率高。

（2）占用内存少。

4.2 缺点

（1）对重复数据无法进行排序。

（2）数据碰撞。比如将字符串映射到 BitMap 的时候会有碰撞的问题，那就可以考虑用 Bloom Filter 来解决，Bloom Filter 使用多个 Hash 函数来减少冲突的概率。

（3）数据稀疏时浪费空间。比如上面举的例子，存入(1, 100000)，只有两个数，但我们不得不开足够大的空间来存放100000，这就造成了中间很多空间的浪费，可以通过引入 Roaring BitMap 来解决。

5、面试题的另一种解法

归根结底，BitMap还是全部使用内存来进行排序的。如果面试官不讲武德，把内存条拔了怎么办？或者他只给你很少的内存。这时候就要外排序上场了。

外排序，字面意思，就是要借用外部的空间来完成排序。谁让你不给我足够的内存呢。通俗一点，就是在内存极少的情况下，利用分治策略，使用外存保存中间结果，最后用多路归并进行排序。

5.1 基本思想

5.2 怎么分

（1）内存中维护一个核心缓冲区memBuffer，将大文件按行读入，直到memBuffer满了或者大文件已经读完，然后对memBuffer里的数据进行内排序（选择合适的内排序算法），排序后将结果写入磁盘文件sort_file1.txt。

（2）清空memBuffer，重复执行步骤1。

（3）大文件处理完毕后，会得到n个有序的子文件。

5.3 怎么合

现在有了n个有序的文件，关键怎么把它们合并成一个有序的文件。可以利用如下原理进行归并排序：一个n个元素的有序集合
$\{x | x_i \leq x_j,i,j \in [0, n)\}$
那么对于m个小集合：S1,S2,S3,…,Sm，所有小集合中的最小值是
$min = min(min(S_1), min(S_2),...,min(S_m))$
举个栗子，对于下面的集合

S1 = {1, 4, 8, 9}

S2 = {3, 6, 11, 13}

S3 = {2, 7, 10, 12}

分别拿出三个集合中的最小值，则min(1, 3, 2) = 1，1是在集合S1中的，那么把1写入大文件，同时S1中拿出下一个数4，则min(4, 3, 2) = 2，2是在集合S3中的，那么把2写入大文件，同时S3中拿出下一个数7，依次类推，直到小文件的值全部取出。

6、总结

本文从一道面试题入手，学习了位图BitMap算法，了解了它的原理已经对它进行了简单的实现，同时列举了BitMap的一些使用场景，最后回到面试题，讲解了如何利用BitMap和外排序进行解决。

下篇文章：JDK的BitSet和Google的EWAHCompressedBitmap源码对比与分析。

你可能感兴趣的:(Java学习之旅,位图算法,BitMap,大量数据排序,5亿数据排序面试题)

【协同任务】VFH算法多无人机协同控制技术【含Matlab源码 1999期】 Matlab领域 matlab
⛄一、VFH*算法简介在机器人的每个位置,建立相应的向量场直方图,得到若干个初始候选方向,VFH将沿每个候选方向前进的后果考虑进去。对每个候选方向,首先估算出机器人沿该方向前进一段距离ds后的新位置,然后以该位置为中心,再建立新的向量场,对新的向量场继续分析得到若干候选方向,如此继续下去,重复ng次,就建立了一个深度为ng的搜索树。最后使用A算法,找出一条路径,使根结点到某一个叶子结点的代价最低,
彻底解放测试工程师双手：用 Playwright API 智能生成 PO 模式，快速适配复杂测试场景 Python测试之道 Playwright深入学习测试提效 python 测试用例
前言在自动化测试中，Playwright是一款备受推崇的浏览器自动化工具，其强大的API（如get_by_role、get_by_text等）让复杂页面元素的精准定位变得更加高效。然而，如何将Playwright的这些功能与PageObject模式（PO模式）结合起来，生成可维护、灵活、通用的测试代码，仍然是一个挑战。尤其是面对层级复杂的页面结构或动态加载的元素，测试工程师往往需要花费大量时间手动
Tenserflow学习笔记【一：Python入门】邪魔小屁屁神经网络与深度学习 python 数据结构机器学习
Python序列数据结构初习一.前言Python的两种主要的序列数据类型二.关于序列的相关操作1.索引2.切片[开始位置：结束位置]3.获取长度len()4.添加元素①append()②insert(a,b)5.合并列表①extend()②‘+’6.删除元素del6.排序7.遍历序列8.字典①遍历②添加、修改指定元素的取值③合并字典update()④删除字典中的元素9.集合（略）总结一.前言Pyt
厘米和磅的转换关系爱代码的小黄人 MATLAB matlab
在排版和设计领域，厘米（cm）和磅（pt）都是常用的长度度量单位，它们之间的转换关系基于特定的换算标准，下面为你详细介绍：基本换算关系磅是印刷行业常用的长度单位，1英寸等于72磅，而1英寸又等于2.54厘米。由此可以推导出厘米与磅的换算公式：1厘米=72/2.54≈28.35磅1磅=2.54/72≈0.0353厘米换算示例厘米转换为磅若有一个长度为5厘米，将其转换为磅，可以使用上述换算公式进行计算
*python中的字符串菜鸡且菜鸡计算机基础 #python python
什么是字符串,字符串的格式多个字符就是字符串.格式:变量名='字符串'或者:变量名="字符串"#例如:name='张三'des='张三是个万能的名字'password='123456'#......都需要用字符串来存储字符串格式化详见里面的格式化输出字符串的下标索引下标==索引字符串:我喜欢你下标索引:0123str='我喜欢你'print(str[0]) #根据下标将字符取出:我print(s
python 类属性实例属性_类属性和实例属性 weixin_39747615 python 类属性实例属性
类属性和实例属性下表列出了4个常见的明星人物：姓名年龄周润发58成龙55刘德华53周星驰54进行归纳总结：这些人物具有较高的知名度，把这些人物归类为明星。每个明星两个属性：姓名和年龄。明星这个群体具有一个属性：数量，在这张表格中，明星的数量是4。姓名和年龄等属性是用于描述具体的一个对象(例如：周润发)，而人物的数量是用于描述明星这个类别。如果使用面向对象技术对以上实体进行描述，周润发、成龙、刘德华
eclipse2017支持的Servlet的版本_jsp进阶（servlet篇） weixin_39814369
Servlet篇（jsp重点）@author:杜勇帅@email:820482874@qq.com-一.Servlet基础一.Servlet概述Servlet是运行在服务器端的java程序(类)，作用是接收并处理客户端的请求，生成响应给客户端。学习了Servlet后，jsp页面只负责展示数据，Servlet负责处理请求(调用Dao实现具体功能)，并将数据转发到jsp页面上去展示(生成响应给客户端)
HarmonyOS第一课第四章习题答案喊我小垚女鸿蒙 harmonyos 华为鸿蒙鸿蒙系统
应用程序框架基础判断题1.在基于Stage模型开发的应用项目中都存在一个app.json5配置文件、以及一个或多个module.json5配置文件。答案：对2.一个应用只可以包含一个UIAbility组件。答案：错误3.Background状态在UIAbility实例销毁时触发。可以在onDestroy()回调中进行系统资源的释放、数据的保存等操作。答案：错误单选题1.关于module.json5
java lambda表达式编译_什么是Java 8 Lambda表达式编译？我是一只萤火虫呀 java lambda表达式编译
参见英文答案>HowwillJavalambdafunctionsbecompiled?考虑下面的Java8代码段。publicstaticvoidmain(String[]args){Listintegers=Arrays.asList(1,2,3,4,5);Consumerconsumer=x->System.out.print(x);integers.forEach(consumer);}什
【ElasticSearch】踩坑对terms的buckets进行bucket_sort排序 Musecho java elasticsearch 数据分析数据结构 es
【ElasticSearch】踩坑对terms的buckets进行bucket_sort排序1.需求和实现选出可用性最高的前15个数据展示：先按照key_id.keyword进行url分组，然后子聚合算出可用性，再用bucket_sort对avail_perc排序，size取15。然后我觉得反正只要15个，terms的size也取了15。以下是实现的es语句GET/aaa/_search{"que
【ROS2】RViz2自定义面板插件（rviz_common::Panel）的详细步骤郭老二 ROS Qt ROS2
【ROS】郭老二博文之：ROS目录1、简述RViz2的插件基于ROS2的插件库（pluginlib）机制，通过动态加载共享库实现功能扩展。注意：RViz2使用QT作为UI框架，虽然QT也有插件机制，但是RViz2并没有使用QT的插件机制，而是通过pluginlib加载功能模块来实现。2、插件类型每个插件必须继承相应的基类，才能被RViz识别。RViz2中共有5类插件：插件类型基类Display（显
【常识】气体单位%Vol、ppm、%LEL 郭老二经验 ppm
1、%VOL%VOL：气体体积百分比如：5%VOL指的是特定气体在空气中的体积占5%。甲烷的爆炸下限是4%VOL2、ppmppm：气体体积百万分之一ppm和Vol的换算：1%Vol=10000ppm3、%LELLEL：气体爆炸下限，可燃气体在空气中能引爆的最低体积百分比浓度%LEL：爆炸下限百分比，即把爆炸下限分为一百份，一个单位为1%LELVOL和LEL的换算，要先找出该可燃气体的爆炸下限值是多
自动驾驶技术的未来趋势与挑战分析智能计算研究中心其他
内容概要自动驾驶技术自诞生以来经历了多个发展阶段。最初的研究集中在感知和控制系统的基础构建，随后进入了数据处理和算法的优化阶段，如今，随着人工智能和机器学习技术的快速应用，自动驾驶行业正处于一个前所未有的迅猛发展期。当前，行业内涌现出多种解决方案，各大汽车制造商与科技公司纷纷加大投入，推动这一领域的技术进步。市场需求不断增加，为自动驾驶技术注入活力。城市交通拥堵、环境污染等问题促使人们寻求更加智能
基于联邦学习的政务大数据平台应用研究宋罗世家技术屋计算机软件及理论发展专栏政务大数据
摘要当前数字政府建设已进入深水区，政务大数据平台作为数据底座支撑各类政务信息化应用，其隐私数据的安全性和合规性一直被业界广泛关注。联邦学习是一类解决数据孤岛的重要方法，基于联邦学习的政务一体化大数据平台应用具有较高的研究价值。首先，介绍政务大数据平台及联邦学习应用现状；然后，分析政务大数据平台面临的隐私数据的采集、分类分级、共享三大管理挑战；接着，阐述基于联邦学习的推荐算法和隐私集合求交技术的解决
线程同步CountDownLatch的使用初夏の猫 java 开发语言
CountDownLatch是Java中一个常用的同步工具类，主要用于协调多个线程的执行。它可以让一个或多个线程等待，直到其他线程执行完毕后才能继续。常见的使用场景是多个线程执行一些并行任务，主线程需要等待所有线程完成任务才能继续执行。基本概念：CountDownLatch类接受一个初始计数值，这个计数值通常是线程的数量。每个线程在完成其任务时调用countDown()方法将计数值减1，直到计数值
C++14新特性之lambda参数auto 画个逗号给明天" C++14新特性 c++开发语言
1.介绍在C++11中，lambda表达式参数需要使用具体的类型，例如：autof=[](inta){returna;}参数的类型为int。在C++14中对lambda表达式进行了优化，参数可以是auto,例如：autof=[](autoa){returna;};这使得lambda表达式更加的灵活，可以接收任意类型的参数，这一特性通常称为泛型lambda。2.使用场景（1）结合STL算法。#inc
编程题-在排序数组中查找元素的第一个和最后一个位置（中等） Kevin Kou 数据结构算法 c++二分查找
题目：给你一个按照非递减顺序排列的整数数组nums，和一个目标值target。请你找出给定目标值在数组中的开始位置和结束位置。如果数组中不存在目标值target，返回[-1,-1]。你必须设计并实现时间复杂度为O(logn)的算法解决此问题。解法一（二分查找）：直接遍历所有数组nums中元素时间复杂度为O(n)，没有利用到数组升序排列的条件。由于数组已经排序，因此整个数组是单调递增的，我们可以利用
es凌晨自己把索引删除了，包括es自己的索引小码农吗日常栏目 elasticsearch 大数据搜索引擎
如果Elasticsearch（ES）在凌晨自动删除了包括自身索引在内的大量索引，这是一个比较严重的问题，下面从多个方面分析可能的原因，并给出排查步骤与相应命令。可能的原因1.索引生命周期管理（ILM）策略ILM允许根据索引的年龄、大小等条件自动管理索引的生命周期，若策略配置不当，可能导致凌晨触发删除操作。2.磁盘压力触发清理当磁盘空间达到一定阈值，ES可能会自动删除一些索引以释放空间。3.自动快
2021-03-01-深入浅出解析jsp 热爱Java的程序猿后端 jsp servlet java
来历servlet的缺点导致jsp的产生JSP全称是JavaServerPagesjsp=html+js+Java+Tag用法servlet只负责响应请求产生数据，并把数据通过转发技术带给jsp，数据的显示交给jsp来做在长期的软件实践中，人们逐渐把servlet作为web应用中的控制器组件来使用，而把JSP技术作为数据显示模板来使用原理所有的jsp最后都编译成servlet,编译后的路径一般在t
LVS（Linux Virtual Server）概述 afei00123 Linux
目录1.LVS简介2.LVS的组成3.LVS负载均衡的三种包转发方式3.1NAT（网络地址映射）3.2IPTunneling（IP隧道）3.3DirectRouting（直接路由）4.LVS相关术语5.LVS-NAT模式工作原理6.LVS-DR模式工作原理7.LVS的负载调度算法1.LVS简介LVS（LinuxVirtualServer）即Linux虚拟服务器，是由章文嵩博士主导的开源负载均衡项目
小记 Java stream 中 peek() 神奏盛开 java lambda
peek函数：接受一个函数作为参数。这个函数会被应用到每个元素上，并将结果元素映射成一个新的元素。相比于类似foreach，更类似于lambda中的map函数。map函数：接受一个函数作为参数。这个函数会被应用到每个元素上，并将返回值映射成一个新的元素。简单来说，map函数就是对流对象（集合中的所有对象）进行操作并返回一个Stream对象，这个Object对象可以是源对象的类型，也可以是其他类型。
Tomcat Request Cookie 丢失问题 m0_74825447 面试学习路线阿里巴巴 tomcat firefox java
优质博文：IT-BLOG-CN一、问题描述生产环境偶尔(涉及到多线程处理)出现"前端传递`Cookie为空"的告警，导致前端请求丢失，出现请求失败问题。告警内容如下前端传递Cookie为空告警内容：服务端获取requestCookie为空，请尽快处理！！！AppId：xxxxxxip：xx.xx.xxx.xx告警事件：2024-03-15背景：为什么要加Cookie告警：项目出海，需要保证多语言，
HttpServletRequest 作用冰糖心158 2025 Java面试系列 Java 开发 java
HttpServletRequest接口在JavaServletAPI中扮演着至关重要的角色，它是Servlet处理客户端HTTP请求的核心对象。每次客户端（例如浏览器）向服务器发送一个HTTP请求时，Servlet容器（例如Tomcat）都会创建一个HttpServletRequest对象，并将客户端的请求数据封装在这个对象中，然后将这个对象传递给Servlet的service()方法（或者do
Java进阶之泛型 m0_74824483 面试学习路线阿里巴巴 java 开发语言
泛型(Generics)定义泛型：允许在定义类、接口和方法时使用类型参数，从而在编译时捕获类型错误，提高代码的类型安全性和复用性。主要用途类型安全：避免类型转换错误，编译时检查类型安全。代码复用：通过泛型可以编写通用的类和方法，适用于多种数据类型。消除强制类型转换：在使用泛型时，编译器会自动进行类型转换，减少代码中的强制类型转换。泛型的基本语法标记符T是类型参数，通常使用T、E、K、V等字母来表示
基于深度学习的半导体检测与预测算法研究(二) 埃菲尔铁塔_CV算法深度学习人工智能神经网络 opencv 计算机视觉 python
摘要随着半导体行业的飞速发展，对生产过程中的检测和性能预测提出了更高要求。深度学习凭借其强大的数据处理和特征提取能力，在半导体领域展现出巨大的应用潜力。本文详细探讨了深度学习在半导体缺陷检测、工艺参数预测等方面的应用原理和方法，介绍了常见的深度学习模型如卷积神经网络（CNN）、循环神经网络（RNN）及其变体在半导体数据处理中的应用，分析了模型训练与优化的关键技术，并通过实际案例验证了深度学习算法在
基于深度学习的半导体算法原理及应用埃菲尔铁塔_CV算法算法机器学习人工智能计算机视觉深度学习 python
摘要随着半导体产业的持续发展，深度学习技术在该领域的应用日益广泛且深入。本文全面阐述了基于深度学习的半导体算法原理，涵盖卷积神经网络（CNN）、循环神经网络（RNN）及其变体长短时记忆网络（LSTM）和门控循环单元（GRU）等在半导体制造过程监测、缺陷检测、性能预测等方面的应用。详细分析了这些算法处理半导体相关数据的机制，探讨了算法实现中的关键技术，如数据预处理、模型训练与优化等。通过实际案例展示
计算机视觉国内外研究现状（综述）埃菲尔铁塔_CV算法计算机视觉
1.国内外研究进展1.2.1特征提取研究进展特征提取是图像处理的一个重要环节，是进行身份识别和行为识别的重要部分。近年来，针对不同特征的提取，国内外学者提出了许多特征提取算法，同样特征提取的效果大都不错。但是在复杂的猪舍环境中提取猪的特征还是比较困难的。下面针对几种目前常用的特征提取算法进行一些介绍。（1）传统的特征提取算法传统特征提取算法已经发展了很久，现阶段比较成熟，是深度学习算法出来之前研究
ES java客户端中关于BucketSortPipelineAggregationBuilder的问题 Sunager ElasticSearch elasticsearch java
es聚合后进行分页（非标准分页，涉及到es底层的检索方式）es桶聚合后排序介绍见ES指南介绍//kibana对聚合后的数据GET/_search{"query":{"bool":{"filter":[{"match":{"question":"好的"}},{"range":{
SpringBoot Jwt令牌的使用（黑马javaweb) liuaiguo75 SpringBoot JAVA Idea spring boot 后端 java spring intellij-idea log4j mybatis
JWT概念JSONWebToken(JWT)是一种开放标准(RFC7519)，它定义了一种紧凑和自包含的方式，用于作为JSON对象在各方之间安全地传输信息。这个信息可以被验证和信任，因为它是数字签名的。JWTs可以使用秘密(使用HMAC算法)或使用RSA或ECDSA的公钥/私钥对进行签名。JWT作用1、授权2、信息交换JWT示例代码1、SpringBoot中引入JWTio.jsonwebtoken
3dgs 2025 学习笔记 AI算法网奇 3d渲染学习笔记
CVPR20243D方向总汇包含（3DGS、三维重建、深度补全、深度估计、全景定位、表面重建和特征匹配等）_cvpr2024-structure-awaresparse-viewx-ray3dreconstr-CSDN博客https://github.com/apple/ml-hugs3DGSCOLMAP-Free3DGaussianSplatting⭐codeprojectFeature3DGS
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他