All_In_gzx_cc

数据结构与算法（大数据存储）------bitmap位图详解

概述

王者有一段时间没玩了，待再次上线的时候，TM（天美）发来了一封邮件，亲爱的召唤师，欢迎回归王者荣耀，你已有88日没有登录过游戏，这是为你精心准备的回归大礼包，礼包是一些体验卡和砖石等。but作为一名程序猿，让楼主更在意的是88这个数字的统计方式。

我们知道王者荣耀用户数很多，假设有一亿用户，如何来记录用户的登录信息，如何来查询活跃用户（如一周内登录三次以上的），最常规的做法就是建一张用户登录信息表，有用户ID，有登录时间这样的，然后用户每登录一次就往表中插入一条数据，没毛病，那么假设一天之内有1亿用户登录，那么2天表中就会有2亿数据，这里会有很严重的问题，首先表中不可能承载这么多数据量，其次就算可以装得下这么多数据，那你怎么统计这么多数据的表？效率性能如何？所以在传统数据库存储层面是不好解决这个问题。

因此，我们不妨设置用一个1bit位来标识用户的登录状态，1/0,1是代表登录，0是代表没登录，那么可以建立如下的数字模型

假设有10个用户，统计一周之内用户的登录次数，模型假如是这样的

星期一：0000011111

星期二：1001011011

星期三：1001011111

星期四：1011000001

星期五：1001011001

横着来看：就标识着星期一这天后边5个用户登录了，前5个用户没登录，星期二1，4，6，7，9，10用户登录其余没有，其余同理，清晰可见。

竖着来看：就标识这同一个人一周之内的登录情况，比如第一个人，周二三五登录了游戏，二四就没有玩，其余同理，便于统计。

这里的数字模型可以是一个字符串或者是数组，这是简体思路。

下面进入主题，位图算法，了解一下！

数据库做持久化的时候，把数据做成数字模型这种形式来存储（比如只存用户ID），若有数据就标志为1或true，若无数据标志为0或false。

比如有一数字模型{5，2，1，2} 这里最大值为5，所以数组的长度就是5，而0到5中不存0，3，4数字

所以：Array[0]=0，Array[1]=1，Array[2]=2，Array[3]=0，Array[4]=0，Array[5]=1

数组模型如下：int[] ={0,1,2,0,0,1}

上面数中由于2有两个，所以只能用int存数组的值，不用boolean型，这样如果有多个同样的数字可以用值表示个数。如上面Array[2]=2，就表示2有2个。

又如：

假设我们有{0,6,3,4}这数组，在位图中数据结构初始化状态应该就是这样的，首先最大是6，那我们申请l大小为6的数组

通过位图算法处理后，得到的位图是这样的

这种算法的缺点在于,最大值和最小值之间不能相差太大，否则浪费申请数组的空间。（蛋士可以优化滴~）

实际应用：

判断一个数是否存在某数据中，假如有40亿数据，我们如何快速判断指定一个数是否存在？

申请512M的内存 512M=51210241024B*8=4294967296比特(bit) 这个空间可以装40亿了

一个bit位代表一个int值

读入40亿个数，设置相应的bit位

读入要查询的数，查看相应bit位是否为1，为1表示存在，为0表示不存在

判断整形数组是否重复

它的做法是按照集合中最大元素max创建一个长度为max+1的新数组，然后再次扫描原数组，遇到几就给新数组的第几位置上1，如遇到5就给新数组的第六个元素置1，这样下次再遇到5想置位时发现新数组的第六个元素已经是1了，这说明这次的数据肯定和以前的数据存在着重复。它的运算次数最坏的情况为2N。如果已知数组的最大值即能事先给新数组定长的话效率还能提高一倍。

给数组排序

首先遍历数组，得到数组的最大最小值，然后根据这个最大最小值来缩小bitmap的范围。这里需要注意对于int的负数，都要转化，而且取位的时候，数字要减去最小值。

给出JAVA代码

public class WeiTu {
    
    public static int[] bitmapSort(int[] arr) {
        // 找出数组中最值
        int max = arr[0];
        int min = max;
        
        for (int i : arr) {
            if (max < i) {
                max = i;
            }
            if (min > i) {
                min = i;
            }
        }
        //初始化位图数组大小
        int temp=0;//用于解决数组有负数的情况        
        int[] newArr=null;
        if(min<0){
            temp=0-min;
            newArr = new int[max - min + 1];
        }else{
            newArr = new int[max+1];
            min=0;
        }
                        
        //构建位图
        for(int i:arr){
            newArr[i+temp]++;//算法体现
        }
        // 重新调整arr数组中的元素
        int index = 0;
        for (int i = 0; i < newArr.length; i++) {
        // 位图是1的就输出，对数组排序
            while (newArr[i] > 0) {
                arr[index] = i + min;
                index++;
                newArr[i]--;
            }
        }
        return arr;
    }

    public static void main(String[] args) {
        int[] arr={5,2,3,7,1};
        //int[] arr={-5,2,-3,7,1};
        int[] arrsort=bitmapSort(arr);
        for(int i:arrsort)
        System.out.println(i);
    }

}

做交集和并集效率极高

举个例子：
有一位图0000101，代表喜欢吃苹果用户
另一位图0000111，代表喜欢吃西瓜用户

统计喜欢吃苹果或西瓜的用户，0000101|0000111=0000111

位图模型详解

有40亿个无符号的整型数据，现在给定一个目标数字，判断这个数字是否在这40亿数据中。题目看起来确实非常简单，有的同学说直接遍历一遍不就ok了吗？还有的同学给出了更高效的查找方式就是将这些数字排序然后进行二分查找。但是，这是有问题的，问题并不在于你搜索这个数字的效率问题，而是你在遍历也好排序也罢，这些数字在内存中放的下么？

一个整型int就是4个字节，10亿个int差不多已经需要4G的内存了，40亿个int就是16G。所以这里方法行不通的根本原因实际上是内存不够，但是我们今天的讲的位图却能很好的帮助我们处理这个问题。

既然根本原因是这些数据用int放不下，那么是否有更小的东西标记这些数字呢？没错，有的同学想到了，char只占一个字节或许能表示一个数字，但是随着数字位数的增多，依旧不可能使用一个字符表示一个数字，这就意味着小于4G内存还是不能解决这个问题。

其实说到这里，我们的问题就转化为如何使用更小的内存单元来标记一个数字，而在程序中我们最小的访问单位的bit位，所以现在我们一起来看使用比特位如何标记(映射)这些数据。

现在我们发现，4个字节本来只能存储一个int，而现在使用位图我们就存了(映射)32个数字，意味着16G/32约等于500m左右我们就能映射这些数据，那么这些数据是怎么映射到位图种的呢？接着看。

设计位图

为了方便，我们将位图用一个数组表示，让vector帮我们开辟一段连续的空间，我们只负责将数据设置或者移除就行。

1. 初始化

class BitMap
{
public:
	BitMap(size_t range)
	{
		//右移5位相当于除以32，加1是因为小于32的数字如果与32相除则得到0
		_bitTable.resize((range >> 5) + 1);//需要 （maxnum / 类型字节数）+ 1 的空间来存储
	}
	
private:
	vector<int> _bitTable;//下标代表每一段bit空间，_bitTable[i]的值代表这一段里面有没有表示数（0无，1有）
};

2. 位图元素的设置

	void SetBit(size_t x)
	{
		size_t index = x >> 5;
		size_t num = x % 32;
		//初始该段_bitTable[index]无数字，为全0；现放入x后，该段_bitTable[index]对应位置变成1，代表其中有数字。
		// 0 | 0 == 0，0 | 1 == 1，或运算，原本没数的位置还是0，放入数的位置变成1
		_bitTable[index] |= (1 << num);//该段中 第num位下标 表示的数 存在了，值置1，所以1左移num个
	}

来看看为什么需要size_t index = x >> 5和size_t num = x % 32两步操作：我们看看要映射5和32这俩个数

5表示放在第1个整型空间的第5位上，32则表示放在第2个整型空间第一位上。而**bitTable[index] |= (1 << num)**能保证把第num位上的数字设置为1，其余数字保持不变。

3. 位图元素的移除

比较简单，需要知道的是**~(1 << num)**表示出了num位为0，其余位都为1.

	void RemoveBit(size_t x)
	{
		size_t index = x >> 5;
		size_t num = x % 32;
		//1 & 0 == 0， 0 & 1 == 0 所以有数的位置1被移除变成0，其他没数的位置本来就是0，&也不会影响
		_bitTable[index] &= ~(1 << num);
	}

4.位图元素的查找

这个没啥好说的，很简单，说到这里，你的位图也就实现完了，非常简单把

bool TestBit(size_t x)
	{
		size_t index = x >> 5;
		size_t num = x % 32;
		//1 & 1 == 1， 0 & 1 == 0 表明bitmap中该位置有匹配数结果就为1，无匹配数结果为0
		return _bitTable[index] & (1 << num);
	}

完整代码实现

class BitMap
{
public:
	BitMap(size_t range)
	{
		_bitTable.resize((range >> 5) + 1);
	}

	//标识一个数字在位图中的位置
	void SetBit(size_t x)
	{
		size_t index = x >> 5;
		size_t num = x % 32;

		_bitTable[index] |= (1 << num);
	}

	//取消数字在位图当中的标识.
	void RemoveBit(size_t x)
	{
		size_t index = x >> 5;
		size_t num = x % 32;

		_bitTable[index] &= ~(1 << num);
	}


	bool TestBit(size_t x)
	{
		size_t index = x >> 5;
		size_t num = x % 32;

		return _bitTable[index] & (1 << num);
	}

private:
	vector<int> _bitTable;
};

拓展

现在将问题修改为让你寻找出40亿个数据中出现过两次的数据，此时我们就需要使用两位来标记同一个数据了。

N位位图的实现如下：

class NBitMap
{
public:
	NBitMap(size_t range)
	{
		_bitTable.resize((range >> 4) + 1);
	}

	void SetBit(size_t x)
	{
		size_t index = x >> 4;
		size_t num = x % 16;
		num *= 2;

		bool first = _bitTable[index] & (1 << num);
		bool second = _bitTable[index] & (1 << (num + 1));

		if (!(first && second))
		{
			_bitTable[index] += (1 << num);
		}
	}

	bool TestBit(size_t x)
	{
		size_t index = x >> 4;
		size_t num = x % 16;
		num *= 2;

		return (_bitTable[index] >> num) & 0x03;
	}

private:
	vector<int> _bitTable;
};

关于位图的讲解就到这里，现在我让你查找10亿个字符串中出现一次的那个字符串，有的同学丝毫不犹豫就要用我们使用的位图，但是仔细思考，我们这里的位图只是可以映射数字类型的数据，变成字符串以及其他文件好像就不再那么得心应手了，别急，聪明的大佬们又想到了一种骚东西叫做布隆过滤器，那么布隆过滤器是什么呢？请看下篇博客哦。

转载自：https://blog.csdn.net/lucky52529/article/details/90172264
https://www.cnblogs.com/zhuoqingsen/p/9214709.html

你可能感兴趣的:(【算法与数据结构】,bitmap,算法,数据结构)

基于图像处理的裂缝宽度检测系统-matlab 人工智能专属驿站计算机视觉图像处理人工智能
图像处理技术广泛地应用于桥梁、房屋、道路等工程施工中出现的表面裂缝,利用数字图像处理技术来测量结构物表面裂缝宽度是一种无损检测方法.基于图像处理的裂缝宽度检测系统需采用的图像处理算法有:（1）读取裂缝图像；（2）图像转化为灰度图像；（3）图像的增强；（4）平滑滤波；（5）阈值分割；（6）形态学去噪；（7）边缘检测(Canny算子)；（8）边缘坐标点的提取；结果见：源程序见：基于图像处理的裂缝宽度检
0基础Deepseek-AI编程课程 2501_90533339 AI编程人工智能
这个0基础Deepseek-AI编程班课程，专门为没有编程经验的学员设计，涵盖了AI编程的基础知识，并深入讲解算法类工具的设计思维，让学员掌握AI编程的核心技能，最终能够独立开发AI工具。课程亮点✅从零开始：即使是0基础的小白，也能快速入门AI编程，掌握核心概念。✅实战驱动：课程不仅仅讲解理论，更会带领学员动手实操，设计属于自己的AI工具。✅深入AI算法：掌握AI编程的逻辑，理解如何构建和优化AI
ORB-SLAM3源码的学习：GeometricTools文件 PaLu-LvL 计算机视觉 #ORB-SLAM3 c++计算机视觉 ubuntu 人工智能学习
前言GeometricTools提供了两种几何计算功能：1.计算两个关键帧之间的基础矩阵、2.通过三角化算法从两个视角恢复三维点。这部分功能在ORB-SLAM2中就已经介绍过了，这里不过多赘述。1.头文件GeometricTools.h除了计算基础矩阵和三角化恢复三维点外，头文件中还提供了两种用于比较矩阵的模板函数。第一个函数用于比较一个OpenCV矩阵和一个Eigen矩阵，第二个函数用于比较两个
tar 压缩算法对比与实践指南 tar压缩效率linux建议
在Linux系统管理和开发过程中，文件压缩打包是一项常见的需求。tar作为最常用的归档工具，支持多种压缩算法，不同算法之间在压缩比、压缩速度和解压速度等方面各有特点。本文将深入分析各种压缩算法的性能特征，并提供实用的选择建议。压缩算法性能对比我们选择了五种常用的压缩方式进行测试，包括：原始tar（无压缩）gzip压缩（tar.gz）xz压缩（tar.xz）zstd压缩（tar.zst）lz4压缩（
数据结构：图（存储结构：邻接矩阵，邻接表）成分复杂选手数据结构 c++visual studio code
图的概念图是由两个集合V和E组成，记为G=(V,E)，其中V是顶点的有穷非空集合，E是V中顶点偶对的有穷集合，这些顶点偶对称为边。图可分为有向图和无向图，有向图中顶点对是有序的，每条边都有起点和终点，称为从Vi到Vj的一条有向边；无向图的顶点对是无序的。图的存储结构图的存储结构有主要有邻接矩阵、邻接表、十字链表和邻接多重表，这里介绍邻接矩阵和邻接表两种方法。邻接矩阵表示法：邻接矩阵使用一个二维数组
朴素贝叶斯模型在文本分类中的应用 Ash Butterfield nlp 分类数据挖掘人工智能
朴素贝叶斯（NaiveBayes）是一种基于贝叶斯定理的概率分类算法，广泛应用于文本分类任务中。它的核心思想是根据训练数据中不同类别的条件概率，预测新文本属于哪个类别。尽管其假设条件较为简单（假设特征之间相互独立），但朴素贝叶斯在许多实际应用中仍表现出色，特别是在处理文本分类任务时。本文将介绍朴素贝叶斯模型的基本原理、在文本分类中的应用以及其优缺点，并通过示例说明其具体实现。1.朴素贝叶斯模型的基
【数据结构基础_链表】 WIN赢数据结构基础数据结构链表
1、链表的定义链表与数组的区分：数组是一块连续的内存空间，有了这块内存空间的首地址，就能直接通过索引计算出任意位置的元素地址。数组最大的优势是支持通过索引快速访问元素，而链表就不支持。链表不一样，一条链表并不需要一整块连续的内存空间存储元素。链表的元素可以分散在内存空间的天涯海角，通过每个节点上的next,prev指针，将零散的内存块串联起来形成一个链式结构。1）这样可以提高内存的利用效率，链表的
量子计算信息安全威胁与应对岛屿旅人网络安全行业分析量子计算 web安全人工智能安全网络网络安全
文章目录前言一、量子计算信息安全威胁及影响1.2量子计算发展迅速，安全威胁日益迫近二、PQC研究与应用进展2.1欧美在PQC领域研究近三十年，积累深厚2.2NIST引领PQC标准制定，取得初步成果2.3美国全方位布局加快推动PQC迁移与应用三、PQC应用发展前景3.1PQC算法和应用安全性需进一步验证3.2PQC算法国际标准将持续开展研究3.3PQC升级迁移是一项长期系统性工程四、QKD技术优劣势
机器学习 - 学习线性模型的重要性谦亨有终跟着AI向前走机器学习学习人工智能
在接下来的博文中，我们将重点学习线性模型的回归模型和分类模型，在学习之前，让我们来了解一下学习线性模型的重要性，以及如何入门学习。一、作为初学者如何学习线性模型？作为初学者，要高效学习机器学习以及其中的线性模型，可以遵循以下几个步骤和建议：（一）、机器学习的整体学习策略打好数学基础线性代数：理解向量、矩阵、线性变换等，这些是理解模型表示（如y=w^Tx+b）和算法优化的基础。微积分：掌握导数、梯度
数据结构：利用邻接矩阵构造图及图的输出c++ Belieber53 c++数据结构算法
输入：请输入顶点数及弧数请按照（顶点，顶点，权值）格式输入各边依附的顶点及权值输出：图的结构如下，用邻接矩阵输出#include#include#include#defineINFINITYINT_MAX//最大值#defineMAX_VERTEX_NUM20//最大顶点个数#defineFALSE0#defineTRUE1#defineOK1#defineERROR-2#defineOVERFL
数据结构：图；邻接矩阵和邻接表 muxue178 数据结构算法
邻接矩阵：1.概念：邻接矩阵是图的存储结构之一，通过二维数组表示顶点间的连接关系。2.具体例子：一.无向图邻接矩阵示例：示例图（顶点：A、B、C，边：A-B、B-C）：邻接矩阵：ABCA010B101C010特点：矩阵对称，主对角线为0（无自环边）。顶点B的度为2，对应第2行/列非零元素数量。非零元素总数=边数×2（无向图双向性）。二、有向图邻接矩阵示例示例图（顶点：V1→V2、V2→V3、V3→
算法基础1.3：双指针，位运算，离散化，区间合并 sunluyang521 算法基础算法
双指针for(inti=0,j=0;iusingnamespacestd;constintN=100010;intn;intq[N],s[N];//s存的是当前j到i这个区间里面每一个数出现的次数。intmain(){scanf("%d",&n);for(inti=0;i1)s[q[j++]]--;//有重复的数，把它拿出去，表示这个数减1res=max(res,i-j+1);//更新答案}cou
常见数据结构的简介（基本概念 & 操作 & 时间复杂度）子诚之编程
文章目录0.概览1.线性表、栈和队列2.数组2.1基本操作1)时间复杂度2)案例3.字符串3.1存储结构3.2基本操作1)时间复杂度2)案例：最大公共字符串4.二叉树4.1储存结构4.2基本操作1)时间复杂度2)案例：使用字典树判断字符串是否存在5.哈希/散列表5.1哈希函数5.2基本操作1)时间复杂度2)案例：构建哈希表《重学数据结构与算法》学习笔记0.概览数据结构增删查特点线性表变长栈队列数组
常见解题方法（位运算、双指针、前缀和） wibkb java 排序算法快速排序
目录位运算双指针前缀和对于自己刷题过程中遇到的一些常见简单解题方法进行了一个总结：数组在数据结构中是线性表的一种，在算法题中常常以整数数组和字符串等形式展现，其实数组中包含有更多的数据类型，这一段主要说明整数数组的一些常见问题解法；数组的一个特点，可以通过下标对于数据进行一个快速访问，即a[i]=xx；位运算本质上应该算在数学系算法的一大类，通过数组中的各个数进行一个位运算来获得最终的结果。位运算
Python随机森林算法详解与案例实现闲人编程 python 算法 python 随机森林数据分析人工智能
目录Python随机森林算法详解与案例实现1、随机森林算法概述2、随机森林的原理3、实现步骤4、分类案例：使用随机森林预测鸢尾花品种4.1数据集介绍4.2代码实现4.3代码解释4.4运行结果5、回归案例：使用随机森林预测波士顿房价5.1数据集介绍5.2代码实现5.3代码解释5.4运行结果6、随机森林的优缺点7、改进方向8、应用场景9、总结Python随机森林算法详解与案例实现1、随机森林算法概述随
Python 循环神经网络（RNN）算法详解与应用案例闲人编程 python python rnn 算法循环神经网络深度学习文本生成
目录Python循环神经网络（RNN）算法详解与应用案例引言一、RNN的基本原理1.1RNN的结构1.2RNN的优势与挑战二、Python中RNN的面向对象实现2.1`RNNCell`类的实现2.2`RNNModel`类的实现2.3`Trainer`类的实现三、案例分析3.1序列预测3.1.1数据准备3.1.2模型训练3.1.3结果分析3.2文本生成3.2.1数据准备3.2.2模型训练3.2.3文
基于深度学习YOLOv10的PCB板缺陷检测系统（附完整资源+PySide6界面+训练代码）人工智能_SYBH 深度学习 YOLO 人工智能目标检测 python
引言：在现代制造业中，电子元件和PCB（印刷电路板）是非常重要的基础设施。PCB缺陷检测是生产过程中至关重要的一步。传统的缺陷检测方法主要依靠人工检查，这不仅效率低，而且容易受到人眼疲劳的影响。随着深度学习技术的不断发展，基于深度学习的自动化缺陷检测已成为研究的热点，尤其是在计算机视觉领域。YOLO（YouOnlyLookOnce）系列算法凭借其高速和高精度的优势，成为了目标检测领域的佼佼者。本文
【蓝桥杯C/C++】彻底理解双指针算法不会喷火的小火龙 #蓝桥杯算法与数据结构算法数据结构 c++
目录学习目标什么是双指针？双指针的分类核心思想模板写法经典例题移除元素双指针法分析题意具体代码最长连续不重复子序列输入格式输出格式数据范围输入样例：输出样例：核心思路数组元素的目标和输入格式输出格式数据范围输入样例：输出样例：核心思路总结一下学习目标了解双指针算法是什么以及分类理解双指针算法的原理会用代码编写双指针算法在实际题目中灵活运用双指针在数组的开章中我们提到了这个算法，如果没有看的话可以学
C++自研游戏引擎-碰撞检测组件-八叉树AABB检测算法实现千年奇葩三维引擎 c++人工智能算法八叉树
八叉树碰撞检测是一种在三维空间中高效处理物体碰撞检测的算法，其原理可以类比为一个管理三维空间物体的智能系统。这个示例包含两个部分：八叉树部分用于宏观检测，AABB用于微观检测。AABB可以更换为均值或节点检测来提高检测精度。八叉树的构建确定根节点范围首先要为整个碰撞检测系统确定一个初始范围，这就像是为所有参与碰撞检测的物体划定一个“活动区域”。这个范围是一个能够完全容纳所有待检测物体的三维立方体空
数字内容体验未来趋势：五大平台横向对比与深度解析清风徐徐de来其他
内容概要当前，企业数字化转型的核心战场正逐步向数字内容体验的精细化运营转移。随着用户行为碎片化与需求多元化趋势加剧，AI驱动的智能推荐系统、基于数据决策的动态优化能力，以及跨渠道的品牌一致性维护，已成为衡量内容平台竞争力的三大核心维度。本文将围绕这三大支柱，通过横向对比主流平台的技术架构与落地实践，揭示未来数字内容体验的演进方向。首先，AI驱动不仅改变了内容分发的效率，更通过深度学习算法实现用户行
共享内存的数据结构 ——循环队列+信息量 ——互斥锁、多进程的消费者模型源码模型测试代码 C++ sevenysq 数据结构 c++centos linux
前言：简单来说，共享内存不能自动扩展，申请多少就是多少，而且只能用C++内置的数据类型。也不能用STL容器，例如vector会自动扩展，容易造成内存泄漏，越界等问题。移动语义也不能用。要想实现多进程的生产/消费者模型只能采用循环队列。循环队列类值得一提的是这里面头尾指针的移动算法：（指针+1）取最大长度的余数。其他都很简单。#include#include#include#include#incl
众英达赏聘：人才与机会的完美交汇点 xjxijd 招聘
在信息化高速发展的今天，无论是企业还是求职者，都渴望能够在一个高效、便捷、精准的平台上找到彼此。众英达赏聘，正是这样一个致力于连接人才与机会的综合性招聘平台。众英达赏聘凭借其独特的算法和精准匹配技术，能够迅速分析用户的需求和特点，为企业和求职者提供个性化的推荐服务。无论是正在寻找优秀团队的企业，还是正在寻找理想工作岗位的求职者，都能在众英达赏聘上找到满意的选择。一个以企业招聘为主并融合本地生活出行
【Elasticsearch】`nested`字段和`join`字段的区别 risc123456 Elasticsearch elasticsearch
`nested`字段和`join`字段都是Elasticsearch中用于处理复杂数据结构的高级数据类型，但它们在设计目标、使用场景和实现方式上存在显著差异。以下是它们的主要区别：---1.设计目标•`nested`字段：•目标：用于处理单个文档中的嵌套数组，将数组中的每个对象独立索引，使其可以独立于其他对象进行查询。•场景：适用于需要在数组中独立查询每个对象的场景，例如博客文章中的评论、订单中的
算法刷题--哈希表--字母异位词和两个数组的交集 Bruce Jue LeetCode刷题算法散列表哈希算法
哈希表概念哈希表是根据关键码的值而直接进行访问的数据结构。直白来讲数组就是一种哈希表。那么哈希表能解决什么问题呢，一般哈希表都是用来快速判断一个元素是否出现集合里。那么一般都是将一个集合里面的元素映射为哈希表的索引。那么设计哈希表的时候需要考虑以下原则：均匀性，尽可能让不同key均匀分布到哈希表中；高效性；覆盖性，确保所有key都能映射到哈希表范围内。当多个元素映射到同一个索引时，这种现象叫做哈希
Py的Pandas：Python pandas库的详细介绍、安装和使用方法追逐程序梦想者 pandas python 数据分析
Py的Pandas：Pythonpandas库的详细介绍、安装和使用方法Pandas是一个Python的数据处理库，它提供了快速、灵活、易用且高效的数据结构来进行数据操作。在数据挖掘、数据分析等领域中，Pandas被广泛应用。本文主要介绍Pandas的安装、基本数据结构、数据读写、数据统计以及数据可视化等方面。安装在命令行中使用pip工具安装Pandas：pipinstallpandas基本数据结
【合集】Java进阶——Java深入学习的笔记汇总 & 再论面向对象、数据结构和算法、JVM底层、多线程、类加载、 web_15534274656 面试学习路线阿里巴巴 java 学习笔记
前言spring作为主流的JavaWeb开发的开源框架，是Java世界最为成功的框架，持续不断深入认识spring框架是Java程序员不变的追求；而spring的底层其实就是Java，因此，深入学习Spring和深入学习Java是硬币的正反面，两者相辅相成，相互促进。本篇博客是一篇不定期持续更新的博客，是一些Java深入学习的笔记汇总。目录前言面向对象专题再论面向对象封装和关键字private，t
深度优先搜索DFS 顾北辰20 Java数据结构算法数据结构 java
目录类`GraphDFS`的定义深度优先搜索方法`dfs`访问顺序的获取`order`深度优先搜索（DFS,Depth-FirstSearch）算法。深度优先搜索是一种用于遍历或搜索树或图的算法，其特点是从某个起始顶点出发，首先访问这个顶点，然后递归地访问与这个顶点直接相连的一个未访问过的顶点，再从这个顶点出发，继续访问它的未访问过的邻接顶点，如此重复，直到不能再深入为止，再回溯，直到所有能到达的
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【前缀和】2024E-分割数组的最大差值【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #前缀和 java c++c语言华为od javascript 算法 python
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例输入输出说明解题思路代码pythonjavaC++CNodejavaScriptGo时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024E+D卷最全真题【完全原创题解|详细考点分类|不断更新
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【排序】2024E-热点网站统计【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #模拟 java c++c语言华为od golang 算法 leetcode
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例一输入输出示例二输入输出解题思路代码pythonjavacppCNodejavaScriptGo时空复杂度华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD机考】2024E+D卷最全真题【完全原创题解|详细考点分
【Py/Java/C++/C/JS/Go六种语言OD独家2024E卷真题】20天拿下华为OD笔试之【前缀和】2024E-环中最长子串2【欧弟算法】全网注释最详细分类最全的华为OD真题题解闭着眼睛学算法最新华为OD真题 #前缀和 #哈希表算法 java c++leetcode javascript c语言华为od
可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳oj1441了解算法冲刺训练（备注【CSDN】否则不通过）文章目录相关推荐阅读题目描述与示例题目描述输入描述输出描述示例输入输出说明解题思路考虑非环字符串通过前缀确定任意连续字串的情况只考奇偶性而非具体数量三个差值均为偶数的情况将奇偶性状态压缩为数字状态压缩为后的前缀和数组的构建根据前缀和数组找到最长子字符串考虑环形字符串原字符串自身拼接储存下标
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他