Mr-Hunter

【数据结构】位图与布隆过滤器

一、位图：

由题引入：

【问题】：给40亿个不重复的无符号整数，没排过序。给一个无符号整数，如何快速判断一个数是否在这40亿个数中。

如果将40亿个数按整型放入内存，显然不科学，就算内存足够，这样做也是浪费空间；排序也一样，存不下；如果用搜索树当然更不行，一个节点有左右孩子，数等，比16G还大,哈希桶也存不下，有一个指针，和数据。这时我们想到直接定址法的哈希，但是直接定地址法的哈希要开整形最大值那么大的整形的空间。42亿九千万个整形大概也就是16G多，存不下，但是我们想到只让判断这个数在或者不在两种状态，用一个比特位就可以表示，没有必要开一个整形，这样就不需要16G,只需16G/4/8=500M，这时我们的内存就可以存下，这就是所说的位图。

【解决思路】：用一个比特位表示一个数，存在的话该位上就置为1，不在的话置为0；这样40亿个数需要40亿个比特位，换算一下也就是500M，相对于16G来说，大大节省了空间。

注意：位图也是一种直接定址法的哈希。本质是用一个数组，但是用一个比特位来表示一种状态，0表示不存在，1表示存在。当然只适合判断，查找整形数据是否存在，且只能对整数进行处理。

【参考代码】：


typedef struct BitMapNode
{
	char* bit; //指向N位组成的空间
	size_t N; //总的位数
}BitMap;


//位图初始化
void BitMapInit(BitMap* pbm, size_t len)
{
	assert(pbm);
	//加一为了使得在为某数寻址时，统一，即向上取整
	// 假如len为25,25/8=4，但是要5个字节才能存的下
	pbm->bit = (char*)malloc(((len>>3)+1));
	assert(pbm->bit);
	memset(pbm->bit,0, sizeof((len>>3)+1));
	pbm->N = len;

}
//位图销毁
void BitMapDestroy(BitMap* pbm)
{
	assert(pbm);
	free(pbm->bit);
	pbm->bit = NULL;
	pbm->N = 0;
	printf("销毁成功\n");
}

//位图
void BitMapSet(BitMap* pbm, int x)
{
	assert(pbm);
	int index = x >> 3;
	int num = x % 8;
	pbm->bit[index] |= (1<<num);
}
void BitMapReset(BitMap* pbm, int x)
{
	assert(pbm);
	int index = x >> 3;
	int num = x % 8;
	pbm->bit[index] &= ~(1<<num);
}

int BitMapTest(BitMap* pbm, int x)
{
	assert(pbm);
	int index = x >> 3;
	int num = x % 8;
	return (pbm->bit[index]&(1<<num)) == 1;
}
void TestBitMap()
{
	BitMap bm;
	BitMapInit(&bm,10);
	BitMapSet(&bm,78);
	BitMapSet(&bm, 99);
	BitMapSet(&bm, 55);
	BitMapSet(&bm, 76);

	BitMapSet(&bm,12);
	printf("  %d    ",BitMapTest(&bm,99));

	BitMapReset(&bm,78);
	printf("   %d    ",BitMapTest(&bm,78));

	BitMapDestroy(&bm);
}

优点：（1）相对来说节省了不少空间。当需要处理的数量级较大时，这个优点显露无疑。（2）查找、删除效率高。位图只是在创建的时候开辟空间消耗时间，但是当位图创建完成后查找、删除只需一步操作。
缺点： 不能判断字符串是否存在

【问题】给定100亿个数据，找到只出现一次的整数

【解决思路】：

（ 100亿整数需要多少内存呢？一个整数4个字节，100亿个整数400亿个字节，1G是10^9个字节，那么400亿个字节就是大约40G的内存，我们根本没有这么大的内存，所以只能另想办法了。

【解决方法】：

解决方法一：
1.将100亿个整数切分成100份，每份大约500MB
2.将每一份加载到内存中放在一个哈希表中，通过哈希表找出只出现一次的数
3.将100份中所有只出现一次的数合并在一起
解决方法二：
利用位图，所谓的位图，是利用一个bit 位来保存一个数据的状态，该数据在，则用1表示，不在，则用0表示。这里有100亿个数据，如果按照一个比特位来保存数据的话，需要512M空间的大小。而这里要统计数据出现的次数，我们知道，数据可能出现0次，可能出现1次，也可能出现多次，那么我们可以用两个比特位来表示数据存储的次数，即00表示0次，01表示出现1次，10表示数据出现多次，11则不表示任何状态，也就需要1G大小的内存空间，刚好够使用。这样我们利用位图就可以找到出现一次的整数。时间复杂度为O（n),空间复杂度为O（1);

二、布隆过滤器

【问题】在40亿个字符串集合中，快速判断一个字符串在或者不在？

这个题我们也可以用位图，可是这是字符串又不是整数，我们可以把字符串通过在字符串哈希转换为整数。可是这时候会产生哈希冲突，会产生误判，一个数明明没在，却判断为在，于是我们可以将一个元素经过不同的哈希函数，映射到多个位置，如果这几个位置上都为1，我们就认为这个元素存在，如果有一个位为0，就表示不存在。这就是所谓的布隆。

布隆：是位图+字符串哈希的结合。基本思想是：通过一个哈希函数将一个元素映射到一个位置，我们只要判断这个位置是不是存在，就能判断是否存在，但是由于哈希冲突的原因，不同的元素经过哈希函数会映射到相同的哈希地址，导致误判，为了缓解误判，我们将一个元素经过多个散列函数映射到多个位置上，如果这多个位都存在，我们认为存在，如果有一个位不存在，则不存在。

注意：布隆过滤器是存在不准确，不存在准确。

【参考代码】：


 
typedef char* DataType;
typedef struct BloomFilterNode
{
	BitMap Bloom;
}BloomFilter;

//哈希函数1
int HashFunc1(DataType x)
{
	int index = 0;
	int *p = x;
	while (*p)
	{
		index = index * 131 + *p;
		p++;
	}
	return index;
}
//哈希函数2
int HashFunc2(DataType x)
{
	int index = 0;
	int *p = x;
	while (*p)
	{
		index = index * 1331 + *p;
		p++;
	}
	return index;
}

//哈希函数3
int HashFunc3(DataType x)
{
	int index = 0;
	int *p = x;
	while (*p)
	{
		index = index * 13322 + *p;
		p++;
	}
	return index;
}




//布隆过滤器初始化
void BloomFilterInit(BloomFilter* bf, size_t len)
{
	assert(bf);
	BitMapInit(&bf->Bloom, len * 5);

}
//布隆过滤器销毁
void BloomFilterDestroy(BloomFilter* bf)
{
	assert(bf);
	BitMapDestroy(&bf->Bloom);
}


//布隆过滤器计数
void BloomFilterSet(BloomFilter* bf, DataType x)
{
	assert(bf);

	int hash1 = HashFunc1(x) % bf->Bloom.N;
	int hash2 = HashFunc2(x) % bf->Bloom.N;
	int hash3 = HashFunc3(x) % bf->Bloom.N;

	BitMapSet(&bf->Bloom, hash1);
	BitMapSet(&bf->Bloom, hash2);
	BitMapSet(&bf->Bloom, hash3);

}
//布隆过滤器重置
void BloomFilteReset(BloomFilter* bf, DataType x);	//不支持
//布隆过滤器测试
int BloomFilterTest(BloomFilter* bf, DataType x)
{
	assert(bf);
	int hash1 = HashFunc1(x) % bf->Bloom.N;
	if (BitMapTest(&bf->Bloom, hash1) == 0)
	{
		return 0;
	}
	int hash2 = HashFunc2(x) % bf->Bloom.N;
	if (BitMapTest(&bf->Bloom, hash2) == 0)

	{
		return 0;
	}
	int hash3 = HashFunc3(x) % bf->Bloom.N;
	if (BitMapTest(&bf->Bloom, hash3) == 0)
	{
		return 0;
	}

	return 1;//这是不确定的 
}

//测试
void TestBloomFilter()
{
	BloomFilter bf;
	BloomFilterInit(&bf, 10);

	BloomFilterSet(&bf, "scadcascs");
	BloomFilterSet(&bf, "school");
	BloomFilterSet(&bf, "urlur");
	BloomFilterSet(&bf, "sort");

	printf("%d\n", BloomFilterTest(&bf, "sdsd"));
	printf("%d\n", BloomFilterTest(&bf, "school"));
	printf("%d\n", BloomFilterTest(&bf, "sort"));

	BloomFilterDestroy(&bf);
}

优点:

相比于其它的数据结构，布隆过滤器在空间和时间方面都有巨大的优势。布隆过滤器存储空间和插入/查询时间都是常数；另外, Hash 函数相互之间没有关系，方便由硬件并行实现；布隆过滤器不需要存储元素本身，在某些对保密要求非常严格的场合有优势；布隆过滤器可以表示全集，其它任何数据结构都不能.

缺点:

布隆过滤器的缺点和优点一样明显。误算率是其中之一。随着存入的元素数量增加，误算率随之增加。但是如果元素数量太少，则使用散列表足矣。另外，一般情况下不能从布隆过滤器中删除元素。我们很容易想到把位列阵变成整数数组，每插入一个元素相应的计数器加1, 这样删除元素时将计数器减掉就可以了。然而要保证安全的删除元素并非如此简单。首先我们必须保证删除的元素的确在布隆过滤器里面。这一点单凭这个过滤器是无法保证的。另外计数器回绕也会造成问题。

【问题一】怎样降低误判的概率？

答：多个哈希函数进行映射

【问题二】有一份黑名单，为了降低冲突的可能性，我们需要看某个记录是否在黑名单中？

【解决方法】：

首先布隆过滤器底层搭载的是位图，但是有不同的哈希函数。
先将记录转化为整型数字，假设有5种不同的方式，即用5个比特位来表示是否有这个人，此时冲突的概率会大大降低。若5个bit为全为1，则这个人有可能在黑名单中，若有一个为0，则这个人一定不在黑名单中。
布隆过滤器判断不存在一定是准确的，但是判断存在可能不准确。

三、大数据处理问题

1.给一个超过100G大小的log file, log中存着IP地址, 设计算法找到出现次数最多的IP地址？!
2.与上题条件相同，如何找到top K的IP？如何直接用Linux系统命令实现？!
3.给定100亿个整数，设计算法找到只出现一次的整数!
4.给两个文件，分别有100亿个整数，我们只有1G内存，如何找到两个文件交集!
5.1个文件有100亿个int，1G内存，设计算法找到出现次数不超过2次的所有整数!
6.给两个文件，分别有100亿个url，我们只有1G内存，如何找到两个文件交集？分别给出精确算法和近似算法!
7.如何扩展BloomFilter使得它支持删除元素的操作？如何扩展BloomFilter使得它支持计数操作？!
8.给上千个文件，每个文件大小为1K—100M。给n个词，设计算法对每个词找到所有包含它文件，你只有100K内存!
9.有一个词典，包含N个英文单词，现在任意给一个字符串，设计算法找出包含这个字符串的所有英文单词!

第1题、给一个超过100G大小的log file, log中存着IP地址, 设计算法找到出现次数最多的IP地址

这是一个大小为100G的一个日志文件，主要问题就是一般的计算机内存肯定放不下；第一个想到的办法就是切分，把100G的文件切成100份，然后把这100个文件当作是大小为100的哈希表，而每份只有1G的大小，就可以依次读入内存进行处理。题目要求是：找到出现次数最多的IP地址，那么文件中肯定存在大量的相同IP地址，思路是让相同的IP存入同一文件，这时又要用到哈希字符串函数，就是上面布隆过滤器用到的转换函数，由相同的IP转换得到的key值一定相同，然后根据index = key%100决定存在于哪一个文件中，而相同的IP也就进入了同一个文件。

然后对单个文件进行处理，找出这个文件中出现次数最多的IP，以IP为key值，value记录出现的次数，用key_value结构的搜索树就可以很快找出来，然后用MAX记录下来，读入下一个文件，然后比较MAX值，遇到更大的就更新,最后得到的MAX就是这个100G文件中出现次数最多的IP地址。
这个题目中的重点思想就是哈希切分。

第2题、一个超过100G大小的log file, 存着IP地址，找到top K的IP。如何直接用Linux系统命令实现？

这一题条件同上一题，不同的是由求次数最多的一个改为求次数最多的前K个。思路同上题，哈希切分然后用堆排序，还是以IP为key值，然后统计各个文件中每个IP出现的次数（方法同第一题，也就是说每个文件建一颗搜索树），然后取其中的K个（key_value结构）结点以次数建一个最小堆；然后将其余的节点依次与堆顶节点比较，如果大于堆顶节点，与其一换，交换之后对堆进行一次向下调整，保证堆顶元素仍是堆中最小，直到所有IP都比较完。然后堆中的就是top K个IP了。

这题是个典型的top K问题，重点是建小堆，然后交换堆顶元素。

第3题、给定100亿个整数，找到只出现一次的整数

与上面同样的一个问题是100亿整数这样一个庞大的数字，大约是35G的大小。但是整数能表示的最大范围也就是2的32次方那么大约就是16G的大小，那么剩下的就都是重复的数，这道题没有规定死内存大小，但是16G还是比较大，浪费内存资源，如何继续缩小内存，还是利用位图思想。与前例腾讯笔试题不同的是，这里需要区分更多的状态，我们需要表示的状态有：00不存在， 01出现一次，10出现多次（>=2次），11不表示。也就是说我们需要用两个比特位来表示一个数的状态，然后遍历一遍位图找到状态为01的数，就是只出现一次的整数。

这个题重点是两个比特位的位图思想。

第4题、两个文件，分别有100亿个整数，我们只有1G内存，找到两个文件的交集

此题初始思路同上，建立位图，不在赘述，这里主要讲求交集。可以对其中一个文件建立位图，然后从另一个文件中依次取数据，判断是否在位图中。数据判断完存在的即为交集。另一种思路，如果这里还有1G的内存的话，可以给两个文件分别键位图，然后比较对应的数据位。

第二种方法是哈希切分，将两个文件都切分为1000小份，每个文件的大小就几十兆的样子，分别对两个对文件里的整数进行哈希分配，即将所有整数模除1000，使相同的数进入相同的文件，然后分别拿A哈希切分好的第一个文件和B哈希切分好的第一个文件对比，找出交集存到一个新文件中，依次类推，直到2000个文件互相比较完。

这个题重点是位图思想和哈希切分。

第5题、1个文件有100亿个int，1G内存，找到出现次数不超过2次的所有整数

这个题思路同第三题，用两个比特位表示的位图，我们需要表示的状态有：00不存在， 01出现1次，10出现2次，11出现多次（>2次）。

这个题重点也是两个比特位的位图思想。

第6题、两个文件，分别有100亿个url，我们只有1G内存，找到两个文件交集，分别给出精确算法和近似算法。

与第四题类似只是这里存的是URL，所以要用布隆过滤器。近似算法是，将一个文件内容存到布隆过滤器中，方法如上面介绍的布隆过滤器中的一样，然后从另一个文件中一个个的取URL判断是否在布隆中存在的就是交集。为什么布隆过滤器是近似算法，是因为它的不存在是确定的，存在是不确定的，即一个字符串对应5个位，如果有一个位为0，则这字符串肯定不存在，如果一个字符串对应的5个位都为1，但是这个字符串却不一定存在，因为可能这5个位都是被其它字符串的对应位置为1的，这就是其中的哈希冲突问题。

精确算法同第四题的方法二，哈希切分。

第7题、扩展BloomFilter使得它支持删除元素的操作或支持计数操作

因为布隆过滤器的一个Key对应多个位，所以如果要删除的话，就会有些麻烦，不能单纯的将对应位全部置为0，因为可能还有其它key对应这些位，所以，需要对每一个位进行引用计数，以实现删除的操作。因为需要每一个对应位都需要一个计数，所以每一位至少需要一个int，那么我们就不得不放弃位图了，也就是放弃了最小的空间消耗，我们需要直接以一个就像数组一样的实现，只不过数组的内容存放的是引用计数。

第8题、给上千个文件，每个文件大小为1K—100M。给n个词，设计算法对每个词找到所有包含它的文件，你只有100K内存!

牛客网上的解析：

0: 用一个文件info 准备用来保存ｎ个词和包含其的文件信息。
1 : 首先把ｎ个词分成ｘ份。对每一份用生成一个布隆过滤器（因为对ｎ个词只生成一个布隆过滤器，内存可能不够用）。把生成的所有布隆过滤器存入外存的一个文件Filter中。
２：将内存分为两块缓冲区，一块用于每次读入一个布隆过滤器，一个用于读文件(读文件这个缓冲区使用相当于有界生产者消费者问题模型来实现同步)，大文件可以分为更小的文件，但需要存储大文件的标示信息（如这个小文件是哪个大文件的）。
３：对读入的每一个单词用内存中的布隆过滤器来判断是否包含这个值，如果不包含，从Filter文件中读取下一个布隆过滤器到内存，直到包含或遍历完所有布隆过滤器。如果包含,更新info 文件。直到处理完所有数据。删除Filter文件。

备注：
１：关于布隆过滤器：其实就是一张用来存储字符串hash值的BitMap.
２：可能还有一些细节问题，如重复的字符串导致的重复计算等要考虑一下。

第9题、有一个词典，包含N个英文单词，现在任意给一个字符串，设计算法找出包含这个字符串的所有英文单词!

思路：用kmp算法或者字典树，KMP算法可见我的另一篇文章：字符串模式匹配问题

第10题、使用位图法判断整形数组是否存在重复

判断集合中存在重复是常见编程任务之一，当集合中数据量比较大时我们通常希望少进行几次扫描，这时双重循环法就不可取了。
位图法比较适合于这种情况，它的做法是按照集合中最大元素max创建一个长度为max+1的新数组，然后再次扫描原数组，遇到几就给新数组的第几位置上1，如遇到 5就给新数组的第六个元素置1，这样下次再遇到5想置位时发现新数组的第六个元素已经是1了，这说明这次的数据肯定和以前的数据存在着重复。这种给新数组初始化时置零其后置一的做法类似于位图的处理方法故称位图法。它的运算次数最坏的情况为2N。如果已知数组的最大值即能事先给新数组定长的话效率还能提高一倍。

第11题、已知某个文件内包含一些电话号码，每个号码为8位数字，统计不同号码的个数。

8位最多99 999 999，大概需要99m个bit，大概10几m字节的内存即可。（可以理解为从0-99 999 999的数字，每个数字对应一个Bit位，所以只需要99M个Bit==1.2MBytes，这样，就用了小小的1.2M左右的内存表示了所有的8位数的电话）

第12题、给40亿个不重复的unsigned int的整数，没排过序的，然后再给一个数，如何快速判断这个数是否在那40亿个数当中？

bitmap算法就好办多了。申请512M的内存，一个bit位代表一个unsigned int值，读入40亿个数，设置相应的bit位；读入要查询的数，查看相应bit位是否为1，为1表示存在，为0表示不存在。
Note: unsigned int最大数为2^32 - 1，所以需要2^32 - 1个位，也就是(2^32 - 1) / 8 /10 ^ 9G = 0.5G内存。
逆向思维优化：usinged int只有接近43亿（unsigned int最大值为232-1=4294967295,最大不超过43亿），所以可以用某种方式存没有出现过的3亿个数（使用数组{大小为3亿中最大的数/8 bytes}存储），如果出现在3亿个数里面，说明不在40亿里面。3亿个数存储空间一般小于40亿个。（xx存储4294967296需要512MB，存储294967296只需要35.16MBxx）

第13题、给定一个数组a，求所有和为SUM的两个数。

如果数组都是整数（负数也可以，将所有数据加上最小的负数x，SUM += 2x就可以了）。如a = [1,2,3,4,7,8]，先求a的补数组[8,7,6,5,2,1]，开辟两个数组b1,b2（最大数组长度为SUM/8/2{因为两数满足和为SUM，一个数 < SUM / 2，另一个数也就知道了}，这样每个b数组最大内存为SUM/(821024*1024) = 128M）,使用bitmap算法和数组a分别设置b1b2对应的位为1，b1b2相与就可以得到和为SUM的两个数其中一个数了。

第14题、在2.5亿个整数中找出不重复的整数，注，内存不足以容纳这2.5亿个整数

解法一：将bit-map扩展一下，采用2-Bitmap（每个数分配2bit，00表示不存在，01表示出现一次，10表示多次，11无意义）进行，共需内存2^32 * 2 bit=1 GB内存，还可以接受。然后扫描这2.5亿个整数，查看Bitmap中相对应位，如果是00变01，01变10，10保持不变。所描完事后，查看bitmap，把对应位是01的整数输出即可。或者我们不用2bit来进行表示，我们用两个bit-map即可模拟实现这个2bit-map，都是一样的道理。

解法二：也可采用与第1题类似的方法，进行划分小文件的方法。然后在小文件中找出不重复的整数，并排序。然后再进行归并，注意去除重复的元素。
2.1 一个序列里除了一个元素，其他元素都会重复出现3次，设计一个时间复杂度与空间复杂度最低的算法，找出这个不重复的元素。

第15题、给一个超过100G的文件，文件中保存的是IP地址，设计算法找到出现次数最多的IP地址，并找出前topK的IP地址。

解决方法：

（1）我们可以从文件中拿出一条IP地址，将所有IP地址遍历一遍，和其他IP地址进行比较，统计次数。在这种方式下，时间复杂度是O（n^2); 但是由于文件太大，I/O操作过于频繁，操作效率不高。
（2）我们可以利用哈希的思想，将100G的文件先切割成110份，每份文件的大小是1G，分别编号；
将文件中的IP地址按照某种方式转化为整型，再设置哈希函数，将IP地址放入不同的文件编号中。
则同一个文件编号存放的IP地址要么相同要么不同。
我们要找出现次数最多的IP地址，可以将IP地址和出现的次数作为键值对封装在unordered_map中。
要找出前topK 的IP地址，我们可以采用堆排，首先取出10个IP地址建立小堆，然后每次取出一个IP地址和堆顶元素比较，如果比堆顶元素大，就交换，依次进行，知道全比较结束。

第16题、4.1个文件有100亿个int，1G内存，设计算法找到出现次数不超过2次的所有整数？

解决方法：借助位图解决。要解决找出只出现次数不超过2次的数字，我们可以增加位图状态，用两个比特位作为哈希映射的地址，我们可以让00(不存在)、01(只出现一次)、11(出现两次)、10(出现两次以上)。
建两个文件，设置一个值key,大于这个key的数进入第一个文件；小于key值的数进入第二个文件（设置的key尽量使得这两个文件中数的数目差不多）
将第一个文件中的所有数的状态存到一个位图中（第一个文件以位图存储大约需要9540多MB的内存），然后通过查找，找出文件一中出现次数不超过两次的所有整数
第二个文件和第一个文件方法一样
合并两个文件中所有找到的数

第17题、给两个文件，分别有100亿个query，我们只有1G内存，如何找到两个文件交集？分别给出精确算法和近似算法？

精确算法：哈希切分。和第三题哈希切割的方法是一样的，只需要将HashFunc变为处理字符串的即可。(query查询)
近似算法：布隆过滤器。将一个文件的query放在布隆过滤器中，然后在用另一个文件中的query去查布隆过滤器中存不存在。布隆过滤器查找存在是不精确的。

第18题、如何扩展BloomFilter使得它支持删除元素的操作？

因为一个布隆过滤器的key对应多个位，冲突的概率比较大，所以不支持删除，因为删除有可能影响到其他元素。如果要对其元素进行删除，就不得不对每一个位进行引用计数。将BloomFilter中的每一位扩展为一个计数器，记录有多少个hash函数映射到这一位；删除的时候，只有当引用计数变为0时，才真正将该位置为0否则减1即可。

第19题、如何扩展BloomFilter使得它支持引用计数操作？

将BloomFilter中的每一位扩展为一个计数器，每个输入元素都要把对应位置加1，从而支持计数操作。但是有一个问题，1个比特位只能是两个状态0和1，我们只能把位图扩大成1字节或者更多，1个字节仅仅能存放计数256，但代价依旧是浪费内存。

结语

在任何时候，都应该坚信坚毅的人生终将开除灿烂的花朵

你可能感兴趣的:(数据结构知识总结)

一篇文章告诉你什么是BloomFilter 后端
什么是BloomFilter布隆过滤器（英语：BloomFilter）是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。主要用于判断一个元素是否在一个集合中。通常我们会遇到很多要判断一个元素是否在某个集合中的业务场景，一般想到的是将集合中所有元素保存起来，然后通过比较确定。链表、树、散列表（又叫哈希表，Hashtable）等等数据结构都是这种思路。但是随着集合中元素的增
【Java数据结构】二叉树相关算法回响N 算法数据结构 java 开发语言链表
第一题：获取二叉树中结点个数得到二叉树结点个数，如果结点为空则返回0，然后再用递归计算左树结点个数+根结点（1个）+右树结点个数。publicintnodeSize(Noderoot){if(root==null)return0;returnnodeSize1(root.left)+nodeSize1(root.right)+1;}第二题：获取叶子结点的个数得到叶子结点个数和结点总数的做法相同，也
【Leetcode】24-两两交换链表中的节点 wanlinBee要努力算法与数据结构 leetcode 链表算法
题目简述给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。测试案例：输入：head=[1,2,3,4]输出：[2,1,4,3]数据结构：classListNode:def__init__(self,val=0,next=None):self.val=valself.next=next解法一（迭代）主要思路根据数据结构
Python 获取字典的值：全面指南 egzosn python java 服务器前端 linux
字典(dict)是Python中一个强大的数据结构，用于存储键值对。无论是处理JSON数据，还是设计复杂的配置文件，字典都无处不在。本文将全面介绍在Python中获取字典值的各种方法，通过多个详细的代码示例，帮助你掌握如何在不同场景下灵活操作字典。一、字典基础知识在Python中，字典使用花括号{}定义，其键必须是不可变的(如字符串、数字或元组)，值可以是任意类型。以下是一个简单的字典示例：登录后
二叉树算法 JAVA 爱掉发的小龙 java 开发语言前端后端 python
二叉树是一种常用的数据结构，它由一系列的节点组成，每个节点最多有两个子节点，分别称为左子节点和右子节点。在Java中，我们可以通过定义一个二叉树的节点类来实现二叉树算法。一个典型的二叉树节点类如下所示：classNode{intval;Nodeleft;Noderight;publicNode(intval){this.val=val;this.left=null;this.right=null;
风控系统之指标回溯，历史数据重跑后端
个人博客：无奈何杨（wnhyang）个人语雀：wnhyang共享语雀：在线知识共享Github：wnhyang-Overview回顾默认你已经看过之前那篇风控系统指标计算/特征提取分析与实现01，Redis、Zset、模版方法。其中已经介绍了如何利用redis的zset结构完成指标计算，为了方便这篇文章的介绍，还是在正式开始本篇之前回顾一下。时间窗口zset是redis中的一种数据结构，表示有序集
[练习]简单结构体操作程序 siy2333 练习算法 c语言笔记学习
在学习C语言的过程中，我们经常会接触到各种数据结构的操作，其中数列（数组）是最基本也是最常用的一种。今天，我们分析一个简单的C语言程序，以及进行一定程度的改进。程序概述这个程序的主要目的是实现一个简单的数列操作，包括数列的内存分配、删除指定元素以及输出数列的功能。程序的核心是一个名为sequence的结构体，它包含数列的大小和指向数列元素的指针。通过几个函数的配合，程序完成了数列的创建、修改和输出
JVM加载影࿐ེ jvm
JVM（Java虚拟机）并不是在工程启动时就将所有类都加载到内存中，而是采用按需加载的方式，即在需要使用某个类时才会加载该类。JVM的类加载机制包括了加载、验证、准备、解析和初始化五个阶段。当Java程序运行时，JVM会根据需要，通过类加载器查找并加载类的字节码数据。这些数据可以来源于本地文件系统、网络、jar包等多种途径。加载完成后，JVM会将类的二进制数据转换成方法区内部的数据结构，并生成一个
Python 数据结构与算法学习 X天地不仁数据结构学习
2022年秋季，笔者初次接触数据结构与算法，当时只觉得书上写的内容晦涩难懂，加之自己的怠惰，很难理解所讲解的内容。所幸，期末的考核因为疫情放开，延迟到了2023年的春季开学，并且试卷的难度很低，60来分，混了个及格。1、什么是数据结构官方定义:并没有…民间定义:“数据结构是数据对象，以及存在于该对象的实例和组成实例的数据元素之间的各种联系。这些联系可以通过定义相关的函数来给出。”---《数据结构、
Lua语言的数据结构 Quantum&Coder 包罗万象 golang 开发语言后端
Lua语言的数据结构及其应用引言Lua是一种轻量级的编程语言，因其简单易学和高效灵活而广受欢迎。尤其在游戏开发、嵌入式系统以及其他需要高性能的场合中，Lua常常作为脚本语言被使用。在Lua中，数据结构的设计充分考虑了其简洁性与高效性，使得开发者能够更方便地进行各种数据处理。本文将深入探讨Lua语言中的主要数据结构及其应用，帮助读者更好地理解和使用Lua。Lua的数据结构概述Lua主要提供了两种内置
【数据分析（二）】初探 Pandas dandellion_ Python语法数据分析 pandas 数据挖掘
目录引言1.基本数据结构1.1.Series的初始化和简单操作1.2.DataFrame的初始化和简单操作1.2.1.初始化与持久化1.2.2.读取查看1.2.3.行操作1.2.4.列操作1.2.5.选中筛查2.数据预处理2.0.生成样例表2.1.缺失值处理2.2.类型转换和排序2.3.统计分析3.数据透视3.0.生成样例表3.1.生成透视表4.数据重塑4.1.层次化索引4.1.1.双层索引的Se
【数据结构】—— 顺序表的实现与优化：空间管理与增容策略酷酷的崽798 数据结构数据结构 c语言
文章目录顺序表的基本概念与结构顺序表的分类静态顺序表动态顺序表顺序表问题与思考插入与删除的时间复杂度增容的开销如何解决空间浪费问题？顺序表作为一种常见的线性数据结构，广泛应用于各种编程任务中。它通过连续的物理内存存储数据元素，提供了高效的随机访问功能。在这篇博客中，我们将深入探讨顺序表的结构、分类、实现方法以及它的一些问题与优化策略，尤其是如何解决空间浪费和增容问题。顺序表的基本概念与结构顺序表（
Python自动化办公测试开发漫漫成长路 python办公自动化自动化
一、引言以下是一个完整的Python自动化办公框架的目录结构和详细的解释。该框架将结合多种工具和技术，涵盖从数据处理到任务调度、自动化邮件发送、网页抓取等常见办公自动化任务。二、常用框架与工具pandas：使用场景：数据处理与分析描述：pandas是一个强大的数据处理库，适用于读取、清理、分析、操作Excel、CSV等表格数据。它提供了DataFrame数据结构，便于处理复杂的数据任务。典型应用：
Java 查询最大最小值详解飞滕人生TYF java java 算法
在Java中，查询最大值和最小值是常见需求。以下将详细介绍最大值和最小值的查询方法，包括适用于数组、集合、以及更复杂的数据结构的解决方案。1.使用Math类Java提供了Math.max和Math.min方法，可用于直接比较两个值。适用场景比较两个或少量的值。示例代码publicclassMaxMinWithMath{publicstaticvoidmain(String[]args){inta=
软考中级复习篇章：数据结构部分的复习海宁不掉头发笔记all 软件工程数据结构算法
软考中级快速通过篇章：数据结构部分的复习一、引言在软考中级的备考过程中，数据结构是极为重要的一个部分。它不仅是计算机科学的基础，也是软考中考查的重点知识领域。扎实掌握数据结构相关内容，对于顺利通过软考中级考试起着关键作用。本文将对数据结构部分的核心知识点进行全面总结，并配以简单的习题练习，帮助大家快速高效地复习这一板块，为软考中级考试做好充分准备。二、数据结构基础概念（一）数据结构的定义数据结构是
python中tensorflow_python机器学习TensorFlow框架弦歌缓缓
TensorFlow框架关注公众号“轻松学编程”了解更多。一、简介TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor(张量)意味着N维数组，Flow(流)意味着基于数据流图的计算，TensorFlow为张量从流图的一端流动到另一端的计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统
js迭代器模式摇光93 JS设计模式 javascript 迭代器模式开发语言
以前JS原生的集合类型数据结构，只有Array（数组）和Object（对象）；而ES6中，又新增了Map和Set。四种数据结构各自有着自己特别的内部实现，但我们仍期待以同样的一套规则去遍历它们，所以ES6在推出新数据结构的同时也推出了一套统一的接口机制——迭代器（Iterator）。ES6约定，任何数据结构只要具备Symbol.iterator属性（这个属性就是Iterator的具体实现，它本质上
javascript数据结构 Sherry Tian javascript javascript 数据结构开发语言
在JavaScript中，数据结构的选择和实现对于编写高效、可维护的代码至关重要。JavaScript提供了一系列内置的数据结构，同时也支持自定义复杂的数据结构。以下是JavaScript中常用的一些数据结构及其基本介绍：内置数据结构1.数组（Array）数组是一种线性数据结构，用于存储一系列有序的元素。JavaScript的数组实际上是对象，支持动态增长和索引访问。特点：动态大小索引访问支持多种
Python中的 json 模块与 pickle 模块：数据序列化与反序列化阁楼观月 python json 编辑器
文章目录前言一、json模块：用于存储和交换数据1.1JSON序列化1.2JSON反序列化1.3json模块的特点二、pickle模块：用于Python对象的序列化与反序列化2.1Pickle序列化2.2Pickle反序列化三、json与pickle的对比四、使用场景五、结语前言在编程中，序列化（Serialization）是指将数据结构或对象转换为一个可以存储或传输的格式的过程，而反序列化（De
Python知识超级汇总 ༺ཌༀ傲世万物ༀད༻ python python 开发语言
Python知识超级汇总文章目录Python知识超级汇总一、引言二、Python基础（一）安装与环境配置（二）基本语法（三）流程控制（四）数据结构三、Python高级特性（一）函数（二）迭代器与生成器（三）装饰器（四）面向对象编程（OOP）（五）异常处理（六）模块与包四、Python常用库与框架（一）NumPy（二）pandas（三）Matplotlib（四）Flask（五）Django五、总结一
js实现数据结构摇光93 算法 javascript 数据结构开发语言
常见的数据结构数组创建数组数组字面量[],newArray().fill()二维数组,两层循环创建增头部添加unshift尾部添加push任意位置添加splice(index,0,item)删头部删除shift尾部删除pop任意位置删除splice(index,num)栈先进后出push,pop队列先进先出push,shift链表classNode{constructor(val){this.va
Python 数据结构与算法习惯有梅自傲举 python 算法排序算法数据结构
1、算法概念在计算机科学中，算法是一个解决特定问题或执行特定任务的有序步骤的有限序列。算法是对一系列输入数据进行处理，产生期望输出结果的一种有效方法。它是解决问题的一种清晰而精确的描述，可以被实现为计算机程序。算法必须满足以下关键特性：有限性（Finiteness）：算法的执行必须在有限的步骤内终止，不会永无止境地执行下去。确定性（Determinism）：对于给定的输入，算法的每一步都有确切的定
golang map原理悟空丶123 golang 开发语言后端
map的实现原理map的定义map是由一组key,value键值对组成的抽象数据结构,并且同一个key只会出现一次。常见map操作add增加k-vremove删除k-vreassign修改k-vlookup查询k-v增删改查的操作。golang里的map结构主要有两种数据结构哈希查找表Hashtable哈希查找表用一个哈希函数将key分配到不同的桶。哈希查找表一般会存在碰撞问题，简而言之，不同的k
Python 数据结构揭秘：栈与队列大鳥 python 数据结构
栈（Stack）定义栈是一种后进先出（LastInFirstOut,LIFO）的数据结构。它类似于一个容器，只能在一端进行插入和删除操作。栈有两个主要的操作：push（入栈）和pop（出栈）.基本操作push（入栈）：将一个元素添加到栈顶.defpush(self,item):self.items.append(item)pop（出栈）：移除栈顶的元素，并返回该元素.defpop(self):if
Golang map实现原理及源码分析 Aeiu Golang golang 源码后端
本文涉及到的源码版本为GoSDK1.16.11、map的基本结构map是Golang中的一种常用数据结构，其本质上是一种哈希表，类似于java的HashMap以及Python的字典(dict)，是一种存储键值对(Key-Value)的数据结构。一般的Map会包含两个主要结构：数组：数组里的值指向一个链表链表：目的解决hash冲突的问题，并存放键值而在Golang中，解决hash冲突的不是链表，而是
【Redis】为什么Redis单线程还这么快？通过什么机制进行优化的？来一杯龙舌兰数据库 #Redis redis 数据库缓存多路复用内存优化 redis快
文章目录纯内存操作高效的数据结构非阻塞I/O与多路复用技术（网络I/O优化）非CPU密集型任务单线程的优势单线程的劣势redis6.0引入多线程后台线程的优化总结更多相关内容可查看Redis的瓶颈在于内存和网络带宽纯内存操作Redis是一个内存数据库，它的数据都存储在内存中，这意味着我们读写数据都是在内存中完成，这个速度是非常快的可能有很多人只知道存内存更快，但是不知道原因内存：中每个存储单元都有
数据结构与算法（python）（数据结构）芃芃舒 python 数据结构开发语言
数据结构与算法（python）（数据结构）文章目录数据结构与算法（python）（数据结构）一、数据结构基本概念二、线性结构1.列表（顺序存储）2.栈3.队列4.栈和队列的应用：迷宫问题.5.链表（链式存储）6.哈希表三、树与二叉树1.树2.二叉树3.二叉搜索树4.AVL树5.B树总结一、数据结构基本概念数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中元素之间的关系组成。简单来说
golang map m0_46521579 C++golang 开发语言后端
Go语言中的map是一种内置的数据结构，用于存储键值对（key-valuepairs）。它类似于其他语言中的字典（Python）、哈希表（Java）或关联数组（PHP）。map提供了高效的查找、插入和删除操作，是Go语言中非常常用的数据结构之一。（1）键值对存储：map存储的是一组键值对，键（key）和值（value）可以是任意类型。（2）键的唯一性：map中的键必须是唯一的，不能重复。（3）无序
字符串知识总结1 竣子好逑初级java java
字符串是Java开发中最常用的数据类型，它是双引号括起来的一系列字符的组合。例如："helloworld"，"请输入密码"等。在Java中，String类、StringBuffer类、StringBuilder类都能表示字符串。1、String类String是Java中最常用的字符串类，双引号括起来的数据都是String类的对象。因为String类是java.lang包中的类，所以使用的时候无需导
包装类知识总结竣子好逑初级java java
包装（Wrapper）类，也叫封装类。包装类不止一个，它是Java针对8种基本数据类型提供的类类型，它们对基本数据类型做了包装。基本类型：byte、short、int、long、float、double、char、boolean包装类：Byte、Short、Integer、Long、Float、Double、Character、Boolean除了int和char的包装类命名比较特殊（单词的全写）外
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

【数据结构】位图与布隆过滤器

一、位图：

二、 布隆过滤器

三、大数据处理问题

结语

你可能感兴趣的:(数据结构知识总结)

二、布隆过滤器