haydenwang8287

海量数据处理算法—Bloom Filter

1. Bloom-Filter算法简介

Bloom-Filter，即布隆过滤器，1970年由Bloom中提出。它可以用于检索一个元素是否在一个集合中。

Bloom Filter（BF）是一种空间效率很高的随机数据结构，它利用位数组很简洁地表示一个集合，并能判断一个元素是否属于这个集合。它是一个判断元素是否存在集合的快速的概率算法。Bloom Filter有可能会出现错误判断，但不会漏掉判断。也就是Bloom Filter判断元素不再集合，那肯定不在。如果判断元素存在集合中，有一定的概率判断错误。因此，Bloom Filter不适合那些“零错误”的应用场合。而在能容忍低错误率的应用场合下，Bloom Filter比其他常见的算法（如hash，折半查找）极大节省了空间。

它的优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。

Bloom Filter的详细介绍：Bloom Filter

2、 Bloom-Filter的基本思想

Bloom-Filter算法的核心思想就是利用多个不同的Hash函数来解决“冲突”。

计算某元素x是否在一个集合中，首先能想到的方法就是将所有的已知元素保存起来构成一个集合R，然后用元素x跟这些R中的元素一一比较来判断是否存在于集合R中；我们可以采用链表等数据结构来实现。但是，随着集合R中元素的增加，其占用的内存将越来越大。试想，如果有几千万个不同网页需要下载，所需的内存将足以占用掉整个进程的内存地址空间。即使用MD5，UUID这些方法将URL转成固定的短小的字符串，内存占用也是相当巨大的。

于是，我们会想到用Hash table的数据结构，运用一个足够好的Hash函数将一个URL映射到二进制位数组（位图数组）中的某一位。如果该位已经被置为1，那么表示该URL已经存在。

Hash存在一个冲突（碰撞）的问题，用同一个Hash得到的两个URL的值有可能相同。为了减少冲突，我们可以多引入几个Hash，如果通过其中的一个Hash值我们得出某元素不在集合中，那么该元素肯定不在集合中。只有在所有的Hash函数告诉我们该元素在集合中时，才能确定该元素存在于集合中。这便是Bloom-Filter的基本思想。

原理要点：一是位数组，而是k个独立hash函数。

1）位数组：

假设Bloom Filter使用一个m比特的数组来保存信息，初始状态时，Bloom Filter是一个包含m位的位数组，每一位都置为0，即BF整个数组的元素都设置为0。

2）添加元素，k个独立hash函数

为了表达S={x₁, x₂,…,x_n}这样一个n个元素的集合，Bloom Filter使用k个相互独立的哈希函数（Hash Function），它们分别将集合中的每个元素映射到{1,…,m}的范围中。

当我们往Bloom Filter中增加任意一个元素x时候，我们使用k个哈希函数得到k个哈希值，然后将数组中对应的比特位设置为1。即第i个哈希函数映射的位置hash_i(x)就会被置为1（1≤i≤k）。

注意，如果一个位置多次被置为1，那么只有第一次会起作用，后面几次将没有任何效果。在下图中，k=3，且有两个哈希函数选中同一个位置（从左边数第五位，即第二个“1“处）。

3）判断元素是否存在集合

在判断y是否属于这个集合时，我们只需要对y使用k个哈希函数得到k个哈希值，如果所有hash_i(y)的位置都是1（1≤i≤k），即k个位置都被设置为1了，那么我们就认为y是集合中的元素，否则就认为y不是集合中的元素。下图中y₁就不是集合中的元素（因为y1有一处指向了“0”位）。y₂或者属于这个集合，或者刚好是一个false positive。

显然这个判断并不保证查找的结果是100%正确的。

Bloom Filter的缺点：

1）Bloom Filter无法从Bloom Filter集合中删除一个元素。因为该元素对应的位会牵动到其他的元素。所以一个简单的改进就是 counting Bloom filter，用一个counter数组代替位数组，就可以支持删除了。此外，Bloom Filter的hash函数选择会影响算法的效果。

2）还有一个比较重要的问题，如何根据输入元素个数n，确定位数组m的大小及hash函数个数，即hash函数选择会影响算法的效果。当hash函数个数k=(ln2)*(m/n)时错误率最小。在错误率不大于E的情况下，m至少要等于n*lg(1/E)才能表示任意n个元素的集合。但m还应该更大些，因为还要保证bit数组里至少一半为0，则m应该>=nlg(1/E)*lge ，大概就是nlg(1/E)1.44倍(lg表示以2为底的对数)。

举个例子我们假设错误率为0.01，则此时m应大概是n的13倍。这样k大概是8个。

注意：

这里m与n的单位不同，m是bit为单位，而n则是以元素个数为单位(准确的说是不同元素的个数)。通常单个元素的长度都是有很多bit的。所以使用bloom filter内存上通常都是节省的。

一般BF可以与一些key-value的数据库一起使用，来加快查询。由于BF所用的空间非常小，所有BF可以常驻内存。这样子的话，对于大部分不存在的元素，我们只需要访问内存中的BF就可以判断出来了，只有一小部分，我们需要访问在硬盘上的key-value数据库。从而大大地提高了效率。

一个Bloom Filter有以下参数：

m	bit数组的宽度（bit数）
n	加入其中的key的数量
k	使用的hash函数的个数
f	False Positive的比率

Bloom Filter的f满足下列公式：

在给定m和n时，能够使f最小化的k值为：

此时给出的f为：

根据以上公式，对于任意给定的f，我们有：

n = m ln(0.6185) / ln(f) [1]

同时，我们需要k个hash来达成这个目标：

k = - ln(f) / ln(2) [2]

由于k必须取整数，我们在Bloom Filter的程序实现中，还应该使用上面的公式来求得实际的f：

f = (1 – e ^-kn/m) ^k[3]

以上3个公式是程序实现Bloom Filter的关键公式。

3、扩展CounterBloom Filter

CounterBloom Filter

BloomFilter有个缺点，就是不支持删除操作，因为它不知道某一个位从属于哪些向量。那我们可以给Bloom Filter加上计数器，添加时增加计数器，删除时减少计数器。

但这样的Filter需要考虑附加的计数器大小，假如同个元素多次插入的话，计数器位数较少的情况下，就会出现溢出问题。如果对计数器设置上限值的话，会导致Cache Miss，但对某些应用来说，这并不是什么问题，如Web Sharing。

Compressed Bloom Filter

为了能在服务器之间更快地通过网络传输Bloom Filter，我们有方法能在已完成Bloom Filter之后，得到一些实际参数的情况下进行压缩。

将元素全部添加入Bloom Filter后，我们能得到真实的空间使用率，用这个值代入公式计算出一个比m小的值，重新构造Bloom Filter，对原先的哈希值进行求余处理，在误判率不变的情况下，使得其内存大小更合适。

4、Bloom-Filter的应用

Bloom-Filter一般用于在大数据量的集合中判定某元素是否存在。例如邮件服务器中的垃圾邮件过滤器。在搜索引擎领域，Bloom-Filter最常用于网络蜘蛛(Spider)的URL过滤，网络蜘蛛通常有一个URL列表，保存着将要下载和已经下载的网页的URL，网络蜘蛛下载了一个网页，从网页中提取到新的URL后，需要判断该URL是否已经存在于列表中。此时，Bloom-Filter算法是最好的选择。

1.key-value 加快查询

一般Bloom-Filter可以与一些key-value的数据库一起使用，来加快查询。

一般key-value存储系统的values存在硬盘，查询就是件费时的事。将Storage的数据都插入Filter，在Filter中查询都不存在时，那就不需要去Storage查询了。当False Position出现时，只是会导致一次多余的Storage查询。

由于Bloom-Filter所用的空间非常小，所有BF可以常驻内存。这样子的话，对于大部分不存在的元素，我们只需要访问内存中的Bloom-Filter就可以判断出来了，只有一小部分，我们需要访问在硬盘上的key-value数据库。从而大大地提高了效率。如图：

2 .Google的BigTable

Google的BigTable也使用了Bloom Filter，以减少不存在的行或列在磁盘上的查询，大大提高了数据库的查询操作的性能。

3.Proxy-Cache

在Internet Cache Protocol中的Proxy-Cache很多都是使用Bloom Filter存储URLs，除了高效的查询外，还能很方便得传输交换Cache信息。

4.网络应用

1）P2P网络中查找资源操作，可以对每条网络通路保存Bloom Filter，当命中时，则选择该通路访问。

2）广播消息时，可以检测某个IP是否已发包。

3）检测广播消息包的环路，将Bloom Filter保存在包里，每个节点将自己添加入Bloom Filter。

4）信息队列管理，使用Counter Bloom Filter管理信息流量。

5. 垃圾邮件地址过滤

像网易，QQ这样的公众电子邮件（email）提供商，总是需要过滤来自发送垃圾邮件的人（spamer）的垃圾邮件。

一个办法就是记录下那些发垃圾邮件的email地址。由于那些发送者不停地在注册新的地址，全世界少说也有几十亿个发垃圾邮件的地址，将他们都存起来则需要大量的网络服务器。

如果用哈希表，每存储一亿个email地址，就需要1.6GB的内存（用哈希表实现的具体办法是将每一个email地址对应成一个八字节的信息指纹，然后将这些信息指纹存入哈希表，由于哈希表的存储效率一般只有50%，因此一个email地址需要占用十六个字节。一亿个地址大约要1.6GB，即十六亿字节的内存）。因此存贮几十亿个邮件地址可能需要上百GB的内存。

而Bloom Filter只需要哈希表1/8到1/4的大小就能解决同样的问题。

BloomFilter决不会漏掉任何一个在黑名单中的可疑地址。而至于误判问题，常见的补救办法是在建立一个小的白名单，存储那些可能别误判的邮件地址。

5、Bloom-Filter的具体实现

c语言实现：

stdafx.h：

 
  #pragmaonce 
 #include<stdio.h> 
 #include"stdlib.h" 
 #include<iostream> 
 #include<time.h> 
 usingnamespacestd; 
 

 
  #include"stdafx.h" 
  
  
 #defineARRAY_SIZE256/*wegetthe256charsofeachline*/ 
 #defineSIZE48000000/*sizeshouldbe1/8ofmax*/ 
 #defineMAX384000000/*themaxbitspace*/ 
  
 #defineSETBIT(ch,n)ch[n/8]|=1<<(7-n%8) 
 #defineGETBIT(ch,n)(ch[n/8]&1<<(7-n%8))>>(7-n%8) 
  
 unsignedintlen(char*ch);/*functionstocalculatethelengthoftheurl*/ 
  
 unsignedintRSHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintJSHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintPJWHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintELFHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintBKDRHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintSDBMHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintDJBHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintDEKHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintBPHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintFNVHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintAPHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintHFLPHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintHFHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintStrHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
 unsignedintTianlHash(char*str,unsignedintlen);/*functionstocalculatethehashvalueoftheurl*/ 
  
  
 intmain() 
 { 
 inti,num,num2=0;/*thenumbertorecordtherepeatedurlsandthetotalofit*/ 
 unsignedinttt=0; 
 intflag;/*ithelpstocheckweathertheurlhasalreadyexisted*/ 
 charbuf[257];/*ithelpstoprintthestarttimeoftheprogram*/ 
 time_ttmp=time(NULL); 
  
 charfile1[100],file2[100]; 
 FILE*fp1,*fp2;/*pointertothefile*/ 
 charch[ARRAY_SIZE]; 
 char*vector;/*thebitspace*/ 
 vector=(char*)calloc(SIZE,sizeof(char)); 
  
 printf("Pleaseenterthefilewithrepeatedurls:\n"); 
 scanf("%s",&file1); 
 if((fp1=fopen(file1,"rb"))==NULL){/*openthegoalfile*/ 
 printf("Connotopenthefile%s!\n",file1); 
 } 
  
 printf("Pleaseenterthefileyouwanttosaveto:\n"); 
 scanf("%s",&file2); 
 if((fp2=fopen(file2,"w"))==NULL){ 
 printf("Connotopenthefile%s\n",file2); 
 } 
 strftime(buf,32,"%Y-%m-%d%H:%M:%S",localtime(&tmp)); 
 printf("%s\n",buf);/*printthesystemtime*/ 
  
 for(i=0;i<SIZE;i++){ 
 vector[i]=0;/*set0*/ 
 } 
  
 while(!feof(fp1)){/*thecheckprocess*/ 
  
 fgets(ch,ARRAY_SIZE,fp1); 
 flag=0; 
 tt++; 
 if(GETBIT(vector,HFLPHash(ch,len(ch))%MAX)){ 
 flag++; 
 }else{ 
 SETBIT(vector,HFLPHash(ch,len(ch))%MAX); 
 } 
  
 if(GETBIT(vector,StrHash(ch,len(ch))%MAX)){ 
 flag++; 
 }else{ 
 SETBIT(vector,StrHash(ch,len(ch))%MAX); 
 } 
  
 if(GETBIT(vector,HFHash(ch,len(ch))%MAX)){ 
 flag++; 
 }else{ 
 SETBIT(vector,HFHash(ch,len(ch))%MAX); 
 } 
  
 if(GETBIT(vector,DEKHash(ch,len(ch))%MAX)){ 
 flag++; 
 }else{ 
 SETBIT(vector,DEKHash(ch,len(ch))%MAX); 
 } 
  
 if(GETBIT(vector,TianlHash(ch,len(ch))%MAX)){ 
 flag++; 
 }else{ 
 SETBIT(vector,TianlHash(ch,len(ch))%MAX); 
 } 
  
 if(GETBIT(vector,SDBMHash(ch,len(ch))%MAX)){ 
 flag++; 
 }else{ 
 SETBIT(vector,SDBMHash(ch,len(ch))%MAX); 
 } 
  
 if(flag<6) 
 num2++; 
 else 
 fputs(ch,fp2); 
  
 /*printf("%d",flag);*/ 
 } 
 /*theresult*/ 
 printf("\nThereare%durls!\n",tt); 
 printf("\nThereare%dnotrepeatedurls!\n",num2); 
 printf("Thereare%drepeatedurls!\n",tt-num2); 
 fclose(fp1); 
 fclose(fp2); 
 return0; 
 } 
  
  
 /*functionsmaybeusedinthemain*/ 
 unsignedintlen(char*ch) 
 { 
 intm=0; 
 while(ch[m]!='\0'){ 
 m++; 
 } 
 returnm; 
 } 
  
 unsignedintRSHash(char*str,unsignedintlen){ 
 unsignedintb=378551; 
 unsignedinta=63689; 
 unsignedinthash=0; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++){ 
 hash=hash*a+(*str); 
 a=a*b; 
 } 
 returnhash; 
 } 
 /*EndOfRSHashFunction*/ 
  
  
 unsignedintJSHash(char*str,unsignedintlen) 
 { 
 unsignedinthash=1315423911; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++){ 
 hash^=((hash<<5)+(*str)+(hash>>2)); 
 } 
 returnhash; 
 } 
 /*EndOfJSHashFunction*/ 
  
  
 unsignedintPJWHash(char*str,unsignedintlen) 
 { 
 constunsignedintBitsInUnsignedInt=(unsignedint)(sizeof(unsignedint)*8); 
 constunsignedintThreeQuarters=(unsignedint)((BitsInUnsignedInt*3)/4); 
 constunsignedintOneEighth=(unsignedint)(BitsInUnsignedInt/8); 
 constunsignedintHighBits=(unsignedint)(0xFFFFFFFF)<<(BitsInUnsignedInt-OneEighth); 
 unsignedinthash=0; 
 unsignedinttest=0; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++){ 
 hash=(hash<<OneEighth)+(*str); 
 if((test=hash&HighBits)!=0){ 
 hash=((hash^(test>>ThreeQuarters))&(~HighBits)); 
 } 
 } 
  
 returnhash; 
 } 
 /*EndOfP.J.WeinbergerHashFunction*/ 
  
  
 unsignedintELFHash(char*str,unsignedintlen) 
 { 
 unsignedinthash=0; 
 unsignedintx=0; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++){ 
 hash=(hash<<4)+(*str); 
 if((x=hash&0xF0000000L)!=0){ 
 hash^=(x>>24); 
 } 
 hash&=~x; 
 } 
 returnhash; 
 } 
 /*EndOfELFHashFunction*/ 
  
  
 unsignedintBKDRHash(char*str,unsignedintlen) 
 { 
 unsignedintseed=131;/*31131131313131131313etc..*/ 
 unsignedinthash=0; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++) 
 { 
 hash=(hash*seed)+(*str); 
 } 
  
 returnhash; 
 } 
 /*EndOfBKDRHashFunction*/ 
  
  
 unsignedintSDBMHash(char*str,unsignedintlen) 
 { 
 unsignedinthash=0; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++){ 
 hash=(*str)+(hash<<6)+(hash<<16)-hash; 
 } 
  
 returnhash; 
 } 
 /*EndOfSDBMHashFunction*/ 
  
  
 unsignedintDJBHash(char*str,unsignedintlen) 
 { 
 unsignedinthash=5381; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++){ 
 hash=((hash<<5)+hash)+(*str); 
 } 
  
 returnhash; 
 } 
 /*EndOfDJBHashFunction*/ 
  
  
 unsignedintDEKHash(char*str,unsignedintlen) 
 { 
 unsignedinthash=len; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++){ 
 hash=((hash<<5)^(hash>>27))^(*str); 
 } 
 returnhash; 
 } 
 /*EndOfDEKHashFunction*/ 
  
  
 unsignedintBPHash(char*str,unsignedintlen) 
 { 
 unsignedinthash=0; 
 unsignedinti=0; 
 for(i=0;i<len;str++,i++){ 
 hash=hash<<7^(*str); 
 } 
  
 returnhash; 
 } 
 /*EndOfBPHashFunction*/ 
  
  
 unsignedintFNVHash(char*str,unsignedintlen) 
 { 
 constunsignedintfnv_prime=0x811C9DC5; 
 unsignedinthash=0; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++){ 
 hash*=fnv_prime; 
 hash^=(*str); 
 } 
  
 returnhash; 
 } 
 /*EndOfFNVHashFunction*/ 
  
  
 unsignedintAPHash(char*str,unsignedintlen) 
 { 
 unsignedinthash=0xAAAAAAAA; 
 unsignedinti=0; 
  
 for(i=0;i<len;str++,i++){ 
 hash^=((i&1)==0)?((hash<<7)^(*str)*(hash>>3)): 
 (~((hash<<11)+(*str)^(hash>>5))); 
 } 
  
 returnhash; 
 } 
 /*EndOfAPHashFunction*/ 
 unsignedintHFLPHash(char*str,unsignedintlen) 
 { 
 unsignedintn=0; 
 inti; 
 char*b=(char*)&n; 
 for(i=0;i<strlen(str);++i){ 
 b[i%4]^=str[i]; 
 } 
 returnn%len; 
 } 
 /*EndOfHFLPHashFunction*/ 
 unsignedintHFHash(char*str,unsignedintlen) 
 { 
 intresult=0; 
 char*ptr=str; 
 intc; 
 inti=0; 
 for(i=1;c=*ptr++;i++) 
 result+=c*3*i; 
 if(result<0) 
 result=-result; 
 returnresult%len; 
 } 
 /*EndOfHKHashFunction*/ 
  
 unsignedintStrHash(char*str,unsignedintlen) 
 { 
 registerunsignedinth; 
 registerunsignedchar*p; 
 for(h=0,p=(unsignedchar*)str;*p;p++){ 
 h=31*h+*p; 
 } 
  
 returnh; 
  
 } 
 /*EndOfStrHashFunction*/ 
  
 unsignedintTianlHash(char*str,unsignedintlen) 
 { 
 unsignedlongurlHashValue=0; 
 intilength=strlen(str); 
 inti; 
 unsignedcharucChar; 
 if(!ilength){ 
 return0; 
 } 
 if(ilength<=256){ 
 urlHashValue=16777216*(ilength-1); 
 }else{ 
 urlHashValue=42781900080; 
 } 
 if(ilength<=96){ 
 for(i=1;i<=ilength;i++){ 
 ucChar=str[i-1]; 
 if(ucChar<='Z'&&ucChar>='A'){ 
 ucChar=ucChar+32; 
 } 
 urlHashValue+=(3*i*ucChar*ucChar+5*i*ucChar+7*i+11*ucChar)%1677216; 
 } 
 }else{ 
 for(i=1;i<=96;i++) 
 { 
 ucChar=str[i+ilength-96-1]; 
 if(ucChar<='Z'&&ucChar>='A') 
 { 
 ucChar=ucChar+32; 
 } 
 urlHashValue+=(3*i*ucChar*ucChar+5*i*ucChar+7*i+11*ucChar)%1677216; 
 } 
 } 
 returnurlHashValue; 
  
 } 
 /*EndOfTianlHashFunction*/ 
 

网上找到的php简单实现：

 
  <?php 
  
 /** 
 *ImplementsaBloomFilter 
 */ 
 classBloomFilter{ 
 /** 
 *Sizeofthebitarray 
 * 
 *@varint 
 */ 
 protected$m; 
  
 /** 
 *Numberofhashfunctions 
 * 
 *@varint 
 */ 
 protected$k; 
  
 /** 
 *Numberofelementsinthefilter 
 * 
 *@varint 
 */ 
 protected$n; 
  
 /** 
 *Thebitsetholdingthefilterinformation 
 * 
 *@vararray 
 */ 
 protected$bitset; 
  
 /** 
 *计算最优的hash函数个数：当hash函数个数k=(ln2)*(m/n)时错误率最小 
 * 
 *@paramint$mbit数组的宽度（bit数） 
 *@paramint$n加入布隆过滤器的key的数量 
 *@returnint 
 */ 
 publicstaticfunctiongetHashCount($m,$n){ 
 returnceil(($m/$n)*log(2)); 
 } 
  
 /** 
 *ConstructaninstanceoftheBloomfilter 
 * 
 *@paramint$mbit数组的宽度（bit数）Sizeofthebitarray 
 *@paramint$khash函数的个数Numberofdifferenthashfunctionstouse 
 */ 
 publicfunction__construct($m,$k){ 
 $this->m=$m; 
 $this->k=$k; 
 $this->n=0; 
  
 /*Initializethebitset*/ 
 $this->bitset=array_fill(0,$this->m-1,false); 
 } 
  
 /** 
 *FalsePositive的比率：f=(1–e-kn/m)k 
 *Returnstheprobabilityforafalsepositivetooccur,giventhecurrentnumberofitemsinthefilter 
 * 
 *@returndouble 
 */ 
 publicfunctiongetFalsePositiveProbability(){ 
 $exp=(-1*$this->k*$this->n)/$this->m; 
  
 returnpow(1-exp($exp),$this->k); 
 } 
  
 /** 
 *Addsanewitemtothefilter 
 * 
 *@parammixedEitherastringholdingasingleitemoranarrayof 
 *stringholdingmultipleitems.Inthelattercase,all 
 *itemsareaddedonebyoneinternally. 
 */ 
 publicfunctionadd($key){ 
 if(is_array($key)){ 
 foreach($keyas$k){ 
 $this->add($k); 
 } 
 return; 
 } 
  
 $this->n++; 
  
 foreach($this->getSlots($key)as$slot){ 
 $this->bitset[$slot]=true; 
 } 
 } 
  
 /** 
 *QueriestheBloomfilterforanelement 
 * 
 *IfthismethodreturnFALSE,itis100%certainthattheelementhas 
 *notbeenaddedtothefilterbefore.Incontrast,ifTRUEisreturned, 
 *theelement*may*havebeenaddedtothefilterpreviously.Howeverwith 
 *aprobabilityindicatedbygetFalsePositiveProbability()theelementhas 
 *notbeenaddedtothefilterwithcontains()stillreturningTRUE. 
 * 
 *@parammixedEitherastringholdingasingleitemoranarrayof 
 *stringsholdingmultipleitems.Inthelattercasethe 
 *methodreturnsTRUEifthefiltercontainsallitems. 
 *@returnboolean 
 */ 
 publicfunctioncontains($key){ 
 if(is_array($key)){ 
 foreach($keyas$k){ 
 if($this->contains($k)==false){ 
 returnfalse; 
 } 
 } 
  
 returntrue; 
 } 
  
 foreach($this->getSlots($key)as$slot){ 
 if($this->bitset[$slot]==false){ 
 returnfalse; 
 } 
 } 
  
 returntrue; 
 } 
  
 /** 
 *Hashestheargumenttoanumberofpositionsinthebitsetandreturnsthepositions 
 * 
 *@paramstringItem 
 *@returnarrayPositions 
 */ 
 protectedfunctiongetSlots($key){ 
 $slots=array(); 
 $hash=self::getHashCode($key); 
 mt_srand($hash); 
  
 for($i=0;$i<$this->k;$i++){ 
 $slots[]=mt_rand(0,$this->m-1); 
 } 
  
 return$slots; 
 } 
  
 /** 
 *使用CRC32产生一个32bit（位）的校验值。 
 *由于CRC32产生校验值时源数据块的每一bit（位）都会被计算，所以数据块中即使只有一位发生了变化，也会得到不同的CRC32值。 
 *Generatesanumerichashforthegivenstring 
 * 
 *RightnowtheCRC-32algorithmisused.Alternativelyonecoulde.g. 
 *useAdlerdigestsormimickthebehaviourofJava'shashCode()method. 
 * 
 *@paramstringInputforwhichthehashshouldbecreated 
 *@returnintNumerichash 
 */ 
 protectedstaticfunctiongetHashCode($string){ 
 returncrc32($string); 
 } 
  
 } 
  
  
  
 $items=array("firstitem","seconditem","thirditem"); 
  
 /*Addallitemswithonecalltoadd()andmakesurecontains()finds 
 *themall. 
 */ 
 $filter=newBloomFilter(100,BloomFilter::getHashCount(100,3)); 
 $filter->add($items); 
  
 //var_dump($filter);exit; 
 $items=array("firsttem","seconditem","thirditem"); 
 foreach($itemsas$item){ 
 var_dump(($filter->contains($item))); 
 } 
  
  
 /*Addallitemswithmultiplecallstoadd()andmakesurecontains() 
 *findsthemall. 
 */ 
 $filter=newBloomFilter(100,BloomFilter::getHashCount(100,3)); 
 foreach($itemsas$item){ 
 $filter->add($item); 
 } 
 $items=array("firsttem","seconditem","thirditem"); 
 foreach($itemsas$item){ 
 var_dump(($filter->contains($item))); 
 } 
  
  
  
  
 

问题实例】给你A,B两个文件，各存放50亿条URL，每条URL占用64字节，内存限制是4G，让你找出A,B文件共同的URL。如果是三个乃至n个文件呢？

根据这个问题我们来计算下内存的占用，4G=2^32大概是40亿*8大概是340亿bit，n=50亿，如果按出错率0.01算需要的大概是650亿个bit。现在可用的是340亿，相差并不多，这样可能会使出错率上升些。另外如果这些urlip是一一对应的，就可以转换成ip，则大大简单了。

http://blog.csdn.net/hguisu/article/details/7866173

你可能感兴趣的:(filter,bloom)

Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
2019-07-09 AutoCompleteTextView 问题皮皮铭
实现自定义Adapter要实现Filterable接口，不然会报错重写getFilter()方法performFiltering()方法实现过滤数据的操作publishResults()用来接收performFiltering()的返回值，发布。
Python 推导式(Comprehensions) 戒灵
1,列表推导式num=[1,2,-5,10,-7,5,7,-1]filtered_and_squared=[x**2forxinnumifx>0]print(filtered_and_squared)迭代器(iterator)遍历输入序列num的每个成员x断言式判断每个成员是否大于零如果成员大于零，则被交给输出表达式，平方之后成为输出列表的成员。列表推导式被封装在一个列表中，所以很明显它能够立即生
spring security中几大组件的作用和执行顺序阿信在这里 java spring
springsecurity中几大组件的作用和执行顺序在SpringSecurity中，AuthenticationProvider、GroupPermissionEvaluator、PermissionEvaluator、AbstractAuthenticationProcessingFilter、DefaultMethodSecurityExpressionHandler和ManageSecu
tf.get_collection() yalesaleng
此函数有两个参数，key和scope。Args:1.key:Thekeyforthecollection.Forexample,theGraphKeysclasscontainsmanystandardnamesforcollections.2.scope:(Optional.)Ifsupplied,theresultinglistisfilteredtoincludeonlyitemswhose
springcloud — 微服务鉴权管理Spring Security原理解析(二) RachelHwang springcloud spring java spring security oauth2 springcloud
引言：回顾之前介绍的OAuth2简单分析与介绍，微服务鉴权管理之OAuth2原理解析(一)，前面的部分，我们关注了SpringSecurity是如何完成认证工作的，但是另外一部分核心的内容：过滤器，一直没有提到，我们已经知道SpringSecurity使用了springSecurityFilterChain作为了安全过滤的入口，这一节主要分析一下这个过滤器链都包含了哪些关键的过滤器，并且各自的使命
Superset二次开发之源码DependencyList.tsx 分析 aimmon Superset二次开发 Superset BI 二次开发 typescript 前端
功能点路径superset-frontend\src\dashboard\components\nativeFilters\FiltersConfigModal\FiltersConfigForm\DependencyList.tsx/***LicensedtotheApacheSoftwareFoundation(ASF)underone*ormorecontributorlicenseagre
Stream 流根据对象属性去重 abments jdk1.8新特性 python pandas 数据分析
目录前言一、实现原理二、实现过程三、filter过滤器的原理总结前言这篇文章介绍一种通过stream流对集合中的对象根据key值去重的简便方法。一、实现原理通过Stream流中的filter方法实现对数据的去重，具体操作是构造一个Predict对象，在Predict中通过检查数据是否存在返回断言中的布尔值。二、实现过程代码如下：publicstaticPredicatedistinctPredic
C#LINQ常用扩展语句月落. C#c#linq solr
在C#中，LINQ提供了许多扩展方法，这些方法定义在System.Linq命名空间中。以下是一些常用的LINQ扩展方法：Where-过滤数据集合，返回满足条件的元素。varfilteredItems=collection.Where(item=>item.SomeProperty>10);Select-从数据集合中选择数据或创建新的投影。varprojectedItems=collection.S
2022-01-03 day62 pipaline流水线作业 zhaocheng690
今日作业：1.pipeline实现流程：拉取代码-->编译-->部署测试-->发送测试通知-->确认是否部署-->部署服务-->发送部署结果通知pipeline{agentanyparameters{gitParameterbranch:'',branchFilter:'.*',defaultValue:'v1.0',description:'请选择要发布的版本:',name:'git_versi
js数组方法map和filter 人间废料记 javascript javascript 前端
目录.map()方法概念语法注意使用场景.filter()方法概念语法注意使用场景.map()和.filter()的区别和联系.map()方法概念.map()函数是JavaScript数组结构中很实用的一个方法之一。可以将map()方法视为经过一个循环并在回调函数中编写语句（格式化、数据处理）以构造一个新数组。用来创建新数组、修改其内容并保持原始数组不变的通用方法。当出现需要修改现有数组的内容并将
Elasticsearch之bool查询 cyt涛 java elasticsearch 大数据搜索引擎 bool 布尔查询全文检索
bool查询是Elasticsearch中最常用的复合查询类型，允许将多个查询组合在一起。它通过逻辑操作符（如must、should、must_not和filter）来构建复杂的查询条件，从而满足多条件匹配、逻辑与（AND）、或（OR）、非（NOT）的查询需求。bool查询主要由四个部分组成：must：必须满足的条件（类似于SQL中的AND）。should：应该匹配的条件（类似于SQL中的OR）。
el-table日期格式化处理2种方式 c28n07 elementui
关于el-table总结[toc]1.方式一：采用filters//template{{props.row.time|dateTimeFormat}}//script->filtersfilters:{dateTimeFormat(dateTime){if(!dateTime){returndateTime;}returnmoment(dateTime).format("YYYY-MM-DD");
Interceptor拦截器+JWT令牌实现登陆验证 wy08success Interceptor springboot java 登陆验证
一、背景与过滤器的作用类似，不过拦截器是spring中的组件，只能拦截进入spring的请求；过滤器则可以拦截所有从前端页面发送来的请求。*拦截器和过滤器选一就可以实现登陆验证，过滤器的实现在以下这篇博客中，有需要可以自取：Filter过滤器+JWT令牌实现登陆验证-CSDN博客二、分析定义拦截器，实现HanderInterceptor接口，并重写其所有方法。注册拦截器三、实现1、目录结构：2、L
登录校验实现——Jwt、Filter/Interceptor 应起忆 java spring
Jwt令牌生成引入依赖，JDK8之后的版本需要引入JAXBjavax.xml.bindjaxb-api2.3.1org.glassfish.jaxbjaxb-runtime2.3.1io.jsonwebtokenjjwt0.9.1写JwtUtilsimportio.jsonwebtoken.Claims;importio.jsonwebtoken.Jwts;importio.jsonwebtoke
登录校验，会话技术，Cookie，Session，JWT令牌，统一拦截技术，过滤器FIlter，拦截器Interceptor，全局异常处理器暖阳爱学计算机 springboot spring boot web java
目录1登录校验2会话技术2.1会话技术介绍2.2Cookie2.2Session2.4令牌技术2.5JWT令牌2.5.1介绍2.5.2生成和校验2.5.3登录下发令牌3统一拦截技术3.1过滤器Filter3.1.1过滤器的使用步骤3.1.2代码实现3.1.3细节3.2拦截器Interceptor3.2.1拦截器的使用步骤3.2.2代码实现3.2.3细节4登录功能具体实现步骤5异常处理5.1异常的解
Cookie & Session & JWT认证 & Filter & Interceptor aDreamerOutOfTheSky java spring spring boot
文章目录前言一、Cookie和Session二、JWT1.三部分2.使用3.另外一种使用3.1引入依赖3.1定义工具类三、Filter过滤器3.1实现Filter接口，并且增加@WebFilter注解3.2启动类上增加注解3.3Filter过滤实现登陆校验3.4拦截器实现登陆校验总结前言本文介绍了Cookie，Session，JWT，过滤器，拦截器的相关知识一、Cookie和Session浏览器请
深入理解Kubernetes：kube-scheduler源码解析 mujingluo kubernetes 容器云原生
Kubernetes的调度器（kube-scheduler）是整个系统中至关重要的组件，它负责将待调度的Pods分配到合适的节点上。本文将深入分析kube-scheduler的源码，揭示其内部工作机制。kube-scheduler的核心功能kube-scheduler的核心功能包括：监听Pod变化：通过KubernetesAPI监听所有未调度的Pods。过滤（Filtering）：根据一系列规则（
Spring Boot中配置图片资源通常涉及到静态资源的管理脚大江山稳 spring boot hive 后端
在SpringBoot中配置图片资源通常涉及到静态资源的管理。SpringBoot默认支持静态资源的映射，你可以通过以下步骤来配置图片资源：配置需要拦截和放行的beanHttpInterceptorConfig配置拦截器HttpSampleInterceptor过滤器ReplaceStreamFilter封装Request数据进行多次读取RequestWrapper放置图片资源：将图片资源放在sr
11- 【JavaWeb】Cookie 、Session、Filter、Listener weixin_44329069 JavaWeb hive python hadoop
了解Cookie、Session、Filter和Listener是JavaWeb开发中非常重要的部分。1.CookieCookie是服务器在客户端浏览器上存储的小数据片段，用于在不同请求之间保持状态。Cookie通常用于保存用户信息、跟踪会话、保存用户偏好等。示例：创建和读取Cookie设置Cookie（在Servlet中）：@WebServlet("/setCookie")publicclass
深入理解Redis原理：缓存雪崩/击穿/穿透/预热/降级 Hey 锡瑞 Redis 缓存
目录1、缓存雪崩1.1、什么是缓存雪崩1.2、解决缓存雪崩2、缓存击穿2.1、什么是缓存击穿2.2、解决缓存击穿3、缓存穿透3.1、什么是缓存穿透3.2、解决缓存穿透3.3、基于RedisBloom实现布隆过滤器4、缓存预热4.1、什么是缓存预热4.2、解决缓存预热5、缓存降级5.1、什么是缓存降级下一篇：redis5种数据结构及底层实现原理1、缓存雪崩1.1、什么是缓存雪崩如果缓在某一个时刻出现
web.xml and server.xml-03-11 封_绝
web.xml加载顺序：ServletContext→context-param→listener→filter→servletserver.xmlAJP服务器群集热部署：不需要每次做修改都重启服务器，//下//如果该路径下没有项目，则会报错（其余项目依旧会正常加载），如果是使用冷部署则不会报错？idea中的设置如下：image.png
iPhone 16和iPhone 16 Pro将发布时缺少这一关键功能 AI小夏 iphone ios
苹果针对GoogleGemini和三星GalaxyAI的回答不会在iPhone16系列发布时一同推出。虽然新的iPhone将从9月20日开始上架销售，但它们将在没有备受期待的AppleIntelligence的情况下发货。公司已经确认其AI将从下个月开始以beta版推出。要等到该功能的稳定版本发布，才能在您的新iPhone上使用。这一消息是一个出乎意料的举动，正如Bloomberg的MarkGur
Android action使用大全超低空MC Android点滴 category android intent action type
1.Intent的用法：（1）Action跳转1、使用Action跳转，当程序AndroidManifest.xml中某一个Activity的IntentFilter定义了包含Action，如果恰好与目标Action匹配，且其IntentFilter中没有定义其它的Type或Category过滤条件，那么就正好匹配了。如果手机中有两个以上的Action程序匹配，那么就会弹出一个对话可框来提示说明。
asp.net core 自定义过滤器注入的几种方式和实现彭小彭~ .net core .net core
在ASP.NETCore中，过滤器（Filters）是一种在MVC应用程序中运行代码的方法，可以在操作（Actions）执行之前或之后运行。过滤器可以应用于控制器（Controllers）或特定的操作方法。过滤器可以用来实现跨切面的逻辑，比如异常处理、授权、缓存、日志等。有几种类型的过滤器：授权过滤器（Authorizationfilters）资源过滤器（Resourcefilters）操作过滤器
LLAMA Factory: 简洁高效的大语言模型训练平台俞纬鉴Joshua
LLAMAFactory:简洁高效的大语言模型训练平台LLaMA-Factory易于使用的LLM微调框架（LLaMA,BLOOM,Mistral,百川，Qwen,ChatGLM）。项目地址:https://gitcode.com/gh_mirrors/ll/LLaMA-Factory项目介绍LLaMAFactory定位为一款简洁、高效的大规模语言模型训练和微调平台。其设计初衷在于让用户无需编码即可
Postgresql 删除数组中的元素 llc的足迹数据库 postgresql 数据库
extra为{“a”:[null,3,null],“b”:111}使用sql将extra中a中的null移除第一步：首先先把[null,3,null]移除，selectjson_agg(elem)filter(whereelem!='null')from(selectjsonb_array_elements('[null,3,null]'::jsonb)aselem)t;这将得到[3]jsonb_
用正则表达式过滤logcat中的多个tag的日志 fc82bb084ee7
在AndroidStudio中,在过滤器的byLogTag选项中配置.我配置了2个tagfilter方便开发,1.multi-tag-filter2.ignore-multi-tag-filter.过滤出指定tag的日志信息^(?:Watchdog|InputReader|ahking)Watchdog忽略指定tag的日志信息^(?!WifiMonitor|WifiHW)有些tag的无用log非常
java8 四大函数式接口和用于数据处理的 stream流使用详解不如敲代码 Java java lambda stream 函数式编程
文章目录Stream使用示例四大函数式接口Function功能型接口Consumer消费型接口Supplier提供型接口Predicate断言型接口常用apistream，parallelStream获取流式对象filter过滤sorted排序map映射，转换peek遍历执行某个操作reduce聚合，将数据流聚合成一个对象collect可变聚合,可以聚合成一个集合在之前一篇博客里面介绍了java8
【小结】利用filter做统一编码转换桌面很乱
思路一：静态代理在filter中做一个内部类继承HttpServletRequestWrapper（此类采用了适配器模式，全部方法均为引用构造方法中传递的ServletRequest），进行静态代理（装饰者模式）。注意区分get和post请求的编码处理方式。加强（重写）request.getParameter(Stringkey)，最后将包装过的request对象(MyRequest)传递给ser
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在