jiangliqing1234

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现

原文转自：http://blog.csdn.net/yangliuy/article/details/7494983

(update 2012.12.28 关于本项目下载及运行的常见问题 FAQ见 newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ )

一、Apriori算法

Apriori是非常经典的关联分析频繁模式挖掘算法，其思想简明，实现方便，只是效率很低，可以作为频繁模式挖掘的入门算法。其主要特点是

1、k-1项集连接规律：若有两个k-1项集，每个项集保证有序，如果两个k-1项集的前k- 2个项相同，而最后一个项不同，则证明它们是可连接的，可连接生成k项集。

2、反单调性。如果一个项集是频繁的，那么它的所有子集都是频繁的。即若一个项集的子集不是频繁项集，则该项集肯定也不是频繁项集。

主要算法流程：

1. 扫描数据库，生成候选1项集和频繁1项集。
2. 从2项集开始循环，由频繁k-1项集生成频繁频繁k项集。
2.1 频繁k-1项集两两组合，判定是否可以连接，若能则连接生成k项集。
2.2 对k项集中的每个项集检测其子集是否频繁，舍弃掉子集不是频繁项集即不在频繁k-1项集中的项集。
2.3 扫描数据库，计算2.3步中过滤后的k项集的支持度，舍弃掉支持度小于阈值的项集，生成频繁k项集。
3. 若当前k项集中只有一个项集时循环结束。

伪代码如下：

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现_第1张图片

JAVA实现代码

[java]  view plain copy   
      
     
 package com.pku.yangliu;  
   
 import java.io.BufferedReader;  
 import java.io.File;  
 import java.io.FileReader;  
 import java.io.FileWriter;  
 import java.io.IOException;  
 import java.util.ArrayList;  
 import java.util.HashMap;  
 import java.util.HashSet;  
 import java.util.List;  
 import java.util.Map;  
 import java.util.Set;  
 import java.util.TreeSet;  
   
 /**频繁模式挖掘算法Apriori实现 
  * @author yangliu 
  * @qq 772330184 
  * @blog http://blog.csdn.net/yangliuy 
  * @mail [email protected] 
  * 
  */  
   
 public class AprioriFPMining {  
     private int minSup;//最小支持度  
     private static List<Set<String>> dataTrans;//以List<Set<String>>格式保存的事物数据库,利用Set的有序性  
       
     public int getMinSup() {  
         return minSup;  
     }  
       
     public void setMinSup(int minSup) {  
         this.minSup = minSup;  
     }  
       
     /** 
      * @param args 
      */  
      public static void main(String[] args) throws IOException {   
         AprioriFPMining apriori = new AprioriFPMining();  
         double [] threshold = {0.25, 0.20, 0.15, 0.10, 0.05};  
         String srcFile = "F:/DataMiningSample/FPmining/Mushroom.dat";  
         String shortFileName = srcFile.split("/")[3];  
         String targetFile = "F:/DataMiningSample/FPmining/" + shortFileName.substring(0, shortFileName.indexOf("."))+"_fp_threshold";  
         dataTrans = apriori.readTrans(srcFile);  
         for(int k = 0; k < threshold.length; k++){  
             System.out.println(srcFile + " threshold: " + threshold[k]);  
             long totalItem = 0;  
             long totalTime = 0;  
             FileWriter tgFileWriter = new FileWriter(targetFile + (threshold[k]*100));  
             apriori.setMinSup((int)(dataTrans.size() * threshold[k]));//原始蘑菇的数据0.25只需要67秒跑出结果  
             long startTime = System.currentTimeMillis();  
             Map<String, Integer> f1Set = apriori.findFP1Items(dataTrans);  
             long endTime = System.currentTimeMillis();  
             totalTime += endTime - startTime;  
             //频繁1项集信息得加入支持度  
             Map<Set<String>, Integer> f1Map = new HashMap<Set<String>, Integer>();  
             for(Map.Entry<String, Integer> f1Item : f1Set.entrySet()){  
                 Set<String> fs = new HashSet<String>();  
                 fs.add(f1Item.getKey());  
                 f1Map.put(fs, f1Item.getValue());  
             }  
               
             totalItem += apriori.printMap(f1Map, tgFileWriter);  
             Map<Set<String>, Integer> result = f1Map;  
             do {      
                 startTime = System.currentTimeMillis();  
                 result = apriori.genNextKItem(result);  
                 endTime = System.currentTimeMillis();  
                 totalTime += endTime - startTime;  
                 totalItem += apriori.printMap(result, tgFileWriter);  
             } while(result.size() != 0);  
             tgFileWriter.close();  
             System.out.println("共用时：" + totalTime + "ms");  
             System.out.println("共有" + totalItem + "项频繁模式");  
         }  
     }  
   
      /**由频繁K-1项集生成频繁K项集 
      * @param preMap 保存频繁K项集的map 
      * @param tgFileWriter 输出文件句柄 
      * @return int 频繁i项集的数目 
      * @throws IOException  
      */  
     private Map<Set<String>, Integer> genNextKItem(Map<Set<String>, Integer> preMap) {  
         // TODO Auto-generated method stub  
         Map<Set<String>, Integer> result = new HashMap<Set<String>, Integer>();  
         //遍历两个k-1项集生成k项集  
         List<Set<String>> preSetArray = new ArrayList<Set<String>>();  
         for(Map.Entry<Set<String>, Integer> preMapItem : preMap.entrySet()){  
             preSetArray.add(preMapItem.getKey());  
         }  
         int preSetLength = preSetArray.size();  
         for (int i = 0; i < preSetLength - 1; i++) {  
             for (int j = i + 1; j < preSetLength; j++) {  
                 String[] strA1 = preSetArray.get(i).toArray(new String[0]);  
                 String[] strA2 = preSetArray.get(j).toArray(new String[0]);  
                 if (isCanLink(strA1, strA2)) { // 判断两个k-1项集是否符合连接成k项集的条件　  
                     Set<String> set = new TreeSet<String>();  
                     for (String str : strA1) {  
                         set.add(str);  
                     }  
                     set.add((String) strA2[strA2.length - 1]); // 连接成k项集  
                     // 判断k项集是否需要剪切掉，如果不需要被cut掉，则加入到k项集列表中  
                     if (!isNeedCut(preMap, set)) {//由于单调性，必须保证k项集的所有k-1项子集都在preMap中出现，否则就该剪切该k项集  
                         result.put(set, 0);  
                     }  
                 }  
             }  
         }  
         return assertFP(result);//遍历事物数据库，求支持度，确保为频繁项集  
     }  
       
     /**检测k项集是否该剪切。由于单调性，必须保证k项集的所有k-1项子集都在preMap中出现，否则就该剪切该k项集 
      * @param preMap k-1项频繁集map 
      * @param set 待检测的k项集 
      * @return boolean 是否该剪切 
      * @throws IOException  
      */  
     private boolean isNeedCut(Map<Set<String>, Integer> preMap, Set<String> set) {  
         // TODO Auto-generated method stub  
         boolean flag = false;  
         List<Set<String>> subSets = getSubSets(set);  
         for(Set<String> subSet : subSets){  
             if(!preMap.containsKey(subSet)){  
                 flag = true;  
                 break;  
             }  
         }  
         return flag;  
     }  
   
     /**获取k项集set的所有k-1项子集 
      * @param set 频繁k项集 
      * @return List<Set<String>> 所有k-1项子集容器 
      * @throws IOException  
      */  
     private List<Set<String>> getSubSets(Set<String> set) {  
         // TODO Auto-generated method stub  
         String[] setArray = set.toArray(new String[0]);  
         List<Set<String>> result = new ArrayList<Set<String>>();  
         for(int i = 0; i < setArray.length; i++){  
             Set<String> subSet = new HashSet<String>();  
             for(int j = 0; j < setArray.length; j++){  
                 if(j != i) subSet.add(setArray[j]);  
             }  
             result.add(subSet);  
         }  
         return result;  
     }  
   
     /**遍历事物数据库，求支持度，确保为频繁项集 
      * @param allKItem 候选频繁k项集 
      * @return Map<Set<String>, Integer> 支持度大于阈值的频繁项集和支持度map 
      * @throws IOException  
      */  
     private Map<Set<String>, Integer> assertFP(  
             Map<Set<String>, Integer> allKItem) {  
         // TODO Auto-generated method stub  
         Map<Set<String>, Integer> result = new HashMap<Set<String>, Integer>();  
         for(Set<String> kItem : allKItem.keySet()){  
             for(Set<String> data : dataTrans){  
                 boolean flag = true;  
                 for(String str : kItem){  
                     if(!data.contains(str)){  
                         flag = false;  
                         break;  
                     }  
                 }  
                 if(flag) allKItem.put(kItem, allKItem.get(kItem) + 1);  
             }  
             if(allKItem.get(kItem) >= minSup) {  
                 result.put(kItem, allKItem.get(kItem));  
             }  
         }  
         return result;  
     }  
   
     /**检测两个频繁K项集是否可以连接，连接条件是只有最后一个项不同 
      * @param strA1 k项集1 
      * @param strA1 k项集2 
      * @return boolean 是否可以连接 
      * @throws IOException  
      */  
     private boolean isCanLink(String[] strA1, String[] strA2) {  
         // TODO Auto-generated method stub  
         boolean flag = true;  
         if(strA1.length != strA2.length){  
             return false;  
         }else {  
             for(int i = 0; i < strA1.length - 1; i++){  
                 if(!strA1[i].equals(strA2[i])){  
                     flag = false;  
                     break;  
                 }  
             }  
             if(strA1[strA1.length -1].equals(strA2[strA1.length -1])){  
                 flag = false;  
             }  
         }  
         return flag;  
     }  
   
     /**将频繁i项集的内容及支持度输出到文件 格式为 模式:支持度 
      * @param f1Map 保存频繁i项集的容器<i项集 , 支持度> 
      * @param tgFileWriter 输出文件句柄 
      * @return int 频繁i项集的数目 
      * @throws IOException  
      */  
     private int printMap(Map<Set<String>, Integer> f1Map, FileWriter tgFileWriter) throws IOException {  
         // TODO Auto-generated method stub  
         for(Map.Entry<Set<String>, Integer> f1MapItem : f1Map.entrySet()){  
             for(String p : f1MapItem.getKey()){  
                 tgFileWriter.append(p + " ");  
             }  
             tgFileWriter.append(": " + f1MapItem.getValue() + "\n");  
         }  
         tgFileWriter.flush();  
         return f1Map.size();  
     }  
       
     /**生成频繁1项集 
      * @param fileDir 事务文件目录 
      * @return Map<String, Integer> 保存频繁1项集的容器<1项集 , 支持度> 
      * @throws IOException  
      */  
     private Map<String, Integer> findFP1Items(List<Set<String>> dataTrans) {  
         // TODO Auto-generated method stub  
         Map<String, Integer> result = new HashMap<String, Integer>();  
         Map<String, Integer> itemCount = new HashMap<String, Integer>();  
         for(Set<String> ds : dataTrans){  
             for(String d : ds){  
                 if(itemCount.containsKey(d)){  
                     itemCount.put(d, itemCount.get(d) + 1);  
                 } else {  
                     itemCount.put(d, 1);  
                 }  
             }  
         }  
           
         for(Map.Entry<String, Integer> ic : itemCount.entrySet()){  
             if(ic.getValue() >= minSup){  
                 result.put(ic.getKey(), ic.getValue());  
             }  
         }  
         return result;  
     }  
   
     /**读取事务数据库 
      * @param fileDir 事务文件目录 
      * @return List<String> 保存事务的容器 
      * @throws IOException  
      */  
     private List<Set<String>> readTrans(String fileDir) {  
         // TODO Auto-generated method stub  
         List<Set<String>> records = new ArrayList<Set<String>>();   
         try {   
             FileReader fr = new FileReader(new File(fileDir));   
             BufferedReader br = new BufferedReader(fr);   
          
             String line = null;   
             while ((line = br.readLine()) != null) {   
                 if (line.trim() != "") {   
                     Set<String> record = new HashSet<String>();   
                     String[] items = line.split(" ");   
                     for (String item : items) {   
                         record.add(item);   
                     }   
                     records.add(record);   
                 }   
             }   
         } catch (IOException e) {   
             System.out.println("读取事务文件失败。");   
             System.exit(-2);   
         }   
         return records;   
     }  
 }  
    

硬件环境：Intel Core 2 Duo CPU T5750 2GHZ, 2G内存
实验结果
F:/DataMiningSample/FPmining/Mushroom.dat threshold: 0.25
共用时：54015ms
共有5545项频繁模式
F:/DataMiningSample/FPmining/Mushroom.dat threshold: 0.2
共用时：991610ms
共有53663项频繁模式
F:/DataMiningSample/FPmining/Mushroom.dat threshold: 0.15

结论：对Mushroom.dat挖掘出来的频繁模式及支持度、频繁模式总数正确，但是算法速度很慢，对大数据量如T10I4D100K低阈值挖掘时间太长
解决办法：改用C++写FP-Growth算法做频繁模式挖掘！

二、FP-Growth算法

FP-Growth算法由数据挖掘界大牛Han Jiawei教授于SIGMOD 00‘大会提出，提出根据事物数据库构建FP-Tree，然后基于FP-Tree生成频繁模式集。主要算法流程如下

Step1 读取数据库，构造频繁1项集及FP-tree

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现_第2张图片

Step2 遍历FP-tree的头表，对于每个频繁项x，累积项x的所有前缀路径形成x的条件模式库CPB

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现_第3张图片

Step3 对CPB上每一条路径的节点更新计数为x的计数，根据CPB构造条件FP-tree
Step4 从条件FP-tree中找到所有长路径，对该路径上的节点找出所有组合方式，然后合并计数
Step5 将Step4中的频繁项集与x合并，得到包含x的频繁项集
Step2-5 循环，直到遍历头表中的所有项

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现_第4张图片

由于时间关系，主要基于芬兰教授Bart Goethals的开源代码实现，源码下载见点击打开链接，文件结构及运行结果如下

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现_第5张图片

对Mushroom.dat，accidents.dat和T10I4D100K.dat三个数据集做频繁模式挖掘的结果如下

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现_第6张图片

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现_第7张图片

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现_第8张图片

三、Eclat算法
Eclat算法加入了倒排的思想，加快频繁集生成速度，其算法思想是由频繁k项集求交集，生成候选k+1项集。对候选k+1项集做裁剪，生成频繁k+1项集，再求交集生成候选k+2项集。如此迭代，直到项集归一。
算法过程：
1.一次扫描数据库，获得初始数据。包括频繁1项集，数据库包含的所有items，事务总数（行）transNum，最小支持度minsup=limitValue*trans。
2.二次扫描数据库，获得频繁2项集。
3.按照Eclat算法，对频繁2项集迭代求交集，做裁剪，直到项集归一。

JAVA实现如下

[java]  view plain copy   
      
     
 package com.pku.yhf;  
   
 import java.io.BufferedReader;  
 import java.io.BufferedWriter;  
 import java.io.File;  
 import java.io.FileInputStream;  
 import java.io.FileNotFoundException;  
 import java.io.FileReader;  
 import java.io.FileWriter;  
 import java.io.IOException;  
 import java.io.InputStreamReader;  
 import java.util.ArrayList;  
 import java.util.BitSet;  
 import java.util.Iterator;  
 import java.util.Set;  
 import java.util.TreeMap;  
 import java.util.TreeSet;  
   
 public class EclatRelease {  
   
     private File file=new File("D:/mushroom.dat.txt");  
     private float limitValue=0.25f;  
     private int transNum=0;  
     private ArrayList<HeadNode> array=new ArrayList<HeadNode>();  
     private HashHeadNode[] hashTable;//存放临时生成的频繁项集，作为重复查询的备选集合  
     public long newItemNum=0;  
       
     private File tempFile=null;  
     private BufferedWriter bw=null;  
       
     public static long modSum=0;  
     /** 
      * 第一遍扫描数据库，确定Itemset,根据阈值计算出支持度数 
      */  
     public void init()  
     {  
         Set itemSet=new TreeSet();  
         MyMap<Integer,Integer> itemMap=new MyMap<Integer,Integer>();  
           
         int itemNum=0;  
         Set[][] a;  
         try {  
             FileInputStream fis=new FileInputStream(file);  
             BufferedReader br=new BufferedReader(new InputStreamReader(fis));  
             String str=null;  
               
             //第一次扫描数据集合  
             while((str=br.readLine()) != null)  
             {  
                 transNum++;  
                 String[] line=str.split(" ");  
                 for(String item:line)  
                 {  
                     itemSet.add(Integer.parseInt(item));  
                     itemMap.add(Integer.parseInt((item)));  
                 }  
             }  
             br.close();  
         //  System.out.println("itemMap lastKey:"+itemMap.lastKey());  
         //  System.out.println("itemsize:"+itemSet.size());  
         //  System.out.println("trans: "+transNum);  
             //ItemSet.limitSupport=(int)Math.ceil(transNum*limitValue);//上取整  
             ItemSet.limitSupport=(int)Math.floor(transNum*limitValue);//下取整  
             ItemSet.ItemSize=(Integer)itemMap.lastKey();  
             ItemSet.TransSize=transNum;  
             hashTable=new HashHeadNode[ItemSet.ItemSize*3];//生成项集hash表  
             for(int i=0;i<hashTable.length;i++)  
             {  
                 hashTable[i]=new HashHeadNode();  
             }  
               
         //  System.out.println("limitSupport:"+ItemSet.limitSupport);  
               
               
             tempFile=new File(file.getParent()+"/"+file.getName()+".dat");  
             if(tempFile.exists())  
             {  
                 tempFile.delete();  
             }  
             tempFile.createNewFile();  
               
               
             bw=new BufferedWriter(new FileWriter(tempFile));  
               
               
               
             Set oneItem=itemMap.keySet();  
             int countOneItem=0;  
             for(Iterator it=oneItem.iterator();it.hasNext();)  
             {  
                 int key=(Integer)it.next();  
                 int value=(Integer)itemMap.get(key);  
                 if(value >= ItemSet.limitSupport)  
                 {  
                     bw.write(key+" "+":"+" "+value);  
                     bw.write("\n");  
                     countOneItem++;  
                 }  
             }  
             bw.flush();  
             modSum+=countOneItem;  
               
             itemNum=(Integer)itemMap.lastKey();  
               
             a=new TreeSet[itemNum+1][itemNum+1];  
             array.add(new HeadNode());//空项  
               
             for(short i=1;i<=itemNum;i++)  
             {  
                 HeadNode hn=new HeadNode();  
             //  hn.item=i;  
                 array.add(hn);  
             }  
               
             BufferedReader br2=new BufferedReader(new FileReader(file));  
               
             //第二次扫描数据集合,形成2-项候选集  
             int counter=0;//事务  
             int max=0;  
             while((str=br2.readLine()) != null)  
             {max++;  
                 String[] line=str.split(" ");  
                 counter++;  
                 for(int i=0;i<line.length;i++)  
                 {  
                     int sOne=Integer.parseInt(line[i]);  
                     for(int j=i+1;j<line.length;j++)  
                     {  
                         int sTwo=Integer.parseInt(line[j]);  
                         if(a[sOne][sTwo] == null)  
                         {  
                             Set set=new TreeSet();  
                             set.add(counter);  
                             a[sOne][sTwo]=set;  
                         }  
                         else{  
                             a[sOne][sTwo].add(counter);  
                                                       
                         }  
                     }  
                 }  
             }  
             //将数组集合转换为链表集合  
               
             for(int i=1;i<=itemNum;i++)  
             {  
                 HeadNode hn=array.get(i);  
                 for(int j=i+1;j<=itemNum;j++)  
                 {  
                     if(a[i][j] != null && a[i][j].size() >= ItemSet.limitSupport)  
                     {  
                         hn.items++;  
                         ItemSet is=new ItemSet(true);  
                         is.item=2;  
                         is.items.set(i);  
                         is.items.set(j);  
                         is.supports=a[i][j].size();  
                         bw.write(i+" "+j+" "+": "+is.supports);  
                         bw.write("\n");  
                         //统计频繁2-项集的个数  
                         modSum++;  
                         for(Iterator it=a[i][j].iterator();it.hasNext();)  
                         {  
                             int value=(Integer)it.next();  
                             is.trans.set(value);  
                         }  
                         if( hn.first== null)  
                         {  
                             hn.first=is;  
                             hn.last=is;  
                         }  
                         else{  
                             hn.last.next=is;  
                             hn.last=is;  
                         }  
                     }  
                 }  
             }  
             bw.flush();  
         } catch (FileNotFoundException e) {  
             e.printStackTrace();  
         } catch (IOException e) {  
             e.printStackTrace();  
         }  
     }  
     public void start()  
     {  
         boolean flag=true;  
         //TreeSet ts=new TreeSet();//临时存储项目集合，防止重复项集出现，节省空间  
           
         int count=0;  
           
         ItemSet shareFirst=new ItemSet(false);  
           
         while(flag)  
         {  
             flag=false;  
             //System.out.println(++count);  
             for(int i=1;i<array.size();i++)  
             {  
                 HeadNode hn=array.get(i);  
                   
                   
                 if(hn.items > 1 )//项集个数大于1  
                 {     
                     generateLargeItemSet(hn,shareFirst);  
                     flag=true;  
                       
                 }  
                 clear(hashTable);  
             }  
               
         }try {  
             bw.close();  
         } catch (IOException e) {  
             e.printStackTrace();  
         }  
     }  
     public void generateLargeItemSet(HeadNode hn,ItemSet shareFirst){  
           
           
         BitSet bsItems=new BitSet(ItemSet.ItemSize);//存放链两个k-1频繁项集的ItemSet交  
         BitSet bsTrans=new BitSet(ItemSet.TransSize);//存放两个k-1频繁项集的Trans交  
         BitSet containItems=new BitSet(ItemSet.ItemSize);//存放两个k-1频繁项集的ItemSet的并  
         BitSet bsItems2=new BitSet(ItemSet.ItemSize);//临时存放容器BitSet  
           
         ItemSet oldCurrent=null,oldNext=null;  
         oldCurrent=hn.first;  
         long countItems=0;  
           
         ItemSet newFirst=new ItemSet(false),newLast=newFirst;  
         while(oldCurrent != null)  
         {  
             oldNext=oldCurrent.next;  
             while(oldNext != null)  
             {  
                 //生成k—项候选集，由两个k-1项频繁集生成  
                 bsItems.clear();  
                 bsItems.or(oldCurrent.items);  
                 bsItems.and(oldNext.items);  
                   
                 if(bsItems.cardinality() < oldCurrent.item-1)  
                 {  
                     break;  
                 }  
                 //新合并的项集是否已经存在  
                   
                 containItems.clear();  
                 containItems.or(oldCurrent.items);//将k-1项集合并  
                 containItems.or(oldNext.items);  
                   
                 if(!containItems(containItems,bsItems2,newFirst)){  
                       
                     bsTrans.clear();  
                     bsTrans.or(oldCurrent.trans);  
                     bsTrans.and(oldNext.trans);  
                     if(bsTrans.cardinality() >= ItemSet.limitSupport)  
                     {  
                         ItemSet is=null;  
                           
                         if(shareFirst.next == null)//没有共享ItemSet链表  
                         {  
                             is=new ItemSet(true);  
                             newItemNum++;  
                         }  
                         else  
                         {  
                             is=shareFirst.next;  
                             shareFirst.next=shareFirst.next.next;  
                               
                             is.items.clear();  
                             is.trans.clear();  
                             is.next=null;  
                               
                         }  
                         is.item=(oldCurrent.item+1);//生成k—项候选集，由两个k-1项频繁集生成  
                           
                         is.items.or(oldCurrent.items);//将k-1项集合并  
                         is.items.or(oldNext.items);//将k-1项集合并  
                           
                         is.trans.or(oldCurrent.trans);//将bs1的值复制到bs中  
                         is.trans.and(oldNext.trans);  
                           
                         is.supports=is.trans.cardinality();  
                           
                         writeToFile(is.items,is.supports);//将频繁项集及其支持度写入文件  
                         countItems++;  
                           
                         modSum++;  
                         newLast.next=is;  
                         newLast=is;  
                           
                     }  
                 }  
                 oldNext=oldNext.next;  
             }  
             oldCurrent=oldCurrent.next;  
         }  
           
         ItemSet temp1=hn.first;  
         ItemSet temp2=hn.last;  
           
         temp2.next=shareFirst.next;  
         shareFirst.next=temp1;  
           
         hn.first=newFirst.next;  
         hn.last=newLast;  
         hn.items=countItems;  
           
     }  
       
     public boolean containItems(BitSet containItems,BitSet bsItems2,ItemSet first)  
     {  
         long size=containItems.cardinality();//项集数目  
           
         int itemSum=0;  
         int temp=containItems.nextSetBit(0);  
         while(true)  
         {  
             itemSum+=temp;  
             temp=containItems.nextSetBit(temp+1);  
             if(temp == -1)  
             {  
                 break;  
             }  
         }  
           
         int hash=itemSum%(ItemSet.ItemSize*3);  
           
         HashNode hn=hashTable[hash].next;  
         Node pre=hashTable[hash];  
         while(true)  
         {  
             if(hn == null)//不包含containItems  
             {  
                 HashNode node=new HashNode();  
                 node.bs.or(containItems);  
                   
                 pre.next=node;  
                   
                 return false;  
             }  
             if(hn.bs.isEmpty())  
             {  
                 hn.bs.or(containItems);  
                   
                 return false;  
             }  
               
             bsItems2.clear();  
             bsItems2.or(containItems);  
             bsItems2.and(hn.bs);  
               
             if(bsItems2.cardinality() == size)  
             {  
                 return true;  
             }  
             pre=hn;  
             hn=hn.next;  
         }  
           
     }  
       
     public void clear(HashHeadNode[] hashTable)  
     {  
         for(int i=0;i<hashTable.length;i++)  
         {  
             HashNode node=hashTable[i].next;  
             while(node != null)  
             {  
                 node.bs.clear();  
                 node=node.next;  
             }  
         }  
     }  
       
     public void writeToFile(BitSet items,int supports)  
     {  
         StringBuilder sb=new StringBuilder();  
         //sb.append("<");  
         int temp=items.nextSetBit(0);  
         sb.append(temp);  
         while(true)  
         {  
             temp=items.nextSetBit(temp+1);  
             if(temp == -1)  
             {  
                 break;  
             }  
             //sb.append(",");  
             sb.append(" ");  
             sb.append(temp);  
         }  
         sb.append(" :"+" "+supports);  
         try {  
             bw.write(sb.toString());  
             bw.write("\n");  
         } catch (IOException e) {  
             e.printStackTrace();  
         }  
     }  
     public static void main(String[] args) {  
         EclatRelease e=new EclatRelease();  
         long begin=System.currentTimeMillis();  
         e.init();  
         e.start();  
         long end=System.currentTimeMillis();  
           
         double time=(double)(end-begin)/1000;  
         System.out.println("共耗时"+time+"秒");  
         System.out.println("频繁模式数目:"+EclatRelease.modSum);  
     }  
 }  
 class MyMap<T,E> extends TreeMap  
 {  
     public void add(T obj)  
     {  
         if(this.containsKey(obj))  
         {  
             int value=(Integer)this.get(obj);  
             this.put(obj, value+1);  
         }  
         else   
             this.put(obj, 1);  
     }  
 }  

ItemSet类如下

[java]  view plain copy   
      
     
 package com.pku.yhf;  
   
 import java.util.BitSet;  
   
 public class ItemSet {  
     public static  int limitSupport;//根据阈值计算出的最小支持度数  
     public static int ItemSize;//Items数目  
     public static int TransSize; //事务数目  
       
     public boolean flag=true; //true，表示作为真正的ItemSet,false只作为标记节点，只在HashTabel中使用  
       
     public int item=0;// 某项集  
       
     public int supports=0;//项集的支持度  
       
     public BitSet items=null;  
     public BitSet trans=null;  
       
     //public TreeSet items=new TreeSet();//项集  
     //public TreeSet trans=new TreeSet();//事务集合  
     public ItemSet next=null;//下一个项集  
       
     public ItemSet(boolean flag)  
     {  
         this.flag=flag;  
         if(flag)  
         {  
             item=0;// 某项集  
               
             supports=0;//项集的支持度  
               
             items=new BitSet(ItemSize+1);  
             trans=new BitSet(TransSize+1);  
         }  
     }  
 }  

对mushroom.dat的频繁模式挖掘结果如下

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现_第9张图片

你可能感兴趣的:(数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现)

[科普] EEPROM、NOR Flash、NAND Flash 是常用的非易失性存储器（断电后保留数据）(DS-R1生成) 兴趣使然_ 嵌入式硬件相关开发语言
在电子系统中，EEPROM、NORFlash、NANDFlash是常用的非易失性存储器（断电后保留数据），但它们在性能、结构、用途上有显著差异。以下是核心对比：1.EEPROM（ElectricallyErasableProgrammableROM）写入方式支持按字节擦写，无需全片擦除即可修改单个字节数据。容量通常为几KB到几MB，适合存储少量数据（如设备配置参数、校准数据）。速度写入速度较慢（m
[科普] SRAM 和 PSRAM 易失性存储器（断电后数据丢失）(由DS-R1生成) 兴趣使然_ 嵌入式硬件相关 fpga开发
在易失性存储器（断电后数据丢失）中，SRAM和PSRAM是两种常见的高速存储方案，但它们的技术原理和应用场景有明显差异。以下是详细对比和扩展说明：1.SRAM（StaticRandom-AccessMemory）核心特性静态存储：通过6晶体管（6T）锁存结构存储数据，无需外部刷新电路，数据在通电时永久保持。速度：读写速度极快（纳秒级延迟），远高于DRAM或Flash，常见于高速缓存场景。功耗：静态
“平均工作电流 10mA / 24HRAVG” 的含义 (由DS-R1生成) 兴趣使然_ 嵌入式硬件相关 ai
“平均工作电流10mA/24HRAVG”的含义可解析如下：分解解释平均工作电流10mA指设备在正常工作状态下，平均消耗的电流为10毫安（mA）。这里的“平均”可能包含不同工作模式（如运行、待机、休眠）或周期性任务下的综合电流值。/24HRAVG“24HR”表示24小时（Hour），“AVG”表示平均（Average）。组合含义：按24小时为周期计算的平均电流，即设备在一天内的整体平均功耗为10mA
【＜二＞丹方改良：Spring 时代的 JavaWeb】之 Spring MVC 的核心组件：DispatcherServlet 的工作原理 Foyo Designer spring mvc java servlet HandlerMapping ViewResolver
点击此处查看合集https://blog.csdn.net/foyodesigner/category_12907601.html?fromshare=blogcolumn&sharetype=blogcolumn&sharerId=12907601&sharerefer=PC&sharesource=FoyoDesigner&sharefrom=from_link一、DispatcherServ
【脑洞小剧场】零帧起手创业小公司之第一次技术分享会 Foyo Designer 技术职场小剧职场和发展程序人生学习方法改行学it 程序员创富
点击查看小剧场合集https://blog.csdn.net/foyodesigner/category_12896948.html阳光明媚的早晨，段萌儿怀揣着对新工作的无限憧憬，踏入了这家充满未知的小公司。然而，她万万没想到，第一天上班就迎来了一场“惊悚”之旅。阳光透过会议室的窗户，洒在摆满椅子的地板上，技术分享会的氛围既紧张又期待。今天，将是公司第一次正式的技术交流盛会，各路技术大牛摩拳擦掌，
熔断和降级的区别，具体使用场景有哪些？蒂法就是我 spring java 后端
熔断与降级的核心区别在于触发条件和应用目标，具体差异及使用场景如下：一、核心区别对比维度熔断降级触发原因下游依赖服务故障（如超时、异常率过高）触发系统整体负载过高或流量洪峰管理目标层级框架级保护（无业务优先级区分）业务级调整（需区分核心/非核心功能）实现方式自动触发（如Hystrix断路器模式）手动配置或自动触发（需预设fallback逻辑）恢复机制自动探测依赖恢复后逐步放量（半开状态）需人工介入
网络设备带内管理与带外管理：应用场景、区别及优缺点详解网络小白不怕黑网络科普网络网络管理网络科普
目录引言什么是带内管理与带外管理？带内管理与带外管理的应用场景带内管理的应用场景带外管理的应用场景带内管理与带外管理的区别数据传输路径管理接口安全性可靠性带内管理与带外管理的优缺点带内管理的优缺点带外管理的优缺点如何选择带内管理与带外管理？总结1.引言在网络管理中，带内管理（In-BandManagement）和带外管理（Out-of-BandManagement）是两种常见的管理方式。它们分别适
AI推动地理信息系统（GIS）软件的创新发展与应用拓展酥脆可口 facebook
摘要地理信息系统（GIS）软件作为空间数据处理与分析的核心工具，在城市规划、资源管理、环境监测等领域发挥着关键作用。本文深入探讨人工智能（AI）如何推动GIS软件的创新发展，分析AI技术在提升空间数据分析能力、优化地图制图、拓展应用场景等方面的重要作用，剖析面临的挑战，并对未来发展趋势进行展望，旨在为GIS行业借助AI实现升级提供理论与实践参考。一、引言传统GIS软件主要依赖基于规则的分析方法和人
python实现一个通讯录，拥有添加联系人，删除联系人，修改联系人，查询联系人，查找通讯录，退出功能新手懒羊哥 python 开发语言
print('-'*25)#输出25个横杠print('-'*25)print("欢迎使用通讯录")print("1.添加联系人")print("2.查看通讯录")print("3.删除联系人")print("4.修改联系人")print("5.查找联系人")print("6.退出")print('-'*25)list1=[0]*10all_user=[]whileTrue:choose=inpu
STM32单片机中APB1和APB2总线选择新手懒羊哥单片机 stm32 嵌入式硬件
在STM32单片机中，APB1和APB2是两种不同的外设总线，它们的主要区别在于连接的外设类型和时钟频率。以下是使用APB1和APB2的时机：APB1（低速总线）：APB1的最高频率一般为36MHz或42MHz。适用于连接低速外设，如I2C、SPI、USART、USB、DAC、I/O端口、定时器等。如果外设的时序要求不是很严格，或者数据传输速率较低，适合使用APB1。APB2（高速总线）：APB2
基于Python爬虫的商业新闻趋势分析：数据抓取与深度分析实战 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言媒体游戏
在信息化和数字化日益发展的今天，商业新闻成为了行业动向、市场变化、竞争格局等多方面信息的重要来源。对于企业和投资者来说，及时了解商业新闻不仅能帮助做出战略决策，还能洞察市场趋势和风险。在此背景下，商业新闻分析的需求日益增长。通过爬虫技术获取和分析商业新闻数据，不仅可以节省时间和成本，还能高效、精准地进行趋势预测与决策支持。本篇博客将详细介绍如何使用Python爬虫技术抓取商业新闻数据，并进行趋势分
基于Python的金融领域AI训练数据抓取实战（完整技术解析）海拥✘ python 金融人工智能
项目背景与需求分析场景描述为训练一个覆盖全球金融市场的多模态大语言模型（LLM），需实时采集以下数据：全球30+主要证券交易所（NYSE、NASDAQ、LSE、TSE等）的上市公司公告企业财报PDF文档及结构化数据社交媒体舆情数据（Twitter、StockTwits）新闻媒体分析（Reuters、Bloomberg）技术挑战地理封锁：部分交易所（如日本TSE）仅允许本国IP访问历史数据动态反爬：
Spring中的循环依赖问题是什么？上官美丽 java ide java spring boot
在使用Spring框架进行开发时，可能会遇到一个比较棘手的问题，那就是循环依赖。说到循环依赖，很多人可能会感到有些困惑，难道这个问题真的有那么复杂吗？其实，理解循环依赖并不是很难。我们可以从Spring的依赖注入机制入手，看看循环依赖是如何产生的，以及如何解决这个问题，让项目运行得更加顺利。**什么是循环依赖呢？**简单来说，循环依赖就是在两个或多个Bean之间相互引用的情况。举个例子，假设有两个
【AI论文】ReCamMaster：基于单视频的相机控制式生成渲染东临碣石82 人工智能数码相机计算机视觉
摘要：相机控制在基于文本或图像条件的视频生成任务中已得到积极研究。然而，尽管改变给定视频的相机轨迹在视频创作领域具有重要意义，但这一领域的研究仍显不足。由于需要保持多帧外观和动态同步的额外约束，这一任务颇具挑战性。为解决这一问题，我们提出了ReCamMaster，这是一个相机控制的生成式视频重渲染框架，能够在新的相机轨迹下重现输入视频中的动态场景。其核心创新在于通过一种简单而强大的视频条件机制，利
解决开发FFMPEG视频播放器右侧白色线问题吃面不喝汤66 OBS二次开发 ffmpeg 音视频
在开发基于Qt和FFmpeg的视频播放器时，我遇到一个常见但令人困惑的问题：在使用VideoWidget（继承自QOpenGLWidget）播放某些视频时，窗口右侧会出现一条白色线。这不仅影响视觉效果，还可能暴露潜在的渲染或缓冲区问题。本文将详细分析这一现象的成因，并提供经过验证的解决方案。问题现象在使用自定义的VideoDecoder和VideoWidget类播放视频时，大多数视频都能正常显示，
SvelteKit 最新中文文档教程（7）—— 构建和部署
前言Svelte，一个语法简洁、入门容易，面向未来的前端框架。从Svelte诞生之初，就备受开发者的喜爱，根据统计，从2019年到2024年，连续6年一直是开发者最感兴趣的前端框架No.1：Svelte以其独特的编译时优化机制著称，具有轻量级、高性能、易上手等特性，非常适合构建轻量级Web项目。为了帮助大家学习Svelte，我同时搭建了Svelte最新的中文文档站点。如果需要进阶学习，也可以入手我
C++并发编程有什么最佳实践？ c++
在C++并发编程中，遵循最佳实践可以显著提升代码的效率、可维护性和可扩展性。以下是一些关键的最佳实践：使用线程池管理线程线程池可以预先创建一组线程，并在需要时将任务分配给这些线程。这种方式减少了创建和销毁线程的开销，提高了程序性能。例如：cpp复制autopool=std::make_shared(std::thread::hardware_concurrency());pool->push(st
QT中日志的使用案例 || 自动创建、管理、保存QT日志数据长安第一美人 qt 开发语言 c++嵌入式硬件
目录1.quiwidget.cpp2.widget.cpp3.widget.h4.在需要记录日志的地方直接将信息插入即可1.释放`m_fileLog`和`m_textStream`1.1为什么要关闭和删除`m_fileLog`和`m_textStream`？1.2如果不这样做会有什么坏处？3.总结4.参考文章需求分析：想实现在qt代码中对软件运行过程中容易出现的问题进行记录，将电量异常分析日志与平
php 高性能，高并发，有哪些框架，扩展，推荐一下，或者技术的实现有哪些行思理运维 LNMP Linux php 开发语言
以下是针对PHP高性能、高并发场景的框架、扩展及技术实现推荐，结合最新技术趋势和行业实践进行总结：一、高性能框架推荐1.C扩展类框架YAF(YetAnotherFramework)特点：由C语言编写，直接嵌入PHP内核，仅提供核心MVC功能，执行效率极高（RPS可达3000+），适合API网关、秒杀系统等场景213。适用场景：对性能要求极高但功能需求简单的项目，如百度、微博部分业务曾采用其修改版。
甘特图：项目经理的时空魔方，解锁高效管理的秘密
在1917年，机械工程师亨利·甘特发明了一张看似简单的条形图，却彻底改变了人类管理复杂工程的方式。如今，这张图表在波音787客机研发、北京冬奥会场馆建设中依然发挥着关键作用。甘特图不仅是进度条的可视化，更是项目管理的时空坐标系——它能将抽象的时间、资源和任务转化为具象的作战地图，让项目经理如同掌握时空魔方般操控项目进程。一、甘特图的四大降维打击优势时空折叠术：三维信息二维呈现时间维度：在特斯拉上海
项目经理在推进项目时，职能线经理不配合怎么办？
在矩阵型组织中，项目经理与职能线经理的博弈如同“双人舞”——前者关注项目目标，后者专注职能效率，两者的权力交叉地带往往成为冲突高发区。PMI报告显示，68%的项目延期与资源协调受阻直接相关，而职能经理的配合度是资源获取的核心变量。本文将从权力结构剖析、实战应对策略到长效机制建设，提供一套破解职能壁垒的系统化方案。一、职能博弈的三大底层逻辑资源争夺战职能经理的KPI聚焦部门资源利用率，与项目临时抽调
项目经理的验收突围战：从风险预判到价值交付的破局之道
在软件项目交付失败的统计中，近40%的问题集中爆发在验收环节。当某智慧城市项目在验收阶段遭遇23个功能点争议时，项目经理发现合同中的验收标准竟写着"系统运行稳定"这样的模糊表述——这个真实案例折射出验收管理的复杂性。项目经理需要构建从需求源头到价值交付的全周期验收防御体系。一、验收危机的三大引爆点与拆解策略需求迷雾：概念共识的断层某医疗AI项目开发时，客户口中的"智能分诊"被工程师理解为规则引擎，
UniApp 从Vue2升级为Vue3需要注意哪些方面行思理 App开发 uni-app vue.js javascript Vue3 Vue2
Vue官方已经发布了Vue3，Vue2不再维护，也在建议大家都迁移到Vue3，所以Vue2终会被淘汰。那么UniApp从Vue2升级为Vue3需要注意哪些方面：1、main.js下面请看创建应用实例Vue2与Vue3的不同：Vue2的写法：//之前-Vue2importVuefrom'vue'importAppfrom'./App'Vue.config.productionTip=false//v
客户总是提出不合理的需求，如何破局？
在项目管理中，“客户提出不合理需求”是项目经理最常遇到的挑战之一。这些需求可能超出合同范围、违背技术可行性、突破预算或时间限制，甚至逻辑上自相矛盾。但真正的困境往往不在于需求本身是否合理，而在于如何平衡客户期望与项目边界，将对抗转化为合作。本文将从需求本质剖析、结构化应对策略到高阶破局思维，提供一套系统化的解决方案。一、需求“不合理”的本质诊断表象与根源的错位冰山模型：客户表面需求（如“界面要更酷
dfs（二十二）78. 子集曾几何时` #DFS 深度优先算法数据结构
78.子集给你一个整数数组nums，数组中的元素互不相同。返回该数组所有可能的（幂集）。解集不能包含重复的子集。你可以按任意顺序返回解集。示例1：输入：nums=[1,2,3]输出：[[],[1],[2],[1,2],[3],[1,3],[2,3],[1,2,3]]示例2：输入：nums=[0]输出：[[],[0]]提示：1>res;vectorpath;vector>subsets(vector
【算法设计-链栈和链队列】链栈和链队列的实现 baimeng5720 算法设计
1.链队列。利用带有头结点的单链表来实现链队列,插入和删除的复杂度都为o(1)代码：#include#includetypedefstructQnode{intdata;Qnode*next;}Qnode;typedefstructLinkQueue{Qnode*front;Qnode*rear;}LinkQueue;voidinitialize(LinkQueue*LinkQueue){Link
链栈与链队列 aaaaaries 单链表队列链表
链栈链栈的定义栈的链式存储结构链栈：即用链表实现栈存储结构栈顶：允许插入和删除的一端（top）栈底：不同于栈顶的另外一端（bottom）空栈：不含任何元素的栈链栈实际上就是一个只能采用头插法插入或删除数据的链表//链栈表示structlink{intdata;structlink*next;};//链栈初始化voidinitstack(structlink*top){top=(structlink
【数据结构】 -- 链表的入栈弹栈王峰～ C语言数据结构
#include#include//链表中的节点结构typedefstructlineStack{intdata;structlineStack*next;}lineStack;//入栈操作;//stack为当前的链栈，a表示入栈元素lineStack*push(lineStack*stack,inta){//创建存储新元素的节点lineStack*line=(lineStack*)malloc(
华纳云：BenchSEE测试工具怎么用？测试
BenchSEE测试工具的使用方法可以按照以下步骤进行：BenchSEE简介：BenchSEE是中国标准化研究院开发的一款服务器产品能效测试基准软件。它支持多种服务器类型和硬件平台，并兼容主流操作系统。准备工作：确保测试系统包括控制端（可以是PC或服务器，需联网并支持谷歌浏览器）、被测服务器、温度计（可选择模拟模式）、功耗仪（可选择模拟模式）。若要生成可信报告，则必须链接功耗仪和温度计。注意功耗仪
springboot独立邮件服务器,后端篇-SpringBoot–自定义域名发送邮件洋莞成
前言最近的一个小项目用到了邮件发送的功能，由于自己实现一套SMTP比较复杂，于是借助第三方如QQ邮箱或网易邮箱或Gmail等邮件系统实现此功能，在开发过程中我使用了网易邮箱，并申请了免费的网易企业邮箱实现自定义域名发送邮件。邮件协议SMTPSMTP(SimpleMailTransferProtocol)即简单邮件传输协议是一个在互联网上传输电子邮件的标准。POPPOP(PostOfficeProt
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &