FP—Growth算法

FP_growth算法是韩家炜老师在2000年提出的关联分析算法，该算法和Apriori算法最大的不同有两点：

第一，不产生候选集，第二，只需要两次遍历数据库，大大提高了效率，用31646条测试记录，最小支持度是2%，

用Apriori算法要半个小时但是用FP_growth算法只要6分钟就可以了，效率非常明显。

它的核心是FP_tree，一种树型数据结构，特点是尽量把相同元素用一个节点表示，这样就大大减少了空间，和birch算法有类似的思想。还是以如下数据为例。

每一行表示一条交易，共有9行，既9笔交易，左边表示交易ID，右边表示商品名称。最小支持度是22%，那么每件商品至少要出现9*22%=2次才算频繁。第一次扫描数据库，统计每件商品出现的次数，按次数对各个商品递减排序，有：。然后第二次扫描数据库，在每条交易中按此种顺序给商品排序，如果有某个商品出现的次数小于阈值2，则删除该商品，有：

剩下的就是构造FP_tree了，这是核心，树的每个节点的结构体如下：

//FP-tree的存储结构
typedef struct CSNode{
//商品编号
int item;
//次数
int count;
//父节点，孩子节点，兄弟节点
CSNode *parent,*firstchild,*nextsibling;
//相同商品的前驱，后继节点，方便将相同商品的节点连接起来,根节点的直接孩子节点的这两个指针都是空
CSNode *pre,*next;
}*CSTree;
其中item,*firstchild,*nextsibling是树这个结构体常用的属性。count记录商品item出现的次数，*parent是为了方便从叶子节点逆向访问根节点而设置的。*pre,*next的注释已经很清楚了。构造树的原则是：将每条记录看做一个从根节点到叶子节点的路径，如果某个商品在节点中已经存在了，则对应count计数器加1，相当于所有的前缀都要加1,如果不存在则在该条记录的后面商品开辟一条新的路径。下面一条一条记录演示怎么构造FP_tree。

第三次访问数据库，构造FP_tree。第一条记录：I2,I1,I5，有：

父节点没有表示出来，根节点是空节点。2:1表示商品2出现了1次，其他表示类推。左边的数组按照商品顺序递减排列，保存了各个商品的当前指针，目的是为了在后面找到相同的后缀，将相同的商品用单项箭头虚线连起来，实际是双向链表链接的，并且将此时的节点商品1和节点商品5保存为商品1和商品5的当前指针，而对于商品2，商品3，商品4的当前指针还在左边的数组中保存。注意根节点的直接孩子不用连起来，后面会讲理由。第二条记录：I2,I4，有：

该记录和第一条记录共用前缀I2,所以商品2的次数要加1，而商品4则作为商品2的一个新孩子节点，这里没有把兄弟节点画出来。并且左边商品4要指向该节点，此时商品4的当前指针指向节点商品4。第三条记录：I2,I3,类似，结果是：

第四条记录：I2,I1,I4有：

当添加完商品4后，商品4的当前指针要指向新的节点商品4，此时两条红色的虚线就把以商品4为后缀的节点连起来了。第5条记录：I1,I3,有：

商品1由于和根节点的所有直接子孩子（这里只有商品2这个子孩子）不同，因此要另外开辟一条路径。商品3的当前指针要指向新的节点商品3，如图中的黄色虚线所指，到这里体现了构造FP_tree的一般性了。再把剩下的记录都加进来，最终的FP_tree是：

这颗FP_tree最大程度的把相同的商品放在用同一个节点保存，最大限度的节省了空间。剩下的工作就是挖掘这颗FP_tree了。

挖掘的目的是找出FP_tree的各个路径中相同的集合，有两中方式，方式一，从根节点朝叶子节点顺着遍历树，方式二，从叶子节点朝根节点逆着遍历树。想想方式一挺麻烦的，幸亏我们设置了*parent指针，通过它就可以很方便的用方式二。我们从商品出现次数由少到多的顺序开始遍历树，先从商品5开始，由于有*pre,*next指针分方便将所有以商品5做为叶子节点的路径全找出来，然后再根据*parent指针找到父节点，根节点是空不用找。以I5做元素的条件模式基是：{(I2 I1:1),(I2 I1 I3:1)}。后面的1表示出现商品I2,I1,I5同时出现的次数。现在解释为什么：根节点的直接孩子不用*pre,*next指针连起来，因为假如连起来的话，那么以它为后缀时，将没有前缀，也就是说它的频繁项集是1，这在大多数情况下没意义。由它构造出条件FP_tree，注意由于开始按照商品名称排序了，那么条件模式基中的每一项也会按照这种方式排序。如果条件模式基中某项A是另外一项B的子集那么在算B时，要将A出现的次数加上，实现这个功能最简单明了的方法就是一一匹配，假如条件模式基共有N项，则时间复杂度是N的平方，若先按照条件模式基的长度递增排序得到：{(I2 I1:1),(I2 I1 I3:1)}，排序的时间复杂度是N*log(N),那么只有可能是长度短的项是长度长的项的子集，此时总匹配次数是：N-1 + N-2 + ,,, + 1 = N*(N-1)/2,和前面的排序时间加起来是：N*log(N) + N*(N-1)/2当N大于时4时，该值小于N的平方。在实际中N一般会大于4。最终我们得到以I5作为后缀的频繁项集是：{I2 I5:2},{I1 I5:2},{I2 I1 I5:2}他们出现的次数都大于等于最小支持度。类似可以得到其它后缀的频繁项集。

FP_growth算法不产生候选序列，并且只需要3次遍历数据库，对比Apriori算法而言有了很大的改进。其实想想这也符合历史发展的规律，Apriori在1993年才提出来的，那是数据挖掘才刚起步，而到2000年时，已经有了一定的发展，FP_growth是站在Apriori的肩膀上发明的，这种现象具有普遍性。

FP—growth代码实现部分

主程序部分

 1 package DataMining_FPTree;

 2 /**

 3  * FPTree频繁模式树算法

 4  * 一个使用的这个算法的用例是输入一个单词或者单词的一部分，搜索引擎就会自动 补全查询词项，通过查看互联网上的用词来找出经常在一块出现的词对（使用Aporior算法也是找出经常出现的词对，这两种方法都是无监督学习），这需要一种发现频繁集的方法

 5  * @author clj

 6  *

 7  */

 8 public class Client {

 9     public static void main(String[] args){

10         //这里使用的是输入文件的绝对路径

11         String filePath="E:\\code\\data mining\\DataMining_FPTree\\src\\DataMining_FPTree\\testInput.txt";

12         //最小支持度阈值

13         int minSupportCount = 2;

14         //构造函数

15         FPTreeTool tool = new FPTreeTool(filePath, minSupportCount);

16         //调用构建树

17         tool.startBuildingTree();

18     }

19 }

View Code

树节点的数据结构

 1 package DataMining_FPTree;

 2 

 3 import java.util.ArrayList;

 4 

 5 /**

 6  * FP树节点

 7  * 这里使用Comparable的原因是因为每个项集要进行排序

 8  * 按照节点的count来排序

 9  * @author clj

10  * 

11  */

12 public class TreeNode implements Comparable<TreeNode>, Cloneable{

13     // 节点类别名称

14     private String name;

15     // 计数数量

16     private Integer count;

17     // 父亲节点，这个节点的用法是根据给定叶子节点上溯到整棵树，这时就需要指向父节点

18     private TreeNode parentNode;

19     // 孩子节点，可以为多个

20     private ArrayList<TreeNode> childNodes;

21     

22     public TreeNode(String name, int count){

23         this.name = name;

24         this.count = count;

25     }

26 

27     public String getName() {

28         return name;

29     }

30 

31     public void setName(String name) {

32         this.name = name;

33     }

34 

35     public Integer getCount() {

36         return count;

37     }

38 

39     public void setCount(Integer count) {

40         this.count = count;

41     }

42 

43     public TreeNode getParentNode() {

44         return parentNode;

45     }

46 

47     public void setParentNode(TreeNode parentNode) {

48         this.parentNode = parentNode;

49     }

50 

51     public ArrayList<TreeNode> getChildNodes() {//孩子节点可能不止一个，所以需要用list来保存

52         return childNodes;

53     }

54 

55     public void setChildNodes(ArrayList<TreeNode> childNodes) {

56         this.childNodes = childNodes;

57     }

58 

59     @Override

60     public int compareTo(TreeNode o) {

61         // TODO Auto-generated method stub

62         return o.getCount().compareTo(this.getCount());

63     }

64 

65     @Override

66     protected Object clone() throws CloneNotSupportedException {//如果想重写父类的方法，比如toString()方法的话，在方法前面加上@Override  系统可以帮你检查方法的正确性，

67         // TODO Auto-generated method stub

68         //因为对象内部有引用，需要采用深拷贝，这里就相当于是一个深度优先搜索,这里的clone相当于没有用

69         //System.out.println("The name="+this.getName());

70         

71         TreeNode node = (TreeNode)super.clone(); 

72         if(this.getParentNode() != null){

73             node.setParentNode((TreeNode) this.getParentNode().clone());

74         }

75         

76         if(this.getChildNodes() != null){

77             node.setChildNodes((ArrayList<TreeNode>) this.getChildNodes().clone());

78         }

79         

80         return node;

81     }

82     

83 }

View Code

程序的主要部分FPTreeTool

  1 package DataMining_FPTree;

  2 

  3 import java.io.BufferedReader;

  4 import java.io.File;

  5 import java.io.FileReader;

  6 import java.io.IOException;

  7 import java.util.ArrayList;

  8 import java.util.Collections;

  9 import java.util.HashMap;

 10 import java.util.Iterator;

 11 import java.util.Map;

 12 import java.util.Map.Entry;

 13 

 14 /**

 15  * FPTree算法工具类

 16  * 与Apriori算法不同的是FP树需要将非频繁项移除并且重排序

 17  * @author clj

 18  * 

 19  */

 20 public class FPTreeTool {

 21     // 输入数据文件位置

 22     private String filePath;

 23     // 最小支持度阈值

 24     private int minSupportCount;

 25     // 所有事物ID记录

 26     private ArrayList<String[]> totalGoodsID;

 27     // 各个ID的统计数目映射表项，计数用于排序使用，用于项集

 28     private HashMap<String, Integer> itemCountMap;

 29     //后面的成员方法中并没有重新定义成员变量，所以成员函数中可以改变的成员变量的值

 30 

 31     public FPTreeTool(String filePath, int minSupportCount) {

 32         this.filePath = filePath;

 33         this.minSupportCount = minSupportCount;

 34         readDataFile();

 35     }

 36 

 37     /**

 38      * 从文件中读取数据,至此还没有对数据进行排序

 39      */

 40     private void readDataFile() {

 41         File file = new File(filePath);

 42         ArrayList<String[]> dataArray = new ArrayList<String[]>();

 43 

 44         try {

 45             BufferedReader in = new BufferedReader(new FileReader(file));//这一句话相当于新建了两个对象

 46             String str;

 47             String[] tempArray;

 48             while ((str = in.readLine()) != null) {

 49                 tempArray = str.split(" ");

 50                 dataArray.add(tempArray);

 51             }

 52             in.close();

 53         } catch (IOException e) {

 54             e.getStackTrace();

 55         }

 56 

 57         String[] temp;

 58         int count = 0;

 59         itemCountMap = new HashMap<>();//之所以使用会使用hashMap的形式是因为后面会更改key所对应的value的值，时间复杂度小

 60         totalGoodsID = new ArrayList<>();//totalGoodsId只需要将其保存在矩阵中

 61         for (String[] a : dataArray) {

 62             temp = new String[a.length - 1];

 63             System.arraycopy(a, 1, temp, 0, a.length - 1);//和Apriori算法一样第一个保存的是第几笔记录

 64             totalGoodsID.add(temp);

 65             for (String s : temp) {

 66                 if (!itemCountMap.containsKey(s)) {

 67                     count = 1;

 68                 } else {

 69                     count = ((int) itemCountMap.get(s));

 70                     // 支持度计数加1

 71                     count++;

 72                 }

 73                 // 更新表项，如果有key s，则直接更新，否则创建

 74                 itemCountMap.put(s, count);

 75             }

 76         }

 77         System.out.println("name="+itemCountMap.keySet()+" count="+itemCountMap.values());

 78         

 79     }

 80 

 81     /**

 82      * 根据事务记录构造FP树

 83      * 当suffixPattern不为空的时候，建立的就是条件FP树

 84      * surffixPatter是后缀模式

 85      */

 86     private void buildFPTree(ArrayList<String> suffixPattern,

 87             ArrayList<ArrayList<TreeNode>> transctionList) {

 88     

 89         

 90         // 设置一个空根节点

 91         TreeNode rootNode = new TreeNode(null, 0);

 92         int count = 0;

 93         // 节点是否存在

 94         boolean isExist = false;

 95         ArrayList<TreeNode> childNodes;

 96         ArrayList<TreeNode> pathList;

 97         // 相同类型节点链表，用于构造的新的FP树

 98         HashMap<String, ArrayList<TreeNode>> linkedNode = new HashMap<>();//每个节点的LinkNode

 99         HashMap<String, Integer> countNode = new HashMap<>();

100         // 根据事务记录，一步步构建FP树，逐个读入事务记录，并把每个事务映射到FP树中的一条路径中

101         for (ArrayList<TreeNode> array : transctionList) {

102             TreeNode searchedNode;//TreeNode节点中每个项集中应该是只有一个元素

103             pathList = new ArrayList<>();//在构建的时候，将读入的每个项集添加到一条已经存在的路径中

104             /*

105             System.out.print("array=");

106             for(int i=0;i<array.size();i++)

107                 System.out.print("\t"+array.get(i).getName());

108             System.out.println();

109             */

110             for (TreeNode node : array) {//array保存的是FP中的一条路径

111                 pathList.add(node);//pathList开始为空，在事务中读到一个节点就把它放到pathList中

112                 //System.out.println("正在处理的节点node="+node.getName()+" count="+node.getCount());

113                 //System.out.println("before keySets="+countNode.keySet()+"count="+countNode.values());

114                 nodeCounted(node, countNode);//countNode是一个HashMap类型，初始时为一个空的HashMap，在读事务过程中依次进行修改

115                 //System.out.println("after keySets="+countNode.keySet()+"count="+countNode.values());

116                 /*System.out.print("pathList=");

117                 for(int i=0;i<pathList.size();i++)

118                     System.out.print("\t"+pathList.get(i).getName());

119                 System.out.println();

120                 */

121                 searchedNode = searchNode(rootNode, pathList);//这里只是查找，不会影响count的变化

122                 childNodes = searchedNode.getChildNodes();

123 

124                 if (childNodes == null) {//如果正好找到路径中的结尾，则直接加入到结尾

125                     //System.out.println("找到了对应的叶节点，在叶节点下存储");

126                     childNodes = new ArrayList<>();

127                     childNodes.add(node);

128                     searchedNode.setChildNodes(childNodes);

129                     node.setParentNode(searchedNode);

130                     nodeAddToLinkedList(node, linkedNode);

131                 } else {

132                     isExist = false;

133                     for (TreeNode node2 : childNodes) {

134                         // 如果找到名称相同，则更新支持度计数

135                         //System.out.println("##############");

136                         if (node.getName().equals(node2.getName())) {

137                             //System.out.println("在父节点下找到了对应的节点");

138                             count = node2.getCount() + node.getCount();

139                             node2.setCount(count);

140                             // 标识已找到节点位置

141                             isExist = true;

142                             break;

143                         }

144                     }

145 

146                     if (!isExist) {

147                         // 如果没有找到，需添加子节点

148                         //System.out.println("&没有在父节点下找到了对应的节点");

149                         childNodes.add(node);

150                         node.setParentNode(searchedNode);

151                         nodeAddToLinkedList(node, linkedNode);

152                     }

153                 }

154                 //System.out.println("countNode.key="+countNode.keySet()+"   value="+countNode.values());

155                 

156                 /*Iterator<Entry<String, ArrayList<TreeNode>>> it = linkedNode.entrySet().iterator();

157                 while( it.hasNext())

158                 {

159                     Map.Entry<String, ArrayList<TreeNode>> entry = it.next();

160                     String key = entry.getKey();

161                     ArrayList<TreeNode> values=(ArrayList<TreeNode>)entry.getValue();

162                     for(TreeNode value:values)

163                     {

164                         System.out.print(" linkedNode.name="+value.getName()+"\tLinkedNode.count="+value.getCount());

165                     }

166                     System.out.println();

167                     //TreeNode tempNode= entry.getValue().get(i);

168                 }*/

169                 

170 

171             }

172         }

173 

174         // 如果FP树已经是单条路径，则输出此时的频繁模式

175         if(suffixPattern!=null)

176         {

177             System.out.println("suffixPattern.size="+suffixPattern.size());

178             for(int i=0;i<suffixPattern.size();i++)

179                 System.out.print(suffixPattern.get(i)+"\t ");

180             System.out.println();

181         }

182         else 

183             System.out.println("suffixPattern.size=0");

184         if (isSinglePath(rootNode)) {

185             System.out.println("issinglePath-------");

186             printFrequentPattern(suffixPattern, rootNode);

187             

188         } else {

189             ArrayList<ArrayList<TreeNode>> tList;

190             ArrayList<String> sPattern;

191             if (suffixPattern == null) {

192                 sPattern = new ArrayList<>();

193             } else {

194                 // 进行一个拷贝，避免互相引用的影响

195                 sPattern = (ArrayList<String>) suffixPattern.clone();

196             }

197 

198             // 利用节点链表构造新的事务

199             for (Map.Entry entry : countNode.entrySet()) {

200                 // 添加到后缀模式中

201                 sPattern.add((String) entry.getKey());

202                 System.out.println("entry.key="+entry.getKey()+"\tentry.value="+entry.getValue());

203                 

204                 //获取到了条件模式机，作为新的事务

205                 tList = getTransactionList((String) entry.getKey(), linkedNode);

206                 

207                 System.out.print("[后缀模式]：{");

208                 for(String s: sPattern){

209                     System.out.print(s + ", ");

210                 }

211                 System.out.print("}, 此时的条件模式基：");

212                 for(ArrayList<TreeNode> tnList: tList){

213                     System.out.print("{");

214                     for(TreeNode n: tnList){

215                         System.out.print(n.getName() + ", ");

216                     }

217                     System.out.print("}, ");

218                 }

219                 System.out.println();

220                 // 递归构造FP树

221                 buildFPTree(sPattern, tList);

222                 // 再次移除此项，构造不同的后缀模式，防止对后面造成干扰

223                 sPattern.remove((String) entry.getKey());

224             }

225         }

226     }

227 

228     /**

229      * 将节点加入到同类型节点的链表中

230      * 

231      * @param node

232      *            待加入节点

233      * @param linkedList

234      *            链表图

235      */

236     private void nodeAddToLinkedList(TreeNode node,

237             HashMap<String, ArrayList<TreeNode>> linkedList) {

238         String name = node.getName();

239         ArrayList<TreeNode> list;

240 

241         if (linkedList.containsKey(name)) {

242             list = linkedList.get(name);

243             // 将node添加到此队列末尾

244             list.add(node);

245         } else {

246             list = new ArrayList<>();

247             list.add(node);

248             linkedList.put(name, list);

249         }

250     }

251 

252     /**

253      * 根据链表构造出新的事务,根据name，得到以name为尾的各记录

254      * 

255      * @param name

256      *            节点名称

257      * @param linkedList

258      *            链表

259      * @return

260      */

261     private ArrayList<ArrayList<TreeNode>> getTransactionList(String name,

262             HashMap<String, ArrayList<TreeNode>> linkedList) {

263         ArrayList<ArrayList<TreeNode>> tList = new ArrayList<>();

264         ArrayList<TreeNode> targetNode = linkedList.get(name);

265         ArrayList<TreeNode> singleTansaction;

266         TreeNode temp;

267         System.out.println("#getTransaction中name="+name);

268         for (TreeNode node : targetNode) {

269             singleTansaction = new ArrayList<>();

270 

271             temp = node;

272             while (temp.getParentNode().getName() != null) {

273                 System.out.println("temp.name="+temp.getName()+"\tcount="+temp.getCount());

274                 temp = temp.getParentNode();

275                 

276                 singleTansaction.add(new TreeNode(temp.getName(), 1));

277             }

278             System.out.println("temp.name="+temp.getName()+"\tcount="+temp.getCount());

279             System.out.println("singleTansaction=");

280             for(int i=0;i<singleTansaction.size();i++)

281             {

282                 System.out.println("("+singleTansaction.get(i).getName()+","+singleTansaction.get(i).getCount()+")");

283             }

284             System.out.println();

285             // 按照支持度计数得反转一下

286             Collections.reverse(singleTansaction);

287             

288 

289             for (TreeNode node2 : singleTansaction) {

290                 // 支持度计数调成与模式后缀一样

291                 node2.setCount(node.getCount());

292             }

293             System.out.println("##singleTansaction=");

294             for(int i=0;i<singleTansaction.size();i++)

295             {

296                 System.out.println("("+singleTansaction.get(i).getName()+","+singleTansaction.get(i).getCount()+")");

297             }

298             System.out.println();

299 

300             if (singleTansaction.size() > 0) {

301                 tList.add(singleTansaction);

302             }

303         }

304 

305         return tList;

306     }

307 

308     /**

309      * 节点计数

310      * 

311      * @param node

312      *            待加入节点

313      * @param nodeCount

314      *            计数映射图

315      */

316     private void nodeCounted(TreeNode node, HashMap<String, Integer> nodeCount) {

317         int count = 0;

318         String name = node.getName();

319 

320         if (nodeCount.containsKey(name)) {

321             count = nodeCount.get(name);

322             count++;

323         } else {

324             count = 1;

325         }

326 

327         nodeCount.put(name, count);

328     }

329 

330     /**

331      * 显示决策树

332      * 

333      * @param node

334      *            待显示的节点

335      * @param blankNum

336      *            行空格符，用于显示树型结构

337      */

338     private void showFPTree(TreeNode node, int blankNum) {

339         System.out.println("￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥￥显示FPTree");

340         for (int i = 0; i < blankNum; i++) {

341             System.out.print("\t");

342         }

343         System.out.print("--");

344         System.out.print("--");

345 

346         if (node.getChildNodes() == null) {//叶子节点

347             System.out.print("[");

348             System.out.print("I" + node.getName() + ":" + node.getCount());

349             System.out.print("]");

350         } else {

351             // 递归显示子节点

352              System.out.print("【" + node.getName() + "】");

353             for (TreeNode childNode : node.getChildNodes()) {

354                 showFPTree(childNode, 2 * blankNum);

355             }

356         }

357 

358     }

359 

360     /**

361      * 待插入节点的抵达位置节点，从根节点开始向下寻找待插入节点的位置，返回待插入节点的父节点

362      * 

363      * @param root

364      * @param list

365      * @return

366      */

367     private TreeNode searchNode(TreeNode node, ArrayList<TreeNode> list) {

368         ArrayList<TreeNode> pathList = new ArrayList<>();

369         TreeNode tempNode = null;

370         TreeNode firstNode = list.get(0);

371         boolean isExist = false;

372         // 重新转一遍，避免出现同一引用

373         for (TreeNode node2 : list) {

374             pathList.add(node2);

375         }

376         //System.out.println("待插入的节点：name="+node.getName()+" count="+node.getCount());

377         /*for(int i=0;i<list.size();i++)

378             System.out.print("\t("+list.get(i).getName()+","+list.get(i).getCount()+")");

379         System.out.println();*/

380         // 如果没有孩子节点，则直接返回，在此节点下添加子节点，查找已构建树中的叶子节点

381         if (node.getChildNodes() == null) {

382             //System.out.println("此节点为叶子节点，为返回的节点，node.name="+node.getName()+" count="+node.getCount());

383             return node;

384         }

385 

386         for (TreeNode n : node.getChildNodes()) {

387             if (n.getName().equals(firstNode.getName()) && list.size() == 1) {//list中只有一个元素，即路径中的第一个元素

388                 tempNode = node;

389                 isExist = true;

390                 //System.out.println("第一个元素恰好为要查找的节点，且节点长度为1");

391                 break;

392             } else if (n.getName().equals(firstNode.getName())) {

393                 // 还没有找到最后的位置，继续找，在查找的过程中时是正好匹配，从路径中消除

394                 //System.out.println("#第一个元素恰好为要查找的节点，且节点长度不为1");

395                 pathList.remove(firstNode);

396                 tempNode = searchNode(n, pathList);//使用递归的形式去查询子节点

397                 //System.out.println("￥￥￥返回节点：tempNode.name="+tempNode.getName()+" count="+tempNode.getCount());

398                 return tempNode;

399             }

400         }

401 

402         // 如果没有找到，则新添加到孩子节点中

403         if (!isExist) {

404             //System.out.println("没有找到");

405             tempNode = node;

406         }

407         //System.out.println("@@@@返回节点：node.name="+tempNode.getName()+" count="+tempNode.getCount());

408         return tempNode;

409     }

410 

411     /**

412      * 判断目前构造的FP树是否是单条路径的

413      * 

414      * @param rootNode

415      *            当前FP树的根节点

416      * @return

417      */

418     private boolean isSinglePath(TreeNode rootNode) {

419         // 默认是单条路径

420         boolean isSinglePath = true;

421         ArrayList<TreeNode> childList;

422         TreeNode node;

423         node = rootNode;

424         //是使用循环而不是递归判断是否是单条路径

425         while (node.getChildNodes() != null) {

426             childList = node.getChildNodes();

427             if (childList.size() == 1) {

428                 node = childList.get(0);

429             } else {

430                 isSinglePath = false;

431                 break;

432             }

433         }

434 

435         return isSinglePath;

436     }

437 

438     /**

439      * 开始构建FP树

440      */

441     public void startBuildingTree() {

442         ArrayList<TreeNode> singleTransaction;//单条事务

443         ArrayList<ArrayList<TreeNode>> transactionList = new ArrayList<>();//事务总链

444         TreeNode tempNode;

445         int count = 0;

446 

447         for (String[] idArray : totalGoodsID) {

448             singleTransaction = new ArrayList<>();

449             for (String id : idArray) {

450                 count = itemCountMap.get(id);

451                 tempNode = new TreeNode(id, count);

452                 singleTransaction.add(tempNode);

453             }

454             

455             // 根据支持度数的多少进行排序

456             Collections.sort(singleTransaction);

457             

458             /*System.out.println("singleTansaction as following:");

459             for(int i=0;i<singleTransaction.size();i++)

460                 System.out.print("("+singleTransaction.get(i).getName()+","+singleTransaction.get(i).getCount()+")");

461             System.out.println();*/

462             

463             for (TreeNode node : singleTransaction) {

464                 // 支持度计数重新归为1,将事务路径节点的count设置为1

465                 node.setCount(1);

466             }

467             /*System.out.println("singleTansaction");

468             for(int i=0;i<singleTransaction.size();i++)

469                 System.out.print("***("+singleTransaction.get(i).getName()+","+singleTransaction.get(i).getCount()+")");

470             System.out.println();*/

471             transactionList.add(singleTransaction);

472         }

473         for(int i=0;i<transactionList.size();i++)

474         {

475             ArrayList<TreeNode> singleTransaction1=new ArrayList<>();

476             singleTransaction1=transactionList.get(i);

477             for(int j=0;j<singleTransaction1.size();j++)

478             {

479                 System.out.print("("+singleTransaction1.get(j).getName()+","+singleTransaction1.get(j).getCount()+")");

480             }

481             System.out.println();

482                 

483         }

484         buildFPTree(null, transactionList);

485     }

486 

487     /**

488      * 输出此单条路径下的频繁模式

489      * 

490      * @param suffixPattern

491      *            后缀模式

492      * @param rootNode

493      *            单条路径FP树根节点

494      */

495     private void printFrequentPattern(ArrayList<String> suffixPattern,

496             TreeNode rootNode) {

497         ArrayList<String> idArray = new ArrayList<>();

498         TreeNode temp;

499         temp = rootNode;

500         // 用于输出组合模式

501         int length = 0;

502         int num = 0;

503         int[] binaryArray;

504 

505         while (temp.getChildNodes() != null) {

506             temp = temp.getChildNodes().get(0);

507 

508             // 筛选支持度系数大于最小阈值的值，P(A)>P(AB),若P(A)<阈值，则删除这个节点即不添加到里面

509             if (temp.getCount() >= minSupportCount) {

510                 idArray.add(temp.getName());

511             }

512         }

513 

514         length = idArray.size();

515         num = (int) Math.pow(2, length);

516         for (int i = 0; i < num; i++) {

517             binaryArray = new int[length];

518             numToBinaryArray(binaryArray, i);

519 

520             // 如果后缀模式只有1个，不能输出自身

521             if (suffixPattern.size() == 1 && i == 0) {

522                 continue;

523             }

524 

525             System.out.print("频繁模式：{【后缀模式：");

526             // 先输出固有的后缀模式

527             if (suffixPattern.size() > 1

528                     || (suffixPattern.size() == 1 && idArray.size() > 0)) {

529                 for (String s : suffixPattern) {

530                     System.out.print(s + ", ");

531                 }

532             }

533             System.out.print("】");

534             // 输出路径上的组合模式

535             for (int j = 0; j < length; j++) {

536                 if (binaryArray[j] == 1) {

537                     System.out.print(idArray.get(j) + ", ");

538                 }

539             }

540             System.out.println("}");

541         }

542     }

543 

544     /**

545      * 数字转为二进制形式

546      * 

547      * @param binaryArray

548      *            转化后的二进制数组形式

549      * @param num

550      *            待转化数字

551      */

552     private void numToBinaryArray(int[] binaryArray, int num) {

553         int index = 0;

554         while (num != 0) {

555             binaryArray[index] = num % 2;

556             index++;

557             num /= 2;

558         }

559     }

560 

561 }

View Code

readDataFile从文件中读取数据，

buildFPTree(ArrayList<String> suffixPattern,ArrayList<ArrayList<TreeNode>> transctionList)构建FP树（包括FP条件树），当suffixpatter不为空的时候构建的就是FP条件树，

nodeAddToLinkedList(TreeNode node,HashMap<String, ArrayList<TreeNode>> linkedList)，和邻接表类似，某个Node在树中出现的位置保存在linkedList中

private ArrayList<ArrayList<TreeNode>> getTransactionList(String name,HashMap<String, ArrayList<TreeNode>> linkedList）得到还有name节点的交易记录

nodeCounted(TreeNode node, HashMap<String, Integer> nodeCount)因为最后交易记录是以节点的计数多少进行排序的，这一个记录node在所有记录中出现的次数，同一条事务其实是没有先后顺序的，为了把树尽可能的减小才这样进行排序的

showFPTree(TreeNode node, int blankNum) 展示树

private TreeNode searchNode(TreeNode node, ArrayList<TreeNode> list) 要插入的节点在树中应该插入到哪个节点的下面呢，这里返回的是待插入节点的父节点

printFrequentPattern(ArrayList<String> suffixPattern,TreeNode rootNode)输出单条路径下的频繁模式，

常见的频繁项集挖掘算法有两类，一类是Apriori算法，另一类是FPGrowth。Apriori通过不断的构造候选集、筛选候选集挖掘出频繁项集，需要多次扫描原始数据，当原始数据较大时，磁盘I/O次数太多，效率比较低下。FPGrowth算法则只需扫描原始数据两遍，通过FP-tree数据结构对原始数据进行压缩，效率较高。

也许有人会问?如果这个数据库足够大,以至于构造的FP树大到无法完全保存在内存中,这该如何是好.这的确是个问题. Han Jiawei在论文中也给出了一种思路,就是通过将原来的大的数据库分区成几个小的数据库(这种小的数据库称之为投射数据库),对这几个小的数据库分别进行FP Growth算法.
还是拿上面的例子来说事,我们把包含p的所有数据库记录都单独存成一个数据库,我们称之为p-投射数据库,类似的m,b,a,c,f我们都可以生成相应的投射数据库,这些投射数据库构成的FP树相对而言大小就小得多,完全可以放在内存里.
在现代数据挖掘任务中,数据量越来越大,因此并行化的需求越来越大,上面提出的问题也越来越迫切.下一篇博客,博主将分析一下,FP Growth如何在MapReduce的框架下并行化.
[1]Mining Frequent Patterns without Candidate Gen

你可能感兴趣的:(算法)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
高性能javascript--算法和流程控制海淀萌狗
-for,while和do-while性能相当-避免使用for-in循环，==除非遍历一个属性量未知的对象==es5:for-in遍历的对象便不局限于数组，还可以遍历对象。原因：for-in每次迭代操作会同时搜索实例或者原型属性，for-in循环的每次迭代都会产生更多开销，因此要比其他循环类型慢，一般速度为其他类型循环的1/7。因此，除非明确需要迭代一个属性数量未知的对象，否则应避免使用for-i
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
JVM源码分析之堆外内存完全解读 HeapDump性能社区
概述广义的堆外内存说到堆外内存，那大家肯定想到堆内内存，这也是我们大家接触最多的，我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值，不过这还不是我们理解的Java堆，-Xmx的值是新生代和老生代的和的最大值，我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值，那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和，在分代算法
《算法》四学习——1.1节进阶的Farmer 算法算法笔记
前言买了一本算法4，每天看一点，对每个小结来个学习总结，输出驱动输入。本篇笔记针对第一章基础1.1基础编程模型1.1节总结了相关的语法、语言特性和书中将会用到的库。笔记自己在编码中容易遗漏的点&&优先级比||高在开发中习惯了加括号，所以没注意到这点，教材上也有但是忘记了二分查找中计算mid=left+(right-left)/2这样计算可以有效避免(left+right)/2溢出答疑java无穷大
排序路小白同学
1.冒泡排序冒泡算法是一种基础的排序算法，这种算法会重复的比较数组中相邻的两个元素。如果一个元素比另一个元素大（小），那么就交换这两个元素的位置。重复这一比较直至最后一个元素。这一比较会重复n-1趟，每一趟比较n-j次，j是已经排序好的元素个数。每一趟比较都能找出未排序元素中最大或者最小的那个数字。这就如同水泡从水底逐个飘到水面一样。冒泡排序是一种时间复杂度较高，效率较低的排序方法。其空间复杂度是
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod