weixin_39959335

apriori java_java实现Apriori算法——频繁项集的计算

请注意，本文编写于 1180 天前，最后修改于 692 天前，其中某些信息可能已经过时。

前言

之前学校开的选修课《数据挖掘》，布置的两道算法题，时间有限完成其中一道：用Apriori算法求特定支持度的频繁项集。

算法本身不难，java萌新我却花费了一天的时间，特此记录。

算法描述

我们目的是求出项数为K的频繁项集即L(K)。

Apriori算法的核心步骤是：L(K-1)通过自连接求出项数为K的候选项集合C(K)

通过对C(K)进行一系列处理(剪枝 + 支持度判断) 得到L(K)集合

在说明下面更多内容之前，先对一部分概念进行说明：事务：如第一张图中，每一行就是一个事务，如 T100 I1,I2,I5。其中T100是事务编号，这个随便命名，只要保证唯一即可。后面的I1 I2 I5是该事务中的项

数据集：如图一，整个表就是数据集，就是所有的事务的集合。即D = {T100,T200…}

项集：包含若干个项(如I1 、I2这样的项)的集合。可以看出项集和事务似乎有点项。但是项集更随意一点，任意几个项都能组成一个项集。但是事务是人为规定好的。

可信度：项集在数据集中出现的重复次数。项集不一定需要在事务中连续出现。如{I1,I2,I5}项集在数据集中出现的次数为2次，分别是第一个和倒数第二个事务。

接下来，详细分析算法中的两个步骤：

1. 自连接：

怎么个连接法呢？以图二中的L2频繁集的集合为例：项集支持度{I1,I2}4

{I1,I3}4

{I1,I5}2

{I2,I3}4

{I2,I4}2

{I2,I5}2

判断两个项集是否可以自连接要看两个项集的K-1项是否完全相同。如果满足条件，连接后的项集 = 第一个项集 + 第二个项集的最后一个元素。

比如{I1 I2}与{I1 I3}满足自连接条件，连接后的项集为{I1 I2 I3}。

2. 剪枝：

剪枝是这个算法的核心，如果不进行这个步骤的话，也能得出正确结果，但是时间就会大大增加了。

剪枝的核心是若某个集合存在一个非空子集不是频繁项集，则该集合不是频繁项集。

我们通过自连接组成新的K项的候选项集后，需要通过剪枝判断是否满足条件。

即找出该候选项集的含有(K-1)项的子集，并分别判断每个子集是否存在于K-1项频繁项集里。只要有一个不存在，那么该K项候选项集也不可能是频繁项集。

这里我们只需要找含有K-1项的子集，而不用找所有的子集，因为这个算法是从下不断递归上来的，含有更少项的子集肯定是在频繁子集里的。

问题关键是怎么寻找某个K项集的K-1项子集呢？

很简单，依次把K项集中的每个元素去掉一个就可以了。

完成了这两步骤，就完成了这个算法了核心步骤。

3. 对精简后候选集统计每一个项集的支持度

4. 根据最小支持度将候选项集转换为K项频繁项集合

可以看出，如果不剪枝的话，第三步的工作量是非常大的。剪枝过后，候选集的体积大大减小了。

但是获取含有一项的频繁项集因为没有候选项集，就需要特殊处理。

这个很简单，就是统计数据集中的每一项的支持度，并和最小支持度进行比较，得到含有一项的频繁项集。

代码分析import java.io.BufferedReader;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStreamReader;

import java.util.*;

/**

* @author hw

* 算法名称：数据挖掘：Apriori算法求特性支持度下的所有的频繁集

* 算法原理：

* 0. 获取C1的时候，因为没有L(0)频繁集，所以单独处理一个函数

* 1. 已经频繁集L(k-1)，{}自连接+剪枝}求出精简后的候选集C(k)

* 2. 根据精简后的候选集C(k)根据求出频繁集L(k)

* 数据结构：

* 1. 使用List 存储整个数据库的数据，string代表每一行的数据

* 2. 使用HashMap 存储项集以及项集的重复次数，便于查找。是{项集}的集合。

* 3. 每个项集用String类型存储。项集中的每一项使用String.split(" ")方法变成数据，以便取用项集中的每一项

* 给定的数据格式：

* 1. 每个数据以空格隔开

* 2. 每一行代表一个事务T,事务编号就是行号

* 示例数据：

* 1. {11，12，13}是一个频繁项集，是属于HashMap中的一个元素，数据类型为String.

* 2. Set = HashMap.keySet(); 用来存储HashMap的所有key的值，也就是存储所有的项集(不包括项集的重复次数)

* 相关概念：

* 1. 支持度百分比

* 2. 支持度

* 3. 事务

* 4. 候选项集

* 5. 频繁项集

public class Main {

private static double SUPPORT_PERCENT = 0.01;

private static List data2DList = new ArrayList<>();

public static void main(String[] args) {

System.out.println("===================Apriori算法主程序界面====================");

//0. 输入数据

/*Scanner in=new Scanner(System.in);

SUPPORT_PERCENT = in.nextDouble();*/

//1. 导入数据

importData();

//2. 进行算法处理

apriori();

}

/**

* Apriori算法主程序，需要递归处理

* @return

public static void apriori(){

//扫描整个数据库D，对每一项进行计数，获得一项的{候选项集合}

Map stepFrequentSetMap = new HashMap<>();

System.out.println("\n=====================第" + 1 + "次扫描的频繁项集列表======================" + "\n");

stepFrequentSetMap.putAll(getFrequentSets(findCandidateOneSets()));

Set stringSet = stepFrequentSetMap.keySet();

for (String string: stringSet){

System.out.println("频繁集：" + string + "支持度:" + stepFrequentSetMap.get(string));

}

System.out.println("\n频繁项集的个数：" + stringSet.size());

int i = 1;

//当生成的频繁项集为空的时候，退出循环

while(stepFrequentSetMap != null && stepFrequentSetMap.size()>0){

i++;

//打印当前的频繁项集的信息

System.out.println("\n=====================第" + i + "次扫描的频繁项集列表======================" + "\n");

stepFrequentSetMap = getFrequentSets(getMinCandidate(stepFrequentSetMap));

if (stepFrequentSetMap != null){

stringSet = stepFrequentSetMap.keySet();

for (String string: stringSet){

System.out.println("频繁集：" + string + "支持度:" + stepFrequentSetMap.get(string));

}

System.out.println("\n频繁项集的个数：" + stringSet.size());

}

/**

* 导入数据

* @return 集合和集合，即二维集合

private static void importData(){

File file = new File("retail.dat");

try {

//文件存在且为文件类型执行接下来的操作

if (file.isFile() && file.exists()){

InputStreamReader reader = new InputStreamReader(new FileInputStream(file),

"UTF-8");

BufferedReader bufferedReader = new BufferedReader(reader);

String lineTxt;

while ((lineTxt = bufferedReader.readLine()) != null){//读取文件中的一行

data2DList.add(lineTxt);

}

reader.close();

}else {

System.err.println("找不到指定文件！");

}

}catch (Exception e){

System.err.println("读取文件内容出错！");

e.printStackTrace();

}

/**

* 寻找1项的候选集C1(起始化特殊的处理)

* @return 返回map集合，这个集合是每一项以及对应的重复次数：key->value

* key：每一个候选项/频繁项

* value：相应候选项/频繁项的重复次数

private static HashMap findCandidateOneSets()

{

HashMap resultSetMap = new HashMap<>();

for(String dataList :data2DList)

{

String[] dataString = dataList.split(" ");

//查询map集合中是否有该元素，如果没有，加入该元素，否则给该元素对于的value(重复次数)+1

for (String string :dataString){

string += " ";

if (resultSetMap.get(string) == null){

resultSetMap.put(string,1);

}else {

resultSetMap.put(string,resultSetMap.get(string) + 1);

}

return resultSetMap;

}

/**

* 从L(k-1)频繁集合中得到精简的C(k)候选集

* 1. {连接 + 剪枝} = {精简后的候选集C(k)}

* 是对L(k-1)频繁集的每一个集合，进行[边连接成候选集，边剪枝]而不是先全部生成了{候选集}，然后再进行一次大循环，进行剪枝，这样会增加时间复杂度

* 先验原则：若某个集合存在一个非空子集不是频繁项集，则该集合不是频繁项集

* 1. 根据先验原则压缩候选集大小后得到精简的候选集集合

* 2. 对精简过的候选项集进行累加计数

* @param frequentMapSet

* @return 返回C(k)候选集合

private static Map getMinCandidate(Map frequentMapSet){

//需要返回的精简过后的候选项集

Map minCandidateMapSet = new HashMap<>();

//导入频繁项集的KEY

Set frequentSet = frequentMapSet.keySet();

/**

* 1. {自连接过程:产生候选项集}

* 对于每一个项集，拆开成项的数组。将该项集的每一项与其他项集的每一项比较，

* 如果有不重复的项，就将该项与原项集链接起来，组成K项的候选项项集。

for (String frequentItemList1: frequentSet){

for (String frequentItemList2: frequentSet){

String[] itemArray1 = frequentItemList1.split(" ");

String[] itemArray2 = frequentItemList2.split(" ");

//自连接生成的候选项集

String linkString = "";

boolean flag = true;//是否可以连接

/**

* 判断是否可以自连接的条件：

* 1. 前K-1项必须相同

* 2. itemArray1的最后一项必须小于第二个项集的最后一项

* 自连接过程：

* 将第一个项集与第二个项集的最后一项连接起来

for (int i =0;i

if (!itemArray1[i].equals(itemArray2[i])){

flag = false;

break;

}

if (flag && itemArray1[itemArray1.length - 1].compareTo(itemArray2[itemArray1.length -1]) < 0){

linkString = frequentItemList1 + itemArray2[itemArray2.length - 1] + " ";

}

/**

* 2. {剪枝过程，也就是先验规则的使用}

* 找出该候选集的所有子集，并判断每个子集是否属于频繁子集

boolean hasInfrequentSubSet = false;// 是否有非频繁子项集，默认无

if (linkString != ""){//自连接成功

//System.out.println(linkString);

//候选项集的所有项的数组

String[] itemArray = linkString.split(" ");

//*重点：找出该候选集的所有子集，实际操作的时候只需要找出比候选集少一项的子集集合

//*重点：因为这都是不断的递归上来的，项数更小的项集肯定是频繁项集

for (int i = 0; i

String subString = "";

for (int j = 0;j

if (j!=i){

subString += itemArray[j] + " ";

}

if (frequentMapSet.get(subString) == null){

hasInfrequentSubSet = true;

break;

}

}else{

hasInfrequentSubSet = true;//这里并不是代表存在非频繁子集，只是表示没有自连接成功，没有找到候选集

}

//自连接成功，加入到候选集集合中

if (!hasInfrequentSubSet){

minCandidateMapSet.put(linkString,0);

}

/**

* 3. {对生成的候选集进行统计支持度}

Set minCandidateSet = minCandidateMapSet.keySet();

// 将每一行的候选项集，由String数据变成字符串数组。

// 将每一行的事务，由String转换成List

for (String itemList: minCandidateSet){

String[] strings = itemList.split(" ");

int num = 0;

for (String data:data2DList){

ListdataList = Arrays.asList(data.split(" "));

Boolean flag = true;

//如果候选项集中有一项在当前事务中找不到，支持度则不会增加

for (int i =0;i < strings.length;i++){

if (!dataList.contains(strings[i])){

flag = false;

break;

}

if (flag){

minCandidateMapSet.put(itemList,minCandidateMapSet.get(itemList) + 1);

}

return minCandidateMapSet;

}

/**

* 从精简后的C(k)候选集中得到L(k)频繁集合

* {统计精简后的候选集C(k)的重复次数} = {最后得到L(k)频繁集}

* 1. 对精简过的候选集进行判断(之前已经做好了计数工作)，不满足支持度的进行排除

* @param minCandidateMapSet

* @return

private static Map getFrequentSets(Map minCandidateMapSet){

if (minCandidateMapSet == null){

//精简后的候选集为空，表示当前项数的候选集不存在，此时需要结束该算法了

System.err.println("候选项集为空");

return null;

}else{

Map frequentMapSet = new HashMap<>();//需要返回的频繁项集

Set minCandidateSet = minCandidateMapSet.keySet();//获取候选项集的KEY，也就是所有的项集的具体数据

Double SUPPORT = (data2DList.size() * SUPPORT_PERCENT);//最小支持度

//Double SUPPORT = 5.0;

System.out.println("最小支持度为：" + SUPPORT + " 候选项集的大小为：" + minCandidateMapSet.size() + "\n");

for (String itemListString: minCandidateSet){

//如果该项集的重复次数大于或者等于最小支持度，就把该项加入到频繁项即中

if (minCandidateMapSet.get(itemListString) >= SUPPORT){

frequentMapSet.put(itemListString,minCandidateMapSet.get(itemListString));

}

if (frequentMapSet.size() == 0){

//计算得到的频繁项集为空，表示此时循环应该结束了

return null;

}else{

return frequentMapSet;

}

你可能感兴趣的:(apriori,java)

ConcurrentHashMap深度解析编程界的彭于晏qaq java java
ConcurrentHashMap深度解析引言：并发容器的"扛鼎之作"在Java并发编程领域，ConcurrentHashMap无疑是最核心的容器之一。作为HashMap的线程安全替代品，它既解决了Hashtable全表锁导致的性能瓶颈，又规避了HashMap在并发环境下的数据不一致风险（如死循环、数据丢失）。自JDK1.5引入以来，ConcurrentHashMap经历了三次重大演进（JDK7分
JavaScript 模块化开发完全指南小李也疯狂前端技术 javascript 开发语言 ecmascript 模块化开发
目录前言一、模块化的基本概念1.1什么是模块化？1.2为什么需要模块化？二、JavaScript模块化的发展历程2.1早期解决方案2.1.1命名空间模式2.1.2立即执行函数表达式（IIFE）2.2社区规范2.2.1CommonJS2.2.2AMD（AsynchronousModuleDefinition）2.2.3CMD（CommonModuleDefinition）2.3ES6模块（ESM）三
最简单控制台版输入框学生信息处理平台
功能实现支持添加、删除、修改、查询、排序功能。使用并行数组nos,names,scores，学生信息统一下标。使用Scanner交互输入。使用冒泡排序实现成绩排序。packagecom.xiangmu.day04;importjava.util.Scanner;publicclassTest01{publicstaticvoidmain(String[]args){Scannersc=newSca
docker-compose部署java项目小瞿慢慢跑 docker docker-compose
docker-compose是定义和运行多容器的工具。换句话说就是通过配置yml文件来运行容器，简化了每次输入dockerrun等命令，把这些命令配置在yml文件统一管理，而且可以用一个yml文件一次启动多个容器，启动时还可以设置各个容器的依赖关系等。如下为测试docker-compose启动java程序1.docker-compose.ymlversion:'3'services:java05:
深入理解 synchronized 锁与你久处不厌 Java java
文章目录一、实现原理对象头Monitor二、synchronized优化1.锁的状态2.锁的升级一、实现原理Java中的每一个对象都可以作为锁。具体表现为以下3种形式。对于普通同步方法，锁是当前实例对象。对于静态同步方法，锁是当前类的Class对象。对于同步方法块，锁是Synchonized括号里配置的对象。代码块同步：使用monitorenter和monitorexit指令实现。方法同步：使用另
Java EE的历史（转）古剑诛仙
转自公众号码农翻身。前言：昨天下午有同学问我JavaEE是干什么用的，能开发什么系统，我在QQ中敲了很多字，掰扯了半天，终于给他整明白了。我突然意识在其实很多初学者对JavaEE的来龙去脉并去清楚，大家并不知道为什么会出现这个技术，要解决什么问题。所以就写了这篇文章介绍下JavaEE的历史。先把时间扯的远一点，94年我上高中的时候，见过亲戚家有过电脑，很好奇，虽然上面都是一些单机桌面程序，根本上不
延迟队列的入门使用
延迟队列的入门使用思考：1.什么是延迟队列？延迟队列运用场景？2.延迟队列的排队过程如何实现？真的是先进先出吗？3.如何实现运用延迟队列一.什么是延迟队列DelayQueue是Java中的一个基于优先级队列的实现的线程安全的延迟队列。运用场景：实现定时任务或者延迟任务的调度。DelayQueue实现BlockingQueue，加入这个队列的元素必须实现Delayed接口，当生产者提交元素进入队列时
Java DelayQueue延迟队列的使用和源码分析 °Fuhb Java基础与进阶 java DelayQueue 延迟队列
文章目录概述示例原理分析概述DelayQueue是JAVA提供的延时队列，队列内部的对象必须实现Delayed接口，该接口只有一个getDelay方法，返回延迟执行的时长。publicinterfaceDelayedextendsComparable{longgetDelay(TimeUnitunit
DelayQueue延时队列简单使用泉泉写Java java 开发语言
DelayQueue是JDK1.5引入到工具，位置在java.util.concurrent。从包路径我们就能知道该工具是给多线程使用到。我们先看看官方注释：AnunboundedblockingqueueofDelayedelements,inwhichanelementcanonlybetakenwhenitsdelayhasexpired.TheheadofthequeueisthatDel
Java性能监测工具JMC的使用介绍
一、JMC介绍JMC是源自JRockitJVM的一套监控和管理工具,Oracle在发布JAVA7u4(Java7Update40)时将其包含在JDK中,用户不再需要单独下载。使用JMC可以监视和管理Java应用程序，不会导致相关工具类的大幅度性能开销，它使用为Java虚拟机(JVM)的普通自适应动态优化收集的数据。官方地址：https://www.oracle.com/java/technolog
Spring Boot 3.0新特性全面解析与实战应用天天进步2015 Java spring boot
SpringBoot3.0新特性全面解析与实战应用引言SpringBoot3.0作为Spring生态系统的一个重要里程碑，带来了众多令人兴奋的新特性和改进。本文将深入解析SpringBoot3.0的核心变化，并通过实战示例展示如何在项目中应用这些新特性。核心变化概览Java版本要求提升SpringBoot3.0最显著的变化是Java版本要求提升至Java17。这一变化不仅仅是版本号的更新，更是对现
JAVA面试八股文，万字长文！ Java进阶八股文 java 面试开发语言职场和发展 spring boot spring jvm
1、多态的作用多态的实现要有继承、重写，父类引用指向子类对象。它的好处是可以消除类型之间的耦合关系，增加类的可扩充性和灵活性。多态允许你通过统一的接口来处理不同类型的对象，这样在添加新的类型时，不需要修改现有的代码，只需要实现相同的接口或继承相同的父类即可。这使得代码的扩展性大大增强。2、什么是反射？反射机制是在运行时，对于任意一个类，都能够知道这个类的所有属性和方法；对于任意个对象，都能够调用它
设计模式-工厂方法模式 Java
模式概述工厂方法模式(FactoryMethodPattern)又称为工厂模式，定义创建对象的接口，但将具体实现延迟到子类，实现对象创建与使用的解耦。简单代码示例//1.抽象产品：日志记录器接口interfaceLogger{voidlog(Stringmessage);}//2.具体产品：文件日志记录器classFileLoggerimplementsLogger{@Overridepublic
实时时间钟表命苦的孩子 java梦 java jvm spring
目录一、前提二、代码2.1窗口2.2时间显示三、代码整合一、前提在之前我们学会了JDK时间相关类，那我们就来小小地利用它来写一个”小玩意儿”。没看过的快去看一遍，在初识JDK时间相关类二、代码2.1窗口首先，你是不是得有一个窗口，那就用得上Swing了。importjavax.swing.*;publicclasstestextendsJFrame{privateJPanelwindonpanel
【Java代码审计 | 第五篇】XSS漏洞成因+实战案例秋说 Java代码审计 java xss
未经许可，不得转载。文章目录XSS漏洞成因1、直接输出用户输入2、在JSP中使用EL表达式输出用户输入3、在Thymeleaf模板中输出用户输入4、在JavaScript中嵌入用户输入实战案例案例1案例2案例3XSSXSS（跨站脚本攻击，Cross-SiteScripting）是一种常见的Web安全漏洞，攻击者通过在网页中注入恶意脚本，使得这些脚本在用户的浏览器中执行。XSS攻击通常分为以下三种类
java二叉树遍历
在Java中，二叉树遍历通常有三种方式：先序遍历(PreorderTraversal)：首先访问根节点，然后递归遍历左子树，最后递归遍历右子树。中序遍历(InorderTraversal)：首先递归遍历左子树，然后访问根节点，最后递归遍历右子树。后序遍历(PostorderTraversal)：首先递归遍历左子树，然后递归遍历右子树，最后访问根节点。例如，对于以下二叉树：1/\23/\/4567先
java学习笔记
期末课堂作业,以下内容为2024年上学期java课堂学习笔记202402150705目录[第1章:Java语言概述](#第1章:Java语言概述)[第2章:数据类型与运算符](#第2章:数据类型与运算符)[第3章:控制流程语句](#第3章:控制流程语句)[第4章:数组](#第4章:数组)[第5章:类与对象](#第5章:类与对象)[第6章:封装、继承与多态](#第6章:封装、继承与多态)[第7章:异
第5章：数据访问层 liangxh2010 微服务后端架构
5.1SpringDataJPA使用文字讲解SpringDataJPA是SpringData项目的一部分，旨在极大地简化JPA（JavaPersistenceAPI）的使用。它通过提供基于Repository接口的编程模型，让我们无需编写任何实现代码就能完成大多数数据访问操作。核心概念：Entity：一个使用@Entity注解的普通Java对象（POJO），它映射到数据库中的一张表。Reposit
MySQL(150)如何进行数据库自动化运维？辞暮尔尔-烟火年年 MySQL 数据库运维 mysql
数据库自动化运维（DBAAutomation）是确保数据库高效、安全运行的关键步骤。自动化运维可以涵盖备份、恢复、监控、性能优化、数据迁移等多个方面。以下是一个详细的指南，展示如何使用Java进行数据库自动化运维，包括代码示例。一、环境准备确保安装有Java开发环境（JDK）、Maven（或Gradle）以及一个数据库（例如MySQL）。我们将使用JDBC来进行数据库操作，以及QuartzSche
直接内存溢出 p＆f° JVM jvm
一、什么是直接内存直接捏成是一块由操作系统直接管理的内存，也叫堆外内存可以使用Unsafe或ByteBuffer分配直接内存可用-XX:MaxDirectMemorySize控制，默认是0，表示不限制二、为什么使用直接内存直接内存vs堆内存io效率高推荐参考：Java直接内存与非直接内存性能测试-阿里云开发者社区三、什么场景使用直接内存1有很大的数据需要存储，它的生命周期又很长2适合频繁的IO操作
单身程序员的幻想女友模拟器，面对对象的三大特征运维帮手大橙子开发语言 java intellij-idea 对象面对对象 windows 程序人生
你new出来的不仅是一个对象，更是一段陪伴、一份慰藉。你孤独的时候想有人和你说说话。而真正的那个她，也一定会出现，和你肩并肩看代码、看星星。项目结构SweetGirlfriendSimulator/├──src/└──com/└──love/├──Main.java//启动类├──Person.java//抽象人类├──IdealGirlfriend.java//理想女友类（可爱温柔）└──Coo
初始Java中的继承七十二小時 Java SE java 开发语言
为什么需要继承Java中使用类对现实世界中实体来进行描述，类经过实例化之后的产物对象，则可以用来表示现实中的实体，但是现实世界错综复杂，事物之间可能会存在一些关联，那在设计程序是就需要考虑。比如：狗和猫，它们都是动物。那能否将这些共性抽取呢？面向对象思想中提出了继承的概念，专门用来进行共性抽取，实现代码复用。继承概念继承(inheritance)机制：是面向对象程序设计使代码可以复用的最重要的手段
Java炼金术：从代码到加密货币——用Java铸造数字黄金的黑科技墨夶 Java学习资料4 java 科技开发语言
一、智能合约：比“契约精神”更严谨的代码1.1用Java写ERC-20代币（以太坊上的数字黄金）//ERC-20代币合约实现（需配合Web3j框架）publicclassMyERC20Token{privatefinalStringname="JavaCoin";privatefinalStringsymbol
android.support.v7.widget.RecyclerView$SavedState cannot be cast to android.widget.AbsListView$Sa... Mis丶H
全部错误信息：java.lang.RuntimeException:UnabletostartactivityComponentInfo{com.enhance.greapp/com.kaomanfen.enhance.gre3k.activity.QuestionWordActivity}:java.lang.ClassCastException:android.support.v7.widge
【华为OD机试】真题E卷-生成哈夫曼树（Java）西攻城狮北 java 华为od 机试真题生成哈夫曼树 2024 c卷
【华为OD机试真题】2024年C卷题库汇总目录（java）一、题目【华为OD机试真题】2024年C卷（java）-生成哈夫曼树题目描述：给定长度为n的无序的数字数组，每个数字代表二叉树的叶子节点的权值，数字数组的值均大于等于1。请完成一个函数，根据输入的数字数组，生成哈夫曼树，并将哈夫曼树按照中序遍历输出。为了保证输出的二叉树中序遍历结果统一，增加以下限制：二叉树节点中，左节点权值小于等于右节点权
淘宝商城四面（附架构面试专题）及B2C商城架构项目实战分享！风平浪静如码
一面主要问题如下（主要注重基础，问得很深很广，压力面试）：首先自我介绍数据结构算法的基本问题，如排序算法，二叉树遍历，后序遍历非递归，图的最短路径问题对一个数组进行绝对值排序的算法java中hashmap的底层实现java中垃圾回收机制GC原理等介绍自己的项目，数据库中用到的数据结构数据模型，死锁的概念（问的应该是数据库的死锁），如何避免死锁?乐观锁和悲观锁?一致性hash算法项目中业务对象的关联
Spring Boot 3.0+JDK 17 Springfox迁移到SpringDoc
为什么需要迁移？随着SpringBoot3.0和JDK17的发布，开发者可以享受更快的性能、更好的模块化支持以及现代Java生态的新特性。然而，升级过程中一个常见的问题是：原本基于Springfox（Swagger）的API文档工具不再兼容新环境。如果你在启动应用时遇到类似以下错误：org.springframework.beans.factory.UnsatisfiedDependencyExc
Doris实战——拈花云科的数据中台实践吵吵叭火大数据 #Doris 数据仓库大数据
目录前言一、业务背景二、数据中台1.0—Lambda三、新架构的设计目标四、数据中台2.0—ApacheDoris4.1新架构数据流转4.2新架构收益五、新架构的落地实践5.1模型选择5.1.1Unique模型5.1.2Aggregate模型5.2资源管理5.3批量建表5.4计算实现5.4.1实时计算5.4.2准实时计算通过JavaUDF生成增量/全量数据基于Doris的大表优化DorisBork
【华为OD机试真题 2025B卷】153、端口合并 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KFickle 最新华为OD机试(C++Java Py C JS)+OJ 华为od c++java 华为OD机试真题 javascript 端口合并
文章目录一、题目题目描述输入输出样例1样例2样例3二、代码与思路参考C++代码Java代码Python代码C语言代码JS代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题，使用C++，Java，Python，C语言，JS五种语言进行解答，每个题目都包含解题思路，五种语言的解法，每日持续更新中，订阅后支持开通在线OJ测试刷题！！！一次订阅永久享受更新
【华为OD机试真题 2025B卷】154、快递业务站 | 机试真题+思路参考+代码解析（C++、Java、Py、C语言、JS） KFickle 最新华为OD机试(C++Java Py C JS)+OJ 华为od c++java 华为OD机试真题快递业务站 javascript c语言
文章目录一、题目题目描述输入输出样例1样例2二、代码与思路参考C++代码Java代码Python代码C语言代码JS代码订阅本专栏后即可解锁在线OJ刷题权限个人博客首页：KFickle专栏介绍：最新的华为OD机试真题，使用C++，Java，Python，C语言，JS五种语言进行解答，每个题目都包含解题思路，五种语言的解法，每日持续更新中，订阅后支持开通在线OJ测试刷题！！！一次订阅永久享受更新，有代
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的