fansy1990

HotSpot关联规则算法（1）-- 挖掘离散型数据

提到关联规则算法，一般会想到Apriori或者FP，一般很少有想到HotSpot的，这个算法不知道是应用少还是我查资料的手段太low了，在网上只找到很少的内容，这篇http://wiki.pentaho.com/display/DATAMINING/HotSpot+Segmentation-Profiling ，大概分析了一点，其他好像就没怎么看到了。比较好用的算法类软件，如weka，其里面已经包含了这个算法，在Associate--> HotSpot里面即可看到，运行算法界面一般如下：

其中，红色方框里面为设置的参数，如下：

-c last ，表示目标所在的目标所在的列，last表示最后一列，也是是数值，表示第几列；

-V first，表示目标列的某个状态值下标值（这里可以看出目标列应该是离散型），first表示第0个，可以是数值型；

-S 0.13，最小支持度，里面会乘以样本总数得到一个数值型的支持度；

-M 2 ，最大分指数；

-I 0.01 ，在weka里面解释为Minimum improvement in target value，不知道是否传统的置信度一样；

相关说明：本篇相关代码参考weka里面的HotSpot算法的具体实现，本篇只分析离散型数据，代码可以在（http://download.csdn.net/detail/fansy1990/8488971）下载。

1. 数据：

@attribute age 			{young, pre-presbyopic, presbyopic}
@attribute spectacle-prescrip	{myope, hypermetrope}
@attribute astigmatism		{no, yes}
@attribute tear-prod-rate	{reduced, normal}
@attribute contact-lenses	{soft, hard, none}
young,myope,no,reduced,none
young,myope,no,normal,soft
young,myope,yes,reduced,none
。。。
presbyopic,hypermetrope,yes,normal,none

这个数据格式是参考weka里面的，加入最前面的5行是因为需要把各个属性进行编码，所以提前拿到属性的各个状态，方便后续操作；
2. 单个节点定义：

public class HSNode {
	private int splitAttrIndex; // 属性的下标
	private int attrStateIndex; // 属性state的下标
	private int allCount ; // 当前数据集的个数
	private int stateCount ; // 属性的state的个数
	private double support; // 属性的支持度
	private List<HSNode> chidren;
	
	public HSNode(){}}

splitAttrIndex 即对应属性astigmatism的下标（应该是第2个，从0开始）；attrStateIndex 则对应这个属性的下标，即no的下标（这里应该是0）；allCount即12，stateCount即5，support 对应41.57%（即5/12的值）；children即其孩子节点；（这里的下标即是从文件的前面几行编码得到的，比如属性age为第一个属性，编码为0，young为其第一个状态，编码为0）；

3. 算法伪代码，（文字描述，太不专业了，如果要看，就将就看？）

1. 创建根节点；
2. 创建孩子节点；
    
   2.1 针对所有数据，计算每列的每个属性的’支持度‘support，
       if support>= MINSUPPORT
          把该列的当前属性加入潜在的孩子节点列表；
	end
   2.2 针对潜在孩子节点列表遍历
       if (!当前节点产生的规则序in全局规则序列）
	  把当前节点加入孩子节点列表；
	  把当前节点产生的规则加入全局规则中；
       end

   2.3 遍历孩子节点列表
        针对当前节点，返回到2，进行递归；

4. 代码关键步骤具体实现：

4.1 数据读取及初始化：

1）读取文件的前面几行，初始化两个变量，attributes和attributeStates ,分别对应所有的属性和属性的各个状态；

 while ((tempString = reader.readLine()) != null) {
            	// 第一行数据是标题
            	if(tempString.indexOf(HSUtils.FILEFORMAT)==0){
            		String attr = tempString.substring(HSUtils.FILEFORMAT.length()
            				, tempString.indexOf("{")).trim();
            		String[] attrStates =tempString.substring(tempString.indexOf("{")+1,
            				tempString.indexOf("}")).split(",");
            		for(int i=0;i<attrStates.length;i++){
            			attrStates[i]=attrStates[i].trim();
            		}
            		attrList.add( attr);
            		line++;
            		this.attributeStates.put(attr, attrStates);
            		continue;
            	}
            	if(flag){
            		this.attributes= new String[line];
            		attrList.toArray(this.attributes);// 复制值到数组中		
            		flag=false;
            	}
            	String[] tempStrings = tempString.split(splitter);
            	lists.add(strArr2IntArr(tempStrings));
            }

2）后面就是把下面的数据转为数值型数组了，strArr2IntArr 函数如下：

	/**
	 * String 数组转为int数组
	 * @param sArr
	 * @return
	 * @throws Exception 
	 */
	private int[] strArr2IntArr(String[] sArr) throws Exception{
		int[] iArr = new int[sArr.length];
		for(int i=0;i<sArr.length;i++){
			iArr[i]= getAttrCode(sArr[i],i);
		}
		return iArr;
	}
	/**
	 * 获得第attrIndex属性的attrState的编码
	 * @param attrState
	 * @param attrIndex
	 * @return
	 * @throws Exception 
	 */
	private int getAttrCode(String attrState,int attrIndex) throws Exception{
		String[] attrStates = attributeStates.get(attributes[attrIndex]);
		for(int i=0;i<attrStates.length;i++){
			if(attrState.equals(attrStates[i])){
				return i;
			}
		}
		throw new Exception("编码错误！");
//		return -1; // 如果运行到这里应该会报错
	}

这里数据读取主要是把离散型的字符串类型数据转换为数值型数据，编码规则如下：

属性age的状态：	[young-->0,pre-presbyopic-->1,presbyopic-->2,]
属性spectacle-prescrip的状态：	[myope-->0,hypermetrope-->1,]
属性astigmatism的状态：	[no-->0,yes-->1,]
属性tear-prod-rate的状态：	[reduced-->0,normal-->1,]
属性contact-lenses的状态：	[soft-->0,hard-->1,none-->2,]

4.2 初始化根节点

// 读取文件并赋值
		List<int[]> intData = readFileAndInitial(HSUtils.FILEPATH,HSUtils.SPLITTER);;
		
		int splitAttributeIndex = attributes.length-1;// 下标需减1
		int stateIndex = HSUtils.LABELSTATE;
		
		int numInstances = intData.size();// 数据总个数
		int[] labelStateCount = attrStateCount(intData,attributes.length-1);
		
		HSUtils.setMinSupportCount(numInstances);
		double targetValue=1.0*labelStateCount[HSUtils.LABELSTATE]/numInstances;
		// 创建根节点
		HSNode root = new HSNode(splitAttributeIndex,stateIndex,labelStateCount[stateIndex],numInstances);
		double[] splitVals=new double[attributes.length];
        byte[] tests = new byte[attributes.length];
		root.setChidren(constructChildrenNodes(intData,targetValue,splitVals,tests));

labelStateCount即目标属性的各个状态的个数，比如这里目标状态为soft，一共有5个值，一共有24个样本，所以其支持度为5/25=20.82%;

constructChildrenNodes函数为创建所有子节点，接收的参数有：intData：所有的数据（经过编码的）；targetValue：当前节点支持度；splitVals和tests数组主要用于针对节点产生规则；

4.3 创建孩子节点：

1）计算潜在孩子节点：

private List<HSNode> constructChildrenNodes(List<int[]> intData,double targetValue,
			double[] splitVals,
            byte[] tests) {
		
		// 设置孩子节点
//		// 获取子数据集
//		
		// 针对每个属性的每个state值计算其支持度（需要符合置信度）
		PriorityQueue<AttrStateSup> pq = new PriorityQueue<AttrStateSup>();
		for(int i=0;i<attributes.length-1;i++){// 最后一个属性不用计算（为Label）
			evaluateAttr(pq,intData,i,targetValue);
		}

这里的evaluateAttr主要是判断每个属性的各个状态是否符合要求，是则加入pq

/**
	 * 是否把第attrIndex属性的state作为备选节点加入pq
	 * @param pq
	 * @param intData 
	 * @param attrIndex
	 * @param targetValue 
	 * @param stateIndex 
	 * @param labelStateCount 
	 */
	private void evaluateAttr(PriorityQueue<AttrStateSup> pq,
			List<int[]> intData, int attrIndex, double targetValue) {
		int[] counts = attrStateCount(intData,attrIndex);
		
		 boolean ok = false;
	      // only consider attribute values that result in subsets that meet/exceed min support
	      for (int i = 0; i < counts.length; i++) {
	        if (counts[i] >= HSUtils.getMinSupportCount()) {
	          ok = true;
	          break;
	        }
	      }
	    if(ok){
	    	double subsetMatrix =0.0;
			for(int stateIndex=0;stateIndex<counts.length;
					stateIndex++){
				subsetMatrix =attrStateCount(intData,attrIndex,stateIndex,attributes.length-1,HSUtils.LABELSTATE);
				if(counts[stateIndex]>=HSUtils.getMinSupportCount()&&subsetMatrix>=HSUtils.getMinSupportCount()){
					
					 double merit = 1.0*subsetMatrix / counts[stateIndex]; //
			         double delta = merit - targetValue;
			         if(delta/targetValue>=HSUtils.MINCONFIDENCE){
			        	 pq.add(new AttrStateSup(attrIndex,stateIndex,counts[stateIndex],(int)subsetMatrix));
			         }
					
				}
			}
	    }// ok
	}

这里首先针对当前数据集计算属性下标为attrIndex的各个状态的计数到counts[]数组中；如果各个状态的所有计数都小于最小支持度，则该属性都不作为备选加入pq中；否则继续判断：计算目标属性的设定状态（比如soft）和当前属性的状态（young）共同出现的次数（第一次应该是2），赋值给subsetMatrix（那么该值就是2）；判断subsetMatrix是否>=最小支持度，如果是在按照上面的代码进行计算，最后还有个判断是用到置信度的（暂译为置信度），如果满足则把其加入到pq中，即备选子节点列表；

2）生成全局规则，并添加孩子节点

List<HSNode> children = new ArrayList<HSNode>();
		List<HotSpotHashKey> keyList = new ArrayList<HotSpotHashKey>();
			while(pq.size()>0&&children.size()<HSUtils.MAXBRANCH){
				AttrStateSup attrStateSup = pq.poll();
				
				// 再次进行过滤
				double[] newSplitVals = splitVals.clone();
	            byte[] newTests = tests.clone();
	            newSplitVals[attrStateSup.getAttrIndex()]=attrStateSup.getStateIndex()+1;
	            newTests[attrStateSup.getAttrIndex()] =(byte)2; 
	      
	            HotSpotHashKey key = new HotSpotHashKey(newSplitVals, newTests);
	            if (!HSUtils.m_ruleLookup.containsKey(key)) {
	            	// insert it into the hash table
	            	HSUtils.m_ruleLookup.put(key, "");       // 需要先增加规则，然后才处理子节点     
	            	HSNode child_i= new HSNode(attrStateSup.getAttrIndex(),attrStateSup.getStateIndex(),
							attrStateSup.getStateCount(),attrStateSup.getAllCount());
					keyList.add(key);
					children.add(child_i);
	            } else {
	              System.out.println("The potential ,but not included :"+attrStateSup);
	            }
		}

这里的全局规则使用HotSpotHashKey生成，具体规则的含义没有理解（可能和算法原理有关，都找不到一篇相关的paper！）

添加一个节点后，就会添加相应的规则，这样可以避免孩子节点的孩子有相同的规则被重复添加；

3）针对每个孩子节点，处理其节点的孩子

// 处理子节点
		for(int i=0;i<children.size();i++){
			HSNode child = children.get(i);
			child.setChidren(constructChildrenNodes(getSubData(intData,child.getSplitAttrIndex(),
					child.getAttrStateIndex()),child.getSupport(),keyList.get(i).getM_splitValues(),
					keyList.get(i).getM_testTypes()));
			
		}

这里使用递归进行调用，方便处理。需注意节点规则的生成使用的两个数组newSplitValues 和newTests需要往下传递，所以在每个孩子节点生成规则的时候把其加入到一个keyList，这样在遍历孩子节点，处理其节点的孩子时，可以找到对应的规则传递数组；

这里的getSubData即是找到当前数据集中和给定的属性下标即属性状态一样的数据返回，如下：

/**
	 * 获取和splitAttributeIndex相同下标的属性以及stateIndex的所有数据
	 * @param intData
	 * @param splitAttributeIndex
	 * @param stateIndex
	 * @return
	 */
	private List<int[]> getSubData(List<int[]> intData,
			int splitAttributeIndex, int stateIndex) {
		List<int[]> subData = new ArrayList<int[]>();
		for(int[] d:intData){
			if(d[splitAttributeIndex]==stateIndex){
				subData.add(d);
			}
		}
		return subData;
	}

4.4 打印规则树

/**
	 * 打印规则树
	 * @param node
	 * @param level
	 */
	public void printHSNode(HSNode node,int level){
		printLevelTab(level);
		System.out.print(node+"\n");
		
		List<HSNode> children= node.getChidren();
		for(HSNode child:children){
			printHSNode(child,level+1);
		}
	}
	private void printLevelTab(int level) {
		for(int i=0;i<level;i++){
			System.out.print("|\t");
		}
	}

这里可以看到针对当前节点，使用直接打印的方式，因为这里覆写了toString方法，所以可以这样，其toString 方法如下：

/**
	 * 格式化输出
	 */
	public String toString(){
		return HSUtils.getAttr(this.splitAttrIndex)+"="+HSUtils.getAttrState(splitAttrIndex, attrStateIndex)
				+"  ("+HSUtils.formatPercent(this.support)+" ["+this.stateCount+"/"+this.allCount+"])";
	}

4.5 算法调用：

package fz.hotspot;

import fz.hotspot.dataobject.HSNode;

public class HotSpotTest {

	/**
	 * @param args
	 * @throws Exception 
	 */
	public static void main(String[] args) throws Exception {
		String file = "D:/jars/weka-src/data/contact-lenses.txt";
		int labelStateIndex = 0; // 目标属性所在下标 
		int maxBranches=2; // 最大分支数目
		double minSupport =0.13; // 最小支持度
		double minConfidence=0.01;// 最小置信度（在weka中使用的是minImprovement）
		HotSpot hs = new HotSpot();
		HSNode root = hs.run(file,labelStateIndex,maxBranches,minSupport,minConfidence);
		System.out.println("\n规则树如下：\n");
		hs.printHSNode(root,0);
	}

}

打印的规则树如下：

contact-lenses=soft  (20.83% [5/24])
|	astigmatism=no  (41.67% [5/12])
|	|	tear-prod-rate=normal  (83.33% [5/6])
|	|	|	spectacle-prescrip=hypermetrope  (100.00% [3/3])
|	|	spectacle-prescrip=hypermetrope  (50.00% [3/6])
|	tear-prod-rate=normal  (41.67% [5/12])
|	|	spectacle-prescrip=hypermetrope  (50.00% [3/6])

可以看到和weka给出的是一致的。

最近在看《暗时间》，上面提到说有想法最好写下来，这样不仅可以加深自己的理解，同时在写的过程中，比如一些表达之类的也可以加强（身为程序员，这方面的能力确实欠缺），同时也可以让别人检验到自己的思维盲点。

文中相关算法理解，仅代表自己观点。

分享，成长，快乐

脚踏实地，专注

转载请注明blog地址：http://blog.csdn.net/fansy1990

Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
synchronized锁升级过程 liang8999 java jvm 开发语言
一、synchronized锁加到什么地方synchronized上锁，其实锁信息是加在对象头中的markdown，对象中的前四个字节表示markdown；markdown还记录了对象的gc、hashcode信息注意：markdown结构与jvm虚拟机的实现有关，I）32位Hotspot虚拟机markdown结构如下：II）64位Hotspot虚拟机的markdown结构如下：二、synchron
mac 版本Jmeter安装教程 weixin_58693614 macos jmeter java
1.确认是否安装JDK*打开终端->输入java-version（注意空格）会出现版本信息javaversion"16.0.1"2021-04-20Java(TM)SERuntimeEnvironment(build16.0.1+9-24)JavaHotSpot(TM)64-BitServerVM(build16.0.1+9-24,mixedmode,sharing)2.若没有安装，移步官网下载安
clickhouse-v24.1-离线部署 Wonderful呀数据库 clickhouse 数据库运维 linux
部署版本数据库版本：24.1.1.2048jdk版本：jdk84个文件（三个ck的包）：OpenJDK8U-jdk_x64_linux_hotspot_8u382b05.tarclickhouse-client-24.1.1.2048.x86_64.rpmclickhouse-common-static-24.1.1.2048.x86_64.rpmclickhouse-server-24.1.1.
读书笔记：《深入理解Java虚拟机》（8） Violet永存读书笔记 java 开发语言 jvm
虚拟机性能监控、故障处理工具JDK命令行工具这些命令在JDK安装目录下的bin目录下：jps(JVMProcessStatus）:类似UNIX的ps命令。用于查看所有Java进程的启动类、传入参数和Java虚拟机参数等信息；jstat（JVMStatisticsMonitoringTool）:用于收集HotSpot虚拟机各方面的运行数据;jinfo(ConfigurationInfoforJava
JDK成长记16：从0分析你不知道的synchronized底层原理（下） _程序员成长记
file上一节你了解了什么是CAS、synchronized形成的锁的类型、重量级锁是用户态进程向内核态申请资源加锁过程，HotSpotJava对象结构，以及初步从3个层面分析了下synchronized的核心流程。还记得核心流程图么？如下所示：file这一节我们仔细来分析下这个过程中，每一步的底层原理。我们需要用到一个工具包，JOL，它可以将java对象的信息打印出来。你可以通过这个工具分析升级
JAVA之JVM入门 java_heartLake JAVA java jvm
Java虚拟机（JVM）是Java平台的核心部分之一，它为Java程序提供了运行环境。一、历史背景1.SunClassicVM发布时间：1996年重要功能：Java1.0的默认JVM。支持基本的字节码执行。简单的垃圾回收机制。2.HotSpotVM发布时间：1999年重要功能：JDK1.3开始成为默认JVM。引入了即时编译器（JITCompiler）。提供了多种垃圾收集器。支持线程调度和同步性能的
方法区的垃圾回收 climb.xu jvm java
方法区的垃圾回收有人认为方法区(如HotSpot虚拟机中元空间或者永久代)是没有垃圾收集行为的,其实不然,Java虚拟机规范中堆方法区的约束是非常宽松的,提到过可以不要求虚拟机在方法区中实现垃圾收集,事实上也确实有未实现或未能完整实现方法区类型卸载的垃圾收集器存在(如JDK11时期的ZGC收集器就不支持类卸载)一般来说这个区域的回收效果比较难令人满意,尤其是类型的卸载,条件相当苛刻,但是这部分区域
每天一个数据分析题（五百）- 关联规则跟着紫枫学姐学CDA 数据分析题库数据分析数据挖掘
广为流传的“啤酒与尿布”的故事，其背后的模型实际上是哪一类？A.分类（Classification）B.分群（Clustering）C.关联（Association）D.预测（Prediction）数据分析认证考试介绍：点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python，SQL，统计学，数据分析理论，深度学习，可视化，机器学习，Spark八个方向的专项练习题库
方法区【JVM】码农回忆录 JVM 方法区常量池 JVM
JVM-方法区1.方法区的作用当类加载器加载完成类之后，会将类信息、运行时常量池、静态变量（此处指的是指针，如果是一个对象对象的分配还是在堆中）等存储在方法区；但在JDK不同版本对字符串常量和静态变量的存储有所不同，这部分内容后续列出2.不同版本的方法区JDK6：在JDK6以前方法区也就是HotSpot虚拟机中的永久代，此时类信息、运行时常量池、静态变量等存储在方法区JDK7：在JDK7中法区也是
性能测试手册：一分钟掌握LoadRunner关联函数应该放在那 Criss陈磊
为什么要有关联函数如果客户端的某个请求是随着服务器端的响应而动态变化，我们就需要用到关联，通过关联函数获取动态的返回值，传给后面的函数使用，完成测试上下文的流程串联。定义：在脚本回放过程中，客户端发出请求，通过关联函数所定义的左右边界值（也就是关联规则），在服务器返回的响应内容中查找，得到相应的值，将其存储的变量中，后续请求再通过对应变量指向的内存取出数据发给服务器发，已完成正确的业务流程的性能测
JVM 自动内存管理知识点梳理 10419 知识点梳理思考 Java java jvm 内存管理
JVM自动内存管理Java内存区域HotSpot虚拟机对象探秘垃圾收集器与内存分配策略哪些内存需要回收？（对象已死？）垃圾收集算法HotSpot的算法细节实现经典垃圾收集器CMSG1低延迟垃圾收集器引用你好！这是我对于JVM自动内存管理相关知识点的梳理与思考，希望对你能有所帮助；菜鸟萌新，问题多多，欢迎指出，谢谢！本文章以图为主，如果文章中没有图片，麻烦移步:链接.Java内存区域HotSpot虚
深入浅出JVM（一）之Hotspot虚拟机中的对象后端
本篇文章思维导图对象的创建对象的创建可以分为五个步骤:检查类加载,分配内存,初始化零值,设置对象头,执行实例构造器类加载检查HotSpot虚拟机遇到一条new指令,会先检查能否在常量池中定位到这个类的符号引用,检查这个类是否类加载过没有类加载过就去类加载类加载过就进行下一步分配内存分配内存对象所需的内存在类加载完成后就可以完全确定分配内存方式虚拟机在堆上为新对象分配内存,有两种内存分配的方式:指针
【机器学习笔记】14 关联规则 RIKI_1 机器学习机器学习笔记人工智能
关联规则概述关联规则（AssociationRules）反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系，那么，其中一个事物就能够通过其他事物预测到。关联规则可以看作是一种IF-THEN关系。假设商品A被客户购买，那么在相同的交易ID下，商品B也被客户挑选的机会就被发现了。有没有发生过这样的事：你出去买东西，结果却买了比你计划的多得多的东西？这是一种被称为
【机器学习笔记】12 聚类 RIKI_1 机器学习机器学习笔记聚类
无监督学习概述监督学习在一个典型的监督学习中，训练集有标签，我们的目标是找到能够区分正样本和负样本的决策边界，需要据此拟合一个假设函数。无监督学习与此不同的是，在无监督学习中，我们的数据没有附带任何标签，无监督学习主要分为聚类、降维、关联规则、推荐系统等方面。主要的无监督学习方法聚类（Clustering）如何将教室里的学生按爱好、身高划分为5类？降维（DimensionalityReductio
R语言Apriori关联规则、kmeans聚类、决策树挖掘研究京东商城网络购物用户行为数据可视化|附代码数据数据挖掘
全文链接：http://tecdat.cn/?p=30360最近我们被客户要求撰写关于网络购物用户行为的研究报告，包括一些图形和统计输出。随着网络的迅速发展，依托于网络的购物作为一种新型的消费方式，在全国乃至全球范围内飞速发展电子商务成为越来越多消费者购物的重要途径。我们被客户要求撰写关于网络购物行为的研究报告。项目计划使用数据挖掘的方法,以京东商城网购用户的网络购物数据为基础,对网络购物行为的三
【JVM篇】什么是类加载器，有哪些常见的类加载器在下小吉. JVM jvm python 开发语言
文章目录什么是类加载器有哪些常见的类加载器什么是类加载器负责在类加载过程中，将字节码信息以流的方式获取并加载到内存当中有哪些常见的类加载器启动类加载器启动类加载器是有Hotspot虚拟机通过的类加载器，加载核心类默认加载Java安装目录/jre/lib下面的类文件扩展类加载器扩展类加载器是jdk中提供的，是使用Java编写的类加载器，加载扩展类默认加载Java安装目录/jre/lib/ext下的类
JVM工作原理与实战(三十八)：JIT即时编译器原理橘子-青衫 JVM工作原理与实战 java jvm 后端架构
专栏导航JVM工作原理与实战RabbitMQ入门指南从零开始了解大数据目录专栏导航前言一、JIT即时编译器二、HotSpot中的JIT编译器三、JIT优化技术1.方法内联2.逃逸分析四、JIT优化建议总结前言JVM作为Java程序的运行环境，其负责解释和执行字节码，管理内存，确保安全，支持多线程和提供性能监控工具，以及确保程序的跨平台运行。本文主要介绍了JIT即时编译器、HotSpot中的JIT编
关于jvm中的安全点的理解今天不想掉头发
>中说道GCRoots的节点主要在全局的引用（例如常量或类静态属性）与执行上下文（例如栈帧中的本地变量表）中，但是进行根节点枚举的时候我们并不需要一个不漏地检查完所有执行上下文和全局引用位置，HotSpot中通过使用一组称为OopMap的数据结构，用于直接存放对象引用，类加载完成，HotSpot就会把对象内某个偏移位置是否为对象引用记录下来，JIT编译过程中，也会在特定的位置记录下栈和局存起中哪些
Java基础-JVM内存管理-HotSpot对象 HughJin
Java工程师知识树/Java基础HotSpot中的对象Java是一门面向对象的编程语言，在Java程序运行过程中时时刻刻都有对象被创建出来。在语言层面上，创建对象（例如克隆、反序列化）通常仅仅是一个new关键字而已，而在虚拟机中，对象（这里指普通Java对象，不包括数组和Class对象等）的创建又是怎样一个过程呢？对象的创建首先我们虚拟机在遇到new的指令时会检查是否能在常量池中找到这个类的符号
Java 三大并大特性-可见性介绍（结合代码、分析源码）夜夜流光相皎洁_小宁 Java技术 java 高并发多线程可见性 jvm hotspot
目录编辑一、可见性概念1.1概念二、可见性问题由来2.1由来分析三、可见性代码例子3.1代码3.2执行结果四、Java中保证可见性的手段4.1volatile4.1.1优化代码4.1.2测试结果4.1.3volatile原理分析4.1.3.1查看字节码4.1.3.2hotspot层面4.1.3.3volatile原理总结4.2synchronized4.2.1代码优化4.2.2测试结果4.2.3s
iOS 应用内一键连接Wi-Fi 小柴2011
项目背景：应用内一键连接Wi-Fi（已知SSID和密码），不需要跳转偏好设置页面点击连接。1，⚠️只支持iOS11.0及以上在General->Deploymentinfo->Deploymenttarget2,在buildPhass->LinkBinayWithLibraries引入框架NetworkExtension.framework3,在Capabilities中打开hotspotConf
解决jstack的报错：Unable to open socket file java
原文网址：解决jstack的报错：Unabletoopensocketfile_IT利刃出鞘的博客-CSDN博客简介说明本文介绍解决jstack的报错的方法，报错信息为：Unabletoopensocketfile。分享Java技术星球：自学精灵-IT技术星球详细报错信息：进程号:Unabletoopensocketfile:targetprocessnotrespondingorHotSpotV
HotSpot初始化王侦
openjdk9JVM启动调试介绍了从Launcher到主线程的整个初始化运行过程。这一篇集中介绍主线程中InitializeJVM最终调用Threads::create_vm初始化hotspot虚拟机各个模块的过程。1.hotspot各模块└──vmHotSpotVM的核心代码├──adlc平台描述文件（上面的cpu或os_cpu里的*.ad文件）的编译器├──asm汇编器接口├──c1clie
Apriori介绍及代码批注 Fishermen_sail 机器学习数据挖掘 scikit-learn python 机器学习推荐算法
一、Apriori原理解析1.概述关联规则分析是数据挖掘中最活跃的研究方法之一，目的是在一个数据集中找到各项之间的关联关系，而这种关系并没有在数据中直接体现出来。以超市的销售数据为例，当存在很多商品时，可能的商品组合数量达到了令人望而却步的程度，这是提取关联规则的最大困难。因此各种关联规则分析算法从不同方面入手减少可能的搜索空间大小以及减少扫描数据的次数。Apriori算法是最经典的挖掘频繁项集的
基于关联规则的计算机类考研院校推荐系统计算机专业毕业设计
关联规则算法，就是我们常说的Apriori算法，利用该算法，通过对数据的关联性进行了分析和挖掘，挖掘出的这些信息在决策制定过程中具有重要的参考价值。本系统主要是根据该算法，帮助考研的学生，选择和推荐学校，方便学生选择到合适的学校。项目开发采用Eclipse做为开发工具，tomcat8.5以上版本，jdk1.8以上。系统采用Spring+SpringMVC+Mybits框架，实现了网站的建设。功能介
Gradle IDEA 乱码混世小萌羊 Gradle intellij-idea java ide
文章目录环境代码测试结果配置JAVA_TOOL_OPTIONS配置build.gradle.kts配置idea64.exe.vmoptions无配置总结问题链接环境Java环境javaversion"21.0.2"2024-01-16LTSJava(TM)SERuntimeEnvironment(build21.0.2+13-LTS-58)JavaHotSpot(TM)64-BitServerVM
Unable to open socket file: target process not responding or HotSpot VM not loaded The -F option ... 程序员牛牛
首先使用ps-ef查询java进程号：linux-h4j5:/opt/aiservice/jdk/bin#ps-ef|grepjavaroot2503724942018:55pts/100:00:00grepjavaai2621610Mar27?01:47:40/opt/aiservice/jdk/bin/java-cp.org.springframework.boot.loader.WarLau
jvm垃圾收集器之七种武器黄晓琪 jvm
目录1.回收算法1.1标记-清除算法(Mark-Sweep)1.2复制算法(Copying)1.3标记-整理算法(Mark-Compact)2.HotSpot虚拟机的垃圾收集器2.1新生代的收集器Serial收集器（复制算法）ParNew收集器(复制算法)ParallelScavenge收集器(复制算法)2.2老年代的收集器SerialOld收集器(标记-整理算法)ParallelOld收集器(标
垃圾收集器与内存分配策略 join_a922
一、GC收集器1、GC回收需要思考的三件事：a)如何判断哪些内存需要回收？b)用什么回收？c)什么时候进行回收？以下分别针对这个几个问题进行说明。问题1：如何判断哪些内存需要回收？判断方法有两种（HotSpot默认采用第二种）:1.引用计数算法给对象添加一个引用计数器，每当一个地方引用它时，计数器值就加1；当引用失效时，计数器值就减1；任何时刻计数器都为0的对象就是不可能再被使用的。2.根搜索算法
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

HotSpot关联规则算法（1）-- 挖掘离散型数据

你可能感兴趣的:(HotSpot,关联规则)