陈序袁

机器学习之决策树：日撸Java三百行day61-62

一、什么是决策树

要了解决策树，先了解“决策”。决策（decision）是指决定的策略或办法，是为人们为各自事件出主意、做决定的过程。我们每天都在决策，如：今晚吃什么、明天穿什么。
了解了“决策”以后，再了解一下“树”。树（tree）是数据结构中的一种，是由 $n$ 个有限节点组成一个具有层次关系的集合。之所以称其为树，是因为它看起来像一棵倒挂的树。

了解好以上两个概念以后，理解决策树就非常容易了。决策树（decision tree）是一类常见的机器学习方法，是为基于树结构来进行决策的方法。以二分类问题为例，我们要对“今天是否适合出门打球？”这样的问题进行决策时，通常会进行一系列的判断或“子决策”：我们先看“今天天气如何？”，如果是晴天，则我们再看“今天温度如何？”；如果是雨天，则我们再看“今天风大吗？”。最后通过决策得出结果。
一棵决策树包含一个根结点、若干个内部结点和若干个叶结点；所有叶节点都对应一个决策结果，其他每一个结点则对应于一个属性测试。
同时，决策树使用了分治法来处理决策，是一个递归的过程。可以将一个大型决策划分为若干个“子决策”进行处理，最终将“子决策”合并，最终得出决策结果。

二、决策树基本思想

决策树生成算法的关键在于：确定当前数据使用哪个属性来分割，即：selectBestAttribute()。对于不同的算法，可能会选择不同的属性。
如何找到最佳的分割属性，就要通过判别哪个属性能够将数据划分的更“纯”一些。所谓的“纯”，就代表着划分出的一整块数据，它们的属性值一致，划分地更纯粹、更彻底。若划分出的一块数据除了一种属性值，还有其他的属性值，那么这块数据就“不纯”。
为了更好地划分出“纯”的数据块，我们就需要引入三个新的概念：信息增益、信息增益率、基尼指数。

·信息增益

在了解信息增益之前，先了解信息熵（information entropy）。信息熵是度量样本集合纯度最常用的一种指标。假定当前样本集合 $D$ 中第 $k$ 类样本所占比例为 $p_{k}(k=1,2,...,|Y|)$ ，则 $D$ 的信息熵定义为：
$Ent(D)=-\sum_{k=1}^{|Y|} p_{k}\log_{2}{p_{k}} \tag{1-1}$
$E n t (D)$ 的值越小，则 $D$ 的纯度越高。反之，熵值越高，纯度越低，样本集合越不稳定。 $E n t (D)$ 的最小值为0，最大值为 $log_{2}{|Y|}$ 。
假设属性 $a$ 有 $V$ 个可能的取值 $\left \{ a^{1},a^{2},a^{3},...,a^{V} \right \}$ ，若使用属性 $a$ 来对样本集 $D$ 进行划分，则会产生 $V$ 个分支结点，其中第 $v$ 个分支结点包含了 $D$ 中属性 $a$ 中所有取值为 $a^{v}$ 的样本，记为 $D^{v}$ 。根据公式（1-1）计算 $D^{v}$ 的信息熵 $Ent(D^{v})$ 。考虑到不同的分支结点所包含的样本数不同，给分支结点赋予权重 $D^{v}|/|D|$ ，即：样本数越多的分支结点影响越大。于是就可以计算出用属性 $a$ 对样本集 $D$ 进行划分所获得的信息增益（information gain）
$Gain(D,a)=Ent(D)-\sum_{v=1}^{V}\frac{|D^{v}|}{|D|}Ent(D^{v}) \tag{1-2}$
信息增益越大，代表使用属性 $a$ 来对样本集进行划分获得的“纯度提升”越大。因此，我们利用信息增益来进行决策树的划分属性选择。

·信息增益率

信息增益更偏向于选择取值数目较多的属性，为了减少这种偏好对划分样本集带来不利影响，我们可以选择信息增益率（information entropy ratio）来选择最优属性。增益率定义为：
$Gainratio(D,a)=\frac{Gain(D,a)}{IV(a)} \tag{2-1}$
其中， $I V (a)$ 定义为：
$IV(a)=-\sum_{v=1}^{V}\frac{|D^{v}|}{|D|}log_{2}{\frac{|D^{v}|}{|D|} } \tag{2-2}$

·基尼指数

除了以上两种方式，也可以通过计算属性的基尼指数（Gini index）来选择划分属性。样本集 $D$ 的纯度可用基尼值来度量。基尼指数定义为：
$Gini(D)=\sum_{k=1}^{|Y|}\sum_{{k}'≠k }^{}p_{k}p_{{k}'} =1-\sum_{k=1}^{|Y|}p_{k}^{2} \tag{3-1}$
基尼指数反映了从样本集 $D$ 中随机抽取两个样本标签不同的概率。因此， $G i n i (D)$ 越小，样本集 $D$ 的纯度越高。
样本集 $D$ 中属性 $a$ 的基尼指数定义为：
$GiniIndex(D,a)=\sum_{v=1}^{V} \frac{|D^{v}|}{|D|}Gini(D^{v}) \tag{3-2}$
在样本集中，选择能够使基尼指数最小的属性作为最佳划分属性。
由于当数据较少、属性值较少时，信息增益选择的属性划分数据的效果最佳，因此本次实验也采用了信息增益的方式来选择最佳划分属性。找到第一个最佳划分属性之后，进行第一个决策。决策树是一个递归的处理过程，因此在本次决策结束以后，就继续之前的操作，在剩余属性中选择一个最佳划分属性进行决策，以此类推。为了便于理解，直接上图。

通过计算数据集的信息增益，获得第一个最佳划分属性Outlook，将数据划分为三个结点。

接着检查划分数据块的纯度，发现Outlook=Overcast的这块数据已经是纯的了，因此直接决策Play=P。其他两个属性还不是纯的，因此需要继续寻找最佳划分属性。此时就开始递归，Outlook=Sunny这块数据的最佳划分属性为Humidity，而Outlook=Rain的这块属性的最佳划分属性为Windy。

检查划分的数据块纯度，发现每一块都是纯的。由此可以得出最终决策结果。(Outlook=Sunny)∧(Humidity=High)=(Play=N)；(Outlook=Sunny)∧(Humidity=Normal)=(Play=P)；(Outlook=overcast)=(Play=P)；(Outlook=Rain)∧(Windy=False)=(Play=P)；(Outlook=Rain)∧(Windy=True)=(Play=N)。

三、算法的基本流程及操作

数据集跟上面图示里的一致，也是weather.arff。下载地址在此。为了方便，依然贴出数据：

@relation weather
@attribute Outlook {Sunny, Overcast, Rain}
@attribute Temperature {Hot, Mild, Cool}
@attribute Humidity {High, Normal, Low}
@attribute Windy {FALSE, TRUE}
@attribute Play {N, P}
@data
Sunny,Hot,High,FALSE,N
Sunny,Hot,High,TRUE,N
Overcast,Hot,High,FALSE,P
Rain,Mild,High,FALSE,P
Rain,Cool,Normal,FALSE,P
Rain,Cool,Normal,TRUE,N
Overcast,Cool,Normal,TRUE,P
Sunny,Mild,High,FALSE,N
Sunny,Cool,Normal,FALSE,P
Rain,Mild,Normal,FALSE,P
Sunny,Mild,Normal,TRUE,P
Overcast,Mild,High,TRUE,P
Overcast,Hot,Normal,FALSE,P
Rain,Mild,High,TRUE,N

基本流程在上面的图示中已经阐述过了，在这里就直接贴出代码与注释。

①初始化全局变量，读取数据文件。

	Instances dataset;//数据集
	boolean pure;//纯度，指的是：是否全票通过
	int numClasses;//分类类型数量
	int[] avaiableInstances;//可用的实例，即一行行数据
	int[] avaiableAttribute;//可用的属性，即一列列数据
	int splitAttribute;//分割属性位置
	ID3[] children;//决策树的孩子
	int label;//标签
	int[] predicts;//预测数组
	static int smallBlockThreshold=3;//阈值
	
	public ID3(String paraFilename) {
		dataset=null;//设置数据集
		try {
			FileReader fileReader=new FileReader(paraFilename);//读取数据文件
			dataset=new Instances(fileReader);//数据导入数据集中 
			fileReader.close();//关闭文件
		}catch (Exception ee) {
			System.out.println("Cannot read the file: " + paraFilename + "\r\n" + ee);
			System.exit(0);
			// TODO: handle exception
		}
		dataset.setClassIndex(dataset.numAttributes()-1);//设置要决策的属性，即最后一个：去不去打球
		numClasses=dataset.classAttribute().numValues();//决策的属性个数，即：去、不去共两个
		
		avaiableInstances=new int[dataset.numInstances()];//可用实例数量，即：数据集中数据条数
		for(int i=0;i<avaiableInstances.length;i++) {
			avaiableInstances[i]=i;//存入数组中
		}
		avaiableAttribute=new int[dataset.numAttributes()-1];//可用属性个数，即：除了最后一个以外，其他的所有属性
		for(int i=0;i<avaiableAttribute.length;i++) {
			avaiableAttribute[i]=i;
		}
		
		//初始化
		children=null;//孩子节点初始为空
		label=getMajorityClass(avaiableInstances);//找出类型作为标签
		pure=pureJudge(avaiableInstances);//判断纯度
	}
		public ID3(Instances paraDataset,int[] paraAvailableInstances,int[] paraAvailableAttributes) {//用于构建一个决策树结点，输入参数为：数据集、可用实例、可用属性
		dataset=paraDataset;
		avaiableInstances=paraAvailableInstances;
		avaiableAttribute=paraAvailableAttributes;
		
		//初始化
		children=null;
		//通过简单投票，选择标签
		label=getMajorityClass(avaiableInstances);//从可用实例中找出最重要的属性进行决策
		//检查其纯度
		pure=pureJudge(avaiableInstances);
	}

②通过计算条件属性的信息熵，寻找最佳划分属性。

	public double conditionalEntropy(int paraAttribute) {
		//第一步，初始化各种变量
		int tempNumClasses=dataset.numClasses();//决策类型数量
		int tempNumValues=dataset.attribute(paraAttribute).numValues();//决策值数量
		int tempNumInstances=avaiableInstances.length;//可用实例数量
		double[] tempValueCounts=new double[tempNumValues];//记录决策值
		double[][] tempCountMatrix=new double[tempNumValues][tempNumClasses];//将实例用矩阵表示
		
		int tempClass,tempValue;
		for(int i=0;i<tempNumInstances;i++) {
			tempClass=(int)dataset.instance(avaiableInstances[i]).classValue();//记录实例的类型
			tempValue=(int)dataset.instance(avaiableInstances[i]).value(paraAttribute);//记录实例的属性值
			tempValueCounts[tempValue]++;
			tempCountMatrix[tempValue][tempClass]++;
		}//of for i
		
		//第二步
		double resultEntropy=0;
		double tempEntropy,tempFraction;
		for(int i=0;i<tempNumValues;i++) {
			if(tempValueCounts[i]==0) {
				continue;//忽略
			}
			tempEntropy=0;
			for(int j=0;j<tempNumClasses;j++) {
				tempFraction=tempCountMatrix[i][j]/tempValueCounts[i];
				if(tempFraction==0) {
					continue;
				}//of if
				tempEntropy+=-tempFraction*Math.log(tempFraction);
			}//of for j
			resultEntropy+=tempValueCounts[i]/tempNumInstances*tempEntropy;
		}
		return resultEntropy;
	}
	public int getMajorityClass(int[] paraBlock) {//找到重要属性
		int[] tempClassCounts=new int[dataset.numClasses()];
		for(int i=0;i<paraBlock.length;i++) {
			tempClassCounts[(int)dataset.instance(paraBlock[i]).classValue()]++;
		}//of for i
		int resultMajorityClass=-1;//暂存结果位置
		int tempMaxCount=-1;//暂存结果值
		for(int i=0;i<tempClassCounts.length;i++) {//依次寻找
			if(tempMaxCount<tempClassCounts[i]) {//若找到更重要的
				resultMajorityClass=i;//替换
				tempMaxCount=tempClassCounts[i];//替换
			}//of if
		}//of for i
		
		return resultMajorityClass;//返回
	}
		public int selectBestAttribute() {//找到最佳属性，并以此属性构建树或子树
		//信息增益 = 信息熵 - 条件信息熵
		//要找到最小的条件信息熵，才能得到最大的信息增益，并以此找到最佳属性进行处理
		splitAttribute=-1;//划分位置初始化
		double tempMinimalEntropy=10000;
		double tempEntropy;
		for(int i=0;i<avaiableAttribute.length;i++) {//将属性逐个判断
			tempEntropy=conditionalEntropy(avaiableAttribute[i]);
			if(tempMinimalEntropy>tempEntropy) {//若找到更小的条件信息熵
				tempMinimalEntropy=tempEntropy;//替换
				splitAttribute=i;//更新划分位置
			}//of if
		}//of for i
		return splitAttribute;//返回划分位置
	}

③利用选择的最佳划分属性，将数据集划分。

	public int[][] splitData(int paraAttribute){//根据属性划分数据
//      如：将所有sunny整合在一起		
//		children[0]: [0, 1, 7, 8, 10]
//		Sunny,Hot,High,FALSE,N
//		Sunny,Hot,High,TRUE,N
//		Sunny,Mild,High,FALSE,N
//		Sunny,Cool,Normal,FALSE,P
//		Sunny,Mild,Normal,TRUE,P
		int tempNumValues=dataset.attribute(paraAttribute).numValues();
		int[][] resultBlocks=new int[tempNumValues][];
		int[] tempSizes=new int[tempNumValues];
		//首先扫描每一块的大小
		int tempValue;
		for(int i=0;i<avaiableInstances.length;i++) {
			tempValue=(int)dataset.instance(avaiableInstances[i]).value(paraAttribute);//取出第i个实例的属性值
			tempSizes[tempValue]++;//该值的数组值+1
		}//of for i
		//然后分配空间
		for(int i=0;i<tempNumValues;i++) {
			resultBlocks[i]=new int[tempSizes[i]];
		}
		//扫描，并填充
		Arrays.fill(tempSizes, 0);//以0将数组tempSize填充
		for(int i=0;i<avaiableInstances.length;i++) {
			tempValue=(int)dataset.instance(avaiableInstances[i]).value(paraAttribute);
			//复制数据
			resultBlocks[tempValue][tempSizes[tempValue]]=avaiableInstances[i];
			tempSizes[tempValue]++;
		}//of for i
		return resultBlocks;
	}

④判断划分后的数据集的纯度。

	public boolean pureJudge(int[] paraBlock) {
		pure=true;
		for(int i=1;i<paraBlock.length;i++) {
			if(dataset.instance(paraBlock[i]).classValue()!=dataset.instance(paraBlock[0]).classValue()) {//只要有一个属性值与第一个不同
				pure=false;//不纯
				break;//停止循环
			}
		}
		return pure;
	}

⑤构建子树。若该数据块是纯的，则不需要建立子树。否则，返回步骤②，进行递归操作。

	public void buildTree() {
		if(pureJudge(avaiableInstances)) {
			return;//如果是纯的，就不需要建立子树
		}
		if(avaiableInstances.length<=smallBlockThreshold) {//若可用实例个数小于阈值
			return;
		}
		selectBestAttribute();//找到最佳属性
		int[][] tempSubBlocks=splitData(splitAttribute);//分割数据为几块
		children=new ID3[tempSubBlocks.length];//初始化孩子节点
		//依照属性创建
		int[] tempRemainingAttributes=new int[avaiableAttribute.length-1];//除了最后一个决策属性以外，其他的都存入该属性数组中
		for(int i=0;i<avaiableAttribute.length;i++) {
			if(avaiableAttribute[i]<splitAttribute) {//小于在左边
				tempRemainingAttributes[i]=avaiableAttribute[i];
			}
			else if(avaiableAttribute[i]>splitAttribute) {//大于在右边
				tempRemainingAttributes[i-1]=avaiableAttribute[i];
			}//of if
		}//of for i
		//创建孩子
		for(int i=0;i<children.length;i++) {
			if((tempSubBlocks[i]==null)||(tempSubBlocks[i].length==0)) {//当子块为空时
				children[i]=null;
				continue;
				//孩子也为空
			}
			else {
				children[i]=new ID3(dataset,tempSubBlocks[i],tempRemainingAttributes);//创建孩子节点
				children[i].buildTree();//递归，孩子也创建其孩子节点
			}//of if
		}//of for i
	}//of buildTree

⑥通过递归，对决策树中结点信息处理，进行决策。

	public int classify(Instance paraInstance) {//分类预测方法
		if(children==null) {
			return label;//孩子为空，返回标签
		}
		ID3 tempChild=children[(int)paraInstance.value(splitAttribute)];//获取孩子
		if(tempChild==null) {//若孩子为空
			return label;//返回
		}
		return tempChild.classify(paraInstance);//递归，预测孩子
	}

⑦定义一个字符串输出方法，用于输出决策结果。

	public String toString() {//以字符串形式输出
		String resultString="";
		String tempAttributeName=dataset.attribute(splitAttribute).name();
		if(children==null) {//没有孩子，无法决策
			resultString+="class = "+label;//直接返回
		}else {
			for(int i=0;i<children.length;i++) {//每个孩子进行输出
				if(children[i]==null) {
					resultString+=tempAttributeName + " = " + dataset.attribute(splitAttribute).value(i) + ": " + "class = " + label  +"\r\n";
				}else {
					resultString+=tempAttributeName + " = " + dataset.attribute(splitAttribute).value(i) + ": " + children[i] + "\r\n";
				}
			}//of for i
		}//of else
	    return resultString;
	}

⑧浅测一下。

	public double test(Instances paraDataset) {
		double tempCorrect=0;
		for(int i=0;i<paraDataset.numInstances();i++) {
			if(classify(paraDataset.instance(i))==(int)paraDataset.instance(i).classValue()) {//若预测成功
				tempCorrect++;
			}//of if
		}//of for i
		return tempCorrect/paraDataset.numInstances();//返回预测精度
	}
	public double selfTest() {//自我测试函数
		return test(dataset);
	}
		public static void id3Test() {
		ID3 tempID3=new ID3("C:/Users/11989/Desktop/sampledata-main/sampledata-main/weather.arff");//新建测试集，并读取数据
		ID3.smallBlockThreshold=3;//阈值设置为3
		tempID3.buildTree();//构造决策树
		
		System.out.println("The tree is:\r\n" + tempID3);
		
		double tempAccuracy=tempID3.selfTest();//浅测一下
		System.out.println("The accuray is: " + tempAccuracy);//输出预测精度
	}
	public static void main(String args[]) {
		id3Test();
	}

四、一些问题

1、决策树的优缺点？

决策树原理简单，易于理解。且几乎不需要数据预处理。不仅能够处理二分类问题，也可以处理多分类问题，不过需要一些特殊处理。
但同时，决策树也有一些缺点。如：当数据出现差错或特殊数据等情况时，会产生一棵完全不同的树。

2、信息增益、信息增益率、基尼指数分别在哪些情况下使用呢？

信息增益在面对类别较少、数据较离散的情况下效果较好，如本文所使用的天气数据。但是属性值取值较多、数据量较多的情况时效果不尽人意。这时就可以使用信息增益率，来减少信息增益对取值数目较多属性的偏好所带来的影响。当数据集较整齐，可以使用基尼指数来选择一个最佳划分属性。当数据集数据越混乱，基尼指数对这种混乱的体现越不充分，此时我们就可以使用信息增益了。

JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
JAVA 高频八股文 Day03 Conqueror675 java 开发语言
12.TCP和Http的区别是什么TCP是传输层协议，负责建立可靠的点对点连接，确保数据有序、完整地传输（如铁路轨道）；HTTP是应用层协议，基于TCP构建，定义了Web服务交互的报文格式和规则（如货运订单）。TCP关注数据如何可靠送达，通过三次握手建立连接、流量控制等机制保证传输；HTTP关注传输内容的意义，提供请求/响应语义（GET/POST等）和无状态通信。补充：说一下什么是三次握手四次挥手
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
JVM字节码加载与存储中的细节
问题引出：为什么Java定义int型变量为32767时使用的是bipush32767，而定义int型变量为32768时使用的是ldc#4？在Java中，如果这样定义int型变量：publicclassTest{publicstaticvoidmain(String[]args){inti=0;intj=5;intk=6;intm=32768;intn=32767;}}变量对应的字节码文件内容是这样
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
Java中的Tomcat，开启Web应用腾飞【基础版】
目录一、Tomcat初登场：揭开神秘面纱（一）啥是Tomcat（二）为啥要有Tomcat二、Tomcat的安装与启动：开启第一步（一）下载Tomcat（二）启动Tomcat三、Tomcat的目录结构：探秘内部布局（一）核心目录介绍（二）目录间的协同工作四、部署JavaWeb应用到Tomcat：让应用上线（一）打包Web应用为WAR文件（二）部署WAR文件到Tomcat五、Tomcat的配置优化：让
Java Web 之 Session 详解艾伦~耶格尔 java 开发语言后端前端 session
在JavaWeb开发中，Session就像网站的专属记忆管家，为每个用户保管着重要的信息和状态，确保用户在网站的旅程顺畅无阻。场景一：想象你去一家大型超市购物，推着购物车挑选商品。这个购物车就如同Session，它记录了你的购物信息，方便你在结账时一次性结算。场景二：你在玩一个在线游戏，登录账号后，你的游戏进度、等级、装备等信息都会被保存在Session中，即使你中途关闭游戏，下次登录时依然可以继
JavaScript之DOM操作与事件处理详解 AA-代码批发V哥 JavaScript javascript
JavaScript之DOM操作与事件处理详解一、DOM基础：理解文档对象模型二、DOM元素的获取与访问2.1基础获取方法2.2集合的区别与注意事项三、DOM元素的创建与修改3.1创建与插入元素3.2修改元素属性与样式3.2.1属性操作3.2.2样式操作3.3元素内容的修改四、DOM元素的删除与替换4.1删除元素4.2替换元素五、事件处理：实现页面交互5.1事件绑定的三种方式5.1.1HTML属性
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
Javaweb学习之Vue模板语法（三）不要数手指啦 vue.js 学习前端
目录学习资料前情回顾本期介绍（vue模板语法）文本插值Vue的Attribute绑定使用JavaScript表达式综合实例代码：学习资料Vue.js-渐进式JavaScript框架|Vue.js(vuejs.org)前情回顾项目的创建大家可以看这篇文章Vue学习之项目的创建-CSDN博客本期介绍（vue模板语法）首先，找到我们编写代码的地方找到自己项目的src文件夹，打开之后点击component
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本