_森罗万象

决策树模型实现：ID3，C4.5生成，剪枝，预测

此次算法实现都是基于《统计学习方法》的描述，而不是西瓜书，不涉及西瓜书内的”预剪枝“和”后剪枝“，剪枝算法为《统计学习方法》算法5.4，计算损失函数时直接计算整棵树的值，没有实现”局部进行”。
生成树部分参考决策树python源码实现（含预剪枝和后剪枝）

"""
实现决策树模型,生成决策树包括ID3,C4.5
剪枝算法实现一般剪枝,即比较损失函数

ID3和C4.5决策树要求数据集是离散的,以课本数据集和西瓜数据集展示生成,剪枝和预测


"""
import json
import numpy as np
from collections import Counter
import copy


# 创建数据集 备注 李航《统计学习方法》中表5.1 贷款申请数据数据
def createDataLH():
	data = np.array([['青年', '否', '否', '一般']])
	data = np.append(data, [['青年', '否', '否', '好']], axis=0)
	data = np.append(data, [['青年', '是', '否', '好']
		, ['青年', '是', '是', '一般']
		, ['青年', '否', '否', '一般']
		, ['中年', '否', '否', '一般']
		, ['中年', '否', '否', '好']
		, ['中年', '是', '是', '好']
		, ['中年', '否', '是', '非常好']
		, ['中年', '否', '是', '非常好']
		, ['老年', '否', '是', '非常好']
		, ['老年', '否', '是', '好']
		, ['老年', '是', '否', '好']
		, ['老年', '是', '否', '非常好']
		, ['老年', '否', '否', '一般']
							], axis=0)
	label = np.array(['否', '否', '是', '是', '否', '否', '否', '是', '是', '是', '是', '是', '是', '是', '否'])
	name = np.array(['年龄', '有工作', '有房子', '信贷情况'])
	return data, label, name


# 创建西瓜书数据集2.0
def createDataXG20():
	data = np.array([['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑']
						, ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑']
						, ['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑']
						, ['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑']
						, ['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑']
						, ['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘']
						, ['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘']
						, ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑']
						, ['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑']
						, ['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘']
						, ['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑']
						, ['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘']
						, ['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑']
						, ['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑']
						, ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘']
						, ['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑']
						, ['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑']])
	label = np.array(['是', '是', '是', '是', '是', '是', '是', '是', '否', '否', '否', '否', '否', '否', '否', '否', '否'])
	name = np.array(['色泽', '根蒂', '敲声', '纹理', '脐部', '触感'])
	return data, label, name



class Node():
	def __init__(self, label, FeatureName, ChildrenNodeDic, Data, FatherNode):
		"""
		:param label: 该结点所预测的label
		:param FeatureName: 生成子结点依据的特征是哪个,叶子结点是None
		:param ChildrenNodeDic: 字典,内容是{生成这个子结点的依据特征取值:子结点},叶子结点是None
		:param Data: 该叶结点包含的数据集
		"""
		self.label = label
		self.FeatureName = FeatureName
		self.ChildrenNodeDic = ChildrenNodeDic
		self.Data = Data
		self.FatherNode = FatherNode
		self.VisualData = {
			"此结点预测标签:": self.label,
			# "此结点存储数据:":self.Data, 这条也不能写,不然 default=lambda obj: obj.VisualData 会报错
			"此结点孩子结点的划分特征:": self.FeatureName,
			"此结点的孩子结点:": self.ChildrenNodeDic,

			# 不能写FatherNode,不然会循环调用
		}

	def DeleteChildren(self):
		"""
		删除此结点的子结点,并更新可视化数据,之前实现是一直忘记更新可视化数据,一度崩溃.
		:return:
		"""
		self.ChildrenNodeDic = None
		self.VisualData = {
			"此结点预测标签:": self.label,
			# "此结点存储数据:":self.Data, 这条也不能写,不然 default=lambda obj: obj.VisualData 会报错
			"此结点孩子结点的划分特征:": self.FeatureName,
			"此结点的孩子结点:": self.ChildrenNodeDic,
			# 不能写FatherNode,不然会循环调用
		}

	def __repr__(self):
		return json.dumps(self, indent=3, default=lambda obj: obj.VisualData, ensure_ascii=False)


class ClassificationDecisionTree():
	def __repr__(self):
		return str(self.TreeRoot)

	def __init__(self, X, y, names, method, epsilon, alpha, Purning=True):
		"""
		:param X: 特征数据集
		:param y: 标签数据集
		:param method: 构建决策树的方法
		:param names: 特征名称
		:param epsilon: 信息熵阈值
		:param alpha: 剪枝的惩罚参数,如果不剪枝可以随便取值
		:param Purning: 是否剪枝
		"""
		X = np.asarray(X)
		y = np.asarray(y).reshape(-1, 1)
		self.OriginalData = np.concatenate([X, y], axis=1)  # 按列合并特征数据集和标签数据集,组成算法中的数据集,与书中的"数据集"契合
		self.Originalnames = names
		self.TreeRoot = self.BuildTree(self.OriginalData, self.Originalnames, method, epsilon)
		self.FeatureIndexDic = {FeatureName: FeatureIndex for FeatureIndex, FeatureName in
								enumerate(names)}  # 特征名称方便可视化展示,特征索引方便预测调用
		if Purning:
			self.TreeRoot = self.DecidePurning(self.TreeRoot, alpha, float("inf"))  # 剪枝,初始Loss设置为无穷大

	def BuildTree(self, Data, names, method, epsilon):
		# 递归调用的开始,构建根结点,它对应的数据集就是完整的数据集,且父结点是None
		return self.CreateNode(Data, names, method, epsilon, None)

	@staticmethod
	def GetHeatFunction(Data):
		"""
		计算数据集的经验熵
		:param Data: 数据集
		:return: 经验熵
		"""
		data_size = Data.shape[0]
		y = Data[:, -1]
		labels, labels_count = np.unique(y, return_counts=True)
		# 计算C_k/D
		P_iList = labels_count / data_size
		return -np.sum(P_iList * np.log2(P_iList))

	@staticmethod
	def GetFeatureHeatFunction(FeatureIndex, Data):
		"""
		计算数据集关于某个特征的熵,实际上就是FectureVector的熵,FectureVector是数据集的第FeatureIndex列
		这里函数参数设置为了与书契合而这样做,实际上可以将此函数与计算熵的函数合并
		:param FeatureIndex: 特征索引
		:param Data: 数据集
		:return: 数据集关于特征的熵
		"""
		data_size = Data.shape[0]
		FectureVector = Data[:, FeatureIndex]
		FeatureValues, FeatureValuesCount = np.unique(FectureVector, return_counts=True)
		# 计算D_i/D,即P_i
		P_iList = FeatureValuesCount / data_size
		return -np.sum(P_iList * np.log2(P_iList))

	def GetConditionalHeatFunction(self, FeatureIndex, Data):
		"""
		计算某个特征对数据集的条件熵
		:param FeatureIndex: 特征在数据集中的索引
		:param Data: 数据集
		:return: 条件熵
		"""
		data_size = Data.shape[0]
		FeatureVector = Data[:, FeatureIndex]  # 特征列
		FeatureValues = set(FeatureVector)
		# print(FeatureValues)
		ConditionalHeatFunction = 0
		for FeatureValue in FeatureValues:
			# FeatureVector==FeatureValue)
			Data_i = Data[FeatureVector == FeatureValue, :]
			ConditionalHeatFunction += (Data_i.shape[0] / data_size) * self.GetHeatFunction(Data_i)
		return ConditionalHeatFunction

	@staticmethod
	def SplitData(Data, FeatureIndex):
		"""
		删除数据集中的FeatureIndex列(重要!!!),并且根据特征分割数据集,注意这里要先取特征列,再删除
		:param Data: 数据集
		:param FeatureIndex:特征
		:return: 分割后的数据集,结构是字典,结构是{特征取值:这个特征取值的子数据集}
		"""

		FeatureVector = Data[:, FeatureIndex]
		Data = np.delete(Data, FeatureIndex, axis=1)
		# print("FeatureVector={}".format(FeatureVector))
		FeatureValues = set(FeatureVector)
		SplitedDataDic = {}
		for FeatureValue in FeatureValues:
			SplitedDataDic[FeatureValue] = Data[FeatureVector == FeatureValue, :]
		return SplitedDataDic

	def CreateNode(self, Data, FeatureNames, method, epsilon, FatherNode):
		"""
		依据数据集创建结点
		:param Data: 数据集,前n-1列是特征数据集,最后一列是标签数据集
		:param FeatureNames: 特征集名称
		:param method: 构建结点方法,ID3,C4.5
		:param epsilon: 信息熵阈值
		:param FatherNode: 本次创建结点的父结点,有父结点这一属性,方便剪枝时向上走
		:return: 创建的结点
		"""

		if len(set(Data[:, -1])) == 1:  # 标签唯一
			return Node(Data[0, -1], None, None, Data, FatherNode)
		if FeatureNames is None:  # 待选特征集是空集
			return Node(Counter(Data[:, -1][0]).most_common(1)[0][0], None, None, Data, FatherNode)
		# 选择最优特征
		BestFeatureIndex = -1
		BestGain = -1
		TmptGain = -1
		for FeatureIndex in range(Data.shape[1] - 1):  # 特征的列数是数据集的列数减去标签的列数
			HeatFunction = self.GetHeatFunction(Data)  # 计算信息熵
			ConditionalHeatFunction = self.GetConditionalHeatFunction(FeatureIndex, Data)
			Gain = HeatFunction - ConditionalHeatFunction
			if method == "ID3":  # 比较信息增益
				TmptGain = Gain
			elif method == "C4.5":  # 比较信息增益比
				FeatureHeatFunction = self.GetFeatureHeatFunction(FeatureIndex, Data)
				TmptGain = Gain / FeatureHeatFunction
			if TmptGain > BestGain:
				BestGain = TmptGain
				BestFeatureIndex = FeatureIndex
		if BestGain < epsilon:
			return Node(Counter(Data[:, -1]).most_common(1)[0][0], None, None, Data, FatherNode)
		BestFeatureName = FeatureNames[BestFeatureIndex]
		# print("BestFeatureName={}".format(BestFeatureName))
		FeatureNames = np.delete(FeatureNames, BestFeatureIndex)
		SplitedDataDic = self.SplitData(Data, BestFeatureIndex)
		# print(SplitedDataDic)
		ChildrenNodeDic = {}
		ThisNode = Node(Counter(Data[:, -1]).most_common(1)[0][0], BestFeatureName, ChildrenNodeDic, Data, FatherNode)
		for FeatureValue in SplitedDataDic.keys():
			#这些子结点的父结点就是这次构建的结点
			node = self.CreateNode(SplitedDataDic[FeatureValue], FeatureNames, method, epsilon, ThisNode)
			ChildrenNodeDic[FeatureValue] = node
		return ThisNode

	def predict(self, x):
		"""
		根据特征,预测label
		:param x: 特征
		:return: label
		"""
		# 根据特征一直走到叶结点,输出叶结点label
		node = self.TreeRoot
		while node.ChildrenNodeDic is not None:
			# 根据FeatureName得到原始样本的FeatureIndex
			FeatureIndex = self.FeatureIndexDic[node.FeatureName]
			if x[FeatureIndex] in node.ChildrenNodeDic.keys():
				node = node.ChildrenNodeDic[x[FeatureIndex]]
			else:
				return node.label  	# 出现没有在训练集中出现的特征取值,直接返回这个结点的预测
		return node.label

	def score(self, X, y):
		X = np.asarray(X)
		y = np.asarray(y)
		cnt = 0
		for index, x in enumerate(X):
			if self.predict(x) == y[index]:
				cnt += 1
		return cnt / (X.shape[0])

	def GetLeaveNodes(self, tree, LeaveNodeList):
		"""
		将空列表作为参数传入,结束之后传入的列表内有tree的叶子结点
		:param tree:待查树
		:param LeaveNodeList:存储叶子结点的空列表
		:return:无,直接修改参数LeaveNodeList
		"""
		if tree:
			if tree.ChildrenNodeDic is None:
				LeaveNodeList.append(tree)
			# print(tree)
			else:
				for ChildrenNode in tree.ChildrenNodeDic.values():
					self.GetLeaveNodes(ChildrenNode, LeaveNodeList)

	def GetLoss(self, node, alpha):
		"""
		得到node为根的子树的损失函数值,与书中的公式对应
		:param node: 子树根
		:param alpha: 惩罚参数
		:return: 损失函数值
		"""
		LeaveNodeList = []
		self.GetLeaveNodes(node, LeaveNodeList)
		NumOfLeaveNode = len(LeaveNodeList)
		Loss = 0
		for ThisNode in LeaveNodeList:
			H_t = self.GetHeatFunction(ThisNode.Data)
			N_t = ThisNode.Data.shape[0]
			Loss += N_t * H_t
		Loss += alpha * NumOfLeaveNode
		return Loss

	def GetPurningTree(self, tree, Data):
		"""
		找到tree中存储Data的那个结点,将其子结点删除
		:param tree: 待查找的tree
		:param Data: 用于标明结点身份的信息,数据集
		:return: 删除数据集是Data的那个结点后的树
		"""
		# 在剪枝时可能因为遍历找父结点时已经进行了剪枝,而发生找不到的情况,
		# 暂时想不到好的办法使得剪枝时的叶结点从高层向低层遍历,因此剪枝时可能会有直接从上面开始判断剪不剪的情况
		if tree is None:
			# print("找不到要删除子结点的父结点")
			pass
		elif tree.Data.shape == Data.shape and (tree.Data == Data).all():
			# print("找到了要删除子结点的父结点")
			# print("删除前tree={}".format(tree))
			tree.DeleteChildren()
			# print("删除后tree={}".format(tree))
			return tree

		elif tree.ChildrenNodeDic is not None:
			# 还不是叶结点并且此结点也不是要删除的结点,继续往下查找
			ChildrenNodeDic = tree.ChildrenNodeDic
			for ChildrenNodeKey in ChildrenNodeDic.keys():
				# 如果值不相等,说明不是要找的结点,对树的子结点进行查找删除,并将删除后的子树挂到原来树上
				tree.ChildrenNodeDic[ChildrenNodeKey] = self.GetPurningTree(ChildrenNodeDic[ChildrenNodeKey], Data)
		return tree

	def DecidePurning(self, tree, alpha, Loss):
		"""
		从叶子结点出发,向上回缩,判断回缩前和回缩后的损失函数,来判断是否剪枝
		:param tree: 待决定剪枝的树,也是当前能够获得的最优的树
		:param alpha: 惩罚参数
		:param Loss: 上一次剪枝完成后的损失,由于是从下往上回缩,如果
		上一次剪枝完成后的损失和这次剪枝完成后的损失一样,即此次的叶子结点
		都没有被剪枝,即此次的tree已经是最优的,再剪叶子结点就会增大损失,此时停止剪枝
		:return: 剪枝后的树
		"""
		LeaveNodeList = []
		self.GetLeaveNodes(tree, LeaveNodeList)
		if len(LeaveNodeList) == 1:
			# 只有一个结点没有叶子结点可以减了
			return tree
		# print(len(LeaveNodeList))
		# 找到叶子结点对应的不同父结点,剪枝是发生在叶子结点的父结点上的
		FatherNodeSet = set()
		for ThisNode in LeaveNodeList:
			FatherNodeSet.add(ThisNode.FatherNode)

		# print(len(FatherNodeSet))
		# 对tree的每组叶结点尝试剪枝(回缩回父结点),比较损伤函数,判断是否进行更新
		ThisTimeBestLoss = -1  # 保存这次剪枝所能达到的最小Loss
		for FatherNode in FatherNodeSet:
			SameTree = copy.deepcopy(tree)
			# 每个结点存储的数据是唯一的,根据数据来判断是否是要进行处理的那个结点
			Data = FatherNode.Data
			PurningTree = self.GetPurningTree(SameTree, Data)
			# 比较损失函数
			# print("找到了父结点={}".format(FatherNode))
			# print("PurningTree={}".format(PurningTree))
			PurningLoss = self.GetLoss(PurningTree, alpha)
			BeforeLoss = self.GetLoss(tree, alpha)
			print("考察结点{}\n剪枝后损失:PurningLoss={},剪枝前损失:BeforeLoss={}".format(FatherNode,PurningLoss,BeforeLoss))
			if (PurningLoss <= BeforeLoss):
				# 剪枝后Loss减少,更新树,并保存当前得到的最小Loss
				print("发生了剪枝")
				tree = PurningTree
				print("此次剪枝后tree={}".format(PurningTree))
				ThisTimeBestLoss = PurningLoss
		if ThisTimeBestLoss == Loss:
			# 这次最好的Loss和上次一样,说明这次修剪没有任何改动,已经达到最优
			return tree
		else:
			# 对剪枝后的树再进行剪枝,
			return self.DecidePurning(tree, alpha, ThisTimeBestLoss)


lhData, lhLabel, lhName = createDataLH()
xgData, xgLabel, xgName = createDataXG20()


alpha=2 			#惩罚参数
Purninglhtree = ClassificationDecisionTree(lhData, lhLabel, lhName,
										   "ID3", epsilon=0.4, alpha=alpha, Purning=True)  # 惩罚参数设置较高时会发生剪枝,较低时与不剪枝一样
NotPurninglhtree = ClassificationDecisionTree(lhData, lhLabel, lhName, "ID3",
											  epsilon=0.4, alpha=None, Purning=False)
print("不剪枝剪枝lhtree={}".format(NotPurninglhtree))
print("剪枝lhtree={}".format(Purninglhtree))

# 西瓜决策树需要设置阈值较高,否则只有根
Purningxgtree = ClassificationDecisionTree(xgData, xgLabel, xgName,
										   "ID3", epsilon=0, alpha=alpha, Purning=True)  # 惩罚参数设置较高,保证剪枝,从而看出与不剪枝的对比
NotPurningxgtree = ClassificationDecisionTree(xgData, xgLabel, xgName, "ID3",
											  epsilon=0, alpha=None, Purning=False)  #
print("不剪枝剪枝xgtree={}".format(NotPurningxgtree))
print("剪枝xgtree={}".format(Purningxgtree))

量化交易简介终回首 Other Language 人工智能量化交易 python
这里写目录标题1是什么2为什么3开源量化交易项目中国德国美国4商业版交易平台5量化界大佬3.1先驱者3.2其他知名人物1是什么借助数学方法，利用计算机技术进行交易的证券投资技术。一般流程想到一种策略。例如股价大于5日均价则卖出，股价小于5日均价则买入。把策略细化成可操作的步骤用代码实现策略的细化操作步骤检验策略效果用历史数据回测。在历史数据上模拟执行该策略，看经过给定的一段时间之后的收益情况如何。
算法训练（leetcode）第四十六天 | 110. 字符串接龙、105. 有向图的完全可达性、106. 岛屿的周长 Star Patrick 刷题日记算法 leetcode 职场和发展
刷题记录*110.字符串接龙105.有向图的完全可达性邻接矩阵邻接表106.岛屿的周长深搜简化代码*110.字符串接龙题目地址使用广搜。本题相当于求最短路径，因此使用广搜。如何应用广搜是一个难点，因为题目给的是字符串而非图的表示（邻接矩阵、邻接表），因此需要自行构建连接关系。题目要求每一步只能修改一个字符，因此从起始字符串开始，对字符串中的每一个字符进行修改，修改后在输入的字符串列表中查找是否存在
Java架构师成长之路 hweiyu00 分享 spring 微服务 spring cloud java
概述本教程主要从6个方面，全面讲解Java技术栈的知识。1.性能调优深入理解MySQL底层原理、索引逻辑，数据结构与算法。使用Explain进行优化分析MVCC原理剖析日志机制解析2.框架源码掌握Spring底层原理带你手写一个Spring解析IOC、AOP源码、以及事务原理3.并发编程剖析Java底层锁机制CAS、JUC工具使用、AQS源码分析以及并发的集合类的讲解4.分布式开发剖析分布式中使用
笔记：代码随想录算法训练营day60：并查集理论基础、寻找存在的路径 jingjingjing1111 笔记
本文为学习并查集理论基础|代码随想录、代码随想录过程中的思考find是找的顶头上司，而不是当前上司，最后怎么也得找到一个顶头上司的上司是自己，要不然这个结构也不成立使用issame替换会使被操作者为当前节点，而非根节点。join(u,v)的功能为将v的根节点挂到u的根节点下模拟过程可以看出，join中的find中的路径压缩要在长度大于2（路径大于1）的时候才会体现出来107.寻找存在的路径卡码网题
【Matlab光伏功率预测】基于RF随机森林算法的多变量光伏功率预测（附MATLAB代码）天天科研工作室光伏功率预测算法 matlab 随机森林机器学习
【Matlab光伏功率预测】基于RF随机森林算法的多变量光伏功率预测（附MATLAB代码）文章目录【Matlab光伏功率预测】基于RF随机森林算法的多变量光伏功率预测（附MATLAB代码）文章介绍基本步骤代码分享运行结果参考资料文章介绍随机森林可以应用于光伏功率预测，这是一项重要的任务，旨在估计光伏发电系统的输出功率。光伏功率预测在可再生能源管理、电网调度和能源计划等领域具有广泛的应用。随机森林回
Uni-App 双栏联动滚动组件开发详解 (电梯导航) FFF-X uni-app
本文基于提供的代码实现一个左右联动的滚动组件，以下是详细的代码解析与实现原理说明：{{item}}{{section.title}}{{para}}exportdefault{//组件参数定义props:{leftData:{//左侧导航数据type:Array,default:()=>['章节1','章节2','章节3','章节4','章节5','章节6'],},rightData:{//右侧内
Golang算法（二）数据结构小烧卖算法 GO语言
数据结构栈队列双向链表二叉搜索树红黑树栈typeStackstruct{head*Node}typeNodestruct{datainterface{}next*Node}funcNewStack()*Stack{s:=&Stack{head:&Node{data:nil,next:&Node{},},}returns}func(s*Stack)Push(datainterface{}){n:=&
Python自动登陆、登出南京理工大学NJUST校园网程序 JimesMz python 开发语言
本文程序针对南京理工大学NJUST和NJUST-FREE校园网开发，其他学校无法使用。文章目录开发目的使用说明参考资料开发目的今天突然想要用代码实现一下自动登陆校园网，上网搜寻了一下。知乎有一些教程，CSDN也有一些完整的代码，但是我跟随教程或者直接运行现有代码都没有能够成功登陆，且NJUST校园网付费，我想要一个“登出”功能，借助Kimi自己写了一下。本人技术不精，以实现功能为主。使用说明请确保
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
某人想将手中的一张面值100元的人民币换成10元、5元、2元和1元面值的票子。要求换正好40张，且每种票子至少一张。问：有几种换法？（C语言）热心市民小汪代码练习 C语言 c语言学习 java
一、首先分析题目有两点1、总和是100元。2、一共分为四十张且每种至少有一张。二、思路分析。10元的为s张，5元的为w张，2元的为e张，1元的为y张。n为有几种换算法首先，每个至少有一张a>=1,b>=1,c>=1,d>=1。#includeintmain(){inttotal;for(ints=1;s<=10;s++){for(intw=1;w<=20;w++){for(inte=1;e<=40
【论文阅读】Persistent Homology Captures the Generalization of Neural Networks Without A Validation Set 开心星人论文阅读论文阅读
将神经网络表征为加权的无环图，直接根据模型的权重矩阵构造PD。计算相邻batch的权重矩阵PD之间的距离。比较同调收敛性与神经网络的验证精度变化趋势摘要机器学习从业者通常通过监控模型的某些指标来估计其泛化误差，并在训练数值收敛之前停止训练，以防止过拟合。通常，这种误差度量或任务相关的指标是通过一个验证集（holdoutset）来计算的。因为这些数据没有直接用于更新模型参数，通常假设模型在验证集上的
【笔记】扩散模型（五）：Classifier-Free Guidance 理论推导与代码实现 LittleNyima Diffusion Models 笔记机器学习深度学习
论文链接：Classifier-FreeDiffusionGuidance上一篇文章我们学习了ClassifierGuidance，这种方法通过引入一个额外的分类器，使用梯度引导的方式成功地实现了条件生成。虽然ClassifierGuidance可以直接复用训练好的diffusionmodels，不过这种方法的问题是很明显的，首先需要额外训练一个分类器，而且这个分类器不仅仅分类一般的图像，还需要分
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
【论文阅读】Availability Attacks Create Shortcuts 开心星人论文阅读论文阅读
还得重复读这一篇论文，有些地方理解不够透彻可用性攻击通过在训练数据中添加难以察觉的扰动，使数据无法被机器学习算法利用，从而防止数据被未经授权地使用。例如，一家私人公司未经用户同意就收集了超过30亿张人脸图像，用于构建商业人脸识别模型。为解决这些担忧，许多数据投毒攻击被提出，以防止数据被未经授权的深度模型学习。它们通过在训练数据中添加难以察觉的扰动，使模型无法从数据中学习太多信息，从而导致模型在未见
最新智能优化算法：贪婪个体优化算法（Greedy Man Optimization Algorithm，GMOA）求解23个经典函数测试集，MATLAB代码 IT猿手 MATLAB 智能优化算法算法 matlab 开发语言人工智能智能优化算法
一、贪婪个体优化算法贪婪个体优化算法（GreedyManOptimizationAlgorithm，GMOA）是HamedNozari与HosseinAbdi于2024年提出的一种新型受生物启发的元启发式算法，它模拟了抵抗变化的竞争个体的行为。GMOA引入了两个独特的机制：MMO抵抗机制，防止过早替换解；周期性寄生虫清除机制，促进多样性并避免停滞。该算法旨在解决传统优化算法中的过早收敛和缺乏多样性
2025最新智能优化算法：改进型雪雁算法（Improved Snow Geese Algorithm, ISGA）求解23个经典函数测试集荣华富贵8 程序员的知识储备1 程序员的知识储备2 程序员的知识储备3 经验分享
摘要随着智能优化算法的不断发展，解决高维、复杂的优化问题已成为研究的重要课题。雪雁算法（SnowGeeseAlgorithm,SGA）作为一种新兴的自然启发式优化算法，以其高效的全局搜索能力受到了广泛关注。然而，雪雁算法在处理多峰、多约束和高维复杂问题时，仍面临收敛速度较慢和易陷入局部最优解的问题。为此，本文提出了一种改进型雪雁算法（ISGA），通过引入自适应权重调整机制和混合局部搜索策略，增强了
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
代码随想录算法训练营Day10 | Leetcode 150逆波兰表达式求值、239滑动窗口最大值、 347前 K 个高频元素 Dominic_Holmes leetcode python 算法数据结构
代码随想录算法训练营Day10|Leetcode150逆波兰表达式求值、239滑动窗口最大值、347前K个高频元素一、反转字符串相关题目：Leetcode150文档讲解：Leetcode150视频讲解：Leetcode1501.Leetcode150.逆波兰表达式求值给你一个字符串数组tokens，表示一个根据逆波兰表示法表示的算术表达式。请你计算该表达式。返回一个表示表达式值的整数。注意：有效的
LeetCode算法题(Go语言实现)_07 LuckyLay Golang学习笔记算法 leetcode 职场和发展 golang
题目给你一个整数数组nums，返回数组answer，其中answer[i]等于nums中除nums[i]之外其余各元素的乘积。题目数据保证数组nums之中任意元素的全部前缀元素和后缀的乘积都在32位整数范围内。请不要使用除法，且在O(n)时间复杂度内完成此题。一、代码实现funcproductExceptSelf(nums[]int)[]int{n:=len(nums)answer:=make([
机器学习：让计算机学会思考的艺术平凡而伟大. 机器学习机器学习人工智能
目录什么是机器学习？机器学习的基本步骤常见的机器学习算法机器学习的实际应用如何入门机器学习？结语在当今数字化时代，机器学习（MachineLearning,ML）已经成为一个炙手可热的话题。从推荐系统到自动驾驶汽车，再到语音助手，机器学习的应用无处不在。然而，对于许多人来说，机器学习仍然是一个神秘而复杂的领域。本文将用通俗易懂的语言，带你走进机器学习的世界，了解它的基本原理和应用。什么是机器学习？
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
使用 NetworkX 进行图论分析与可视化 aiweker 跟我学python 图论 python
使用NetworkX进行图论分析与可视化NetworkX是一个用于创建、操作和研究复杂网络的Python库。它提供了丰富的图论算法和数据结构，适用于各种网络分析任务。本文将分点介绍NetworkX的主要功能，并通过代码示例进行详细说明。1.安装NetworkX在开始使用NetworkX之前，首先需要安装它。可以通过pip进行安装：pipinstallnetworkx2.创建图NetworkX支持多
流浪地球 - 华为OD机试真题(E卷、Java) 什码情况华为od java 数据结构算法面试机试
针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。有兴趣的同学可以扫码添加我们的微信（code5bug）了解，免费试课一下。题目描述流浪地球计划在赤道上均匀部署了N个转向发动机，按位置顺序编号为0~N。1).初始状态下所有的发动机都是未启动状态;2).发动机启动的方式分为”手动启动”和”关联启动”两种方式;3).如果在时刻1一个发动机被启动，下一个时刻
MATLAB的function函数的使用晚风微凉～ matlab 开发语言
在工程应用中，我们经常会遇到算法的计算较为复杂，很多算法的过程重复次数过多的问题，针对这个问题我们可以考虑使用function函数简化代码编写的工作量。1、单个传参在使用function的函数时，我们首先需要定义function函数的结构；function[输出参数]=函数名（输入参数）%注释：function函数的使用一般是比较多的，因此需要注意注释的编写，避免后期工作的误导；主要代码：****
TCP三次握手与四次挥手（全网最易懂保姆级教程）秋‍. JAVA 网络服务器运维 java tcp/ip 三次握手
一、前置知识准备1.TCP协议特性-面向连接：通信前需要建立专用通道-可靠传输：通过确认机制保证数据可达-全双工通信：双方可同时发送数据-流量控制：滑动窗口机制-拥塞控制：慢启动算法2.关键概念说明|术语|说明||------------|----------------------------------------------------------------------||**SYN**|
三维点云重建的原理及代码晚风微凉～ matlab 图像处理
点云重建是将来自各种传感器（如激光雷达、相机等）采集的离散点云数据转换为具有结构和几何形状的物体模型的过程。在这个过程中，算法的核心任务是从大量的离散点中提取出具有几何意义的特征，并将这些特征组合成相应的物体模型。在实际应用中，无法获得物体所有表面的三维坐标数据，因此点云重建算法必须处理部分点云数据，尽可能准确地还原物体的几何结构。点云重建的目标是通过对描述物体表面形状的点数据进行处理，根据它们的
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
实时光线追踪技术：Ray Tracing_2024-07-21_02-55-16.Tex chenjj4003 游戏开发 python 算法人工智能矩阵线性代数骨骼绑定开发语言
实时光线追踪技术：RayTracing实时光线追踪技术教程基础知识光线追踪原理光线追踪是一种渲染技术，它通过模拟光线在场景中的传播和反射来生成图像。在实时光线追踪中，这一过程被优化以在有限的时间内完成，通常用于游戏和实时动画。其核心原理是逆向追踪，即从观察者（摄像机）发出光线，而不是从光源发出，这样可以减少计算量。示例：光线追踪的基本算法#Python示例代码，展示如何计算光线与场景中物体的交点c
图像质量评价学习笔记02：IQA模型性能评价指标（PLCC、SROCC、KROCC、RMSE）可靠的豆包蟹同志图像质量评估IQA 图像处理计算机视觉人工智能算法
性能好的图像质量评价（IQA）算法，其质量评测分数会与主观质量分数高度一致，IQA有许多评价指标，为了衡量方法测试结果与主观评价之间的一致性，视频质量专家组VQEG（VideoQualityExpertsGroup，目前国际上对视频质量进行标准化及性能测试的权威组织）提出了四个可以验证客观评价结果和主观评价结果之间的紧密程度的四个指标：PLCC、SROCC、KROCC和RMSE，也是目前最常用的I
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep

决策树模型实现：ID3，C4.5生成，剪枝，预测

你可能感兴趣的:(统计学习方法代码实现,决策树,剪枝,机器学习,算法)