ChristinaF

分类算法之决策树

一、算法

Key points:

决策树是一个分类算法，分类结果是离散值（对应输出结果是连续值的回归算法）；
有监督的分类算法;
是一种贪婪算法，生成的每一步都是局部最优值
容易over fitting
noise影响不大
空间划分，通过递归的方法把特征空间划分成不重叠的矩形

例子（from Machine Learning in Action）:

判断是否是Fish,有两个特征Can survive without coming to surface?和 Has flippers?

最后实现的决策树为：

生成决策树时要考虑的问题：

How should the training records be split?

每次split的时候，都要挑选一个最佳的特征。

The method developed for selecting the best split are often based on the degree of impurity of the child node.

例如：集合{'yes':10,'no':0}的不纯洁度最低，集合{'yes':5,'no':5}不纯洁度最高，显然要挑不纯度低的特征；描述不纯度的方法有以下几种：

信息熵

Gini

Gini impurity is the expected error rate if one of the results from a set is randomly applied to one of the items in the set.(集体智慧编程) ???

计算出每个子集的不纯度后，再计算split以后总不纯度。与split前的不纯度相比较

信息增益（information gain）就是指信息熵的有效减少量

选择差值最大的

例如：原集合为[yes,yes,no,no,no]

选择“surface”, split后的集合为：[yes,yes,no]和[no,no]

选择"Flippers", split后的集合为:[yes,yes,no,no]和[no]

最后选择差值最大的，即”surface“

How should the splitting procedure stop?

当所有的records属于同一类，即分类完毕；或者features用完了

或者information gain=0??

当达到以上两种情况时，往往会发生过拟合，见以下

如何处理过拟合的问题：

Pre-pruning：

- 设定一个阈值，该阈值可以是决策树高度，节点实例个数，信息增益值等，该节点成为叶节点

- 该叶节点持有其数据集中样本最多的类或者其概率分布

Post-pruning：

- 首先构造完整的决策树，允许决策树过度拟合训练数据

- 对置信度不够的节点的子树用叶节点或树枝来替代

- 该叶节点持有其子树的数据集中样本最多的类或者其概率分布

什么时候需要剪枝：

数据噪音，因此有的分类不准
训练数据量少，或者不具有代表性
过拟合

ID3, C4.5, C5.0, CART

ID3 1986年 Quilan

选择具有最高信息增益的属性作为测试属性

ID3(DataSet, featureList): 
  - 创建根节点R 
  - 如果当前DataSet中的数据都属于同一类，则标记R的类别为该类 
  - 如果当前featureList集合为空，则标记R的类别为当前DataSet中样本最多的类别 
  - 递归情况： 
    # 从featureList中选择属性（选择Gain(DataSet,F)最大的属性） 
    # 根据F的每一个值v,将DataSet划分为不同的子集DS，对每一个Ds:
      - 创建节点C 
      - 如果DS为空，节点C标记为DataSet中样本最多的类别 
      - 如果DS不为空，节点C=ID3（DS,featureList-F） 
      - 将节点C添加为R的子节点

C4.5 1993年 by Quilab(对ID3的改进)

信息增益率（information gain ratio）
连续值属性

离散化处理：将连续型的属性变量进行离散化处理，形成决策树的训练集

- 把需要处理的样本按照连续变量的大小从小到大进行排序

- 假设该属性对应的不同的属性值一共有N个，那么总共有N-1个可能的候选分割阈值点，每个候选的分割阈值点的值为上述排序后的属性值中两两前后元素的中点

- 用信息增益率选择最佳划分

缺失值

- 处理缺少属性值的一种策略是赋给它节点t所对应的训练实例中该属性的最常见值

- 复杂一点的办法是为每个可能值赋一个概率

- 最简单的办法是丢弃这些样本

后剪枝（基于错误剪枝EBP-Error Based Pruning）

C5.0 1998年

加入了Boosting算法框架

CART (Classification and Regression Trees)

二元划分

- 二叉树不易产生数据碎片，精确度往往会高于多叉树，所以在CART算法中采用二元划分

不纯性度量

- 分类目标：Gini指标、Towing、order Towing

- 连续目标：最小平方残差、最小绝对残差

剪枝

- 用独立的验证数据集对训练集生长的树进行剪枝

分类树：

CART_classification(DataSet, featureList, alpha,)：
创建根节点R
如果当前DataSet中的数据的类别相同，则标记R的类别标记为该类
如果决策树高度大于alpha，则不再分解，标记R的类别classify(DataSet)
递归情况：
标记R的类别classify(DataSet)
从featureList中选择属性F（选择Gini(DataSet, F)最小的属性划分，连续属性参考C4.5的离散化过程(以Gini最小作为划分标准)）
根据F，将DataSet做二元划分DS_L 和 DS_R：
如果DS_L或DS_R为空，则不再分解
如果DS_L和DS_R都不为空，节点
    C_L= CART_classification(DS_L, featureList, alpha); 
    C_R= CART_classification(DS_R featureList, alpha)
将节点C_L和C_R添加为R的左右子节点

回归树

CART_regression(DataSet, featureList, alpha, delta)：
创建根节点R
如果当前DataSet中的数据的值都相同，则标记R的值为该值
如果最大的phi值小于设定阈值delta，则标记R的值为DataSet应变量均值
如果其中一个要产生的节点的样本数量小于alpha，则不再分解，标记R的值为DataSet应变量均值
递归情况：
从featureList中选择属性F（选择phi(DataSet, F)最大的属性，连续属性（或使用多个属性的线性组合）参考C4.5的离散化过程 (以phi最大作为划分标准)）
根据F，将DataSet做二元划分DS_L 和 DS_R：
如果DS_L或DS_R为空，则标记节点R的值为DataSet应变量均值
如果DS_L和DS_R都不为空，节点
    C_L= CART_regression(DS_L, featureList, alpha, delta); 
    C_R= CART_regression(DS_R featureList, alpha, delta)
将节点C_L和C_R添加为R的左右子节点

分类树与回归树的差别在于空间划分方法一个是线性一个是非线性

二、python实现

如何在python中存储一棵决策树. 如果每个特征只有两种选择，就是一棵二叉树。但往往不局限于二叉树。

采用字典数据结构，如上例中的决策树最后可以表示成这样：

{'no surfacing': {0: 'no', 1: {'flippers': {0: 'no', 1: 'yes'}}}}

新建一个结点：{'label':{}}, split以后{'label':{cond1:{},cond2:{},cond3:{}}},如果满足if语句,{}就是一个label,如果不满足，就建结点

一个节点作为一个类

class decisionNode(object):
	def __init__(self,test_cond=-1,value=None,labels=None,trueBranch=None,falseBranch=None):
		self.test_cond = test_cond #该节点上判断条件
		self.value=value #非叶子节点才有
		self.labels=labels #叶子节点才有
		self.trueBranch=trueBranch #左节点
		self.falseBranch=falseBranch #右节点

输入训练样本：

# This Python file uses the following encoding: utf-8
from math import log
def createDataSet():
    dataSet = [[1, 1, 'yes'],
               [1, 1, 'yes'],
               [1, 0, 'no'],
               [0, 1, 'no'],
               [0, 1, 'no']]
    features = ['no surfacing','flippers']
    #change to discrete values
    return dataSet, features

用递归的方法建造决策树，代码如下：

用字典表示：

def treeGrowth(dataSet,features):
	classList=[example[-1] for example in dataSet]
	if classList.count(classList[0])==len(classList):  #所有E中只有一种class
		return classList[0]
	if len(dataSet[0])==1: #没有多余的features
		return classify(classList)

	bestFeat=findBestSplit(dataSet)
	bestFeatLabel=features[bestFeat]
	mytree={bestFeatLabel:{}}
	featValues=[example[bestFeat] for example in dataSet]
	uniqueFeatValues=set(featValues)
	del(features[bestFeat])
	for values in uniqueFeatValues:
		subDataSet=splitDataSet(dataSet,bestFeat,values)
		mytree[bestFeatLabel][values] =treeGrowth(subDataSet,features)		
	return mytree

用节点类表示：

def treeGrowth(dataSet,features):
	classList=[example[-1] for example in dataSet]   #stop condition
	
	if classList.count(classList[0])==len(classList) :
		return decisionNode(labels=classList[0])

	if features==[] :
		return decisionNode(labels=classify(classList))

	root=decisionNode()
	bestFeature = findBestSplit(dataSet)
	
	bestFeatureLabel=features[bestFeature]
	#print bestFeatureLabel
	root.test_cond=bestFeatureLabel

	featureValues=[example[bestFeature] for example in dataSet]
	uniqueFeatureValues =set(featureValues)
	del(features[bestFeature])
	
	for value in uniqueFeatureValues:
		subDataSet=splitDataSet(dataSet,bestFeature,value)
		if value==1:
			trueChild=treeGrowth(subDataSet,features)
			root.trueBranch=trueChild
			root.value=value
		falseChild=treeGrowth(subDataSet,features)
		root.falseBranch=falseChild
	return root

找出子集合中的大多数：

def classify(classList):
	classCount={}
	for vote in classList:
		if vote not in classCount.keys():
			classCount[vote]=0
		classCount[vote]+=1
	sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
	return sortedClassCount[0][0]

找出最佳特征：

def findBestSplit(dataSet):
	numFeatures=len(dataSet[0])-1
	baseEntropy = calcShannonEnt(dataSet)
	bestInfoGain = 0.0
	bestFeat=-1
	for i in range(numFeatures):
		featValues=[example[i] for example in dataSet]
		uniqueFeatValues=set(featValues)
		newEntropy=0.0
		for val in uniqueFeatValues:
			subDataSet=splitDataSet(dataSet,i,val)
			prob=len(subDataSet)/float(len(dataSet))
			newEntropy+=prob*calcShannonEnt(subDataSet)
		if (baseEntropy- newEntropy)>bestInfoGain:
			bestInfoGain=baseEntropy- newEntropy
			bestFeat=i

	return bestFeat

def splitDataSet(dataSet,feat,values):
	retDataSet = []
	for featVec in dataSet:
		if featVec[feat]==values:
			reducedFeatVec=featVec[:feat]
			reducedFeatVec.extend(featVec[feat+1:])
			retDataSet.append(reducedFeatVec)
	return retDataSet

def calcShannonEnt(dataSet):
	numEntries = len(dataSet)
	labelCounts = {}
	for featVec in dataSet:
		currentLabel = featVec[-1]
		if currentLabel not in labelCounts.keys(): 
			labelCounts[currentLabel]=0
		labelCounts[currentLabel]+=1	
	shannonEnt=0.0

	for key in labelCounts:
		prob=float(labelCounts[key])/numEntries
		if prob!=0:
			shannonEnt-=prob*log(prob,2)
	return shannonEnt

三、R实现

creatDataSet<-function(){
  dataSet<-data.frame(c(1,1,1,0,0),c(1,1,0,1,1),c("yes","yes","no","no","no"))
  names(dataSet)<-c("no surfacing","flippers","results")
  return (dataSet)
}

setClass("decisionNode",
         representation(
           test_cond = "ANY",
           value = "ANY",
           labels = "ANY",
           trueBranch = "ANY",
           falseBranch = "ANY"
         ),
         prototype(
           test_cond = NA,
           value = NA,
           labels = NA,
           trueBranch = NA,
           falseBranch = NA 
         )
)

findBestSplit<-function(dataSet){
  classList<-dataSet$result
  numFeatures<-length(dataSet)-1
  baseEntropy<-calcShannonEnt(dataSet)
  bestInfoGain<-0
  for(i in range(1:numFeatures)){
    newEntropy<-0
    for(j in range(unique(dataSet[,i]))){
      subDataSet<-splitDataSet(dataSet,i,j)
      prob<-length(subDataSet[,1])/length(dataSet[,1])
      newEntropy<-newEntropy+prob*calcShannonEnt(subDataSet)
    }
    if((baseEntropy-newEntropy)>bestInfoGain){
      bestInfoGain<-baseEntropy-newEntropy
      bestFeature<-i
    }
  }
  return (bestFeature)
}

calcShannonEnt <- function(dataSet){
  end<-length(dataSet)
  sum<-length(dataSet[,1])
  labelCounts<-as.data.frame(table(dataSet[,end]))
  shannonEnt<-0
  for(i in range(1:length(labelCounts[,1]))){
    prob<- labelCounts[i,-1]/sum
    if(prob!=0){
      shannonEnt<-shannonEnt-prob*log(prob,2)
    }
    
  }
  return (shannonEnt)
}

splitDataSet<- function(dataSet,feature,value){
  subDataSet<-dataSet[which(dataSet[,feature]==value),]
  subDataSet[,feature]<-NULL
  return (subDataSet)
}

treeGrowth<-function(dataSet){
  classList<-dataSet$result
  if(length(which(classList==classList[1]))==length(classList)) return (new("decisionNode",labels=classList[1]))
  if(length(dataSet)==1) return (new("decisonNode",labels=classify(classList)))
  root<-new("decisionNode")
  
  bestFeature<-findBestSplit(dataSet)
  bestFeatureLabel<-names(dataSet)[bestFeature]
  root@test_cond<-bestFeatureLabel
  uniqueValues<-unique(dataSet[bestFeature])
  for(i in range(uniqueValues)){
    root@value<-i
    subDataSet<-splitDataSet(dataSet,bestFeature,i)
    
    if (i==1){
      trueChild<-treeGrowth(subDataSet)
      root@trueBranch<-trueChild
    }else{
      falseChild<-treeGrowth(subDataSet)
      root@falseBranch<-falseChild
    }
  }
  
  return (root)
}

四、与R包函数对比
另：评价分类器的方法：

Spring注解驱动开发之BeanPostProcessor后置处理器桐花思雨 spring #应用 spring
目录1.前言2.`BeanPostProcessor`接口2.1.`BeanPostProcessor`的源码2.2.自定义`BeanPostProcessor`后置处理器2.2.1.实现`BeanPostProcessor`接口2.2.2.创建实体类2.2.3.创建配置类2.2.4.测试结果1.前言BeanPostProcessor后置处理器可用于bean初始化前后进行逻辑增强。Spring提供
php amp 字符串处理,php字符串处理之全角半角转换布博士 php amp 字符串处理
半角全角的处理是字符串处理的常见问题，本文尝试为大家提供一个思路。一、概念全角字符unicode编码从65281~65374(十六进制0xFF01~0xFF5E)半角字符unicode编码从33~126(十六进制0x21~0x7E)空格比较特殊,全角为12288(0x3000),半角为32(0x20)而且除空格外,全角/半角按unicode编码排序在顺序上是对应的所以可以直接通过用+-法来处理非空
大模型之提示词工程十指令——结合认知科学与高效学习法的AI协作指南 SEVEN-YEARS 学习人工智能
1.费曼学习法：用“教学”倒逼模型理解复杂概念原理：通过模拟教学场景，迫使模型深入理解知识本质。指令示例：“请用‘小学数学老师’的身份，向孩子解释区块链的基本原理。”输出：“区块链就像一个透明的记账本，每个人都可以看到上面的记录。比如你和同学一起买零食，大家轮流在本子上记录谁买了什么，这样没有人能偷偷修改记录。”应用场景：技术概念简化、跨领域知识迁移、科普内容生成。2.帕累托法则：聚焦关键20%的
kotlin之foreach跳出循环
1.创建函数跳出循环。funbreakTest(){ (0..10).forEachIndexed{index,i-> Log.d("teststartindex=$index,i=$i") if(index>=7){ return } Log.d("testendindex=$index,i=$i") } }2.通过run语句，
FOC学习笔记（3）结构性凸极与饱和性凸极的区别及其在无感FOC中的影响 desssq FOC记录笔记单片机嵌入式硬件 foc算法
电机凸极性(Saliency)是指由于转子磁路不对称性导致的直轴(d轴)和交轴(q轴)磁阻或电感存在差异的特性。这种不对称性表现为d轴(与转子永磁体磁场方向一致)磁阻通常较大(电感较小)，而与之正交的q轴磁阻通常较小(电感较大)。凸极性是无位置传感器控制(特别是高频注入法)实现转子位置估算的关键物理基础，尤其在零速和低速工况下至关重要。凸极性主要来源于两种机制：结构性凸极和饱和性凸极。结构性凸极是
Android面试准备之Android基础北诺南兮 android java 面试
一、Handler机制创建一个Handler//提示已过时Handlerhandler=newHandler();Handlerhandler=newHandler(Looper.myLooper());隐式指定Looper的Handler初始化方法已被Android11报过时，根据注释，是由于不指定Looper在一些场景下会导致任务丢失或程序崩溃，比如没有Looper的线程。publicstat
python爬虫登录校验之滑块验证、图形验证码（OCR） yuwinter Python python 爬虫 ocr 滑块验证
在爬虫过程中，验证码和滑块验证是常见的反爬措施。针对这些挑战，通常采用OCR识别图形验证码和模拟滑块拖动来处理滑块验证。以下是如何处理这两种类型验证的详细方法。1.图形验证码（OCR）a.使用tesserocr和Pillow处理图形验证码tesserocr是基于TesseractOCR引擎的Python封装，常用来识别简单的图形验证码。如果验证码不太复杂，可以用它来识别文本。步骤：安装依赖：pip
【Java从入门到放弃之通用容器类】 ThetaarSofVenice #Java从入门到放弃 java python 开发语言
通用容器类通用容器类Collection接口Collection接口源码Collection接口概述List接口List接口源码List接口概述Set接口Set接口源码Set接口概述Queue接口Queue源码Queue概述Map接口Map接口源码总结通用容器类Java提供了一组丰富的通用容器类（也称为集合框架，CollectionsFramework），用于存储和管理一组对象。这些容器类提供了灵
【Java从入门到放弃之 ConcurrentModificationException】 ThetaarSofVenice #Java从入门到放弃 java 开发语言
ConcurrentModificationExceptionConcurrentModificationException探索ConcurrentModificationException解决问题总结ConcurrentModificationExceptionConcurrentModificationException是Java中的一种运行时异常，通常发生在使用迭代器遍历集合（如ArrayL
[架构之美]Ubuntu 系统安装 Redis 的详细步骤（七）曼岛_ 架构之美 ubuntu redis linux
Ubuntu系统安装Redis的详细步骤一，安装成功截图1.1更新系统并安装依赖1.2修改配置文件1.3安装成功截图二，安装Redis2.1更新系统并安装依赖
Flutter多设备之响应式布局 harmonyos
Flutter多设备之响应式布局参考鸿蒙原生响应式布局场景，保持相似体验。布局能力使用场景使用说明断点将窗口宽度划分为不同的范围（即断点），监听窗口尺寸变化，当断点改变时同步调整页面布局。依赖扩展库：breakpoint媒体查询媒体查询支持监听窗口宽度、横竖屏、深浅色、设备类型等多种媒体特征，当媒体特征发生改变时同步调整页面布局。直接使用FlutterSDK中MediaQuery，无需额外适配栅格
Flutter多设备之典型布局场景 harmonyos
Flutter多设备之典型布局场景参考鸿蒙原生典型布局场景，保持相似体验。布局能力使用场景使用说明页签栏使用页签控制内容切换的容器，每个页签对应一个内容视图。基于动态断点，当位于sm,md时,使用flutter内置组件DefaultTabController、TabBar和TabBarView显示底部页签栏；当位于lg时，使用DefaultTabController和NavigationRail显
LGTM？Github中那些迷之缩写 SunTecTec github
PR:PullRequest.拉取请求，给其他项目提交代码LGTM:LooksGoodToMe.朕知道了代码已经过review，可以合并SGTM:SoundsGoodToMe.和上面那句意思差不多，也是已经通过了review的意思WIP:WorkInProgress.传说中提PR的最佳实践是，如果你有个改动很大的PR，可以在写了一部分的情况下先提交，但是在标题里写上WIP，以告诉项目维护者这个功能
AI框架之Spring AI与Spring Cloud Alibaba AI使用讲解 web13688565871 面试学习路线阿里巴巴人工智能 spring java
文章目录1AI框架1.1SpringAI简介1.2SpringAI使用1.2.1pom.xml1.2.2可实现的功能1.3SpringCloudAlibabaAI1.4SpringCloudAlibabaAI实践操作1.4.1pom.xml1.4.2配置文件1.4.3对接文本模型1.4.4文生图模型1.4.5语音合成模型1AI框架1.1SpringAI简介在软件开发的世界中，Java一直是企业级应
华为HarmonyOS NEXT 应用开发实现日常提醒应用「已注销」华为 harmonyos 鸿蒙鸿蒙系统
前言不久前华为已经宣布全新HarmonyOSNEXT鸿蒙星河版将在今年秋天正式和消费者见面，并已经面向开发者开放申请。鸿蒙星河版会有更智能、更极致的原生体验，也标志着鸿蒙迈向其发展的第二阶段。因此，对于鸿蒙生态建设而言，2024年可谓至关重要，而生态建设的前提，就是要有足够的开发人才。与之对应的，今年春招市场上与鸿蒙相关岗位和人才旺盛的热度，一方面反应了鸿蒙生态的逐渐壮大，另一方面也让人们对鸿蒙下
C++ | Leetcode C++题解之第30题串联所有单词的子串 Ddddddd_158 经验分享 c++Leetcode 题解
题目：题解：classSolution{public:vectorfindSubstring(string&s,vector&words){vectorres;intm=words.size(),n=words[0].size(),ls=s.size();for(inti=0;idiffer;for(intj=0;j
Python接口测试之接口关键字封装测试老哥 python 软件测试自动化测试职场和发展测试用例接口测试测试工具
点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快我们使用RF做UI自动化测试的时候，使用的是关键字驱动。同样，Python做接口自动化测试的时候，也可以使用关键字驱动。但是这里并不是叫关键字驱动，而是叫数据驱动。而接口测试的关键字是什么呢？我们数据驱动的载体是Excel，那么excel里存放的数据是接口测试用例数据，一个接口数据里有常量和变量。变量就是一些参数对应的值，而常量就是接口的
展开说说Android之Retrofit详解_使用篇老梁学Android&HarmonyOS 网络编程 android retrofit 网络
Retrofit是由Square公司开发的类型安全HTTP客户端框架，借助动态代理在运行时生成接口实现类，将注解转化为OkHttp请求配置；节省成本通过转换器(Gson/Moshi)自动序列化JSON/XML，内部处理网络请求在主线程返回报文。Retrofit直译是封装、翻版。他就是对okhttp做了进一步封装，方便使用，它底层的所有请求默认走的都是Okhttp。所以使用Retrofit必须依赖o
红黑树与2-3树：插入、删除操作的时间复杂度与实现机制比较一键难忘红黑树数据结构
本文收录于专栏：算法之翼红黑树与2-3树：插入、删除操作的时间复杂度与实现机制比较红黑树（Red-BlackTree）和2-3树（2-3Tree）是两种广泛用于平衡二叉查找树的自平衡树结构。它们在插入、删除和查找操作中的性能都表现良好，并且可以确保树的高度是对数级别，从而保证了高效的操作时间。本文将对红黑树和2-3树进行深入的比较，并结合代码实例说明它们的实现和应用。1.数据结构简介1.1红黑树简
【力扣hot100】python刷题笔记之哈希 Animato. 哈希算法 leetcode 笔记
1.两数之和（简单）题目描述：给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以按任意顺序返回答案。示例：解法一：暴力解法：双层循环（这里就不给代码了）解法二：哈希表（时间复杂度O(n)）算法思路：（1）先创建一个空字典当做哈希表来存储已经遍历过的
K8S必问面试题之：K8S架构中每个组件的作用运维爱背锅 K8S面试题 kubernetes 架构容器 K8S面试题面试 devops 运维
微信关注运维爱背锅，用通俗易懂的方式教你运维K8S面试题：K8S架构中每个组件的作用大家好！今天我们来聊聊Kubernetes（简称K8S）中各个组件的作用，这是一道必问的面试题——各个组件就像一支分工明确的足球队，有人守门、有人射门，还有人负责喊战术。下面咱们就用“人话”拆解一下这些组件的职责。1.etcd：集群的“八卦的小本本”作用：分布式K-V（键值）存储数据库，专门记录集群的所有“秘密”，
左神算法之矩阵旋转90度岳轩子左神算法算法矩阵线性代数
目录旋转矩阵90度（原地操作）1.题目2.解释3.思路4.代码5.总结6.其他旋转矩阵90度（原地操作）1.题目旋转矩阵90度，且只能用有限的几个变量。比如下面的矩阵：12345678910111213141516转换结果为：139511410621511731612842.解释旋转矩阵90度是指将矩阵顺时针旋转90度。观察旋转前后的变化可以发现：原矩阵的第一行变为旋转后矩阵的最后一列原矩阵的第二
PPT 要你好看（全彩）又是一个装逼的
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！PPT,要你好看（全彩）杨臻编著ISBN978-7-121-14725-82011年11月出版定价：49.90元16开264页宣传语：般若黑洞▪百万点击之升华16位知名PPT高手联袂热议内容简介此刻呈现在你面前的
深度学习使用Pytorch训练模型步骤 vvvdg 深度学习 pytorch 人工智能
训练模型是机器学习和深度学习中的核心过程，旨在通过大量数据学习模型参数，以便模型能够对新的、未见过的数据做出准确的预测。训练模型通常包括以下几个步骤：1.数据准备：收集和处理数据，包括清洗、标准化和归一化。将数据分为训练集、验证集和测试集。2.定义模型：选择模型架构，例如决策树、神经网络等。初始化模型参数（权重和偏置）。3.选择损失函数：根据任务类型（如分类、回归）选择合适的损失函数。4.选择优化
Python实例题：基于 KNN 算法的手写数字识别
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目基于KNN算法的手写数字识别要求：实现一个基于K-NearestNeighbors(KNN)算法的手写数字识别系统。支持以下功能：使用MNIST数据集训练和测试模型实现KNN分类算法可视化手写数字样本评估模型性能（准确率、混淆矩阵等）添加用户交互界面，允许用户绘制数字并进行识别。解题思路：使用sklearn加载MNIST数据
二叉树之层序遍历
二叉树之层序遍历前言一、层序遍历是什么？二、层序遍历的构建三、样例代码疑问补充：总结前言在二叉树的四种遍历中，唯独层序遍历是最特殊的，他用的不是递归的思路，而是队列，在部分面试题里也出现不少一、层序遍历是什么？层序遍历就是按层从上到下，每层按一定顺序对树的节点进行遍历如图所示：他通过队列的形式，输入第一个节点到队头后，随着他的pop，他会将他的左右孩子push进入队列每当一个节点被pop，他的左右
Cesium 实战 05 - 标绘编辑功能系列之编辑线段对象（Linestring | Polyline）非科班Java出身GISer Cesium 实战教程 cesium 编辑线 cesium 修改线编辑 polyline cesium编辑line cesium修改line 修改 polyline cesium编辑标绘线
Cesium实战-标绘编辑功能系列之编辑线段对象（Linestring|Polyline）核心代码完整代码在线示例本来想着标绘功能是比较基础的功能，而且网上一搜一堆，就不在教程里放了。后来觉得，标绘也是项目实战中非常常用的，网上虽然教程挺多，但是由于质量参差不齐，版本各不一致。本教程系列还是加上比较合适，主要是在线示例可以更好的帮助到需要的GISer。标绘编辑功能系列包含=编辑点、编辑线、编辑面，
pycharm——djiango之数据迁移，终端操作 Pop– python
首先在pycharm中找到terminal(终端)，输入指令：pythonmanage.pymakemigrations之后你会看到如下图：这表示创建成功。接着输入指令：pythonmanage.pymigrate就能看到好多ok，你在数据库中也能看到很多表你可以在终端打开数据库查看表，也可以使用客户端的可视化界面查看，还可以在pycharm中右边的database里边打开查看，如下图：之后你就可
MySQL之全场景常用工具链 AA-代码批发V哥 MySQL mysql 数据库运维
MySQL之全场景常用工具链一、基础连接与客户端工具1.1mysql命令行客户端1.2MySQLWorkbench：官方可视化1.3NavicatPremium二、管理与开发工具2.1phpMyAdmin：Web端管理首选2.2HeidiSQL：轻量Windows客户端三、性能优化工具3.1EXPLAIN：查询优化3.2SHOWPROFILE：细粒度性能分析3.3慢查询日志：捕获性能痛点四、备份与
22种创新思路！今年必将是特征选择爆发的一年小唯啊小唯人工智能注意力机制特征选择
2025深度学习发论文&模型涨点之——特征选择特征选择是机器学习和数据挖掘领域中一个非常重要的步骤。它指的是从原始特征集合中挑选出对目标变量有较强预测能力的特征子集。在实际的数据集中，往往包含众多特征，但并非所有特征都对模型的性能有正面影响。例如在房价预测任务中，原始特征可能包括房屋的面积、房间数量、所在小区、周边配套设施等众多内容。通过特征选择，可以剔除一些无关的或者冗余的特征，比如可能存在的重
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那