chou_shun

决策树的理解及实现（小白版附代码）

前言

本文的代码部分均采用伪代码+代码的形式，帮助有些想挑战自己的小白同学可以自己通过伪代码敲出代码！

简介

决策树（Decision Tree)是一种十分常用的分类方法。作为一种有监督学习，它对特征属性和样本标签之间的映射关系进行建模。相对于K-近邻算法，决策树的主要优势在于数据形式非常容易理解。而决策树之所以称为树，是因为其处理数据的过程可以用树来表示。理论总是那么难以理解，那我们直接上例子吧

一个例子

表1的数据包括5个样本，其特征分别为A，B，样本标签用L表示。特征值和样本标签都只有两种取值：是，否。

现在，我们先尝试用两个特征来对样本进行划分，并用树结构表示：

从图1中我们可以看出：
当特征A的值为否时（即样本4，5），样本标签均为否。因此我们可以预测当A为否时，无论B为何值，样本标签为否
当特征A的值为是时（即样本1，2，3），此时标签不太好分了（有是，也有否），因此我们再用B来进行划分：
当A为是，B为否时（即样本3），样本标签均为否。因此我们可以预测当A为是，B为否时，样本标签为否。
当A为是，B为是时（即样本1，2），样本标签均为是。因此我们可以预测当A为是，B为是时，样本标签为是。

此时我们就将样本都分完了，如果再给我们一组特征值，我们能够轻松地通过特征值，找到“对应”的样本标签了。是不是很简洁明了？
现在探讨一个问题。显而易见，数据集有多个特征，因而也有多种划分方式（比如对于表1我们也可以先对B进行划分），划分数据集的大原则是：把无序的数据变得更加有序。而哪种数据划分方式是最好的数据划分呢？接下来我们引入熵和信息增益的概念。

熵

不要被这个很学术的名词吓到了哈~其实，只要你了解了这个名词之后，你就可以…拿它去装逼了。
熵这个名字起源于信息论之父克劳德·香农，据说在香农写完信息论之后，冯·诺伊曼建议使用“熵”这个术语，因为大家都不知道它是什么意思。
我的理解是，熵就是信息的不确定性。比如说，一个房间如果全部是口罩，那么它的信息量是很低的，而另一个房间里既有口罩，也有防护服，消毒液等等，我们就说它信息量较大。换言之，可能值越多，信息越不确定，熵越大。给出计算熵的公式：

其中P(xi)为可能值为i的概率，n为可能值的数目。举个例子，对于表1的样本标签，共有两种可能值，其中值为’是’的概率是0.4，值为’否’的概率是0.6，因此其熵为：-0.4log(0.4)-0.6log(0.6) = 0.97

下面贴出计算熵的伪代码：

for 实例 in dataSet:
    建立key值为样本标签值，value值为标签值出现的次数的字典
    通过每个实例更新该字典
    for key in 字典:
        计算每个标签出现的频率
        更新香农熵
返回香农熵

代码如下：

def calcShannonEnt(dataSet):
    numEntries = len(dataSet)   # 数据集一共有多少个实例
    labelCounts = {}            # 定义一个字典，key为标签的可能值，value为该可能值的个数
    for featVec in dataSet:
        currentLabel = featVec[-1]
        if currentLabel not in labelCounts.keys():   # 如果现在字典中没有该可能值，则初始化其value为0
            labelCounts[currentLabel] = 0   
        labelCounts[currentLabel] += 1
    shannonEnt = 0.0            # 初始化香农熵为0
    for key in labelCounts:
        prob = float(labelCounts[key])/numEntries
        shannonEnt -= prob * log(prob, 2)            # 计算香农熵   
    return shannonEnt

划分数据集

求得数据集的熵之后，我们就要通过特征的划分，来降低数据集的熵，这个降低的值，就是信息增益。信息增益的计算公式为（这个公式是我为了解释清楚而自己定义的，没有任何来历的）：

其中n为该特征的可能值个数（即数据集被该特征划分成了多少块），Pi为第i块数据子集中的实例占整个数据集的比例，Hi为第i块数据子集的信息熵。所以，我们之前所要找的最好的划分方式，就是用信息增益最大的特征来进行划分（这里假设我们已经找到这个特征啦）。
划分数据集的伪代码如下：

# 函数参数为数据集dataSet，划分数据集的特征A， 划分后这一块数据子集对应的特征值V
创建空列表r
for 实例 in dataSet:
    if 该实例的特征A的值为V:
        将该实例的特征A去掉后添加到r中
返回r

代码如下：

def splitDataSet(dataSet, axis, value):  # 输入参数分别为：待划分的数据集，划分数据集的特征，划分后这一块数据子集对应的特征值
    retDataSet = []                      # 建立新的list对象，存储划分后的数据子集
    for featVec in dataSet:              # 遍历数据集，一旦发现符合要求的实例，则将其元素抽取，并添加到新建的列表中
        if featVec[axis] == value:
            reducedFeatVec = featVec[:axis]
            reducedFeatVec.extend(featVec[axis+1:])
            retDataSet.append(reducedFeatVec)
    return retDataSet

接下来我们将遍历整个数据集，循环计算香农熵和splitDataSet()函数，找到最好的划分方式，其伪代码如下：

计算原始香农熵
for 每个特征:
    for 该特征的每个特征值:
        用该特征值划分数据集
        求得划分后数据子集的信息熵之和
    求得该特征的信息增益
返回信息增益最大的特征

代码如下：

def chooseBestFeatureToSplit(dataSet):
    numFeatures = len(dataSet[0]) - 1
    baseEntropy = calcShannonEnt(dataSet)               # 计算整个数据集的原始香农熵
    bestInfoGain = 0.0
    bestFeature = -1                                    # 初始化最大信息增益和最佳特征
    for i in range(numFeatures):                        # 遍历每个特征
        featList = [example[i] for example in dataSet]
        uniqueVals = set(featList)                      # 集合（set）数据类型，得到featList中不重复的值
        newEntropy = 0.0
        for value in uniqueVals:                        # 遍历当前特征中的所有唯一属性值，对每个特征值都划分一次数据集
            subDataSet = splitDataSet(dataSet, i, value)
            prob = len(subDataSet)/float(len(dataSet))
            newEntropy += prob * calcShannonEnt(subDataSet)
        infoGain = baseEntropy - newEntropy             # 计算当前特征的信息增益
        if infoGain > bestInfoGain :
            bestInfoGain = infoGain
            bestFeature = i                             # 比较所有特征的信息增益，返回最好划分的特征索引值
    return bestFeature

递归构建决策树

目前我们已经了解了从数据集构造决策树算法所需要的子功能模块，其工作原理为：
得到原始数据集，然后基于最好的特征划分数据集，由于特征的值可能多余两个，因此可能存在大于两个分支的数据集划分（即一个结点可能有大于两个子结点）。
第一次划分后，数据将被向下传递到树分支的下一个结点，在这个结点上，如果该数据子集的标签不完全一样，我们可以通过另一个特征再次划分数据，因此我们可以采用递归的原则来处理。
递归结束的条件是：程序遍历完所有特征，或者每个叶子结点的数据子集都有相同的标签。当然，还有一种情况，所有特征都被“用完”了，但样本标签依然不是唯一的，此时，我们通常会采用取多数的方法决定该叶子结点的标签。
取多数的伪代码如下：

# 函数参数为数据子集中标签的列表
建立一个字典，key为标签值，value为数据子集中标签值为key的个数
for 字典中的key:
    更新字典
    根据字典中的value对字典进行排序，返回出现最多的标签

代码如下:

def majorityCnt(classList):
    classCount = {}             # 建立一个字典，key为标签值，value为数据子集中标签值为key的个数
    for vote in classList:
        if vote not in classCount.keys():classCount[vote] = 0
        classCount[vote] += 1
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)
    # .items()将字典分解为形式为([key,value], ...)的元组列表，运算符模块的itemgetter方法按第二个元素的次序对元组进行排序。返回出现次数最多的标签名称
    return sortedClassCount

如今我们已经“万事俱备，只欠东风”。而最后一步，就是建树了。
给出建树的伪代码:

#函数参数为数据集dataSet和特征列表labels
if 标签完全相同:
    返回标签值
if 遍历完特征:
    调用majorityCnt，将其返回值作为返回值
调用chooseBestFeatureToSplit，找到最佳特征b
以b为key建立一个字典myTree
删除labels中的特征b
for 特征b的每一个不重复值value:
    myTree[b]的键值为 递归调用该函数(其参数是什么？)
return myTree

下面直接贴上完整的代码吧

from math import log
import operator

def majorityCnt(classList):
    classCount = {}             # 建立一个字典，key为标签值，value为数据子集中标签值为key的个数
    for vote in classList:
        if vote not in classCount.keys():classCount[vote] = 0
        classCount[vote] += 1
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)
    # .items()将字典分解为形式为([key,value], ...)的元组列表，运算符模块的itemgetter方法按第二个元素的次序对元组进行排序
    return sortedClassCount


def calcShannonEnt(dataSet):
    numEntries = len(dataSet)   # 数据集一共有多少个实例
    labelCounts = {}            # 定义一个字典，key为标签的可能值，value为该可能值的个数
    for featVec in dataSet:
        currentLabel = featVec[-1]
        if currentLabel not in labelCounts.keys():   # 如果现在字典中没有该可能值，则初始化其value为0
            labelCounts[currentLabel] = 0
        labelCounts[currentLabel] += 1
    shannonEnt = 0.0            # 初始化香农熵为0
    for key in labelCounts:
        prob = float(labelCounts[key])/numEntries
        shannonEnt -= prob * log(prob, 2)            # 计算香农熵
    return shannonEnt


def createDataSet():
    dataSet = [[1, 1, 'yes'],
               [1, 1, 'yes'],
               [1, 0, 'no'],
               [0, 1, 'no'],
               [0, 1, 'no']]
    label = ['no surfacing', 'flippers']
    return dataSet, label


def splitDataSet(dataSet, axis, value):  # 输入参数分别为：待划分的数据集，划分数据集的特征，划分后这一块数据子集对应的特征值
    retDataSet = []                      # 建立新的list对象，存储划分后的数据子集
    for featVec in dataSet:              # 遍历数据集，一旦发现符合要求的实例，则将其元素抽取，并添加到新建的列表中
        if featVec[axis] == value:
            reducedFeatVec = featVec[:axis]
            reducedFeatVec.extend(featVec[axis+1:])
            retDataSet.append(reducedFeatVec)
    return retDataSet


def chooseBestFeatureToSplit(dataSet):
    numFeatures = len(dataSet[0]) - 1
    baseEntropy = calcShannonEnt(dataSet)               # 计算整个数据集的原始香农熵
    bestInfoGain = 0.0
    bestFeature = -1                                    # 初始化最大信息增益和最佳特征
    for i in range(numFeatures):                        # 遍历每个特征
        featList = [example[i] for example in dataSet]
        uniqueVals = set(featList)                      # 集合（set）数据类型，得到featList中不重复的值
        newEntropy = 0.0
        for value in uniqueVals:                        # 遍历当前特征中的所有唯一属性值，对每个特征值都划分一次数据集
            subDataSet = splitDataSet(dataSet, i, value)
            prob = len(subDataSet)/float(len(dataSet))
            newEntropy += prob * calcShannonEnt(subDataSet)
        infoGain = baseEntropy - newEntropy             # 计算当前特征的信息增益
        if infoGain > bestInfoGain :
            bestInfoGain = infoGain
            bestFeature = i                             # 比较所有特征的信息增益，返回最好划分的特征索引值
    return bestFeature

def createTree(dataSet, labels):
    classList = [example[-1] for example in dataSet]
    if classList.count(classList[0]) == len(classList):
        return classList[0]
    if len(dataSet[0]) == 1:
        return majorityCnt(classList)
    bestFeat = chooseBestFeatureToSplit(dataSet)
    bestFeatLabel = labels[bestFeat]
    myTree = {bestFeatLabel:{}}
    del(labels[bestFeat])
    featValues = [example[bestFeat] for example in dataSet]
    uniqueVals = set(featValues)
    for value in uniqueVals:
        subLabels = labels[:]
        myTree[bestFeatLabel][value] = createTree(splitDataSet(dataSet, bestFeat, value), subLabels)
    return myTree


myDat, labels = createDataSet()
myTree = createTree(myDat, labels)
print(myTree)

结果如下

{'no surfacing': {0: 'no', 1: {'flippers': {0: 'no', 1: 'yes'}}}}

结语

本文的例子和代码均来自《机器学习实战》第三章
第一次写博客，虽然主要参（zhao）考（ban）了《机器学习实战》，但还是费了一番工夫，其实写博客的过程也是加深自己理解的过程。
之后会努力把数据挖掘的十大算法都陆续写完，这样也好打发宅在家的这段时间。
欢迎大家收藏，但更欢迎大家批评指正哈哈！第一次肯定很多疏漏，包括很多功能我都不太会…谢谢大家！

Linux主机时间同步会飞的土拨鼠呀 Linux运维技巧 linux 服务器运维
写在前面处于内网的Linux主机，时间容易不准确，在我遇到的内网服务器中，大部分的时间会有偏差，一般偏差5到10分钟。如果系统部署在这个机器上，那么系统的时间也是不准确的，此时我们需要对Linux主机做时间同步处理。手动同步时间1.date:查看当前时间[root@localhost~]#date2021年03月22日星期一15:59:59CST2.date'+%Y%M%D'按照格式显示当前日期[
使用Spring Actuator + Micrometer + Prometheus + Grafana监控Spring Boot应用程序帅过驴的袋鼠 java docker
前言读取本文需要的知识：Java,Docker基本命令当某个应用在生产环境中运行时,监控其运行状态是必要的和明智的。通过实时了解应用程序的运行状况,你能在问题出现之前得到警告,也可以在客户端注意到问题之前解决问题。最终的效果图模块简单介绍SpringActuator:在应用程序离提供众多Web接口,通过它们了解应用运行时的内部状况。Micrometer:为Java平台上的性能数据收集提供了一个通用
Junit5 单元测试框架的使用 qq_40815999 单元测试
Junit5简单使用总结作为一款测试框架，一般我们需要从以下几个方面去考虑TestCase：测试用例的管理Assertions:用例断言的管理TestExecution:测试执行，以何种顺序执行TestFixtures:测试装置，测试用例运行的前后动作，用来管理测试用例的执行TestSuites:测试套，控制用例批量运行TestRunner：测试用例的运行器TestResultReport：测试报
uniapp或小程序使用jsencrypt 钢铁熊猫33 小程序前端 uniapp 小程序 jsencrypt rsa
uniapp或小程序使用报错jsencrypt.js使用了window对象，app、小程序中没有窗口对象的环境解决办法在jsencrypt.js文件插入以下代码varnavigator2={appName:'Netscape',userAgent:'Mozilla/5.0(iPhone;CPUiPhoneOS9_1likeMacOSX)AppleWebKit/601.1.46(KHTML,like
Spring Boot & MyBatis Plus 版本兼容问题（记录） michael.csdn spring boot mybatis plus 后端
SpringBoot&MyBatisPlus版本兼容问题（Invalidvaluetypeforattribute'factoryBeanObjectType':java.lang.String）问题描述问题排查1.检查`@MapperScan`的路径2.项目中没有配置`FactoryBean`3.检查`Spring`和`MyBatisPlus`版本兼容性解决方法问题描述当使用spring-boo
STM32学习和实践笔记（28）：printf重定向实验复业思维20240108 STM32 stm32 学习笔记
1.printf重定向简介在C语言中printf函数里，默认输出设备是显示器，如果想要用这个函数将输出结果到串口或者LCD上显示，就必须重定义标准库函数里中printf函数调用的与输出设备相关的函数。比如要使用printf输出到串口，需要先将fputc函数里面的输出指向串口,这个更改就叫重定向。
STM32CubeIDE 的应用: 重定向printf 到stm32串口 logan_lei stm32 uart 串口通信
一。导入stdio.h库文件/*Privateincludes----------------------------------------------------------*//*USERCODEBEGINIncludes*/#include/*USERCODEENDIncludes*/二。重写函数/*USERCODEBEGIN4*/#ifdef__GNUC__#definePUTCHAR_
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
导出 YOLOv11 模型的详细步骤和说明 old_power 计算机视觉 YOLO 人工智能计算机视觉
以下是关于如何导出YOLOv11模型的详细步骤和说明：1.导出YOLOv11模型的基本步骤YOLOv11模型可以通过Ultralytics提供的接口轻松导出为多种格式，如ONNX、TensorRT、CoreML等。以下是导出模型的基本步骤：1.1安装Ultralytics库首先，确保已安装Ultralytics库：pipinstallultralytics1.2加载模型并导出使用Python代码加
【Redis】golang操作Redis基础入门 m0_74825360 面试学习路线阿里巴巴 redis golang 数据库
【Redis】golang操作Redis基础入门大家好我是寸铁??总结了一篇【Redis】golang操作Redis基础入门sparkles:喜欢的小伙伴可以点点关注??Redis的作用Redis（RemoteDictionaryServer）是一个开源的内存数据库，它主要用于存储键值对，并提供多种数据结构的支持。Redis的主要作用包括：1.缓存:Redis可以作为缓存系统，将常用的数据缓存在内
【route】route add命令详解 m0_74825360 面试学习路线阿里巴巴 php 网络开发语言
routeadd命令的主要作用是添加静态路由，通常的格式是：routeADD157.0.0.0MASK255.0.0.0157.55.80.1METRIC3IF2参数含义：^destination^mask^gatewaymetric^^interfacedestination【网段地址】mask【子网掩码】gateway【网关地址】metric【路由跳数】if【端口号】一般情况下，不涉及本机地址
Element-plus封装表格Validate 努力搬砖的宣 vue.js 前端 javascript elementui
Element-plus实现表格内的表单验证：useAttrValidateHook在Vue.js项目中，表单验证是一个常见的需求，尤其在处理复杂表格编辑场景时。本文将详细介绍一个基于Vue3的自定义Hook——useAttrValidate，它提供了一种便捷的方式来处理表格组件中的字段校验。效果如下：1.导入与初始化Javascriptimport{reactive,nextTick}from"
软件测试工具——Junit单元测试衣衣困 junit 单元测试
什么是单元测试定义：单元测试是对软件中的最小可测试单元（通常是一个函数或方法）进行的验证性测试，旨在确保其按预期工作。目的：通过测试单元代码来发现并修复错误，提高代码的可靠性和维护性。“单元”的大小或范围，并没有一个明确的标准，“单元”可以是一个函数、方法、类、功能模块或者子系统。单元测试一般是有开发人员或测试人员来做。单元测试通常和白盒测试联系到一起，如果单从概念上来讲两者是有区别的，不过我们通
大腾智能CAD：基于云原生架构，融合AI技术的高效三维设计解决方案大腾智能 cad 工业软件信创国产化工业数字化
CAD（计算机辅助设计）技术自诞生以来，在工业设计中经历了从二维到三维、从单一功能到集成化、智能化的飞跃式发展。这一技术不仅极大地提高了设计效率，还使得设计精度和创新能力得到了前所未有的提升，已成为现代工业设计不可或缺的重要工具。随着“中国制造2025”等战略的实施，国产CAD软件迎来了前所未有的市场机遇。大腾智能公司紧跟时代步伐，推出了一款完全基于云原生架构的国产三维CAD设计软件，它集三维建模
Python+Scapy 实现ARP扫描并获取IP+MAC root@localhost Python python 扫描测试工具
环境：Python3.x+scapydefip_mac_scanner(hosts:str,local_mac:str,detail:bool=False):"""网段IP&MacARP协议扫描器:paramhosts:网段e.g.‘*.*.*.*/*’:paramlocal_mac:本地MAC地址，e.g.‘**-**-**-**-**-**’:paramdetail:是否显示详细信息:retu
微信小程序开发工具介绍及安装（上）计算机萍萍学姐小程序开发微信小程序小程序微信
本章主要介绍微信小程序开发工具的介绍小程序开发工具的安装方法开发工具的基本功能介绍微信小程序开发工具的介绍微信小程序开发工具是一款由微信官方提供的集成开发环境（IDE），旨在帮助开发者更便捷地创建、调试和发布微信小程序。该开发工具具备丰富的功能和工具集，可以极大地提高小程序开发的效率和质量。以下是对微信小程序开发工具的介绍：一、简介微信小程序开发工具是微信官方推出的一款跨平台开发工具，适用于开发者
Copilot 概述计算机萍萍学姐 copilot copilot 人工智能机器学习
Copilot是什么？它有什么用途？Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。Copilot的目标是在保持代码质量和可读性的前提下，提高开发者的编码效率，使得编码工作更为高效和便捷。Copilot的出现是解决编程过程中可能遇到的一些难点和瓶颈问题，特别是在快速迭代的敏捷开发场景中，提高编码效率和减少编
Python模拟发送SOME/IP消息（Scapy模块）李星星BruceL 车载总线及以太网 python tcp/ip 网络协议车载系统服务发现
Python模拟服务端或客户端发送SOME/IP消息1说明2依赖3服务端3.1导包3.2参数定义3.3提供服务（OfferService）3.4订阅ACK/NACK（SubscribeACK/NACK）3.5通知（Notifier）3.6请求/响应ACK（ResponseACK）1说明主要介绍如何使用Python+scapy模块进行SOME/IP以及SOME/IP-SD消息的发送和解析；关于SOM
JS通过ASCII码值实现随机字符串的生成（可指定长度以及解决首位不出现数值）觉醒法师 JavaScript javascript 前端开发语言 typescript
在之前写过一篇“JS实现随机生成字符串（可指定长度）”，当时写的过于简单和传统，比较粗放。此次针对此问题，对随机生成字符串的功能进行优化处理，对随机取到的字符都通过程序自动来完成。在写之前，我们先了解下String.charCodeAt、Array.from()、String.fromCharCode等方法，以及随机获取指定范围中的值，这些在此次功能优化中起到关键作用。一、String.charC
Spring Boot快速接入Prometheus监控|写给Java开发运维 ikyrxbxfas Spring Java Java编程 java spring boot 运维 mysql 分布式
不想听我废话的，直接看代码就行：https://github.com/strictnerd/spring-petclinic-compose最近跟几个粉丝聊天吹水，说最近公司裁员严重，不仅裁掉了大部分的人，也裁掉了大部分的业务；之前公司有钱赚，什么产品都愿意做，无论行不行都会试一试，一堆没有什么流量的系统都在线上跑着，但是没有上级发话，一个也不敢停掉。站着资源不说，关键还得保证活着，基本就是运维人
uniapp小程序项目从0到1开发扶园 uni-app 小程序
一、在HBuilderX新建项目,然后可以先把可能用到的文件夹建好二、引入UI框架,根据npm方式配置文档uView2地址:https://uviewui.com/components/install.htmlcmd执行[email protected]引入并使用uView的JS库，注意这两行要放在importVue之后。//main.jsimportuViewfrom"uview
固件测试工具选型需要考察的功能点汇总 daopuyun 安全测试测试工具固件测试
通过专业的固件测试工具可以帮助我们提高测试效率、提升测试的覆盖度、确保测试的准确性，保障产品的安全和质量。本文我们讲固件测试工具的功能点进行梳理和汇总，方便大家在采购固件测试工具时进行选型比对。一、固件测试工具·漏洞扫描功能：使用自动化固件测试工具最基本的功能就是针对固件进行扫描，找到固件中的安全漏洞，如缓冲区溢出、权限提升、格式字符串等。在固件测试领域，基于二进制的自动化扫描工具能够更好地对代码
Ceisum无人机巡检直播视频投射白嫖叫上我 Cesium 无人机 cesium webgis
接上次的视频投影，Leader告诉我这个视频投影要用在两个地方，一个是我原先写的轨迹回放那里，另一个在无人机起飞后的地图回显，要实时播放无人机拍摄的视频，还要能转镜头，让我把这个也接一下。我的天！告诉我的时候人都傻了，这是一个功能嘛？一个是拿到了全部的轨迹数据进行回显，播放的视频也是完整的资源，视频要求投射在地面上。另一个是接收实时的轨迹数据进行回显，播放的是实时的直播，视频居然还要求跟着镜头一起
Cesium 无人机航线规划（航点航线）白嫖叫上我 Cesium 无人机 cesium
航线规划实现定制航线，一键巡检功能小镜头模拟的是此方向的拍照效果，觉得合适可以打个拍照印记设置里可调控参数------------------------------------------------------2025-01-10--------------------------------------------------------改进了一下，加入多个动作组，可设置每个航点的动作动作组
mockito+junit 单元测试测试私有方法利用反射去调用提升覆盖率反射调用时传入参数为 null aq_money junit 单元测试 java
今天公司安排我写单元测试因为要通过三级认证公司要求是覆盖率必须达到100%而在写单元测试的时候对于是否要测试私有方法一直是一个争议公司规范对私有方法也进行测试代码如下：privatevoidpostGpInfo(GpAlertInfoDOgpAlertInfoDO){if(JudgeUtils.isNull(gpAlertInfoDO)){BusinessException.throwBusine
【dbt】数据加工大师浅谈一盘胡椒鱼 dbt 数据库数据仓库 etl 数据分析 sql
dbt是dbtlabs公司在2016年推出的一款基于Python的开源数据加工工具。从2019年开始，dbt的用户数量增涨十分迅速。dbtlabs凭借此工具，在2022年估值达到了42亿美金。dbt的价值dbt是面向分析工程师提供服务。【分析工程师】是dbt新定义的岗位，是基于DataOps思想，综合了数据工程师和数据分析师两者。即分析师也应该会代码开发（实际上，现在很多的数据分析师就是在做sql
Vue+Element-plus搭建 a3337779 vue.js 前端 javascript
一.下载node看这篇博客：http://t.csdn.cn/kTeRL二.安装vue的脚手架(vue-cli)如果没有切换node的下载镜像，使用这条命令切换淘宝镜像：npmconfigsetregistryhttps://registry.npm.taobao.org然后直接下载npminstallvue-cli-g//（vue-lcli2)npminstall-g@vue/cli//(vue
uniapp 小程序目录搭建以及 pages.json 配置 YZRHANYU uniapp+微信小程序 json uni-app 小程序
uniapp小程序目录搭建1.分包结构├──api各个模块接口文件夹├──login.js登录模块接口文件├──common公共模块，包含公共基础css等├──base.css公共基础css├──components主包当中使用的组件或者复用率较高的组件作为全局组件├──node_modulesnodejs相关依赖包文件目录├──pages主包:业务页面文件存放的目录├──common├──sys
webrtc 源码阅读 make_ref_counted模板函数用法 wu_qz webrtc 笔记
目录1.模板参数解析1.1typenameT1.2typename...Args1.3typenamestd::enable_if::value,T>::type*=nullptr2.scoped_refptr3.newRefCountedObject(std::forward(args)...);4.综合说明5.在webrtc中的用法5.1peerConnectionFactory对象的构建过程
h264之多视点mvc编码及解码过程(JMVC平台举例） wu_qz 视频编解码 mvc
h264标准参考平台JMVC是针对MVC标准的，JMVC支持多视点编码、合流、多视点解码操作。可以利用JMVC生成h264mvc码流和解码。JMVC的下载地址是：jvet/JMVC·GitLabH.264/AVCmulti-viewcoding(MVC)extensionJMVCreferencesoftwarehttps://vcgit.hhi.fraunhofer.de/jvet/jmvcwi
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

决策树的理解及实现（小白版附代码）

前言

简介

一个例子

熵

划分数据集

递归构建决策树

结语

你可能感兴趣的:(决策树的理解及实现（小白版附代码）)