zipper112

机器学习--决策树

文章目录

- 决策树的思想
- 分类树
- - 信息熵
  - - 信息增熵
  - 基尼系数
  - CART
  - 简单实现
  - - CART剪枝
  - sklearn的分类树
- 回归树
- - CART
  - sklearn的回归树

决策树的思想

决策树的思想在现实中也非常常见，比如买一个东西，我们在想买或者不买，就会经过类似以下的决策过程：
决策树也是如此，比如我们要解决一个分类问题，也可以借助类似的过程，然后对输入的数据进行分类。
在分类树中每一个叶节点都是一个类别，而每一个内部节点对应着一个规则条件。

分类树

分类树就是用来解决分类问题的决策树。
一颗决策树的学习过程分为：特征选择，决策树的生成，剪枝
三个过程

信息熵

首先是特征选择，每次决策树进行分支其实都是选择一个特征然后根据这个特征进行分支。

而我们选择特征时，有的特征可能用于当前的节点划分十分有效，有的则几乎无法用于当前节点的划分，所以需要一个标准进行衡量某个特征进行划分之后它的划分效果好坏如何。

首先介绍信息熵，信息熵可以衡量随机变量的不确定度。
设X是一个取有限个值的离散随机变量且有：
$P(X=x_i)=p_i(i=1,2...,n)$
则这个随机变量X的信息熵就为：
$-\sum\limits_{i = 1}^np_ilog(p_i)$
其中，这个对数如果以2为底则信息熵此时的单位为比特，以e为底则此时单位为纳特，并且如果存在 $p_i=0$ 则默认 $p_ilog(p_i)=0$

举个例子，假设有一个只有两个类别的样本，一个类别为1一个为0，其中1这个类别占 $\frac{1}{3}$ ，0这个类别占 $\frac{2}{3}$ 则信息熵则为
$-[\frac{1}{3}log_2(\frac{1}{3}) + \frac{2}{3}log_2(\frac{2}{3})] \approx 0.918$
信息熵越大说明分类越不准确，也就是此时混乱程度越大，小则相反。
假设随机变量X只有两个类别(即只有两种取值)，则设取其中一个类别的概率为 $a$ 则另一个就为 $1 - a$
此时信息熵就为
$H(x) = -[a*log_2(a)+ (1 - a) * log_2(1-a)]$
此时可以画出它的图像。

可以发现当a的取等于1或者0时信息熵的值都取到了最小，切当a取到了0.5时信息熵最大。
也很容易理解，因为当a=0.5时X的取值最不确定，而等于0或者1时，X的取值最确定。

信息增熵

首先定义条件熵，条件熵 $H (Y ∣ X)$ 是指在随机变量X已经确定了的条件下，Y的不确定性，其定义为：
$H(Y|X)=\sum\limits_{i = 1}^np_iH(Y|X=i)$
其中 $p_i=P(X=i)$
此时就可以定义信息增熵了：
设训练集为 $D$ ，当前所选的特征为A，则选特征A之后的信息增熵为
$G (D, A) = H (D) - H (D ∣ A)$
即在选择特征A之后并且划分，然后得到的训练集的信息熵与原本训练集的信息熵的差，这个差越大训练集的信息熵减少的就越多，划分出来的数据的种类就越确定，划分效果就越好。

基尼系数

基尼系数与信息熵类似，也可以用于计算当前训练集的不确定度，它的计算公式为
$Gini(p)=1-\sum\limits_{i = 1}^np_i^2$

CART

CART的全称为Classification and Regression Tree.
CART是实现决策树的算法之一，他假设决策树每个内部节点只有"是"或者"否"两种状态，这样所得到的决策树就是一颗二叉树。
CART算法包括两部分

基于训练数据生成决策树，生成的决策树要尽可能的大。
用验证数据集对决策树进行剪枝，然后选择出最优决策树。

CART树的生成

如果当前节点满足条件，则把它作为一个叶节点然后根据少数服从多数确定他的类别。
否则，对于每个特征A，选择A所可以取到的所有分隔点 $i$ 使 $A = i$ 然后把训练集D划分成两部分，然后计算信息熵，并选出一个最优的划分。
从所有特征中选出信息熵最小的一个划分，然后按这个划分对训练集进行分割
对新的划分重复上述步骤，直到满足条件
条件可以有很多，比如当前节点的信息熵小于某个阈值，或者当前节点的样本数小于某个值。

简单实现

首先导入所需要的包

import numpy as np
from collections import Counter
from math import log2

然后定义一个DecisionTree类，重写__inint__方法

class DecisionTree:
    __used_criterion = None
    root = None
    """
    max_depth: 表示最大深度
    criterion: 衡量切分效果的指标[只有'gini'和'entropy']
    min_samples：一个节点被切分所需要的最少样本数
    root用来存树根
    __used_criterion用来存所使用的criterion
    """
    def __init__(self, max_depth=None, criterion='gini', min_samples=10):
        self.max_depth = max_depth
        self.criterion = criterion
        self.min_samples = min_samples
        if criterion == 'gini':
            self.__used_criterion = self.__gini
        else:
            self.__used_criterion = self.__entropy

写出基尼系数和信息熵得到计算公式

def __gini(self, y):
        cout, l = Counter(y), len(y)
        res = 0
        for i in cout.values():
            res += (i / l) ** 2
        return 1 - res

    def __entropy(self, y):
        cout, l = Counter(y), len(y)
        res = 0
        for i in cout.values():
            res += (i / l) * log2(len(i) / l)

然后写一个函数用于切分节点

def __splitFeature(self, X, y, id): # id表示特征，X和y是data和target
        lX, rX, ly, ry = None, None, None, None # 表示切分后左右的训练数据，特征
        bestValue, splitLine = float('inf'), None # 最好的值和最好的切分点
        idx = np.argsort(X[:, id]) # 对某个特征所有的值进行排序
        for i in range(1, len(X)):# 这里选取的是依次取每两个点的中间值进行切分，然后选择最好的一个
            tmpSplitLine = (X[idx[i], id] + X[idx[i - 1], id]) / 2
            reIdx = X[:, id] < tmpSplitLine
            reIdxr = X[:, id] >= tmpSplitLine
            tmpValue = self.__used_criterion(y[reIdx]) + self.__used_criterion(y[reIdxr]) 
            if tmpValue < bestValue:
                splitLine = tmpSplitLine
                bestValue = tmpValue
                lX, rX, ly, ry = X[reIdx], X[reIdxr], y[reIdx], y[reIdxr]
        return lX, rX, ly, ry, bestValue, splitLine

然后我们写一个类用于存储树节点

class TreeNode:
    def __init__(self, split_line=None, c=None):
        self.c = c
        self.feature_position = None
        self.split_line = split_line
        self.left = None
        self.right = None

然后开始递归构建树

def __CART(self, X, y, now: TreeNode, depth):
        # now 是当前正在创建的节点
        L = len(X)
        if L <= self.min_samples or depth == self.max_depth or len(set(y)) == 1: # 如果满足条件就停止然后按照少数服从多数把该节点变成叶节点
            c = Counter(y).most_common()[0][0]
            now.c = c
        else: # 否则进行分割
            minValue = float('inf')
            bestCb, pos = None, None
            for i in range(X.shape[1]):
                cb = self.__splitFeature(X, y, i)
                if cb[4] < minValue:
                    bestCb = cb
                    minValue = cb[4]
                    pos = i
            if not len(cb[0]) or not len(cb[1]): #  处理出现重合点的情况
                c = Counter(y).most_common()[0][0]
                now.c = c
                return
            now.split_line = bestCb[5]
            now.feature_position = pos
            l, r = TreeNode(), TreeNode() # 左右子树的创建
            now.left, now.right = l, r
            self.__CART(bestCb[0], bestCb[2], l, depth + 1)# 递归处理
            self.__CART(bestCb[1], bestCb[3], r, depth + 1)

然后顺便把fit也写出来

def fit(self, X, y):
        self.root = TreeNode() # 创建根节点
        self.__CART(X, y, self.root, 1) # 从根开始递归创建
        return self # 根据sklearn标准返回自身

写一个预测方法

def __single_predict(self, x, now: TreeNode):
        if now.split_line == None: # 如果当前节点没有分隔点那么它是叶节点该输入数据就等于这个类别
            return now.c
        elif x[now.feature_position] < now.split_line: # 否则比较叶节点的指定特征值在切分点的左还是右
            return self.__single_predict(x, now.left)
        else:
            return self.__single_predict(x, now.right)

    def predict(self, X):
        return np.array([self.__single_predict(i, self.root) for i in X])

完整代码

import numpy as np
from collections import Counter
from math import log2

class TreeNode:
    def __init__(self, split_line=None, c=None):
        self.c = c
        self.feature_position = None
        self.split_line = split_line
        self.left = None
        self.right = None


class DecisionTree:
    __used_criterion = None
    root = None

    def __init__(self, max_depth=None, criterion='gini', min_samples=10):
        self.max_depth = max_depth
        self.criterion = criterion
        self.min_samples = min_samples
        if criterion == 'gini':
            self.__used_criterion = self.__gini
        else:
            self.__used_criterion = self.__entropy
    
    def __gini(self, y):
        cout, l = Counter(y), len(y)
        res = 0
        for i in cout.values():
            res += (i / l) ** 2
        return 1 - res

    def __entropy(self, y):
        cout, l = Counter(y), len(y)
        res = 0
        for i in cout.values():
            res += (i / l) * log2(len(i) / l)
        return -res

    
    def __splitFeature(self, X, y, id):
        lX, rX, ly, ry = None, None, None, None
        bestValue, splitLine = float('inf'), None
        idx = np.argsort(X[:, id])
        for i in range(1, len(X)):
            tmpSplitLine = (X[idx[i], id] + X[idx[i - 1], id]) / 2
            reIdx = X[:, id] < tmpSplitLine
            reIdxr = X[:, id] >= tmpSplitLine
            tmpValue = self.__used_criterion(y[reIdx]) + self.__used_criterion(y[reIdxr]) 
            if tmpValue < bestValue:
                splitLine = tmpSplitLine
                bestValue = tmpValue
                lX, rX, ly, ry = X[reIdx], X[reIdxr], y[reIdx], y[reIdxr]
        return lX, rX, ly, ry, bestValue, splitLine 
    
    def __CART(self, X, y, now: TreeNode, depth):
        # now 是当前正在创建的节点
        L = len(X)
        if L <= self.min_samples or depth == self.max_depth or len(set(y)) == 1:
            c = Counter(y).most_common()[0][0]
            now.c = c
        else:
            minValue = float('inf')
            bestCb, pos = None, None
            for i in range(X.shape[1]):
                cb = self.__splitFeature(X, y, i)
                if cb[4] < minValue:
                    bestCb = cb
                    minValue = cb[4]
                    pos = i
            if not len(cb[0]) or not len(cb[1]):
                c = Counter(y).most_common()[0][0]
                now.c = c
                return
            now.split_line = bestCb[5]
            now.feature_position = pos
            l, r = TreeNode(), TreeNode()
            now.left, now.right = l, r
            self.__CART(bestCb[0], bestCb[2], l, depth + 1)
            self.__CART(bestCb[1], bestCb[3], r, depth + 1)

    def fit(self, X, y):
        self.root = TreeNode()
        self.__CART(X, y, self.root, 1)
        return self

    def __single_predict(self, x, now: TreeNode):
        if now.split_line == None:
            return now.c
        elif x[now.feature_position] < now.split_line:
            return self.__single_predict(x, now.left)
        else:
            return self.__single_predict(x, now.right)

    def predict(self, X):
        return np.array([self.__single_predict(i, self.root) for i in X])

CART剪枝

CART剪枝分为两步：

对生成的决策树从底端开始不断地向上剪枝，直到根节点，过程中生成一系列子树 ${T_0, T_1,....,T_k\}$
使用交叉验证法在验证集上从子树的集合中选出一个最优子树

设损失函数为
$C_\alpha(T)=C(T) + \alpha|T|$
$C_\alpha(T)$ 表示以T为根节点的子树的误差， $C (T)$ 表示以T为根节点的子树其对训练数的误差， $\alpha$ 是权重， $∣ T ∣$ 则是以T为根节点的子树的叶子数目。

我们想要剪枝，其目的就是减少叶子的数目从而降低模型的复杂度，所以考虑误差时把叶子的数目也当成一个参数来考量是很合理的。
假设有一个内部点T，设它变成一个叶节点时误差为:
$C_\alpha(T)=C(T) + \alpha$
以他为根的子树 $T_t$ 的误差为
$C_\alpha(T_t)=C(T_t) +\alpha|T_t|$
很明显，当 $\alpha$ 很小时 $C_\alpha(T_t) < C_\alpha(T)$ ，因为构成决策树时分枝之后信息熵或者基尼系数必定减小。
当 $\alpha$ 逐渐增大达到某一个值，就会出现 $C_\alpha(T_t) = C_\alpha(T)$
此时联立两个式子就有 $\alpha=\frac{C(T) - C(T_t)}{|T_t| - 1}$
如果 $\alpha$ 越小说明这个节点构成的子树删去对整个决策树在训练数据上的偏差增大就越小。
有了上面的几个式子，就可以得到CART剪枝的步骤了。

自下而上的计算内部节点 $T$ 的 $C_\alpha(T)$ 和 $C_\alpha(T_t), |T_t|$ 以及 $tmp_T=\frac{C(T) - C(T_t)}{|T_t| - 1}$ $\alpha=min(\alpha, tmp_T)$
对 $tmp_T = \alpha$ 的节点进行剪枝，然后得到剩下的树 $T$ 并存储
如果此时T是由根节点和两个叶节点构成的树那么此时就结束，否则重复上述步骤。

sklearn的分类树

可以从sklearn的tree模块中引入DecisionTreeClassifier

from sklearn.tree import DecisionTreeClassifier

"""
Parameters
    ----------
    criterion : 
    	选择使用哪种方式衡量切分效果，可以写'entropy'或者'gini'分别是信息熵和基尼系数
    	实际中使用两个中的哪个都差别不大，但基尼系数计算的比较快一点

    splitter : string, optional (default="best")
        控制如何去选择切分点，可以选'best'和'random'，使用best的话会一直生成一种决策树
        使用random则会增加随机性可以防止过拟合，同时也会产生一定的偏差

    max_depth : int or None, optional (default=None)
        决策树的最大深度，用于剪枝

    min_samples_split : int, float, optional (default=2)
        一个样本点被且分时所需要的最小样本数，同样可以用于剪枝，当为浮点数时应该在0-1之间，表示占训练数据
        的比例

    min_samples_leaf : int, float, optional (default=1)
        表示一个叶节点比如包含的最少样本数，当值为浮点数时与min_samples_split同理，也可以用于剪枝

    max_features : int, float, string or None, optional (default=None)
    	用于限制分枝时考虑的特征数，比较暴力的直接舍去特征
        The number of features to consider when looking for the best split:

            - If int, then consider `max_features` features at each split.
            - If float, then `max_features` is a percentage and
              `int(max_features * n_features)` features are considered at each
              split.
            - If "auto", then `max_features=sqrt(n_features)`.
            - If "sqrt", then `max_features=sqrt(n_features)`.
            - If "log2", then `max_features=log2(n_features)`.
            - If None, then `max_features=n_features`.

    random_state : int, RandomState instance or None, optional (default=None)
        用于控制是否随机生成一棵树，如果是则default=None否则可以直接传入一个seed

"""

回归树

CART

CART算法同样可以解决回归问题。
假设CART最终生成n个叶节点 ${R_1, R_2, ..., R_n\}$ ，每个节点有一个预测值 $c$ ,则有
$f(x_i) = c_k(x_i \in R_k)$
与分类树一样，我们需要决定如何去切割，需要知道如何计算误差。
回归问题的误差衡量标准很多，这里采用MSE，与分类树一样对于一个内部节点，我们需要选择一个特征，然后找到它的一个最优的切分值，按照这个切分值把训练数据切分成两部分。
假设按照第k个特征以特征值b切分成了两个部分，分别用集合表示为 $R_1(k, b) =\{x|x_k < b\}, R_2(k, b) =\{x|x_k \geq b\}$
由于最后每一个叶节点都要有一个预测值，所以对于任意样本数据对应的标记 $y_1, y_2, ...,y_a$ 想要找到一值w使
$\sum\limits_{i = 1}^a(y_i - w)^2$
最小，这个值显然就是 $\frac{1}{a}\sum\limits_{i = 1}^ay_i$ 。
所以对于某个节点，他的最佳预测值就是这个节点所包含的样本的标记的均值
假设切分后两边数据标记的均值分别为 $c_1, c_2$ ，那么求上述最佳切分值就可以表示为求
$\hat b=\argmin_{b}[\sum\limits_{x_i \in R_1(k, b)}(y_i - c_1)^2 + \sum\limits_{x_i \in R_2(k, b)}(y_i - c_2)^2]$
然后再求出最佳的一个用于切分的特征
$\hat k, \hat b = \argmin_{k, b}[\sum\limits_{x_i \in R_1(k, b)}(y_i - c_1)^2 + \sum\limits_{x_i \in R_2(k, b)}(y_i - c_2)^2]$
然后把切分后的数据传入两个孩子中，然后递归重复上述步骤。

sklearn的回归树

sklearn中从tree模块导入DecisionTreeRegressor，就可以使用回归树了。
回归树的参数和分类树很相似，就不写了，生成一个伪数据测试一下回归树的拟合效果。

可以发现决策树的对于这么一个数据它的偏差很大，但是后续可以通过集成学习的方法来增强它的拟合能力比如随机森林，GBDT

国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
奇异值分解（SVD）文弱_书生乱七八糟神经网络人工智能
奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
yum install locate出现Error: Unable to find match: locate解决方案爱编程的喵喵 Linux解决方案 linux locate yum 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了yuminstalllocate出现
【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目 ai AI编程
文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
【机器学习】建模流程 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能线性回归逻辑回归
1、数据获取1.1来源数据获取是机器学习建模的第一步，常见的数据来源包括数据库、API、网络爬虫等。数据库是企业内部常见的数据存储方式，例如：MySQL、Oracle等关系型数据库，以及MongoDB等非关系型数据库，它们能够存储大量的结构化和非结构化数据API（应用程序编程接口）提供了从外部获取数据的便捷方式，例如：社交媒体平台的API可以获取用户发布的内容和互动信息网络爬虫则适用于从网页中提取
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
【机器学习】模型拟合 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能欠拟合过拟合
1、欠拟合1.1现象欠拟合是机器学习和统计建模中的一种常见问题，表现为模型无法充分捕捉数据中的潜在规律和模式。无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。1.2原因模型过于简单是导致欠拟合的主要原因：例如，使用直线去拟合具有明显曲线趋势的数据，或者使用低阶多项式去拟合高阶的复杂函数关系。这种情况下，模型的表
基于Python的智能决策支持系统：实现智能化决策的关键要素 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录基于Python的智能决策支持系统：实现智能化决策的关键要素11.背景介绍2.核心概念与联系数据收集与预处理模型构建与训练决策规则生成与优化决策结果评估与反馈3.核心算法原理具体操作步骤数据挖掘算法机器学习算法优化算法4.数学模型和公式详细讲解举例说明线性回归模型最小二乘法5.项目实践：代码实例和详细解释说明6.实际应用场景金融领域医疗领域供应链管理智能制造7.工具和资源推荐编程语言和开发
下一代模型技术演进与场景应用突破智能计算研究中心其他
内容概要当前模型技术正经历多维度的范式跃迁，可解释性模型与自动化机器学习（AutoML）成为突破传统黑箱困境的核心路径。在底层架构层面，边缘计算与量子计算的融合重构了算力分配模式，联邦学习技术则为跨域数据协作提供了安全可信的解决方案。主流框架如TensorFlow和PyTorch持续迭代优化能力，通过动态参数压缩与自适应超参数调优策略，显著提升模型部署效率。应用层创新呈现垂直化特征，医疗诊断模型通
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
人工智能之数学基础：线性子空间每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习线性代数线性子空间线性空间
本文重点在前面的课程中，我们学习了线性空间，本文我们我们在此基础上学习线性子空间。在应用中，线性子空间的概念被广泛应用于信号处理、机器学习、图像处理等领域。子空间的性质子空间是线性空间的一部分，它需要满足下面的性质：设V是数域F上的线性空间，W是V的一个非空子集。如果W对于V中的加法运算和数乘运算也构成F上的一个线性空间，则称W为V的线性子空间（或称向量子空间）。具体来说，设V是一个线性空间，W是
详解离线安装Python库爱编程的喵喵 Python基础课程 python 离线安装 requirements
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了详解离线安装Python库，希望能对
ESG证书：AI预测未来十年职场人的黄金入场券 ESG学习圈 pandas python django
当ChatGPT开始撰写ESG报告，当机器学习模型精准预测企业碳排放轨迹，一场由AI驱动的ESG革命正在颠覆传统可持续发展领域。根据彭博新能源财经预测，到2030年全球ESG资产管理规模将突破50万亿美元，而AI技术将成为撬动这个万亿级市场的核心杠杆。一、AI透视下的ESG黄金时代在微软开发的AI模型ESG-NOW系统中，通过分析全球4300家上市公司近十年的环境数据，成功预测2025年新能源行业
【Dive Into Stable Diffusion v3.5】1：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练 Donvink 大模型 #AIGC stable diffusion AIGC 人工智能机器学习深度学习
目录1引言2项目简介3快速上手3.1下载代码3.2环境配置3.3项目结构3.4下载模型与数据集3.5运行指令3.6核心参数说明3.6.1通用参数3.6.2优化器/学习率3.6.3数据相关4结语1引言在人工智能和机器学习领域，生成模型的应用越来越广泛。StableDiffusion作为其中的佼佼者，因其强大的图像生成能力而备受关注。今天，我的开源项目DiveIntoStableDiffusionv3
知识库在意图识别中扮演着**数据支撑**和**语义理解辅助**的双重角色 PersistDZ 大数据与AI 人工智能
知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色，而训练智能客服的意图识别Agent需要结合知识库的结构化数据与机器学习技术。以下是详细解析：一、知识库在意图识别中的作用1.提供标注数据意图标签定义：知识库中存储了预先定义的意图分类体系（如“订单查询”“退换货”“投诉”等），为模型提供明确的训练目标。标注样本：知识库包含大量用户对话历史及其对应的意图标签，是训练监督学习模型的核心数据源。2
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
Hessian 矩阵是什么 ZhangJiQun&MXP 教学 2021 AI python 2024大模型以及算力矩阵线性代数算法人工智能机器学习
Hessian矩阵是什么目录Hessian矩阵是什么Hessian矩阵的性质及举例说明**1.对称性****2.正定性决定极值类型****特征值为2（正），因此原点(0,0)(0,0)(0,0)是极小值点。****3.牛顿法中的应用****4.特征值与曲率方向****5.机器学习中的实际意义**一、定义与公式二、实例分析Hessian矩阵是多元函数二阶偏导数构成的方阵，用于分析函数局部曲率、判断极
LoRA中黑塞矩阵、Fisher信息矩阵是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵机器学习人工智能 transformer 深度学习算法线性代数
LoRA中黑塞矩阵、Fisher信息矩阵是什么1.三者的核心概念黑塞矩阵（Hessian）二阶导数矩阵，用于优化问题中判断函数的凸性（如牛顿法），或计算参数更新方向（如拟牛顿法）。Fisher信息矩阵（FisherInformationMatrix,FIM）统计学中衡量参数估计的不确定性，反映数据中包含的关于参数的信息量。在机器学习中常用于自然梯度下降（NaturalGradientDescent
神经网络基础之正则化硬水果糖人工智能神经网络人工智能机器学习
引言：正则化（Regularization）是机器学习中一种用于防止模型过拟合技术。核心思想是通过在模型损失函数中添加一个惩罚项（PenaltyTerm），对模型的复杂度进行约束，从而提升模型在新数据上的泛化能力。一、正则化目的防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。简化模型：正则化通过限制模型参数的大小或数量，迫
决策树算法全解析：从零基础到Titanic实战，一文搞定机器学习经典模型吴师兄大模型 0基础实现机器学习入门到精通算法机器学习决策树人工智能深度学习编程开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

机器学习--决策树

文章目录

决策树的思想

分类树

信息熵

信息增熵

基尼系数

CART

简单实现

CART剪枝

sklearn的分类树

回归树

CART

sklearn的回归树

你可能感兴趣的:(机器学习)