Ai研究僧

【机器学习（四）】决策树、ID3算法、C4.5算法、CART算法：原理，案例和代码

1.引言

2.决策树

2.1 决策树与if-then规则

2.2 决策树与条件概率分布

2.3 决策树学习

3.特征选择

4.决策树生成

4.1 ID3生成算法

4.2 C4.5生成算法

5.决策树剪枝

5.1剪枝算法

6.CART算法

6.1 CART回归树生成树

6.2 最小二乘法回归树

6.3 CART分类树生成

6.3.1 基尼指数

6.3.2 CART分类树生成

6.3.3 CART剪枝

6.3.4 CART剪枝流程

7.代码实现

上一篇：【机器学习（三）】机器学习中：信息熵，信息增益，信息增益比，原理，案例，代码实现。

1.引言

决策树（decision tree）是一种分类与回归的方法，顾名思义，决策树呈树形结构，可以认为是if-then规则的集合，也可以认为是特征空间与类空间上的条件概率分布。

主要的优点：分类速度快、可读性强。

决策树学习通常有三个步骤：特征选择、决策树生成和决策树修剪。

常用的决策树算法有：ID3算法、C4.5算法和CART算法，其中CART更是被广泛应用。

2.决策树

定义：分类决策树模型是一种描述对实例进行分类的属性结构。决策树由结点和向边组成。结点有两种类型：内部结点和叶结点。内部结点表示一个特征或者属性，叶结点表示一个类。

例如上图，圆形是内部结点，表示特征和属性，矩形表示叶子结点，表示一个类。训练的时候，按照训练数据集的属性和类，逐渐构建一个树，分类的时候，从根结点按照递归的方法对内部结点的属性进行测试和匹配，直到到达叶结点。

2.1 决策树与if-then规则

可以认为决策树是if-then规则的集合，其中内部结点之间连城的通路，构建成一条规则。路径上的点是规则的条件，叶子结点则是规则的结论。每一个实例都被一条路径或者一条规则覆盖，而且只被一条路径或规则覆盖。

2.2 决策树与条件概率分布

决策树还可以认为是特征条件下类的条件概率分布。将特征空间划分为互不相交的单元或区域，并在每个单元定义一个类的概率分布。而决策树的一条路径就是一个单元，因此可以认为决策树是给定条件下类的概率分布的集合。

2.3 决策树学习

给定训练集，其中，n是特征个数； $y\epsilon \{1,2,...,K\}$ 是类的标记。

决策树的目的就是根据训练数据集构建一个决策树模型，使它能够对实例进行正确分类。

所以决策树的本质就是从训练数据中归纳出一组分类规则，这样决策树可能有很多个，也可能一个没有。但是我们需要的是一个与训练数据矛盾较小的决策树，又要具有很好的泛化能力，不仅对训练数据有很好的拟合，对未知数据又有很好的预测。

决策树学习使用损失函数作为自己的目标函数，学习的策略就是最小化损失函数。决策树学习的算法通常是一个递归选择最优特征的方法，根据特征对训练数据进行分割，使各个子数据有一个最好的分类过程。这一个过程也是对特征空间的划分，也对应着决策树的构建。从根结点开始，选择特征作为自己的内部结点，递归构建，直到每个子集都被分到叶子结点上（即都有明确的分类），这就完成类决策树的构建。

3.特征选择

在构建决策树的时候，可以构建许多决策树，哪种决策树才是最有效的决策树？在开始构建的时候就考虑这个问题。要想构建一个高效的决策树，一般（CART除外）需要遵守信息增益或信息增益比的规则（点此查看信息熵、信息增益、信息增益比原理）。一般我们选择信息增益或信息增益比最大的特征作为当前的特征。信息增益体现出了特征与类的关联程度，即特征对类的不确定度的影响程度，信息增益比则是对这种程度的修正，避免决策树偏向选择取值较多的特征。

举一个例子：下表是贷款申请情况表，最后一列给出类是否给予贷款。

我们要从这表中构建一个决策树，怎样选择特征作为节点呢？

所以需要计算类的信息熵、特征与类的信息增益、信息增益比。

如下图，通过计算得到房子的信息增益最大（0.420），要是以信息增益为特征条件，那么构建决策树的第一个节点（根结点）应该是“房子”这个特征。（此处有详细的计算过程：信息熵、信息增益、信息增益比原理）

如下图，计算得到信息增益比，同样特征“房子”的信息增益比最大（0.4325），当以信息增益比为选择条件的时候，特征“房子”应该作为第一个节点（根结点）

4.决策树生成

4.1 ID3生成算法

ID3算法的核心就是在决策树各个节点上使用信息增益作为选择特征的准则，使用递归方法构建决策树。

输入：训练数据集D，特征集A和阈值 $\varepsilon$

输出：决策树T

若D中所有实例属于同一类，则T为单结点树，并将类作为该结点的类标记，返回T；

若 $A=\phi$ ，则T为单结点树，将D中实例树最大的类作为该结点的类标记，返回T；

否则信息增益算法计算A中各特征对D的信息增益，选择信息增益最大的特征；

如果的信息增益小于阈值 $\varepsilon$ ，则置T为单结点树，并将D中实例数最大的类作为该结点的类标记，返回T；

否则，对的每一个可能的值，依照=将D分割为若干个非空子集，将中实例树最大的类作为标记，构建子节点，由结点及其子节点构成树T，返回T；

对第i个子节点，以为训练集，以 $A-\{A_g\}$ 为新的特征集，递归调用1~5，得到树T，返回T。

以上一个案例为为例：

作为特征“年龄”，作为特征“工作”，作为特征“房子”，作为特征“信贷”。在上一步的计算中，可以知道特征的信息增益最大，所以选择作为根结点的特征。它把数据集划分为两个子集（取是）和（取否）。由于只有同一类的样本点，所以单独成为一个叶子结点，结果类标记“是”。

则下面对从特征、和中选择新的特征，计算各个特征的信息增益：

从上图，可以看到信息增益最大，因此作为新的内部结点。

从引出两个节点，即将数据集划分成两个（取是）和（取否）。由于内的类属于同一类，且类标记为“是”，故此数据集为叶子结点，且标记为“是”；内的类也是属于同一类，故此数据集为叶子结点，且类标记为“否”。这样就生成了一个决策树（下图），仅仅使用了两个特征，使决策树更加高效。

4.2 C4.5生成算法

ID3算法生成树有一个缺点，就是容易过拟合。为此C4.5算法对ID3算法进行改进，使用信息增益比作为选择特征的条件。

输入：训练数据集D，特征集A和阈值 $\varepsilon$

输出：决策树T

若D中所有实例属于同一类，则T为单结点树，并将类作为该结点的类标记，返回T；

若 $A=\phi$ ，则T为单结点树，将D中实例树最大的类作为该结点的类标记，返回T；

否则信息增益算法计算A中各特征对D的信息增益比，选择信息增益比最大的特征；

如果的信息增益小于阈值 $\varepsilon$ ，则置T为单结点树，并将D中实例数最大的类作为该结点的类标记，返回T；

否则，对的每一个可能的值，依照=将D分割为若干个非空子集，将中实例树最大的类作为标记，构建子节点，由结点及其子节点构成树T，返回T；

对第i个子节点，以为训练集，以 $A-\{A_g\}$ 为新的特征集，递归调用1~5，得到树T，返回T。

以上一个为例，计算信息增益比：

作为特征“年龄”，作为特征“工作”，作为特征“房子”，作为特征“信贷”。如下图，可以知道的信息增益比最大，因此选择作为根结点。它把数据集划分为两个子集（取是）和（取否）。由于只有同一类的样本点，所以单独成为一个叶子结点，结果类标记“是”。

则下面对从特征、和中选择新的特征，计算各个特征的增益比：

从上图，可以看到信息增益比最大，因此作为新的内部结点。

从引出两个节点，即将数据集划分成两个（取是）和（取否），由于内的类属于同一类，且类标记为“是”，故此数据集为叶子结点，且标记为“是”；内的类也是属于同一类，故此数据集为叶子结点，且类标记为“否”。

这样就生成了一个决策树，在这个案例中，C4.5和ID3生成的决策树是一样的，但是规则上有细微的区别——特征条件不同。

5.决策树剪枝

ID3和C4.5算通过递归产生决策树，直到不能继续。这样产生的树往往对训练数据分类很准确，但是对未知的测试数据的分类却没有那么准确——过拟合。因此需要通过剪枝，对已经生成的树进行简化，增加决策树的鲁棒性。

顾名思义，剪枝，就是裁掉一些已经生成的子树或者叶子结点，将其父结点或者根结点作为新的叶结点，从而简化了分类树模型。

决策树剪枝通过极小化整体损失函数或代价函数实现。

设树T的叶结点个数为，t是树T的叶结点，该结点有个样本点，其中k类的样本点有个，为叶结点t上的经验熵， $\alpha \geq 0$ 是参数。则决策树学习的损失函数为：

$C_\alpha (T)=\sum_{t=1}^{|T|}N_tH_t(T)+\alpha |T|$

其中经验熵为： $H_t(T)=-\sum_{k} \frac{N_t_k}{N_t}log\frac{N_t_k}{N_t}$ ，

将损失函数的右边第一项记做 $C(T)=\sum_{t=1}^{|T|}N_tH_t(T)$ ，这是损失函数变成 $C_\alpha =C(T)+\alpha |T|$ 。

当 $\alpha$ 较大时，最优树偏小；

$\alpha$ 较小的时候，最优树偏大；

，根结点组成的单结点最优；

$\alpha=0$ ，整个树是最优的。

决策树的生成只考虑了通过提高信息增益或信息增益比来训练数据，这样使模型对训练数据有很好的拟合效果，对未知数据的分类效果不是十分好。剪枝，通过优化损失函数，减小模型复杂度，学习整体最好表现。

剪枝，就是当 $\alpha$ 确定时，选择损失函数最小的模型，即损失函数最小的子树。

5.1剪枝算法

输入：生成算法产生的决策树T，参数 $\alpha$ ；

输出：修剪后的子树 $T_\alpha$ 。

计算每个节点的经验熵

递归地从树的叶结点向上回溯。设一组叶结点回到其父结点，之前之后整体树分别为和，对应的损失函数分别是 $C_\alpha (T_B)$ 和 $C_\alpha (T_A)$ ,如果： $C_\alpha (T_A)\leq C_\alpha (T_B)$ ，则进行剪枝，将父结点变为新的叶结点。

返回2，直到不能继续剪枝为止，得到损失函数最小的子树 $T_\alpha$

决策树的剪枝是在局部进行的，所以决策树剪枝可以由动态规划算法实现。

6.CART算法

CART（classififcation and regression trees）是一种既可以分类（离散）也可以回归（连续）的决策树。CART只假设决策树是二叉树，因此CART最终生成的树形结构是二叉树。

6.1 CART回归树生成树

假设X与Y是输入和输出变量，并且Y是连续的，给定训练数据集 $D=\{(x_1,y-1),(x_2,y_2),...(x_N,y_N)\}$ 。将输入控件划分为M个单元，于是回归树模型可以表示为：

$f(x)= \sum_{m=1}^{M}c_mI$

当输入空间事先知道时，使用平方误差 $\sum_{x_i}(y_i-f(x_i)^2)$ 作为回归树的预测误差。

采用启发式方法，选择第个变量作为分类点，取他的值s，把输入数据切分成两部分（输入小于s）和（输入大于s）。

然后寻找最优切分变量和最优切分点即可。

6.2 最小二乘法回归树

按照6.1方法生成的回归树就是最小二乘回归树（二叉树）。

输入：训练数据集

输出：回归树

选择最优切分变量和切分点，求解损失 $min_j_s[min_c_1\sum_{x_i}(y_i-c_1)^2+min_c_2\sum_{x_i}(y_i-c_2)^2]$ ，找到损失最小的和切分点。

用选定的(j,s)划分区域（输入小于s）和（输入大于s），并决定输出值 $c_m=\frac{1}{N_m}\sum_{x_i}y_i$

继续对两个区域调用步骤1和2，直到满足停止条件。

将输入空间划分为M个子区域，生成决策树： $f(X)=\sum_{m=1}^{M}c_mI$

继续以上一个案例为例，如何使用最小二乘回归树来构建决策树。

首先是挨个特征计算，找到损失函数最小的特征。从第一轮结果中可知道的损失最小（3），因此选择“房子”作为根结点，将数据划分成两部分。左边是，由于中的数据全为一类，因此为一个叶结点。右边是，对其内的特征继续计算损失函数，即第二轮计算。

从结果中可以看到，的损失值为0，因此可以直接停止后续计算，确定“工作”为新的节点。将数据分成两部分：和。其中数据为一类，所以是叶子结点。同理也是叶子结点。这就生成了一个归回二叉决策树。

6.3 CART分类树生成

分类树是使用基尼指数作为特征选择，同时决定这个特征的最优二值切分点（生成的同样是二叉树）。

6.3.1 基尼指数

设有K个分类，样本属于第k类的概率是：

概率分布的基尼指数定义为： $Gini(p)=\sum_{k=1}^{K}p_k(1-p_k)=\sum_{k=1}^{K}p_k^2$

二分类问题，属于1的概率是p，基尼指数为：

集合问题，是集合D的第k类样本子集，K是类的个数，基尼指数为： $Gini(p)=1-\sum_{k=1}^{K}(\frac{|C_k|}{|D|})^2$ 。如果集合D被特征A分割成两部分和。在特征A的条件下，D的基尼指数为： $Gini(D,A)=\frac{|D_1|}{|D|}Gini(D_1)+\frac{|D_2|}{|D|}Gini(D_2)$

基尼指数和信息增益、信息增益比一样，都近似代表分类误差率。

6.3.2 CART分类树生成

输入：训练数据集D

输出：CART决策树

从根结点开始，递归地对每个结点进行一下操作，构建二叉树：

设结点的训练数据集为D，计算现有特征A对D的基尼指数；

选择基尼指数最小的特征及其对应点，将数据集分成两部分，分配到两个子节点中。

对两个子节点递归调用1和2，直到满足停止条件（节点中样本个数小于预定阈值或基尼指数小于预定阈值）。

生成CART决策树

同样以上一个案例为例，如何使用CART算法生成决策树

首先是挨个特征计算，计算基尼指数。从第一轮结果中可知道的基尼指数最小（0.27），因此选择“房子”作为根结点，将数据划分成两部分。左边是，由于中的数据全为一类，因此为一个叶结点。右边是，对其内的特征继续计算新的基尼指数，即第二轮计算。

从结果中可以看到，的基尼指数为0，确定“工作”为新的节点。将数据分成两部分：和。其中数据为一类，所以是叶子结点。同理也是叶子结点。这就生成了一个归回二叉决策树。

6.3.3 CART剪枝

从生成的决策树底部开始，剪去一些子树，使决策树变小，从而能够对未知数据有更准确的预测。

剪枝的步骤就是先在已经生成决策树底端不断剪枝，直到的根结点，形成一个子树序列 $\{T_0,T_1,T_2,...,T_n\}$ ；然后通过交叉验证法在独立的验证数据集上对子树序列进行预测，从中选择最优子树。

在剪枝的过程中计算子树的损失函数： $C_\alpha (T)=C(T)+\alpha |T|$ ，其中是对训练数据的预测误差，是子树的叶子结点个数， $C_\alpha$ 是参数为 $\alpha$ 时的子树的整体损失。

时，任意内部结点t，以t为单结点树的损失函数是： $C_\alpha =C(t)+\alpha$

时，任意内部结点t，以t为根结点的子树损失函数是： $C_\alpha(T_t) =C(T_t)+\alpha|T_t|$

当 $\alpha =0$ 或 $\alpha$ 很小的时候，有： $C_\alpha (T_t)< C_\alpha (t)$

当 $\alpha$ 逐渐增大，在一个值的时候有： $C_\alpha (T_t)= C_\alpha (t)$

所以，只要 $g(t) =\frac{C(t)-C(T_t)}{|T_t|-1}$ ，和t就有相同的损失函数，t是单结点，是子树，因此剪枝，保留t更好。将剪枝后得到，同时将设为 $\alpha_1$ ，那么为区间 $[\alpha _1,\alpha _2)$ 的最优子树。如此一直剪下去，直到根结点。

剪枝得到子树序列 $\{T_0,T_1,T_2,...,T_n\}$ ，利用独立验证的数据集测试子树序列中各个子树的平方误差或者基尼指数。在子树序列中，一个子树对应一个 $\alpha _i$ ，选择损失最小的子树作为最终的剪枝结果，得到最优化决策树 $T_\alpha$ 。

6.3.4 CART剪枝流程

输入：CART回归生成树

输出：最优决策树 $T_\alpha$

设

设 $\alpha =+\infty$

自下而上地对各个内部结点t计算，以及 $g(t)=\frac{C(t)-C(T_t)}{|T_t|-1}$ ， $\alpha =min(\alpha,g(t))$ 。其中表示以t为根结点的子树，是对训练数据的预测误差，是的叶结点个数。

对 $g(t)=\alpha$ 的内部结点t进行剪枝，并对叶结点t以多数表决法（投票）决定其类，得到树T。

设 $k=k+1,\alpha _k\alpha ,T_k=T$

如果不是由根结点以及两个叶结点构成的数，则返回到步骤2；否则令。

采用交叉验证法在子树序列 $\{T_0,T_1,T_2,...,T_n\}$ 中选择最优的子树 $T_\alpha$ 。

7.代码实现

关于案例的ID3算法和C4.5算的信息增益和信息增益比的代码实现，见信息熵、信息增益、信息增益比原理。

案例的ID3算法实现如下（不使用机器学习库）：

import numpy as np
import pandas as pd
from math import log


def create_data():
    datasets = [['青年', '否', '否', '一般', '否'],
                ['青年', '否', '否', '好', '否'],
                ['青年', '是', '否', '好', '是'],
                ['青年', '是', '是', '一般', '是'],
                ['青年', '否', '否', '一般', '否'],
                ['中年', '否', '否', '一般', '否'],
                ['中年', '否', '否', '好', '否'],
                ['中年', '是', '是', '好', '是'],
                ['中年', '否', '是', '非常好', '是'],
                ['中年', '否', '是', '非常好', '是'],
                ['老年', '否', '是', '非常好', '是'],
                ['老年', '否', '是', '好', '是'],
                ['老年', '是', '否', '好', '是'],
                ['老年', '是', '否', '非常好', '是'],
                ['老年', '否', '否', '一般', '否'],
                ]
    labels = [u'年龄', u'有工作', u'有自己的房子', u'信贷情况', u'类别']
    # 返回数据集和每个维度的名称
    return datasets, labels


# 定义节点类 二叉树
class Node:
    def __init__(self, root=True, label=None, feature_name=None, feature=None):
        self.root = root
        self.label = label
        self.feature_name = feature_name
        self.feature = feature
        self.tree = {}
        self.result = {'label:': self.label, 'feature': self.feature, 'tree': self.tree}

    def __repr__(self):
        return '{}'.format(self.result)

    def add_node(self, val, node):
        self.tree[val] = node

    def predict(self, features):
        if self.root is True:
            return self.label
        return self.tree[features[self.feature]].predict(features)


class DTree:
    def __init__(self, epsilon=0.1):
        self.epsilon = epsilon
        self._tree = {}

    # 熵
    @staticmethod
    def calc_ent(datasets):
        data_length = len(datasets)
        label_count = {}
        for i in range(data_length):
            label = datasets[i][-1]
            if label not in label_count:
                label_count[label] = 0
            label_count[label] += 1
        ent = -sum([(p / data_length) * log(p / data_length, 2) for p in label_count.values()])
        return ent

    # 经验条件熵
    def cond_ent(self, datasets, axis=0):
        data_length = len(datasets)
        feature_sets = {}
        for i in range(data_length):
            feature = datasets[i][axis]
            if feature not in feature_sets:
                feature_sets[feature] = []
            feature_sets[feature].append(datasets[i])
        cond_ent = sum([(len(p) / data_length) * self.calc_ent(p) for p in feature_sets.values()])
        return cond_ent

    # 信息增益
    @staticmethod
    def info_gain(ent, cond_ent):
        return ent - cond_ent

    def info_gain_train(self, datasets):
        count = len(datasets[0]) - 1
        ent = self.calc_ent(datasets)
        best_feature = []
        for c in range(count):
            c_info_gain = self.info_gain(ent, self.cond_ent(datasets, axis=c))
            best_feature.append((c, c_info_gain))
        # 比较大小
        best_ = max(best_feature, key=lambda x: x[-1])
        return best_

    def train(self, train_data):
        """
        input:数据集D(DataFrame格式)，特征集A，阈值eta
        output:决策树T
        """
        _, y_train, features = train_data.iloc[:, :-1], train_data.iloc[:, -1], train_data.columns[:-1]
        # 1,若D中实例属于同一类Ck，则T为单节点树，并将类Ck作为结点的类标记，返回T
        if len(y_train.value_counts()) == 1:
            return Node(root=True,
                        label=y_train.iloc[0])

        # 2, 若A为空，则T为单节点树，将D中实例树最大的类Ck作为该节点的类标记，返回T
        if len(features) == 0:
            return Node(root=True, label=y_train.value_counts().sort_values(ascending=False).index[0])

        # 3,计算最大信息增益 同5.1,Ag为信息增益最大的特征
        max_feature, max_info_gain = self.info_gain_train(np.array(train_data))
        max_feature_name = features[max_feature]

        # 4,Ag的信息增益小于阈值eta,则置T为单节点树，并将D中是实例数最大的类Ck作为该节点的类标记，返回T
        if max_info_gain < self.epsilon:
            return Node(root=True, label=y_train.value_counts().sort_values(ascending=False).index[0])

        # 5,构建Ag子集
        node_tree = Node(root=False, feature_name=max_feature_name, feature=max_feature)

        feature_list = train_data[max_feature_name].value_counts().index
        for f in feature_list:
            sub_train_df = train_data.loc[train_data[max_feature_name] == f].drop([max_feature_name], axis=1)

            # 6, 递归生成树
            sub_tree = self.train(sub_train_df)
            node_tree.add_node(f, sub_tree)

        # pprint.pprint(node_tree.tree)
        return node_tree

    def fit(self, train_data):
        self._tree = self.train(train_data)
        return self._tree

    def predict(self, X_test):
        return self._tree.predict(X_test)


datasets, labels = create_data()
train_data = pd.DataFrame(datasets, columns=labels)
dt = DTree()
tree = dt.fit(train_data)
print(tree)
print('预测结果：', dt.predict(['老年', '否', '否', '一般']))

结果展示：

树的结构：{'label:': None, 'feature': 2, 'tree': {'否': {'label:': None, 'feature': 1, 'tree': {'否': {'label:': '否', 'feature': None, 'tree': {}}, '是': {'label:': '是', 'feature': None, 'tree': {}}}}, '是': {'label:': '是', 'feature': None, 'tree': {}}}}

对'老年', '否', '否', '一般'的预测结果是：否

使用机器学习库：可以实现ID3、CART算法，具体的需求可以根据注释的地方更改即可。

from sklearn import tree
import numpy as np


def create_data():
    datasets = [[1, 0, 0, 1, 0],
                [1, 0, 0, 2, 0],
                [1, 1, 0, 2, 1],
                [1, 1, 1, 1, 1],
                [1, 0, 0, 1, 0],
                [2, 0, 0, 1, 0],
                [2, 0, 0, 0, 0],
                [2, 1, 1, 0, 1],
                [2, 0, 1, 3, 1],
                [2, 0, 1, 3, 1],
                [2, 0, 1, 3, 1],
                [2, 0, 1, 2, 1],
                [2, 1, 0, 2, 1],
                [2, 1, 0, 3, 1],
                [2, 0, 0, 1, 0],
                ]
    datasets = np.array(datasets)
    # 返回数据集和每个维度的名称
    return datasets[:, :4], datasets[:, -1]


train_x, train_y = create_data()
#  标准的格式
# tree.DecisionTreeClassifier(criterion='gini',splitter='best',
#                             max_depth=None,min_samples_split=2,
#                             min_samples_leaf=1,min_weight_fraction_leaf=0.0,
#                             max_features=None,random_state=None,
#                             max_leaf_nodes=None,min_impurity_decrease=0.0,
#                             min_impurity_split=None,class_weight=None,
#                             presort=False)

clf = tree.DecisionTreeClassifier(criterion='entropy') # ID3
# clf = tree.DecisionTreeClassifier(criterion='gini') # CART
clf.fit(train_x, train_y)

#  测试一个数据集
new = train_x[0, :]
print('new one:' + str(new))
print('预测结果为：', clf.predict(new.reshape(1,-1)))

结果展示，找一个数据进行测试的结果如下：

下一篇：【机器学习（五）】从决策树到随机森林

-------------------------------------------------------------------------------------------------------------------------------------

2020-6-17更新了ID3实现案例的代码部分、使用机器学习库实现决策树的部分。

你可能感兴趣的:(机器学习,深度学习,决策树,算法,机器学习,分类算法,cart分类回归树)

基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
Go与Python在数据管道与分析项目中的抉择：性能与灵活性的较量真智AI 人工智能 python go
你正在设计一个全新数据管道或启动一个分析项目，此时你或许正在思考该选择Python还是Go。五年前，这甚至不是个值得讨论的问题——你会毫不犹豫地选择Python，故事到此为止。然而，近年来Go在数据领域，尤其是在数据基础设施和实时处理方面，正逐渐被更多人采用。实际上，这两种语言都已在现代数据技术栈中找到了各自的定位。Python依然非常适合机器学习和数据分析，而Go则逐步成为高性能数据基础设施的首
Python爬虫实战：从新浪财经爬取股票新闻的完整实现 Python爬虫项目 python 爬虫开发语言数据分析 php
第一部分：爬虫概述1.1什么是爬虫？爬虫是指通过程序模拟浏览器的行为，自动化地抓取网络上的数据。通过爬虫技术，能够从各种网站上提取信息，广泛应用于数据采集、数据分析、机器学习等领域。1.2新浪财经简介新浪财经是中国最大的财经信息平台之一，提供股票、基金、债券、外汇等多方面的财经新闻和数据。在股票领域，新浪财经提供了大量的股票行情、实时数据、新闻报道等信息，因此爬取新浪财经的股票新闻对于投资分析和决
AI 智能运维，重塑大型企业软件运维：从自动化到智能化的进阶实践 AI、少年郎人工智能运维自动化
一、引言：企业软件运维的智能化转型浪潮在数字化转型加速的背景下，大型企业软件架构日益复杂，微服务、多云环境、分布式系统的普及导致传统运维模式面临效率瓶颈。AI技术的渗透催生了智能运维（AIOps）的落地，通过机器学习、大模型、智能Agent等技术，实现从"人工救火"到"智能预防"的范式转变。本文结合头部企业实践，解析AI在运维领域的核心应用场景、技术架构及未来趋势，特别针对基础运维中流程重构、技术
Spring AI 概述与功能简介 drebander AI 编程 spring 人工智能 java
SpringAI是一个由Spring团队开发的开源框架，旨在为人工智能（AI）和机器学习（ML）提供一个成熟且高效的开发平台。它将Spring生态系统的设计理念应用于AI开发，尤其强调模块化、可移植性以及简洁的集成。SpringAI提供了丰富的功能，涵盖从AI模型的调用到与数据库的集成等多个方面，帮助开发者构建和管理AI驱动的应用程序。1.SpringAI背景SpringAI的背景源于Spring
在二分类任务中如何处理包含中文的类别特征 Dush32 分类数据挖掘人工智能机器学习数据分析
在机器学习中，处理类别特征（CategoricalFeatures）是常见的任务，特别是在中文数据中，很多类别特征如省份、城市等都是字符串类型。如何将这些类别变量转换为模型可以理解的数值格式，是每个数据科学家都必须面对的挑战。在这篇文章中，我们将探讨两种常见的类别特征编码方法：astype('category')和LabelEncoder，并比较它们在二分类任务中的效果。我们以“省份”这一类别特征
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
AI原生应用领域多租户的技术架构剖析 AI天才研究院 AI-native 架构人工智能 ai
AI原生应用领域多租户技术架构深度剖析元数据框架标题：AI原生应用多租户技术架构：从隔离性到智能化的分层设计与实践关键词：AI原生应用、多租户架构、数据隔离、模型共享、云原生租户管理摘要：本文系统解析AI原生应用场景下多租户技术架构的核心设计逻辑，覆盖从数据层到模型层的全栈隔离与共享机制。通过第一性原理推导，结合云原生、机器学习生命周期管理（MLOps）等技术范式，提出包含租户上下文管理、动态资源
我们大多在食用二次知识――论知识的阶级性 Yo有灵L0
不论是《美丽新世界》，还是《未来简史》，对人类未来的预计都没有很美好。这其中包含了太多集权的观点。即：人类的绝大多数资源被极少数人所掌控，而绝大多数人沦为平庸。在《美丽新世界》里，阶级的划分直接由人为控制出生来决定；在《未来简史》里，当人们把越来越多的事情交给算法去处理之后，人类自身则降至被动的地位。这些看起来和知识不搭边？不，知识这条路，竟然也存在着阶级划分。这种阶级划分，有自身的因素，也有环境
React 英语打地鼠游戏——一个寓教于乐的英语学习游戏伍哥的传说前端源码分享 react.js 游戏学习
英语打地鼠游戏一个寓教于乐的英语学习游戏，通过经典的打地鼠玩法帮助用户学习英语单词。✨项目特色游戏化学习经典打地鼠玩法：6个洞穴，听英文选单词即时反馈：答对/答错立即语音提示计分系统：每答对一题得10分，激发学习动力60秒限时：紧张刺激的游戏节奏多媒体体验双语语音播报：英文单词标准发音+中文反馈流畅动画效果：基于Anime.js的精美动画响应式设计：支持手机、平板、电脑多端适配丰富词库多主题分类：
2020.12.15 周二早评缠论悟道
#财经##股票##缠论股票投资#2020.12.15周二早评上证指数30F回调走势中。5F下跌中枢构建中，关键区间3384~3387，如遇阻力不能突破，将迎接新一轮下跌！今日操作：1.高开：第一压力位3387，第二压力3403，第三压力位3428。2.低开：第一支撑位3344，第二支撑位3291，第三支撑位3202。完全分类：1.1F反弹回到3357，发生中枢扩展，形成5F下跌中枢，随后将跌破33
Python爬虫实战：批量下载小红书笔记图片的全流程技术解析 Python爬虫项目 2025年爬虫实战项目 python 爬虫笔记开发语言音视频 github
1.引言：为什么要爬取小红书笔记图片小红书作为新兴的生活方式分享平台，聚集了大量高质量原创笔记内容，涵盖时尚、美妆、旅游、美食等多领域。笔记中的图片往往是内容的核心，批量下载小红书笔记图片，有助于：内容归档与备份数据分析与用户行为研究图像识别与机器学习训练电商推广及内容再加工但小红书对内容保护做得较好，爬取难度较高，需要结合多技术手段突破。2.小红书平台特点与爬取难点动态加载与API接口多变：页面
Python游戏开发实战：打造高仿俄罗斯方块掌机坦克大战
引言在那个电子游戏刚刚兴起的年代，俄罗斯方块掌机上的坦克大战承载着无数玩家的童年记忆。简单的像素画面、紧张刺激的战斗、精准的操作反馈，这些元素构成了一个经典的游戏体验。今天，我们将用Python和pygame库来重新诠释这个经典游戏，不仅要还原其精髓，更要在技术实现上进行创新和优化。这个项目不仅仅是一个简单的游戏复刻，更是一次完整的游戏开发实践。从游戏架构设计到用户体验优化，从碰撞检测算法到动态难
【华为od刷题（C++）】HJ89 24点运算 m0_64866459 华为od c++开发语言
我的代码：#include//包含了如排序、排列等常用算法#include//用于输入输出操作#include//无序映射，用于将扑克牌的字符映射到对应的数字#include//动态数组，用于存储输入的扑克牌usingnamespacestd;charops[4]={'+','-','*','/'};//这是一个操作符数组，包含了四个基本的数学运算符：加、减、乘、除unordered_mapmap
人脸识别实战：使用Python OpenCV 和深度学习进行人脸识别(2)
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
揭秘FloodFill算法：图像填充利器 KENYCHEN奉孝 python实践大全算法 python 开发工具
FloodFill算法概述FloodFill是一种用于填充连通区域的算法，常用于图像处理、绘图工具（如“油漆桶”工具）和迷宫求解等场景。其核心思想是从一个起始点出发，向四周（四邻域或八邻域）扩展，直到遇到边界或满足停止条件。算法原理连通性定义：根据需求选择四邻域（上、下、左、右）或八邻域（包含对角线方向）作为填充方向。边界条件：填充需在指定区域内进行，遇到边界颜色或特定标记时停止。实现方法递归实现
【算法300题】：双指针
双指针板块925.长按键入leetcode链接你的朋友正在使用键盘输入他的名字name。偶尔，在键入字符c时，按键可能会被长按，而字符可能被输入1次或多次。你将会检查键盘输入的字符typed。如果它对应的可能是你的朋友的名字（其中一些字符可能被长按），那么就返回True。思路这道题目只要是末尾的边界条件比较恶心一点classSolution{public:boolisLongPressedName
算法：floyd和高精度洛谷最短路 P1037 [NOIP 2002 普及组] 产生数健仙算法算法数据结构 c++
思路：因为某个数变成另一个数是单向的，并且一个数变成另一个数后还可以变，让我联想到图论的内容，一个数变成其他数就相当于这个数与另一个数有单向边，而且边之间的线路可以让一个数可能变成很多数，因为数据量很小，我就想到了floyd，就是我们用floyd做传递闭包，得出一个数可以变成哪些数，然后将每个位看一遍，乘起来就是答案，不过这里有个小坑，答案超过了2的64次方，所以还要高精度算法处理一下。代码：#i
算法：动态规划洛谷 P8776 [蓝桥杯 2022 省 A] 最长不下降子序列健仙算法动态规划蓝桥杯
思路：首先，这题你得先会（nlogn）复杂度的求最长不下降子序列方法。我们可以直接让k个数从下标为1开始，滑动到末端，这k个数就不用看它，因为我们把他设置成k个数后面的数，所以答案先加上k，然后我们看预处理每一个数从他开始（包括这个数）后面的最长不下降子序列，把长度放入b数组中，这样我们答案就是k加上b【k+1】，然后我们看k前面的数，k前面的数不是让答案加上前面的最长不下降子序列，因为此时我们有
算法竞赛备赛——【图论】求最短路径——Floyd算法 Aurora_wmroy 算法竞赛备赛算法图论 c++蓝桥杯数据结构
floyd算法基于动态规划应用：求多源最短路时间复杂度：n^3dijkstra：不能解决负边权floyd：能解决负边权不能解决负边权回路问题求最短路径：dijkstrabfsfloyd思路1.让任意两点之间的距离变短：引入中转点k通过k来中转i---->k---->jj2.找状态：n个点都可以做中转点的情况下，i到j之间的最短路径的长度是x最终状态：dp[n][i][j]=x;中间状态：dp[k]
《[系统底层攻坚] 张冬〈大话存储终极版〉精读计划启动——存储架构原理深度拆解之旅》-系统性学习笔记（适合小白与IT工作人员）谢郎Kobe 大活存储学习架构云计算硬件架构大数据
致所有存储技术探索者笔者近期将系统攻克存储领域经典巨作——张冬老师编著的《大话存储终极版》。这部近千页的存储系统圣经，以庖丁解牛的方式剖析了：存储硬件底层架构、分布式存储核心算法、超融合系统设计哲学等等。喜欢研究数据存储或者工作应用到存储的小伙伴，可以学习这本书。如果想利用碎片时间学习，也可以持续关注一下笔者不定期的章节解析。现在本人将此书的目录结构整理如下，未来笔者将按照顺序不定期更新【学习笔记
颠覆性的货币时代来了！千城攻略“主权资产货币系统”面世笔记侠
2020年7月7日，深圳千城攻略算法云技术有限公司与重塑布雷顿森林体系委员会云签约，成为面向央行提供服务的主权货币技术核心成员。重塑布雷顿森林委员会执行董事MarcUzan先生、千城攻略首席算法官郑志军先生出席签约仪式。与比特币、Libra完全不一样，千城攻略颠覆了长期以来根深蒂固的“主权信用货币”体制观念，推出了“主权资产货币”，由于其有着非常严谨科学的全新经济学理论和货币理论系统支撑，并且解决
【机器学习】必会降维算法之：独立成分分析（ICA） Carl_奕然机器学习算法人工智能
独立成分分析（ICA）1、引言2、独立成分分析（ICA）2.0引言2.1定义2.2应用场景2.3核心原理2.4实现方式2.5算法公式2.6代码示例3、总结1、引言小屌丝：鱼哥，最近胡塞武装很哇塞啊。小鱼：你什么时候开始关注军事了？小屌丝：这…还用关注吗？都上新闻了。小鱼：嗯，那你知道胡塞武装为什么这么厉害吗？小屌丝：额…当然是光脚不怕穿鞋的。小鱼：…你可真是…小屌丝：真是啥？小鱼：一个字，自己体会
数字滤波器原理及应用借助matlab,数字滤波器原理及应用（借助Matlab）陈慈龙数字滤波器原理及应用借助matlab
第l章数字信号处理引言1．1引言1．2数字信号处理起源1．3信号域1．4信号分类1．5DStP：一个学科第2章采样原理2．1引言2．2第l章数字信号处理引言1．1引言1．2数字信号处理起源1．3信号域1．4信号分类1．5DStP：一个学科第2章采样原理2．1引言2．2香农采样原理2．3信号重构2．4香农插值2．5采样方法2．6多通道采样2．7MATLAB音频选项第3章混叠3．1引言3．2混叠3．3
ica算法c语言,独立成分分析(ICA)的模拟实验(R语言) weixin_39632212 ica算法c语言
本笔记是ESL14.7节图14.42的模拟过程。第一部分将以ProDenICA法为例试图介绍ICA的整个计算过程；第二部分将比较ProDenICA、FastICA以及KernelICA这种方法，试图重现图14.42。ICA的模拟过程生成数据首先我们得有一组独立(ICA的前提条件)分布的数据$S$(未知)，然后经过矩阵$A_0$混合之后得到实际的观测值$X$，即$$X=SA_0$$也可以写成$$S=
列梅兹remez算法求解最佳一致逼近多项式(C语言实现) landcruiser007 计算方法计算方法数值分析列梅兹算法
//remzf.h//实现remez算法#include#includevoidremz(a,b,p,n,eps,f)intn;doublea,b,eps,p[],(*f)(double);{inti,j,k,m;doublex[21],g[21],d,t,u,s,xx,x0,h,yy;if(n>20)n=20;//逼近多项式的最高次数为19m=n+1;d=1.0e+35;for(k=0;k<=n
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用青云交大数据新视界 Java 大视界 java 大数据机器学习情绪分析智能投资多源数据
Java大视界--Java大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用）引言：正文：一、金融情绪数据的立体化采集与治理1.1多模态数据采集架构1.2数据治理与特征工程二、Java机器学习模型的工程化实践2.1情感分析模型的深度优化2.2强化学习驱动的动态投资策略三、顶级机构实战：Java系统的金融炼金术四、技术前沿：Java与金融科技的未来融合4.1量子机器学习集成4.2联邦学习在合
Java数据结构与算法(爬楼梯动态规划) 盘门 java数据结构与算法实战 java 动态规划开发语言
前言爬楼梯就是一个斐波那契数列问题，采用动态规划是最合适不过的。实现原理初始化:dp[0]=1;dp[1]=2;转移方程：dp[i]=dp[i-1]+d[i-2];边界条件:无具体代码实现classSolution{publicintclimbStairs(intn){if(n==1){return1;}int[]dp=newint[n];dp[0]=1;dp[1]=2;for(inti=2;i<
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL