浅若清风cyf

python实现三种经典决策树算法

决策树实现ID3、C4.5、CART算法

Author: 浅若清风cyf
Date: 2020/12/15

一、创建数据集

手动

def createDataSet():
    """
    创建测试的数据集
    :return:
    """
    dataSet = [
        # 1
        ['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'],
        # 2
        ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '好瓜'],
        # 3
        ['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'],
        # 4
        ['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '好瓜'],
        # 5
        ['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'],
        # 6
        ['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', '好瓜'],
        # 7
        ['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', '好瓜'],
        # 8
        ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', '好瓜'],

        # ----------------------------------------------------
        # 9
        ['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', '坏瓜'],
        # 10
        ['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', '坏瓜'],
        # 11
        ['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', '坏瓜'],
        # 12
        ['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', '坏瓜'],
        # 13
        ['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', '坏瓜'],
        # 14
        ['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', '坏瓜'],
        # 15
        ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', '坏瓜'],
        # 16
        ['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', '坏瓜'],
        # 17
        ['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', '坏瓜']
    ]

    # 特征值列表
    labels = ['色泽', '根蒂', '敲击', '纹理', '脐部', '触感']

    # 特征对应的所有可能的情况
    labels_full = {
     }

    for i in range(len(labels)):
        labelList = [example[i] for example in dataSet]
        uniqueLabel = set(labelList)
        labels_full[labels[i]] = uniqueLabel

    return dataSet, labels, labels_full

dataSet, labels, labels_full=createDataSet()
print(dataSet)
print(labels)
print(labels_full)

[['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'], ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '好瓜'], ['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'], ['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '好瓜'], ['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'], ['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', '好瓜'], ['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', '好瓜'], ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', '好瓜'], ['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', '坏瓜'], ['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', '坏瓜'], ['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', '坏瓜'], ['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', '坏瓜'], ['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', '坏瓜'], ['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', '坏瓜'], ['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', '坏瓜'], ['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', '坏瓜'], ['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', '坏瓜']]
['色泽', '根蒂', '敲击', '纹理', '脐部', '触感']
{'色泽': {'青绿', '乌黑', '浅白'}, '根蒂': {'硬挺', '蜷缩', '稍蜷'}, '敲击': {'浊响', '清脆', '沉闷'}, '纹理': {'稍糊', '清晰', '模糊'}, '脐部': {'凹陷', '稍凹', '平坦'}, '触感': {'软粘', '硬滑'}}

从文件读取

import numpy as np
import pandas as pd
# df=pd.read_excel("./watermelon20.xlsx")
# df.to_csv('./watermelon20.csv',index=False)
df=pd.read_csv('./watermelon20.csv')
print(df)
# 属性集合
attr=df.columns.values.tolist()[1:]
data_org=np.array(df[attr])
# static_attr=df.columns.values.tolist()[1:]#这里的属性 不改变，仅仅作为索引
print(attr)
print(len(attr))
print(data_org.shape)
print(data_org)

# print(static_attr)

    编号  色泽  根蒂  敲声  纹理  脐部  触感 好瓜
0    1  青绿  蜷缩  浊响  清晰  凹陷  硬滑  是
1    2  乌黑  蜷缩  沉闷  清晰  凹陷  硬滑  是
2    3  乌黑  蜷缩  浊响  清晰  凹陷  硬滑  是
3    4  青绿  蜷缩  沉闷  清晰  凹陷  硬滑  是
4    5  浅白  蜷缩  浊响  清晰  凹陷  硬滑  是
5    6  青绿  稍蜷  浊响  清晰  稍凹  软粘  是
6    7  乌黑  稍蜷  浊响  稍糊  稍凹  软粘  是
7    8  乌黑  稍蜷  浊响  清晰  稍凹  硬滑  是
8    9  乌黑  稍蜷  沉闷  稍糊  稍凹  硬滑  否
9   10  青绿  硬挺  清脆  清晰  平坦  软粘  否
10  11  浅白  硬挺  清脆  模糊  平坦  硬滑  否
11  12  浅白  蜷缩  浊响  模糊  平坦  软粘  否
12  13  青绿  稍蜷  浊响  稍糊  凹陷  硬滑  否
13  14  浅白  稍蜷  沉闷  稍糊  凹陷  硬滑  否
14  15  乌黑  稍蜷  浊响  清晰  稍凹  软粘  否
15  16  浅白  蜷缩  浊响  模糊  平坦  硬滑  否
16  17  青绿  蜷缩  沉闷  稍糊  稍凹  硬滑  否
['色泽', '根蒂', '敲声', '纹理', '脐部', '触感', '好瓜']
7
(17, 7)
[['青绿' '蜷缩' '浊响' '清晰' '凹陷' '硬滑' '是']
 ['乌黑' '蜷缩' '沉闷' '清晰' '凹陷' '硬滑' '是']
 ['乌黑' '蜷缩' '浊响' '清晰' '凹陷' '硬滑' '是']
 ['青绿' '蜷缩' '沉闷' '清晰' '凹陷' '硬滑' '是']
 ['浅白' '蜷缩' '浊响' '清晰' '凹陷' '硬滑' '是']
 ['青绿' '稍蜷' '浊响' '清晰' '稍凹' '软粘' '是']
 ['乌黑' '稍蜷' '浊响' '稍糊' '稍凹' '软粘' '是']
 ['乌黑' '稍蜷' '浊响' '清晰' '稍凹' '硬滑' '是']
 ['乌黑' '稍蜷' '沉闷' '稍糊' '稍凹' '硬滑' '否']
 ['青绿' '硬挺' '清脆' '清晰' '平坦' '软粘' '否']
 ['浅白' '硬挺' '清脆' '模糊' '平坦' '硬滑' '否']
 ['浅白' '蜷缩' '浊响' '模糊' '平坦' '软粘' '否']
 ['青绿' '稍蜷' '浊响' '稍糊' '凹陷' '硬滑' '否']
 ['浅白' '稍蜷' '沉闷' '稍糊' '凹陷' '硬滑' '否']
 ['乌黑' '稍蜷' '浊响' '清晰' '稍凹' '软粘' '否']
 ['浅白' '蜷缩' '浊响' '模糊' '平坦' '硬滑' '否']
 ['青绿' '蜷缩' '沉闷' '稍糊' '稍凹' '硬滑' '否']]

决策树结构【ID3】

# 决策树结构：【字典的多重嵌套】
{
     
        "纹理": {
     
                "稍糊": {
     
                        "触感": {
     
                                "硬滑": "否",
                                "软粘": "是"
                        }
                },
                "清晰": {
     
                        "根蒂": {
     
                                "蜷缩": "是",
                                "硬挺": "否",
                                "稍蜷": {
     
                                        "色泽": {
     
                                                "青绿": "是",
                                                "浅白": "是",
                                                "乌黑": {
     
                                                        "触感": {
     
                                                                "硬滑": "是",
                                                                "软粘": "否"
                                                        }
                                                }
                                        }
                                }
                        }
                },
                "模糊": "否"
        }
}

决策树结构【C4.5】

决策树结构【CART】

{
     
        "清晰": {
     
                "yes": {
     
                        "硬滑": {
     
                                "yes": "是",
                                "no": {
     
                                        "青绿": {
     
                                                "yes": {
     
                                                        "稍蜷": {
     
                                                                "yes": "是",
                                                                "no": "否"
                                                        }
                                                },
                                                "no": "否"
                                        }
                                }
                        }
                },
                "no": {
     
                        "乌黑": {
     
                                "yes": {
     
                                        "浊响": {
     
                                                "yes": "是",
                                                "no": "否"
                                        }
                                },
                                "no": "否"
                        }
                }
        }
}

可视化结果【ID3】

import matplotlib.pyplot as plt
import numpy as np
fig=plt.figure(figsize=(12,8))
img=plt.imread('./决策树正确结果.jpg')
plt.imshow(img)
plt.axis('off')
plt.show()

算法伪代码

fig=plt.figure(figsize=(16,10))
img=plt.imread('./决策树算法流程.jpg')
plt.imshow(np.uint8(img))
plt.axis('off')
plt.show()

ID3：信息增益

fig=plt.figure(figsize=(16,12))
img=plt.imread('./决策树ID3-信息增益.jpg')
plt.imshow(img)
plt.axis('off')
plt.show()

C4.5：增益率

fig=plt.figure(figsize=(16,14))
img=plt.imread('./决策树C4.5-增益率.jpg')
plt.imshow(img)
plt.axis('off')
plt.show()

CART：基尼指数

fig=plt.figure(figsize=(16,12))
img=plt.imread('./决策树CART-基尼指数.jpg')
plt.imshow(img)
plt.axis('off')
plt.show()

完整代码

import numpy as np
import pandas as pd
from collections import Counter
import pprint
import json

class DecisionTree():
    D = None  # 数据集
    attribute_list = None  # 属性集
    attribute_value_list = dict()  # 属性集对应取值集合
    tree = None  # 决策树【Notice: 字典类型是引用传值，因此需要在init中再初始化它，否则对这个类创建多个对象是该成员变量会指向同一个地址，导致数据会叠加在一起】

    def __init__(self):  # 构造函数：自动加载数据集
        self.tree=dict()
        df = pd.read_csv('./watermelon20.csv')
        # 属性集合
        self.attribute_list = df.columns.values.tolist()[1:]
        # 数据集（过滤掉编号）
        self.D = np.array(df[self.attribute_list])
        # 获取每个属性的每个属性值
        for i in range(len(self.attribute_list)):
            self.attribute_value_list[self.attribute_list[i]] = set(df[self.attribute_list[i]])
        # 去除类别
        self.attribute_list = self.attribute_list[:-1]

    # 判断集合是否属于同一个类别C【是则设为叶结点，标记为类别C】
    def isSameLabel(self, D):
        labels = [D[i][-1] for i in range(len(D))]  # 取出每个样本的标签
        return len(set(labels)) == 1  # 属于同一个类别则labels集合元素数量为1，返回True

    # 判断数据集中的所有属性上的取值是否相同【相同的话设为叶结点，并标记为类别多的类别】
    def isEmptyOrSameAttribute(self, D, attribute_list):
        if len(attribute_list) == 0:
            print("所有属性划分完，无法继续划分，设为叶结点")
            # print("len(attribute_list) == 0")
            return True
        else:
            attribute_index_list = []
            for i in attribute_list:
                attribute_index_list.append(self.attribute_list.index(i))
            subset_D = D[:, np.array(attribute_index_list)]
            for i in range(1, subset_D.shape[0]):
                if (subset_D[0] == subset_D[i]).all():
                    pass
                else:
                    return False
        print("所有样本的所有属性相同，无法划分")
        return True

    # 计算信息熵
    def Ent(self, D):
        labels = D[:, -1]
        count_result = Counter(labels)
        # 统计每个标签的频数
        labels_count = np.array(list(count_result.values()))
        p = labels_count / D.shape[0]
        # 计算信息熵
        ent = -1 * np.sum(p * np.log2(p))
        return ent

    # 计算信息增益
    def Gain(self, D, attribute):
        # 统计属性attribute的每个取值的样本数
        attribute_values = np.squeeze(D[:, self.attribute_list.index(attribute)])  # 获取每个样本在属性attribute上的取值
        attribute_keys = np.array(list(set(list(attribute_values))))  # 获取所有属性值
        D_split = []
        for i in range(attribute_keys.shape[0]):
            mask = (attribute_values == attribute_keys[i])
            D_split.append(D[mask])  # 按照属性 attribute每个取值划分数据集
        D_split = np.array(D_split)
        # 计算每个属性值的信息熵
        ent_list = []
        attribute_i_count_list = []
        for i in range(D_split.shape[0]):
            ent_list.append(self.Ent(D_split[i]))
            attribute_i_count_list.append(D_split[i].shape[0])
        ent_list = np.array(ent_list)
        attribute_i_count_list = np.array(attribute_i_count_list)
        # 计算信息增益
        gain = self.Ent(D) - np.sum(attribute_i_count_list / D.shape[0] * ent_list)
        return gain

    # 计算增益率
    def Gain_ratio(self, D, attribute):
        D_attribute_values = np.squeeze(D[:, self.attribute_list.index(attribute)])  # 获取每个样本在属性attribute上的取值
        count_result=Counter(D_attribute_values)
        attribute_i_count_list=np.array(list(count_result.values()))
        IV=-1*np.sum(attribute_i_count_list/D.shape[0]*np.log2(attribute_i_count_list/D.shape[0]))
        gain_ratio=self.Gain(D,attribute)/IV
        return gain_ratio

    # 计算基尼值【数据集D的不纯度】
    def Gini(self,D):
        # 获取集合D的标签
        D_labels=D[:, -1]
        count_result = Counter(D_labels)
        # 统计每个标签的频数
        labels_count = np.array(list(count_result.values()))
        p = labels_count / D.shape[0]
        return 1-np.sum(p*p)
    
    # 计算基尼指数【计算属性attribute中按照某个属性划分得到的两个集合（二叉树）的基尼系数最小的作为划分属性】
    def Gini_index(self,D,attribute):
        # 获取样本集D在属性attribute上的取值
        D_attribute_values = np.squeeze(D[:, self.attribute_list.index(attribute)])  # 获取每个样本在属性attribute上的取值
        # 统计每个属性值的样本数【字典】
        count_result=Counter(D_attribute_values)
        # 统计属性的所有取值【转换成数组】
        attribute_keys=np.array(list(count_result.keys()))
#         attribute_values_count_list=np.array(list(count_result.values()))
        # 按照不同属性值划分数据集【是/否】【CART算法是划分为二叉树，而不是多叉树】
        gini_index_list=[]
        for i in range(attribute_keys.shape[0]):
            D_split=[]
            D_split_count=[]
            mask = (D_attribute_values == attribute_keys[i])
            D_split.append(D[mask])  # 取值与属性值相同：是
            D_split.append(D[(1-mask).astype('bool')]) 
            D_split = np.array(D_split)
            D_split_count.append(D_split[0].shape[0])
            D_split_count.append(D_split[1].shape[0])
            D_split_count=np.array(D_split_count)
            # 计算按照该属性值划分后的Gini值
            gini_list=[]
            for i in range(D_split.shape[0]):
                gini_list.append(self.Gini(D_split[i]))
            gini_list = np.array(gini_list)
            # 计算基尼指数
            gini_index = np.sum(D_split_count / D.shape[0] * gini_list)  # D.shape[0]==2
            gini_index_list.append(gini_index)
        # 选择最小的基尼指数作为属性attribute的基尼指数
        gini_index_list=np.array(gini_index_list)
        gini_index_min=np.min(gini_index_list)
        gini_index_min_attribute_value=attribute_keys[np.argmin(gini_index_list)]
        return gini_index_min,gini_index_min_attribute_value
        

    # 计算最优划分属性
    def get_bestAttribute(self, D, attribute_list, alg='ID3'):
        '''
        Notice: ID3和C4.5算法执行次函数有一个返回值，而CART算法有两个返回值
        '''
        if alg == 'ID3':
            best = attribute_list[0]
            max_gain = 0
            for i in attribute_list:
                gain_i = self.Gain(D, i)
                if gain_i > max_gain:
                    best = i
                    max_gain = gain_i
            # print('best=', best, 'max_gain=', max_gain)
            return best
        elif alg == 'C4.5':
            # 增益率准则对可取值数目较少的属性有所偏好，C4.5算法并不是直接选择增益率最大的候选划分属性，
            # 而是使用一个启发式：先从候选划分属性中找出信息增益高于平均水平的属性，再从中选择增益率最高的
            gain_list=[]
            for i in attribute_list:
                gain_list.append(self.Gain(D,i))
            gain_list=np.array(gain_list)
            gain_mean=np.mean(gain_list)
            attribute_chosen=np.array(attribute_list)[gain_list>=gain_mean]  # 注意要加=，当只有一个属性值或者所有属性增益率相同时，没有属性的增益率大于平均值
            gain_rate_list=[]
            for i in attribute_chosen:
                gain_rate_list.append(self.Gain_ratio(D,i))
            gain_rate_list=np.array(gain_rate_list)
            best = attribute_chosen[np.argmax(gain_rate_list)]
            return best
        elif alg=='CART':
            # 基尼值Gini(D)反映了从数据集D中随机抽取两个样本，其类别标记不一致的概率，因此，Gini(D)值越小，数据集D的纯度越高
            # 在属性集中选择划分后基尼指数最小的属性作为最优属性
            gini_index_list=[]
            gini_index_attribute_value_list=[]
            for i in attribute_list:
                gini_index_min,gini_index_min_attribute_value=self.Gini_index(D,i)
                gini_index_list.append(gini_index_min)
                gini_index_attribute_value_list.append(gini_index_min_attribute_value)
            gini_index_list=np.array(gini_index_list)
            gini_index_attribute_value_list=np.array(gini_index_attribute_value_list)
            
            best_attribute_idx=np.argmin(gini_index_list)
            return attribute_list[best_attribute_idx],gini_index_attribute_value_list[best_attribute_idx]
            
        else:
            raise Exception("请选择合法的划分属性选优算法！")

    # 构建决策树tree【这里树结构采用嵌套的字典类型】
    def createTree(self, tree, D, attributes,alg='ID3'):
        attribute_list = attributes.copy()
        # 判断数据集是否属于同一个类别【不用再划分】
        if self.isSameLabel(D):
            return D[0][-1]

        if self.isEmptyOrSameAttribute(D, attribute_list):
            # 获取样本数多的类
            labels = D[:, -1]  # 获取所有样本的标签
            labels_set = set(list(np.squeeze(labels)))  # 获取标签集合
            labels_dict = dict()  # 获取每个标签对应的样本
            for i in labels_set:  # 初始化
                labels_dict[i] = 0
            for i in range(D.shape[0]):  # 统计每个标签的样本数
                labels_dict[D[i][-1]] += 1
            keys = list(labels_dict.keys())
            values = list(labels_dict.values())
            return keys[np.argmax(values)]

        if alg=='ID3' or alg=='C4.5':
            # 选择最优划分属性【选择后需要在属性集中取出该属性再进行递归】
            best_attribute = self.get_bestAttribute(D, attribute_list, alg=alg)

            # 属性集取出最优属性，进行下一轮递归
            attribute_list.remove(best_attribute)
            # 获取数据集在最优属性上的所有取值
            attribute_values = self.attribute_value_list[best_attribute] 

            # 按照最优属性的每个值划分数据集
            D_attribute_values = np.squeeze(D[:, self.attribute_list.index(best_attribute)])  # 获取每个样本在属性attribute上的取值
            D_split = dict()
            # 按每个取值划分数据集
            for i in attribute_values:
                mask = (D_attribute_values == i)
                D_split[i] = D[mask]  # 按照属性 attribute每个取值划分数据集

            # 对最优属性的每个取值进行遍历
            subTree = dict()

            tree[best_attribute] = dict()
            for i in attribute_values:
                if D_split[i].shape[0] == 0:  # 该属性上没有样本，根据父结点的样本分布作为当前结点的样本分布
                    labels=D[:,-1]
                    result=Counter(labels)
                    result_keys=list(result.keys())
                    result_values=list(result.values())
                    label=result_keys[np.argmax(result_values)]
                    subTree[i]=label
                    continue
                subTree[i] = self.createTree(tree[best_attribute], D_split[i], attribute_list,alg=alg)
            
            tree[best_attribute] = subTree
            node=dict()    # 需要单独创建一个结点，而不能直接返回subTree或tree，会导致子节点为None
            node[best_attribute]=subTree
            return node  # 当某个属性值还需划分时，返回子树，否则该属性值的value为None
        elif alg=='CART':
            # 选择最优划分属性和最优属性值【CART算法与ID3和C4.5不同，CART算法使用属性值按是否相等划分成二叉树】
            best_attribute,best_attribute_value = self.get_bestAttribute(D, attribute_list, alg=alg)

            # CART算法的属性可以重复使用
#             attribute_list.remove(best_attribute)
            # 获取数据集在最优属性上的所有取值
#             attribute_values = self.attribute_value_list[best_attribute] 

            # 按照最优属性值划分成两个子数据集
            D_attribute_values = np.squeeze(D[:, self.attribute_list.index(best_attribute)])  # 获取每个样本在属性attribute上的取值
            D_split = dict()
            # 按照最优属性值划分数据集
            mask = (D_attribute_values == best_attribute_value)
            D_split['yes'] = D[mask]  
            D_split['no'] = D[(1-mask).astype('bool')]

            # 对最优属性的每个取值进行遍历
            subTree = dict()

            tree[best_attribute_value] = dict()
            attribute_values=['yes','no']
        
            for i in attribute_values:                    
                subTree[i] = self.createTree(tree[best_attribute_value], D_split[i], attribute_list,alg=alg)
                
            tree[best_attribute_value] = subTree

            node=dict()    # 需要单独创建一个结点，而不能直接返回subTree或tree，会导致子节点为None
            node[best_attribute_value]=subTree
            return node  # 当某个属性值还需划分时，返回子树，否则该属性值的value为None

    # 构建决策树
    def build(self,alg='ID3'):
        self.createTree(self.tree, self.D, self.attribute_list,alg=alg)

    # 可视化决策树【递归输出】
    def show(self,tree,blank):
        if type(tree)!=type(self.tree):
            return
        keys=list(tree.keys())
        for i in keys:
            for t in range(blank):
                print('\t', end='')
            print('{',i,':')
            self.show(tree[i],blank+1)
            if type(tree[i])!=type(self.tree):  # 是否为叶结点
                for t in range(blank + 1):
                    print('\t', end='')
                print(tree[i])
            for t in range(blank):
                print('\t', end='')
            print('}')
            
    # 可视化决策树【调包pprint】
    def showTreeDict(self):
        pprint.pprint(self.tree)

    # 可视化决策树【调包json】    
    def showTreeDictJson(self):
        js=json.dumps(self.tree,indent=8,ensure_ascii=False)
        print(js)
    
    # 使用ID3/C4.5生成的决策树进行判断
    def decision(self,sample):
        print("输入样本：",sample)
        attribute=list(self.tree.keys())[0]  # '纹理'
        tree=self.tree
        while True:
            if type(tree)==type(self.tree):
                tree = tree[attribute]
                tree=tree[sample[self.attribute_list.index(attribute)]]
                if type(tree)==type(self.tree):
                    attribute=list(tree.keys())[0]
            else:
                print("识别结果：",end='')
                print('好瓜') if tree=='是' else print("坏瓜")
                break
    
    # 使用CART生成的决策树进行判断
    def decision_CART(self,sample):
        print("输入样本：",sample)
        attribute=list(self.tree.keys())[0]  # '纹理'
        tree=self.tree
        while True:
            if type(tree)==type(self.tree):
                # 获取树的key
                attribute_value=list(tree.keys())[0]
                # 检索对应的属性
                attribute_idx=-1
                attribute_value_set=set()
                attribute_value_set.add(attribute_value)
                for i in self.attribute_list:
                    if attribute_value_set.issubset(self.attribute_value_list[i]):
                        attribute_idx=self.attribute_list.index(i)
                        print(i)
                        break
                if attribute_idx==-1:
                    raise Exception("Can't find the attribute of {}".format(attribute_value))
                # 判断样本该属性值是否与决策树的属性值相等
                attribute_value_equal=(attribute_value==sample[attribute_idx])
                tree=tree[attribute_value]
                if attribute_value_equal:
                    tree=tree['yes']
                else:
                    tree=tree['no']
            else:
                print("识别结果：",end='')
                print('好瓜') if tree=='是' else print("坏瓜")
                break

dt=DecisionTree()
dt.build(alg='ID3')
dt.showTreeDictJson()
dt.decision(dt.D[0][:-1])

{
        "纹理": {
                "模糊": "否",
                "稍糊": {
                        "触感": {
                                "软粘": "是",
                                "硬滑": "否"
                        }
                },
                "清晰": {
                        "根蒂": {
                                "硬挺": "否",
                                "蜷缩": "是",
                                "稍蜷": {
                                        "色泽": {
                                                "乌黑": {
                                                        "触感": {
                                                                "软粘": "否",
                                                                "硬滑": "是"
                                                        }
                                                },
                                                "青绿": "是",
                                                "浅白": "是"
                                        }
                                }
                        }
                }
        }
}
输入样本： ['青绿' '蜷缩' '浊响' '清晰' '凹陷' '硬滑']
识别结果：好瓜

dt=DecisionTree()
dt.build(alg='C4.5')
dt.showTreeDictJson()
dt.decision(dt.D[0][:-1])

{
        "纹理": {
                "模糊": "否",
                "稍糊": {
                        "触感": {
                                "软粘": "是",
                                "硬滑": "否"
                        }
                },
                "清晰": {
                        "触感": {
                                "软粘": {
                                        "色泽": {
                                                "乌黑": "否",
                                                "青绿": {
                                                        "根蒂": {
                                                                "硬挺": "否",
                                                                "蜷缩": "是",
                                                                "稍蜷": "是"
                                                        }
                                                },
                                                "浅白": "否"
                                        }
                                },
                                "硬滑": "是"
                        }
                }
        }
}
输入样本： ['青绿' '蜷缩' '浊响' '清晰' '凹陷' '硬滑']
识别结果：好瓜

dt=DecisionTree()
dt.build(alg='CART')
# pprint.pprint(dt.tree)
# dt.show(dt.tree,0)
dt.showTreeDictJson()
dt.decision_CART(dt.D[0][:-1])

{
        "清晰": {
                "yes": {
                        "硬滑": {
                                "yes": "是",
                                "no": {
                                        "青绿": {
                                                "yes": {
                                                        "稍蜷": {
                                                                "yes": "是",
                                                                "no": "否"
                                                        }
                                                },
                                                "no": "否"
                                        }
                                }
                        }
                },
                "no": {
                        "乌黑": {
                                "yes": {
                                        "浊响": {
                                                "yes": "是",
                                                "no": "否"
                                        }
                                },
                                "no": "否"
                        }
                }
        }
}
输入样本： ['青绿' '蜷缩' '浊响' '清晰' '凹陷' '硬滑']
纹理
触感
识别结果：好瓜

谨以此纪念《数据挖掘与机器学习》课程期末考试手算ID3决策树！o(╥﹏╥)o ——2021.1.21

应用程序性能优化：从操作系统到算法的全方位攻略 Spring_java_gg 性能优化性能优化算法
作为一名应用程序性能优化专家，我将带你踏上一段生动有趣的旅程，探索如何从操作系统、编程语言、数据库和算法四个方面提升你的应用性能。准备好了吗？让我们开始吧！1.操作系统层面的优化想象一下，操作系统就像是一个大型的调度中心，负责管理所有的资源和任务。为了让这个调度中心更加高效，我们可以采取以下措施：合理配置内核参数：调整操作系统的内核参数，如文件描述符限制、网络缓冲区大小等，可以显著提高应用的响应速
Python实例题：简单的聊天机器人狐凄实例 python 开发语言
目录Python实例题题目要求：解题思路：代码实现：Python实例题题目简单的聊天机器人要求：实现一个基于规则的聊天机器人，支持简单问答和对话。支持以下功能：问候语识别与回应天气查询（模拟）时间/日期查询简单数学计算随机笑话生成添加对话历史记录功能，可随时查看。支持退出对话的指令。解题思路：使用关键词匹配实现简单的问答逻辑。利用Python内置模块处理时间、数学计算等功能。维护对话历史列表存储交
VScode 里面使用 python 去直接调用 CUDA NeRF_er python vscode pytorch
上一个帖子主要分享了如何去将C++程序打包成一个package。我们最后的目的实际上是想把CUDA的程序打包成一个Package，C++程序只是起到了桥梁的作用：首先：CUDA程序和C++的程序一样，都有一个.cu的源文件和一个.h的头文件。我们的文件包含Cpp文件组成，负责当作CUDA和Python的桥梁。还有对应的CUDA的源代码文件和头文件。将这个cpp文件命名成ext.cpp.#inclu
Spring AI 第二讲之 Chat Model API 第五节HuggingFace Chat
HuggingFaceInferenceEndpoints允许您在云中部署和提供机器学习模型，并通过API对其进行访问。开始使用有关HuggingFaceInferenceEndpoints的更多详细信息，请访问此处。前提条件添加spring-ai-huggingface依赖关系：org.springframework.aispring-ai-huggingface获取HuggingFaceAPI
贪心算法（GREEDY ALGORITHM）证明实践 m0_72431373 贪心算法算法 leetcode
基础概念贪心算法Formal的解释这里就不介绍了，有兴趣的直接去wikipedia上理解。简单地来说，贪心算法就是在某种规律下不断选取局部最优解，从而达到全局最优。《挑战程序设计竞赛》中有一个很直观的解释：一直向前！证明方法既然贪心算法是利用规律选取局部最优解，那么我们选取规律所得出的全局解就不一定是全局最优解。因此，我们需要证明，我们所选这个规律是可以得出一个全局最优解的。注意这里所谓的可以得出
Python 库包 sentence-transformers 音程机器学习人工智能 python 开发语言
sentence-transformers是一个非常流行的Python库，专门用于将文本（句子、段落、文档）转换为高质量的语义向量（嵌入）。它基于Transformer架构（如BERT、RoBERTa、DistilBERT等）的预训练模型，并在大量语义相似性数据上进行了微调，能够捕捉句子之间的深层语义关系。什么是sentence-transformers？项目地址：https://www.sber
【python】解决No module named _sqlite3的问题欧阳秦穆
环境版本说明：centos7python3.6.4django2.0在创建django项目时候。报错以下信息详细错误信息如下：原因：未安装sqlite模块解决：1安装sqlite-develyuminstallsqlite-devel2重新编译pythoncd/usr/local/python3.6.4./configuremakemakeinstall
SIMULINK开发项目实例 1000 例专栏之第663例：基于simulink的SVPWM技术的研究的三相电压源逆变器建模仿真 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 matlab simulink
目录准备工作步骤详解第一步：创建Simulink项目第二步：选择并添加合适的库组件第三步：构建基本的三相电压源逆变器模型第四步：实现SVPWM算法第五步：仿真与调试第六步：结果分析第七步：优化与改进第八步：导出与部署总结三相电压源逆变器（VoltageSourceInverter,VSI）在电力电子中是将直流电转换为交流电的一种重要设备，广泛应用于电机驱动、不间断电源（UPS）、可再生能源系统等领
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
构建智能企业知识管理平台：动态知识图谱与语义检索系统 AI天才研究院 Agentic AI 实战 AI大模型企业级应用开发实战 AI人工智能与大数据知识图谱人工智能 ai
构建智能企业知识管理平台：动态知识图谱与语义检索系统关键词：知识管理平台、动态知识图谱、语义检索、知识图谱构建、语义检索算法摘要：本文详细探讨了构建智能企业知识管理平台的核心技术，重点介绍了动态知识图谱和语义检索系统的原理与实现。通过分析知识图谱的构建方法和语义检索算法，结合实际案例，展示了如何利用这些技术提升企业的知识管理水平。文章内容包括背景介绍、核心概念、算法原理、系统架构设计、项目实战以及
DeepFM算法原理及应用场景
DeepFM（DeepFactorizationMachine）是一种结合了因子分解机（FactorizationMachines,FM）和深度神经网络（DNN）的混合模型，主要用于处理高维稀疏数据（如推荐系统中的点击率预测）。其核心思想是同时捕捉低阶（线性）和高阶（非线性）特征交互。1.算法原理模型结构如下：FM部分：负责捕捉低阶特征交互（如一阶和二阶特征组合）。一阶项：线性特征权重。二阶项：通
巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
大模型 AI智能体Coze知识库从使用到实战详解非著名架构师大模型知识文档人工智能 Coze知识库
一、Coze知识库核心价值解析1.1知识库技术架构创新Coze知识库采用四层混合架构设计，在2025年大模型应用中展现出独特优势：存储层：支持向量数据库（Qdrant）+图数据库（Neo4j）双引擎处理层：集成PDF/PPT/Excel等23种文件解析器检索层：混合检索算法（BM25+稠密检索+语义路由）应用层：RAG（检索增强生成）优化接口与传统方案相比，查询准确率提升42%，特别擅长处理：专业
Python Scrapy的爬虫中间件开发 AI天才研究院 python scrapy 爬虫 ai
PythonScrapy爬虫中间件开发：从原理到实战的深度解析关键词Scrapy中间件、爬虫扩展、请求响应处理、反爬绕过、中间件生命周期、钩子函数、分布式爬取摘要本文系统解析Scrapy爬虫中间件（SpiderMiddleware）的开发方法论，覆盖从基础概念到高级实践的全链路知识。通过第一性原理推导中间件的核心机制，结合层次化架构分析（理论→设计→实现→应用），提供生产级代码示例与可视化流程模型
使用Python将PDF转换成word、PPT wh3933 python pdf word
在现代企业环境中，文档格式的转换是一项普遍且关键的需求。PDF（PortableDocumentFormat）作为一种最终的、通常不可编辑的“打印”状态格式，被广泛用于分发和归档。然而，内容的创建、协作和修改主要在MicrosoftOffice套件中进行，特别是Word（DOCX）和PowerPoint（PPTX）。因此，以编程方式弥合这两种格式之间的鸿沟，已成为数据提取、内容迁移和工作流自动化领
Python实现文件移动到指定文件夹 wh3933 python java 前端
在Python中，将文件从一个位置移动到另一个位置是一项常见的操作。无论是整理下载、归档旧文件，还是在复杂的项目中管理文件结构，掌握文件移动的技巧都至关重要。本文将全面介绍在Python中移动文件的各种方法，并提供详尽的代码示例，帮助您轻松应对不同场景下的文件管理需求。核心方法：shutil.move()在Python标准库中，shutil模块提供了高级的文件操作功能，其中的shutil.move
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
python中使用pyinstaller将python项目打包为exe可执行文件不吃西红柿丿 python windows
1、安装pyinstallerpipinstallpyinstaller-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、打包应用2.1、使用命令行直接打包pyinstaller-F-w-iyour_path/log.icomain.py命令：-F将项目打包为单个exe文件，没有其它文件-D将项目打包为一个文件夹里面又有一个exe文件以及其它依赖，启动速度比-
如何解决pip安装报错ModuleNotFoundError: No module named ‘os’问题 lyzybbs 全栈Bug解决方案专栏 pip python pycharm 开发语言 pandas numpy beautifulsoup
【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘os’问题1.摘要在使用PyCharm2025的控制台执行pipinstall时，常常会遇到各种奇怪的安装失败或安装后仍然报ModuleNotFoundError的问题，例如“Nomodulenamed‘os’”。本文将从开发场景、环境
如何解决pip安装报错ModuleNotFoundError: No module named ‘sys’问题 lyzybbs 全栈Bug解决方案专栏 pip pycharm python pandas scrapy beautifulsoup matplotlib
【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘sys’问题摘要在使用PyCharm内置终端或控制台执行pipinstallsys等命令时，常常会遇到如下异常：ModuleNotFoundError:Nomodulenamed‘sys’该错误看似与常驻Python核心库sys有关，但
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
Java+Python智能化云盘【Day5-1】关沐吖 Java+Python Ai智能云盘项目开发专栏 python java 开发语言
RAG系统链路和数据加载Loaders技术OK啊昨天Day4-2，最后提及了很多的一些Loader加载器，有文档类型、数据库类型、网页加载器类型等等，它们其实都是属于langchain_community.document_loaders这个包下的类。今天来先复习一下都有哪些，再讲讲其中的代码运行的基本框架，和文档中有图片的处理方式。Loader的分类与常见类型文件加载器（FileLoaders）
Java+Python智能化云盘【Day3】关沐吖 Java+Python Ai智能云盘项目开发专栏 java python 开发语言
提示词工程Prompt简介：大模型必备Prompt提示词工程讲解什么是PromptEngineering提示词工程通过特定格式的文本输入引导AI模型生成期望输出的技术，明确地告诉模型你想要解决的问题或完成的任务也是大语言模型理解用户需求并生成相关、准确回答或内容的基础类比：给Java程序员的任务需求文档（越清晰明确，结果越符合预期）为什么需要学习？大模型就是你的员工，你可以有多个助手，OpenAI
Java+Python智能化Ai云盘[Day2]
OK啊，为了完成学校老师布置的UML作业主播也是开始拿自己的项目开始当成期末大作业来交了。顺道的我也把自己的项目整个的梳理了一通，如果大家最近有UML的大作业要交也可以自取，到时候我把文章word版本直接发到百度网盘上去。里面我只有类图、用例图、活动图、顺序图、状态图。这次也算是一个提前复习了一下项目了把，整个的文档文字都是拿ai去写的，图的话也是我先看了一遍代码，然后给ai说了一遍也算是自己理通
React与Vue的区别？扎西_德勒 vue.js react.js javascript
一、区别:1.语法Vue采用自己特有的模板语法；React是单向的，采用jsx语法创建react元素。2.监听数据变化的实现原理不同Vue2.0通过Object.defineproperty()方法的getter/setter属性,实现数据劫持,每次修改完数据会触发diff算法(双端对比)React默认是通过shouldComponentUpdata生命周期来决定是否需要渲染更新,再触发它的dif
2025年6月AIGC发展全景：技术轻量化、Agent产业化与伦理新挑战 Loving_enjoy 计算机学科论文创新点深度学习人工智能经验分享 facebook
>**当一块消费级GPU能解高考数学题，当AI智能体接管医院诊断流程，我们正站在人机协作新纪元的门槛上**2025年6月，AIGC领域迎来关键转折点——**模型轻量化**让百亿参数算法飞入寻常设备，**多模态融合**打破文本与视觉的次元壁，而**Agent智能体**正从实验室概念蜕变为产业核心引擎。这场变革不仅重塑技术范式，更在重构商业逻辑与人类创造力边界。---###一、技术突破：垂直化、轻量化
代码随想录算法训练营第十一天天天开心(∩_∩) 算法
LeetCode.150逆波兰表达式求值题目链接逆波兰表达式求值题解classSolution{publicintevalRPN(String[]tokens){Stackcstack=newStackset=newHashSetdeque=newLinkedListdeque.getLast()){deque.removeLast();}deque.add(val);}intpeek(){ret
解读国密非对称加密算法SM2 云水木石详解国密算法数据安全
本文先介绍非对称加密算法，然后聊一聊椭圆曲线密码算法（EllipticCurveCryptography，ECC），最后才是本文的主题国密非对称加密算法SM2。因为我的数学知识有限，对于算法涉及的一些复杂的理论知识，也是不懂，所以本文不会涉及理论，仅仅从编程的角度解读一下SM2。在进行国密算法开发的这段时间，我主要参考的书籍是《深入浅出HTTPS：从原理到实战》，微信读书上也有电子版，如果你也是进
基于uniapp小程序的诗词学习系统附带文章源码部署视频讲解等
文章目录前言详细视频演示具体实现截图核心技术介绍小程序框架Uniapp前端框架Vue持久层框架MyBaits为什么选择我代码参考数据库参考测试用例参考源码获取前言博主介绍：✌CSDN特邀作者、资深全栈开发程序员，曾在互联网大厂担任高级职位、码云/掘金/华为云/阿里云/InfoQ/StackOverflow/github等平台优质作者、专注于Java、小程序、前端、python等技术领域毕业项目实战
【归纳】C++入门算法模版总结（超级详细！！！）（包括高精度，排序，枚举，二分，搜索，动态规划等）
0.前言本文针对有一定算法基础的选手制作，收录了大部分算法的模板，详细解说可以点进去我提供的链接了解。或者进入我的主页给一点支持！本人也是一名新手，如果这篇文章有不严谨的地方或者不懂的地方可以在评论区留言，我会为你们一一解答的。【归纳】C++入门算法模版总结（包括高精度，排序，枚举，二分，搜索，动态规划等）（超级详细！！！）0.前言1.高精度1.1.单独实现1.1.1.高精度加法1.1.2.高精度
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc

python实现三种经典决策树算法

决策树实现ID3、C4.5、CART算法

一、创建数据集

你可能感兴趣的:(机器学习,Python,决策树,python,机器学习,算法)