SophiaCV

独家总结 | 决策树算法Python实现（附代码详解及注释）

↑ 点击上方【计算机视觉联盟】关注我们

上一篇已经介绍过决策树基本原理机器学习经典算法决策树原理详解（简单易懂）

纸上得来终觉浅，仅仅懂了原理还不够，要用代码实践才是王道，今天小编就附上小编自己在学习中实践的决策树算法。

1、信息增益

计算给定数据集的熵：

 1def calc_shannon_ent(data_set):
 2    """计算给定数据集的熵"""
 3    num_entries = len(data_set)  # 数据集中实例的总数
 4
 5    # 创建数据字典，键值是最后一列的数值。如果当前键值不存在，则扩展字典并将当前键值加入字典
 6    # 每个键值都记录了当前类别出现的次数
 7    label_counts = {}  # 创建数据字典
 8    for feat_vec in data_set:
 9        current_label = feat_vec[-1]  # 键值是最后一列的数值，表示类别标签
10        # 如果当前键值不存在，则扩展字典并将当前键值加入字典
11        if current_label not in label_counts.keys():
12            label_counts[current_label] = 0
13        label_counts[current_label] += 1
14
15    # 使用所有类标签的发生频率来计算类别出现的概率，并用这个概率来计算熵，统计所有类标签发生的次数
16    shannon_ent = 0
17    for key in label_counts:
18        prob = float(label_counts[key])/num_entries  # 计算类标签的概率
19        shannon_ent -= prob * log(prob, 2)  # 计算熵
20    return shannon_ent

2、划分数据集

对每个特征划分数据集的结果计算一次信息熵，然后判断按照哪个特征划分数据集是最好的划分方式

 1# data_set表示待划分的数据集，axis为划分数据集的特征，value指需要返回的特征的值
 2def split_data_set(data_set, axis, value):
 3    """按照给定的特征划分数据集"""
 4    # Python语言在函数中传递的是列表的引用。在函数内部对对象的修改，将会影响该列表对象的整个生存周期。
 5    # 为了消除这个不良影响，我们声明一个新列表对象（ret_data_set），用来存储符合要求的值
 6    ret_data_set = []
 7
 8    for feat_vec in data_set:
 9        # print(feat_vec)
10        # 将符合特征特征的数据抽取出来
11        if feat_vec[axis] == value:
12            reduced_feat_vec = feat_vec[: axis]  # 符合特征值的前边的数据（特征位置之前的数据）
13            # print(reduced_feat_vec)
14            reduced_feat_vec.extend(feat_vec[axis+1:])  # 符合特征值的后边数据（特征位置之后的数据）
15            # print(reduced_feat_vec)
16            ret_data_set.append(reduced_feat_vec)
17    return ret_data_set

代码过程：

1、输入三个参数：带划分的数据集、划分数据集的特征、需要返回的特征的值

2、Python语言在函数中传递的是列表的引用，在函数内部对列表对列表对象的修改，将会影响该列表对象的整个生存周期。为了不修改原始数据集，需要在函数的开始声明一个新列表对象，ret_data_set=[]

3、代码中使用extend和append方法（Python中append()和extend方法的使用和区别）

3、选择最好的数据集划分方式

 1def choose_best_feature_to_split(data_set):
 2    """选择最好的数据集划分"""
 3    num_features = len(data_set[0])-1  # 数据集特征的个数
 4    base_entropy = calc_shannon_ent(data_set)  # 计算数据集的熵
 5    best_info_gain = 0  # 初始化信息最优信息增益
 6    best_feature = -1  # 初始化最优特征
 7
 8    # 遍历每个特征
 9    for i in range(num_features):
10        feat_list = [example[i] for example in data_set]  # 提取数据集中i位置特征
11        # 将数据集特征转化为独立元素的集合列表。
12        # 集合和列表类型相似，不同之处仅在于集合类型中的每个值互不相同
13        # 从列表中创建集合是Python语言得到的列表中唯一元素值的最快方法
14        unique_vals = set(feat_list)
15        new_entropy = 0  # 初始化特征值
16
17        # 遍历给定特征的每个特征值
18        for value in unique_vals:
19            # 按照给定特征及特征值，划分数据集
20            sub_data_set = split_data_set(data_set, i, value)
21            prob = len(sub_data_set)/float(len(data_set))  # 计算Dv/D
22            new_entropy += prob * calc_shannon_ent(sub_data_set)  # 计算Dv/D*Ent(Dv)并求和
23        info_gain = base_entropy - new_entropy  # 计算特征的信息增益
24
25        # 判断最优信息增益，即求最大信息增益
26        if info_gain > best_info_gain:
27            best_info_gain = info_gain
28            best_feature = i
29    return best_feature  # 返回最优特征

代码过程：

选择最好特征的原则是信息增益最大的特征

4、递归构建决策树

 1def majority_cnt(class_list):
 2    """返回出现次数最多的分类名称"""
 3    class_count = {}   # 键值为分类名称，值为每个分类名称出现的频率
 4    # 遍历分类名称列表
 5    for vote in class_list:
 6        if vote not in class_count.keys():
 7            class_count[vote] = 0
 8        class_count[vote] += 1
 9    # 由大到小排序
10    sorted_class_count = sorted(class_count.items(), key=operator.itemgetter(1), reverse=True)
11    # 返回出现次数最多的分类名称
12    return sorted_class_count[0][0]
13
14
15# 函数有两个参数：数据集和标签列表。标签列表包含了素有特征的标签
16def create_tree(data_set, labels):
17    """创建树"""
18    class_list = [example[-1] for example in data_set]  # 数据标签列表
19    # print('数据标签列表为：', end='')
20    # print(class_list)
21    # print('class_list[0]为：', end='')
22    # print(class_list[0])
23    # 第一停止条件是所有的类标签完全相同，则返回该类标签
24    # 这里是通过判断第一个键类标签的数量与总数据标签列表长度，如果两者相等，则表明类标签完全相同
25    if class_list.count(class_list[0]) == len(class_list):
26        return class_list[0]
27    # 第二个停止条件是使用完了所有特征，仍然不能将数据集划分成仅包含唯一类别的分组
28    # 判断data_set[0]的长度为1，说明只剩下标签值，即labels列
29    # 因为这里无法简单的返回唯一的类标签，所以这里调用前边的majority_cnt函数挑选出现次数最多的类别作为返回值
30    # print('data_set[0]为：', end='')
31    # print(data_set[0])
32    if len(data_set[0]) == 1:
33        return majority_cnt(class_list)
34    # 选取最好特征
35    best_feat = choose_best_feature_to_split(data_set)
36    # print('best_feat为：', end='')
37    # print(best_feat)
38    # 存储最优特征的label，因为label和最优特征其实就是对应的，best_feat的索引也是特征label的索引
39    best_feat_lable = labels[best_feat]
40    # print('best_feat_lable为：', end='')
41    # print(best_feat_lable)
42    my_tree = {best_feat_lable: {}}
43    del labels[best_feat]
44    # 获取最优特征的属性值
45    feat_values = [example[best_feat] for example in data_set]
46    # 将最优特征的属性值转换为唯一的元素
47    unique_vals = set(feat_values)
48    # 遍历最优特征中属性的值。在每个数据集划分上调用函数create_tree()，得到额返回值将会被插入到字典遍历my_tree中
49    # 函数终止时，字典中将会嵌套很多叶子节点信息的字典数据
50    for value in unique_vals:
51        sub_labels = labels[:]  # 使用列表切片复制列表标签类
52        my_tree[best_feat_lable][value] = create_tree(split_data_set(data_set, best_feat, value), sub_labels)
53    return my_tree

代码过程：

1、递归构建树的结束条件是：程序遍历完所有划分数据集的属性，或每个分支下的所有实例都具有相同的类

5、绘制决策树

  1#!/usr/bin/env python
  2# -*- coding:utf-8 -*-
  3import matplotlib.pyplot as plt
  4# 设置决策节点和叶节点的边框形状、边距和透明度，以及箭头的形状
  5decision_node = dict(boxstyle='sawtooth', fc='0.8')  # 决策节点的样式
  6leaf_node = dict(boxstyle='round4', fc='0.8')  # 叶节点的样式
  7arrow_args = dict(arrowstyle='<-')  # 箭头的样式
  8
  9
 10def retrieve_tree(i):
 11    """存储树的信息"""
 12    list_of_trees = [{'no surfacing': {0: 'no', 1: {'flippers': {0: 'no', 1: 'yes'}}}},
 13                     {'no surfacing': {0: 'no', 1: {'flippers': {0: {'head': {0: 'no', 1: 'yes'}}, 1: 'no'}}}}
 14                     ]
 15    return list_of_trees[i]
 16
 17
 18def get_num_leafs(my_tree):
 19    num_leafs = 0
 20    # 强制转换keys返回类型
 21    first_str = list(my_tree.keys())[0]
 22    second_dict = my_tree[first_str]
 23    for key in second_dict.keys():
 24        # 使用type()函数判断叶子节点是否为字典类型。
 25        # 如果该节点是字典类型，则该节点也是一个判断节点，需要递归函数get_num_leafs()函数
 26        # get_num_leafs函数遍历整棵书，累计叶子节点的个数，并返回该数值
 27        if type(second_dict[key]).__name__ == 'dict':
 28            num_leafs += get_num_leafs(second_dict[key])
 29        else:
 30            num_leafs += 1
 31    return num_leafs
 32
 33
 34def get_tree_depth(my_tree):
 35    max_depth = 0
 36    first_str = list(my_tree.keys())[0]
 37    second_dict = my_tree[first_str]
 38    for key in second_dict.keys():
 39        # 使用type()函数判断叶子节点是否为字典类型。
 40        # 如果该节点是字典类型，则该节点也是一个判断节点，需要递归函数get_tree_depth()函数
 41        # get_tree_depth函数遍历整棵书，终止条件是叶子节点，一旦达到叶子节点，则从递归中返回，并将计算树的深度的数量加1
 42        if type(second_dict[key]).__name__ == 'dict':
 43            this_depth = 1 + get_tree_depth(second_dict[key])
 44        else:
 45            this_depth = 1
 46        if this_depth > max_depth:
 47            max_depth = this_depth
 48    return max_depth
 49
 50
 51# 该函数需要一个绘图区域
 52def plot_node(node_txt, center_pt, parent_pt, node_type):
 53    create_plot.ax1.annotate(node_txt, xy=parent_pt, xycoords='axes fraction',
 54                             xytext=center_pt, textcoords='axes fraction', va='center',
 55                             ha='center', bbox=node_type, arrowprops=arrow_args)
 56
 57
 58# cntr_pt指子节点的坐标，parent_pt指父节点的坐标，txt_string填充的文本消息
 59def plot_mid_text(cntr_pt, parent_pt, txt_string):
 60    """在父子节点间填充文本信息"""
 61    # 填充的位置在父节点和子节点中间位置
 62    xmid = (parent_pt[0]-cntr_pt[0])/2.0 + cntr_pt[0]
 63    ymid = (parent_pt[1]-cntr_pt[1])/2.0 + cntr_pt[1]
 64    create_plot.ax1.text(xmid, ymid, txt_string, va="center", ha="center", rotation=30)
 65
 66
 67# my_tree指树的信息，patent_pt指父节点的坐标，node_txt指标注的属性信息
 68def plot_tree(my_tree, parent_pt, node_txt):
 69    # 获取树的宽度
 70    num_leafs = get_num_leafs(my_tree)
 71    # 获取树的深度
 72    depth = get_tree_depth(my_tree)
 73    # 第一次划分数据集的类别标签
 74    first_str = list(my_tree.keys())[0]
 75    cntr_pt = (plot_tree.x_off + (1.0 + float(num_leafs))/2.0/plot_tree.totalw, plot_tree.y_off)
 76    # print(cntr_pt, parent_pt)
 77    # 标记子节点属性值
 78    plot_mid_text(cntr_pt, parent_pt, node_txt)
 79    # 子节点标记标签
 80    plot_node(first_str, cntr_pt, parent_pt, decision_node)
 81    # 第二个字典
 82    second_dict = my_tree[first_str]
 83    # 两个节点之间的距离间隔为：1.0/plot_tree.totald
 84    plot_tree.y_off = plot_tree.y_off - 1.0/plot_tree.totald
 85    for key in second_dict.keys():
 86        if type(second_dict[key]).__name__ == 'dict':
 87            plot_tree(second_dict[key], cntr_pt, str(key))
 88        else:
 89            plot_tree.x_off = plot_tree.x_off + 1.0/plot_tree.totalw
 90            print(plot_tree.x_off)
 91            plot_node(second_dict[key], (plot_tree.x_off, plot_tree.y_off), cntr_pt, leaf_node)
 92            plot_mid_text((plot_tree.x_off, plot_tree.y_off), cntr_pt, str(key))
 93    plot_tree.y_off = plot_tree.y_off + 1.0/plot_tree.totald
 94
 95
 96def create_plot(in_tree):
 97    fig = plt.figure(1, facecolor='white')
 98    fig.clf()
 99    axprops = dict(xticks=[], yticks=[])
100    create_plot.ax1 = plt.subplot(111, frameon=False, **axprops)
101    # plot_tree.totalw和plot_tree.totald存储书树的宽度和树的深度
102    plot_tree.totalw = get_num_leafs(in_tree)
103    plot_tree.totald = get_tree_depth(in_tree)
104    # plot_tree.x_off和plot_tree.y_off追踪已经绘制的节点位置，以及放置下一个节点的恰当位置
105    plot_tree.x_off = -0.5/plot_tree.totalw
106    # print(plot_tree.x_off)
107    plot_tree.y_off = 1.0
108    plot_tree(in_tree, (0.5, 1.0), '')
109    plt.show()
110
111
112# 调用绘制决策树
113my_tree = retrieve_tree(0)
114create_plot(my_tree)

代码过程：

（1）get_num_leafs和get_tree_depth函数：

1、第一个关键字是第一此划分数据集的类别标签，附带的数值比扫视子节点的取值。这里书中，直接使用 first_str = my_tree.keys()[0]，这个使用在Python2版本管用，在3版本后会出“TypeError: 'dict_keys' object does not support indexing”错误，是因为python3以后的版本改变了dict.keys的返回值，返回的是dict_keys对象，不支持索引值。所以这里强制将keys返回类型转换为list即可，如上述代码方式。

2、使用Python提供的type()函数判断叶子节点是否为字典类型

绘制决策树运行结果：

6、测试算法：使用决策树执行分类

 1def classify(input_tree, feat_labels, test_vec):
 2    """使用决策树分类测试数据"""
 3    first_str = list(input_tree.keys())[0]
 4    second_dict = input_tree[first_str]
 5    # 使用index方法查找当前列表中第一个匹配firstStr变量的元素
 6    feat_index = feat_labels.index(first_str)
 7    # 遍历整棵树
 8    for key in second_dict.keys():
 9        # 如果测试数据的属性值等于Key的值
10        if test_vec[feat_index] == key:
11            # 判断是否为字典类型，如果是字典类型，则说明不是叶子节点，得需要递归
12            # 这里判断得出类别，就是寻找是否是字典类型，如果是字典类型，则不是叶子节点，如果不是字典类型，则说明是叶子结点
13            if type(second_dict[key]).__name__ == 'dict':
14                class_label = classify(second_dict[key], feat_labels, test_vec)
15            else:
16                class_label = second_dict[key]
17    return class_label

这里如果进行调用的时候，在feat_index = feat_labels.index(first_str)代码行的位置会出现“ValueError: 'no surfacing' is not in list”的错误，因为在创建树的时候，labels内的元素是被删除了，我们在运行的时候，需要将labels备份副本即可。

这里是分步骤讲解决策树实践的步骤以及思路，每一个部分都是独立的函数，盟友可以自己组建起来组成一个决策树Python实现代码，也可以公众号回复关键词【决策树】下载整理好的完整代码练习理解！

往期回顾

亲身经历2019年校招8个大厂心得体会，纯干货分享（大疆、百度...）

2018年29篇必读机器学习论文总结，BERT, SeqGAN等上榜

机器学习经典算法决策树原理详解（简单易懂）

斯坦福李飞飞高徒Johnson博士论文: 组成式计算机视觉智能（附195页PDF）

带你详细了解机器视觉竞赛—ILSVRC竞赛

2018年度最强的30个机器学习项目！

何恺明等最新突破：视频识别快慢结合，取得人体动作AVA数据集最佳水平

对比两年斯坦福AI报告：32张图表带你全盘掌握行业发展

数据结构与算法（六）——循环队列的顺序存储结构（超详解，附动图+代码） fs站在远方看童年数据结构与算法队列指针算法数据结构
上一篇最后我们分析了队列的利弊，故我们这里对队列进行优化。就有了这一篇，循环队列。队列的问题主要便是入队的时间复杂度O(1).出队的时间复杂度0(n)。还有就是当进行插入和删除操作后，线性表的开始空间可能会被空出来，会浪费且占用空间。所以我们这里让队列首位相连变成了一个环，但是如何相连，相连之后入队和出队又是如何操作呢，相连以后会不会出现问题呢，出现问题又该如何解决呢，大家跟我一起往下看吧。优化（
python-with...as--管理上下文环境的语法结构赵钱孙李的赵 python
在Python中，with…as语句是一种用于管理上下文环境的语法结构，常用于处理资源的获取和释放，如文件操作、网络连接、锁定互斥等。它通过上下文管理协议（contextmanagementprotocol）来确保资源的正确使用和释放，即使在处理过程中出现了异常。在Python中，任何实现了上下文管理协议的对象都可以用作with…as语句中的上下文管理器。上下文管理协议要求对象实现两个特殊方法：e
python--对象存储服务器赵钱孙李的赵 python学习记录者 python 服务器开发语言
目录对象存储服务器定义概念普及对象（Object）桶（Bucket）终端节点（Endpoint）访问域名知名的对象存储服务器提供商微软云Azure：MicrosoftAzureBlobStorage华为云OBS:阿里云OSS:腾讯云COSMinIO:AmazonS3(SimpleStorageService)GoogleCloudStorageIBMCloudObjectStorage具体代码使用
python--数据结构赵钱孙李的赵 python学习记录者 python
1.list列表1.1特点有序：列表按照插入顺序排列。可变：可以添加，删除或者修改列表中的元素。异构：包含不同类型的数据。可重复：可迭代对象：可以使用迭代器协议来遍历列表中的元素，列表支持两种基本的迭代方法：for循环和迭代器协议。ps:迭代器协议要求对象实现两个特殊方法：iter()：返回一个迭代器对象next()：返回迭代器中的下一个值，如果没有更多值时，它会抛出StopIteration异常
Python 初始化方法钢铁男儿 Python
1、初始化方法1.1之前代码存在的问题----在类的外部给对象增加属性将案例代码进行调整，先调用方法再设置属性，观察一下执行效果。提示：在日常开发中，不推荐在类的外部给对象增加属性；如果在运行时，没有找到属性，程序会报错；对象应该包含有哪些属性，应该封装在类的内部；1.2初始化方法当使用**类名（）**创建对象时，会自动执行以下操作：1）、为对象在内存中分配空间—创建对象；2）、为对象的属性设置初
小波变换Python代码优游的鱼
小波变换是一种数字信号处理技术，用于对信号进行频域分析和处理。它通常用于信号压缩、滤波和其他信号处理应用中。在Python中，可以使用PyWavelets库来实现小波变换。下面是一个简单的例子，展示了如何使用PyWavelets库对信号进行小波变换：importpywtimportnumpyasnp#定义信号signal=np.random.rand(32)#进行小波变换wavelet='db1'
Python进阶篇 AI天才研究院 Python实战深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介什么是Python？Python是一种高级编程语言，它的设计理念强调代码可读性、简洁性和可扩展性。其语法简洁而清晰，它支持多种编程范式，包括面向对象的、命令式、函数式编程等。Python被认为是“胶水语言”——能够把许多编程语言连接起来并提供一个统一的接口，用以实现各种功能。为什么要学习Python？首先，Python是一种简单易学、功能丰富的语言。在很多情况下
【leetcode100】二叉搜索树中第k小的元素 SsummerC leetcode100 算法数据结构 leetcode python
1、题目描述给定一个二叉搜索树的根节点root，和一个整数k，请你设计一个算法查找其中第k小的元素（从1开始计数）。示例1：输入：root=[3,1,4,null,2],k=1输出：12、初始思路2.1思路使用中序遍历（左根右）进行遍历，遍历结果为从小到大的排序，进而可以输出第k小的元素。#Definitionforabinarytreenode.#classTreeNode:#def__init
初始化一个python项目 joker云 python 开发语言
初始化一个Python项目通常涉及以下步骤：选择项目名称：选择一个描述性的名称来代表你的项目。创建项目目录：在你的工作空间中创建一个新目录。设置虚拟环境：使用虚拟环境可以隔离项目依赖，避免不同项目之间的依赖冲突。编写代码：在项目目录中创建Python脚本。管理依赖：使用requirements.txt或Pipfile来管理项目依赖。配置项目：创建setup.py或pyproject.toml文件来
python里的初始化使用将将_毛团尾巴 python 开发语言 pytest
比如我们在函数B想要调用函数A，可以使用调用函数A的函数名，然后得到函数A的return值但是如果调用函数A需要传入参数才能运行，或者不想再去调用整个函数A获取值，此时可以将需要调用的参数初始化，变成全局参数，这样就不需要再次运行函数A，并且不仅仅只能调用得到一个return值（一个函数只能有一个return，且只能return一个变量值）1、普通类里面的初始化使用_init_def__init_
速通 AI+Web3 开发技能: 免费课程+前沿洞察 OpenBuild.xyz 人工智能 web3 区块链去中心化
AI正以前所未有的速度重塑各行各业，从生成式模型到大规模数据处理，AI逐渐成为核心驱动力。与此同时，Web3去中心化技术也在重新定义信任、交易和协作方式。当这两大前沿技术相遇，AI+Web3的融合已不再是理论，而是未来趋势，有望催生出颠覆性的创新应用和商业模式。AI提供智能化工具和算法支持，Web3则为数据和应用赋予了去中心化的灵魂，二者结合将开创全新的技术生态。无论是智能合约中的AI决策，还是链
python小波变换万元神万得 python
def extract_wavelet_features(data, column_name='声波强度 (AE)', scales=np.arange(1, 4), wavelet='cmor'): emr_values = data[column_name].values coefficients, frequencies = pywt.cwt(emr_values, scales
QVector从小到大排序卢一涵 qt
QVectorvector{5.1,3.8,9.1,4.6,1.7};std::sort(vector.begin(),vector.end());//从小到大排序。qDebug()<<vector;如上代码所示，执行完以后，得到排序后的列表。
react_hooks系列08_useId 田江 react.js javascript 前端
useId是一个钩子，用于生成唯一的ID，在服务器和客户端之间是稳定的，同时避免hydration不匹配。类似于Symbol，也类似于uuid。注意：useId不是用来生成列表中的键的。Keys应该从你的数据中生成。对于一个基本的例子，直接将id传递给需要它的元素。对于同一组件中的多个ID，使用相同的ID附加一个后缀。如下例子，保证了元素id的唯一性。importReact,{useId,useS
人工智能学习（一）之python入门 power-辰南大模型算法实战工程 python 数据库前端
一、引言在当今的软件开发领域，面向对象编程（Object-OrientedProgramming，OOP）已经成为一种主流的编程范式。Python作为一门功能强大且简洁易读的编程语言，对面向对象编程提供了非常完善的支持。无论是开发大型项目、构建数据科学应用，还是进行自动化脚本编写，理解和掌握Python面向对象编程都能让你更高效地完成任务。本文将带你快速入门Python面向对象编程，通过清晰的概念
HarmonyOS-面试整理大众筹码 harmonyos 面试华为
目录为什么选择HarmonyOS/优点/特点鸿蒙系统的权限有哪些授权方式区别：说一说鸿蒙系统的安全机制说一说鸿蒙系统的微内核与安卓的内核区别鸿蒙操作系统的微内核架构有哪些优势分布式能力在鸿蒙系统中如何实现请解释一下鸿蒙系统中的分布式软总线技术如何在鸿蒙操作系统中进行多设备协同开发？鸿蒙操作系统如何保障系统的安全性？请描述一下鸿蒙操作系统的用户界面开发框架鸿蒙操作系统支持哪些编程语言请解释一下鸿蒙操
保姆级讲解 python之enumerate()方法，包教包会查理零世 python 开发语言
目录引入find()基本用法进入正题enumerate()基本用法使用enumerate()遍历列表并打印索引和值可以使用自定义起始索引实战演练总结引入在Python中，find()方法主要用于字符串操作，用于查找子字符串在字符串中的位置。它返回的是子字符串第一次出现的索引位置，如果找不到则返回-1。需要注意的是，find()是字符串的方法，而不是列表或数组的方法。那数组怎么办？当然是今天要介绍的
Python笔记#边学边记笔记#文件和异常月吟荧静笔记 python
一、从文件读取数据1.1读取整个文件pi.digits.txt3.141592653589793238462643383279file_reader.pywithopen("pi_digit.txt")asfile_0:contents=file_0.read()print(contents)3.141592653589793238462643383279withopen("pi_digit.tx
华为OD机试E卷 --最多获得的短信条数--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述某云短信厂商，为庆祝国庆，推出充值优惠活动。现在给出客户预算，和优惠售价序列，求最多可获得的短信总条数。输入描述第一行客户预算M，其中0≤M≤10^6第二行给出售价表，P1,P2,…Pn,其中1≤n≤100,Pi为充值i元获得的短信条数。1≤Pi≤1000,1≤n≤100输出
小波变换算法详解（附Python和C++代码）卢一涵算法人工智能机器学习 c++
小波变换算法是将初始数据分解为低频和高频的两组数据，再由这两组数据重新构造初始数据的算法（与傅里叶变换算法类似）。一般来说小波变换常用于数据降噪领域，也可以用于对数据进行压缩、数据特征提取、特征增强等方面。小波算法很难理解对不对，博主也觉得难理解，不过，算法本身并没有特别复杂，简单说就使把数据分解然后再重构这两个步骤。只要知道这两个步骤，剩下的就是顺水推舟，容易理解多了。小波分解：分解的步骤其实就
【Python】解决 ERROR: Exception:Traceback (most recent call last):（亲测有效）嵌入式职场【Python数学建模】python 人工智能开发语言
目录1、遇到问题2、问题解决1、遇到问题ERROR:Exception:Traceback(mostrecentcalllast):File"F:\Python38\lib\site-packages\pip\_internal\cli\base_command.py",line180,in_mainstatus=self.run(options,args)File"F:\Python38\lib
蓝桥杯算法|基础笔记（1）幼稚鬼？算法蓝桥杯笔记
**时间复杂度**一、概念理解时间复杂度是用来衡量算法运行时间随输入规模增长而增长的量级。它主要关注的是当输入规模趋向于无穷大时，算法执行基本操作的次数的增长趋势，而不是精确的运行时间。二、分析代码中的基本操作确定关键操作在一段代码中，首先要找出对整体运行时间影响最大的操作。例如，在一个循环中，如果循环体主要是进行简单的算术运算，那么这些算术运算就是基本操作。对于排序算法，比较元素大小和交换元素位
蓝桥杯算法日常|枚举[*找到最多的数] 幼稚鬼？ 25/1/8寒假蓝桥杯练习日志专栏算法蓝桥杯哈希算法
**找到最多的数**重点疑问总结：1、数组输入输出c++一般会采用那种方便的方式？？用的就是我想的那种，就是用的最大范围定义的。2、怎样方便给数组中每个数出现的次数计数？？刚开始想的是：每个数把全部的数比较一下子最后发现最佳方法是：哈希表，这里用了一个数组，数组下标表示统计的哪个数，数组的值是该数出现的次数。题目截图解题思路：遍历矩阵，将每个数字及其出现次数存储在一个哈希表（这里使用数组模拟哈希表
操作系统的算法调度的平均时间5-24 yaoyaoyao可爱呀
最短作业优先调度算法平均等待时间例：三个作业J1，J2，J3一起到达，分别对应的执行时间为24，3，3，则最短作业优先调度算法调度的平均等待时间为3假设一起到达：先做最短的J2或J3周转时间等待时间=周转时间-运行时间0-3J23-0=3303-6J36-0=6636-30J130-0=30306平均等待时间=（0+3+6）/3=3
使用python将数据导入postgresql数据中强强0007 postgresql python 数据库
1插入一条数据连接postgresql数据库中的origindb数据库，用户为dn。创建表插入一条数据##导入psycopg2包importpsycopg2##连接到一个给定的数据库conn=psycopg2.connect(database="origindb",user="dn",password="000000",host="192.168.10.102",port="5432")##建立游
在Python中进行openAI接口调用 MartinGaoC python 开发语言人工智能 DALL·E 2 文心一言 gpt-3
在Python中进行openAI接口调用一、环境配置二、安装OpenAISDK三、新建一个index.py文件运行效果四、目前支持的模型列表写在最后一、环境配置确保已经安装了Python后安装pip命令python-mensurepip--default-pip卸载python-mpipuninstallpip查看是否安装成功pip--version二、安装OpenAISDK进入项目文件夹下，安装
pg使用python编写存储过程_postgresql – 可以在Postgres Python存储过程中使用NLTK 耶律大石
您可以在PL/Python存储过程或触发器中使用几乎任何Python库.概念要理解的关键点是PL/Python是CPython(无论如何都在PostgreSQL中包括9.3);它使用与普通独立Python完全相同的解释器,它只是将它作为库加载到PostgreSQL支持的.有一些限制(如下所述),如果它适用于CPython,它可以与PL/Python一起使用.如果您的系统上安装了多个Python解释
python md5加密_Python MD5加密实例详解 weixin_39870238 python md5加密
详解PythonMD5加密Python3下MD5加密#由于MD5模块在python3中被移除#在python3中使用hashlib模块进行md5操作importhashlib#待加密信息str='thisisamd5test.'#创建md5对象hl=hashlib.md5()#Tips#此处必须声明encode#若写法为hl.update(str)报错为：Unicode-objectsmustbe
python md5加密字符串_Python使用MD5加密字符串示例 weixin_39830012 python md5加密字符串
Python使用MD5加密字符串示例Python加密模块有好几个，但无论是哪种加密方式都需要先导入相应的加密模块然后再使用模块对字符串加密。先导入md5加密所需模块：代码如下:importhashlib创建md5对象代码如下:m=hashlib.md5()生成加密串，其中password是要加密的字符串代码如下:m.update('password')获取加密串代码如下:psw=m.hexdige
python md5加密列表_python生成md5加密的方法 weixin_39637646 python md5加密列表
MD5消息摘要算法(英语：MD5Message-DigestAlgorithm)，一种被广泛使用的密码散列函数，可以产生出一个128位(16字节)的散列值(hashvalue)，用于确保信息传输完整一致。MD5是最常见的摘要算法，速度很快，生成结果是固定的128bit字节，通常用一个32位的16进制字符串表示。hashlib介绍Python的hashlib提供了常见的摘要算法，如MD5，SHA1等
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR

独家总结 | 决策树算法Python实现（附代码详解及注释）

你可能感兴趣的:(决策树,列表,算法,python,编程语言)