ZHW_AI课题组

对比K近邻算法与决策树算法在MNIST数据集上的分类性能

目录

1. 作者介绍
2. K近邻算法与决策树算法介绍
- 2.1 K近邻（KNN）简介
- 2.2 决策树算法简介
- 2.3 MNIST数据集简介：
3. K近邻算法和决策树算法在Mnist数据集分类实验对比
- 3.1 K近邻算法对Mnist数据集分类实验
- 3.2 K近邻代码实现
- 3.3 决策树算法实验
- 3.4 决策树代码实现
- 3.5 实验结果对比

1. 作者介绍

郝特吉，男，西安工程大学电子信息学院，2022级研究生
研究方向：机器视觉与人工智能
电子邮件：[email protected]

路治东，男，西安工程大学电子信息学院，2022级研究生，张宏伟人工智能课题组
研究方向：机器视觉与人工智能
电子邮件：[email protected]

2. K近邻算法与决策树算法介绍

2.1 K近邻（KNN）简介

K近邻是一种经典且简单的监督学习方法，既能够用来解决分类问题，也能够解决回归问题。
原理：当对测试样本进行分类时，通过扫描训练样本集，找到与该测试样本最相似的个训练样本，根据这个样本的类别进行投票确定测试样本的类别。
基本要素：
1.分类决策规则
一般采用少数服从多数的投票制规则，但可以根据具体问题，实现分段距离加权的方式进行，本次KNN主要采用多数服从少数的投票制规则。

2.距离度量
Lp 距离：

p = 1 ，为曼哈顿距离
p = 2，为欧氏距离
p = ∞ ，为各个坐标距离的最大值
本次实验采用欧氏距离
3.k 值的选择

本次实验主要对k的值为15的准确率变化进行研究

2.2 决策树算法简介

决策树，是一个类似流程图的树形结构，树内部的每一个节点代表对一个特征的测试，树的分支代表该特征的每一个测试结果，而树的每一个叶子节点代表一个类别。树的最高层是就是根节点。
举个例子，以面试机器学习算法工程师为例，下图说明了如何利用决策树进行面试。

从中不难总结出决策树的主要问题就是：
1.哪个维度划分？
2.该维度的哪个值划分？

决策树算法的策略
1. 信息熵：
代表随机变量不确定度，熵越大，数据不确定性越高。熵越小，数据不确定性越低。目的：希望在树节点划分后使信息熵降低。

二分类信息熵曲线如上图所示。
**2.基尼指数（基尼不纯度）：**表示在样本集合中一个随机选中的样本被分错的概率。
目的：希望在划分后使得基尼指数降低。

二分类基尼系数曲线如上图所示

2.3 MNIST数据集简介：

MNIST是一个手写体数字 0-9 的图片数据集，一共统计了来自250个不同的人手写数字图片，其中，每张图片为：28*28的灰度图片，对应标签采用 one-hot -vector 形式编码
Mnist数据集官网：http://yann.lecun.com/exdb/mnist/

MNIST数据集的下载内容：

使用后自动解压为：

train_and_test 划分：
Train_datas:60000张
Test_datas:10000张

对数据集进行可视化，下图为Mnist数据集中的图和标签

下图为Mnist数据集在FDA降维下的分布

3. K近邻算法和决策树算法在Mnist数据集分类实验对比

3.1 K近邻算法对Mnist数据集分类实验

本次实验对Mnist数据集进行分类，在距离度量为：欧式距离，分类决策规则为：少数服从多数的基础上，研究：在使用KNN算法达到最高准确率的情况下，K在1-5之间的取值。
在测试集（10000）sample：300个样本
在训练集（60000）sample：10000个样本

3.2 K近邻代码实现

import torch
import numpy as np
from torch.utils.data import DataLoader
from torch import nn, optim
from math import sqrt
from torchvision import transforms, datasets
import visdom
from collections import Counter

viz = visdom.Visdom()
batchsize_all = 10000
batchsize = 1

minist_train = datasets.MNIST('minist', True, transform=transforms.Compose([
    transforms.ToTensor()
]), download=True)
minist_train = DataLoader(minist_train, batch_size=batchsize_all, shuffle=True)

minist_test = datasets.MNIST('minist', True, transform=transforms.Compose([
    transforms.ToTensor()
]), download=True)
minist_test = DataLoader(minist_test, batch_size=batchsize, shuffle=True)

# X = []
# Y = []
# for batchidx, (X_train, Y_train) in enumerate(minist_train):
#     X.append(X_train)
#     Y.append(Y_train)
# print(len(Y))
#
# X1 = []
# Y1 = []
# for batchidx, (X_test, Y_test) in enumerate(minist_test):
#     X1.append(X_test)
#     Y1.append(Y_test)
# print(len(Y1))

# x, y = next(iter(minist_train))

# print('x:', x.shape)
# print(y.shape)
# print(y)
acc_sum = 0
sum = 0

viz.line([0], [-1], win='knn_accuracy', opts=dict(title='knn_accuracy'))


k = int(input('请输入选择最近邻的个数：'))
for _ in range(300):
    for batchidx, (X_train, Y_train) in enumerate(minist_train):
        #KNN
        distances = []
        x_test, y_test = next(iter(minist_test))
        viz.images(x_test, nrow=1, win='x', opts=dict(title='x'))
        # print(x_test.shape)
        # print()



        for x_train in X_train:
            x_train = x_train.unsqueeze(0)
            # print(x_train.shape)
            #k_nn
            pp = pow(x_train - x_test, 2).view(1, 28*28)
            D = sqrt(pp.sum(dim=1))
            # print(pp)
    #         D = sqrt(np.sum(((x_train - x_test)**2).view(28*28)))  #欧拉距离
            distances.append(D)
        nearest = np.argsort(distances)  #索引排序从近到远
        # print(nearest)
        k_top = [Y_train[i] for i in nearest[:k]]  #前K个标签值
        nears_value = [X_train[i] for i in k_top]
        votes = Counter(k_top)  #得到投票结果
        pre_label = votes.most_common(1)[0][0]  #预测最可能结果
        sum += 1
        if pre_label == y_test:   #计算分类准确率
            acc_sum += 1
        accuracy = acc_sum / sum
        print('准确率为：', accuracy)
        np_pre_label = pre_label.numpy()
        viz.line([accuracy], [sum], win='knn_accuracy', update='append')
        viz.text(str(np_pre_label), win='pre_label', opts=dict(title='prelabel'))
        break

    # print(pre_label)
    # print(y_test)

3.3 决策树算法实验

本次实验在scikit-learn中集成的决策树CART下进行：
发现：
1.信息熵计算相对较慢，
2.scikit-learn中默认为基尼系数
3.没有特别大的差距
决策树的局限性：严重的过拟合

下图为1-500个不同深度gini分类准确率曲线

下图为1-500不同深度entropy分类准确率

3.4 决策树代码实现

from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
import visdom
import numpy as np

mnist = load_digits()
x, test_x, y, test_y = train_test_split(mnist.data, mnist.target, test_size=0.2, random_state=40)

viz = visdom.Visdom()
viz.line([0], [-1], win='decision_tree_accuracy_entropy', opts=dict(title='decision_tree_accuracy_entropy'))
# viz.line([0], [-1], win='decision_tree_accuracy_gini', opts=dict(title='decision_tree_accuracy_gini'))

for i in range(500):
    model = DecisionTreeClassifier(max_depth=i+1, criterion="entropy")
    # model = DecisionTreeClassifier(max_depth=i + 1, criterion="gini")
    model.fit(x, y)
    pre = model.predict(test_x)
    acc = np.sum(pre == test_y) / pre.size
    print('accuracy：', acc)
    viz.line([acc], [i+1], win='decision_tree_accuracy_entropy', update='append')
    # viz.line([acc], [i + 1], win='decision_tree_accuracy_gini', update='append')

3.5 实验结果对比

在本次针对Mnist数据集，分别采用KNN和决策树算法进行分类的对比实验中发现KNN的分类准确率优于决策树！
KNN_average_accuracy = 93.126% > 88.055% = decision_tree_max_accuracy
why？
分析：
Mnist数据集的样本的特殊之处：它是一个250多人手写的数字体，且在Mnist数据集官网上发布的是一个经过居中和裁边处理过的28*28的灰度图。

如果没有居中和裁边处理：

经过居中裁边处理：

可以看出，经过裁边的mnist数据集非常适合运用KNN将其区分开来
而灰度图起作用在计算距离时，只考虑其图像的空间分布，没有将颜色通道干扰考虑在内，这样就更高效更有针对性的计算出分布之间的距离！
第二个原因则是，在是决策树本身的局限性和mnist数据集特性的共同作用：
我们可以从mnist的降维分布看出，总会有一些不同类的分布距离十分靠近：

观察准确率减少时发现分类错误的样本：

总结：
但是决策树在高维空间中对决策边界的划分，总是有一部分很难被完美区分，而KNN却可以根据K值的选择一定程度上将样本做出正确划分！这就是为什么KNN在MNIST数据集上的分类性能要优于决策树的主要原因！

你可能感兴趣的:(决策树,算法,近邻算法)

Kafka 压缩算法详细介绍王多鱼的梦想～ kafka 分布式运维 apache
文章目录一、Kafka压缩算法概述二、Kafka压缩的作用2.1降低网络带宽消耗2.2提高Kafka生产者和消费者吞吐量2.3减少Kafka磁盘存储占用2.4减少KafkaBroker负载2.5降低跨数据中心同步成本三、Kafka压缩的原理3.1Kafka压缩的基本原理3.2.Kafka压缩的工作流程3.3Kafka压缩的数据存储格式四、Kafka压缩方式配置4.1Kafka生产者（Produce
大数据分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型艾派森大数据分析案例合集机器学习人工智能 python 数据挖掘回归
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集
Java并发CAS中的ABA问题 fragrans Java Java 并发编程 CAS ABA
1.ABA产生的原因CAS会导致“ABA问题”。CAS算法实现一个重要前提需要取出内存中某时刻的数据并在当下时刻比较并替换，那么在这个时间差类会导致数据的变化。比如说一个线程1从内存位置V中取出A，这时候另一个线程2也从内存中取出A，并且线程2进行了一些操作将值变成了B，然后线程2又将V位置的数据变成了A，这时候线程1进行CAS操作发现内存中仍然是A，然后线程1操作成功。只关注开始和结尾，不关心中
【手写数据库内核组件】0301 缓存模型介绍，缓存分层架构与缓存映射算法，以及缓存淘汰替换算法，同步一致的策略韩楚风 C语言实战-手写数据库内核组件数据库缓存架构 c语言数据结构
0301缓存介绍专栏内容：postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.文章目录0301缓存介绍一、概述二、多样的数据造就各异的缓存三、缓存的架构四、缓存算法4.1缓存组织算法4.2缓存映射算法4.3缓存替换算法4.4缓存同步算法五、总结结尾
留学生scratch计算机haskell函数ocaml编程ruby语言prolog作业VB matlabgoodboy ruby 开发语言后端
您列出了一系列编程语言和技术，这些可能是您在留学期间需要学习或完成作业的内容。以下是对每个项目的简要说明和它们可能涉及的领域或用途：Scratch：Scratch是一种图形化编程语言，专为儿童和初学者设计，用于教授编程基础概念。它通过拖拽代码块来创建程序，非常适合学习算法、逻辑和基本的编程概念。计算机（科学）：这是一个广泛的领域，涉及计算机硬件、软件、算法、数据结构、网络安全等多个方面。留学生可能
基于最近邻数据进行分类纠结哥_Shrek 分类数据挖掘人工智能
完整代码：importtorchimportnumpyasnpfromsklearn.neighborsimportKNeighborsClassifierfromsklearn.metricsimportaccuracy_scoreimportmatplotlib.pyplotasplt#生成一个简单的数据集(2个特征和2个分类)#X为输入特征，y为标签X=np.array([[1,2],[2,
代码随想录算法训练营第三十九天-动态规划-337. 打家劫舍 III taoyong001 算法动态规划 c++leetcode
老师讲这是树形dp的入门题目解题思路是以二叉树的遍历（递归三部曲）再结合动规五部曲dp数组如何定义：只需要定义一个二个元素的数组，dp[0]与dp[1]dp[0]表示不偷当前节点的最大价值dp[1]表示偷当前节点后的最大价值这样可以把每个节点的状态值都表示出来但这个数组的两个值只表示当前节点的状态值递归时要使用后序遍历：使用后序遍历的原因就是要从叶子结点一层一层向上统计出来/***Definiti
使用OpenSSL库接口，实现AES CBC加密，基于X509 base64编码证书的RSA非对称加密例子 GavinFj C语言相关工作学习总结算法数据安全
RSA加密的填充方式安全不一样，RSA算法PKCS1填充方式没有OAEP填充方式安全；同样的AES选择CBC模式更加安全。网上看了好多例子，都没有使用X509base64编码证书的RSAOAEP填充方式加密。研究记录下RSA、AES的加密，以供参考。话不多说，直接上demo。/*************************************************************
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法） FF-Studio DeepSeek R1 算法语言模型人工智能自然语言处理机器学习
——关于使用Unsloth库、LoRa微调及GRPOTrainer自定义奖励函数实现“只输出10个英语单词”的探索为什么要进行“只输出10个英文单词”的极端尝试？在大模型的训练或微调当中，大多数场景我们都希望它能“自由发挥”，给出越丰富越好的答案。但，为了更好的理解强化学习在LLM训练过程中发挥的意义，也为了学习GPRO这个强化学习算法，笔者出此题目，方便大家学习理解。GRPO（GroupRela
【AI中数学-数理统计-综合实例-包括python实现】揭开数据的面纱：真实样本数据的探索与可视化云博士的AI课堂 AI中的数学人工智能 python 数理统计数据预处理数据探索数据可视化机器学习
第五章：数理统计-综合实例1.揭开数据的面纱：真实样本数据的探索与可视化在人工智能（AI）应用中，数据是构建算法和模型的基石，而数理统计则为我们提供了理解和处理这些数据的工具。数据探索和可视化是数理统计中至关重要的步骤，它们不仅能帮助我们理解数据的分布、关系和趋势，还能够为后续的建模工作提供依据。本节将通过五个实际案例，展示如何使用数理统计和可视化技术对真实样本数据进行探索。每个案例都包括具体的描
数据结构与算法之排序: LeetCode 1356. 根据数字二进制下 1 的数目排序 (Ts版) Wang's Blog Data Structure and Algorithms 动态规划 leetcode 算法
根据数字二进制下1的数目排序https://leetcode.cn/problems/sort-integers-by-the-number-of-1-bits/description/描述给你一个整数数组arr。请你将数组中的元素按照其二进制表示中数字1的数目升序排序如果存在多个数字二进制中1的数目相同，则必须将它们按照数值大小升序排列请你返回排序后的数组示例1输入：arr=[0,1,2,3,4
2025年美赛数学建模 MCM Problem B: Managing Sustainable Tourism 问题 B：可持续旅游管理代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模旅游 2025美赛 2025年数学建模美赛 python代码 matlab 可持续旅游管理
目录代码框架：遗传算法优化可持续旅游模型python代码代码解析：matlab代码代码解析：代码框架：遗传算法优化可持续旅游模型python代码importnumpyasnpimportrandomimportmatplotlib.pyplotasplt#定义遗传算法的参数POP_SIZE=100#种群大小GENS=500#迭代代数MUTATION_RATE=0.01#变异率CROSSOVER_R
Python 实现文本摘要功能热爱技术的小胡 python
互联网时代信息爆炸式增长，人们面对越来越多的信息无法一一阅读，而文本自动摘要技术可以一定程度上缓解这个问题。摘要就是一篇文章的核心部分信息，文本自动摘要技术分抽取式摘要和生成式摘要，前者是在原文中挑选一定比例的句子拼凑成一个摘要，后者更接近人为的总结式简写一篇文章。目前越来越多的研究者使用深度神经网络来研究生成式摘要技术，但是难度也挺大，效果有限。本文的方法是使用基于启发式规则的算法实现了一个抽取
区块链学习资料 sunchenzl 区块链学习资料
本文列举了关于区块链和数字加密技术的文章和资源，分为以下几个部分：构建区块和基础；基础（和历史）；关键概念——包括特定课题（例如区块链治理）；隐私和安全；扩展；共识算法、加密货币经济和投资；资金筹集和通证分布；去中心化交易所；稳定货币；加密货币经济原生产品（数字加密收藏品、管理市场、游戏）。最后，文章还提供了开发者教程、实践教程和人物事迹，以及其他资源，例如时事新闻和课程。干货满满哦！1、构建区块
快手NS sig3签名算法（2025年1月） sh_moranliunian 蜘蛛侠网络爬虫后端 python 爬虫算法
kuaishou/__NS_sig3.js源码见文章最后。python中调用示例importjsonimportsysimportrequestsimportosimportexecjsimporthashlibimportdatetimefromCookieUtilimportCookieUtilfromfake_useragentimportUserAgentnormal_js=execjs.
bkcrack安装 x0da6h 网络安全
bkcrack是一款破解密码算法工具在ctf中主要用于破解压缩包密码本文主要介绍它的下载、安装方法先从github获取资源，windows中安装bkcrack还需要额外安装VC++的Redistributablegitclonehttps://github.com/kimci86/bkcrack.git然后配置cmake工具，需要用到cmake手动构建brack的项目代码pipinstallcma
【IMU Kalman滤波器】9轴IMU传感器（加速度计、陀螺仪、磁力计）的卡尔曼滤波器算法研究（Matlab代码实现）然哥爱编程算法 matlab 开发语言
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、引言二、9轴IMU传感器原理及误差分析三、卡尔曼滤波器算法四、实验与结果分析五、结论与展望2运行结果3参考文献4Matlab代码、数据⛳️赠与读者‍做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是努力，很多时候借力比努
CVPR‘24开源 | ADA-Track：端到端3D多目标跟踪最新SOTA！计算机视觉工坊 3D视觉从入门到精通 3d 目标跟踪人工智能
编辑：计算机视觉工坊添加小助理：dddvision，备注：方向+学校/公司+昵称，拉你入群。文末附行业细分群扫描下方二维码，加入3D视觉知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门视频课程（星球成员免费学习）、最新顶会论文、3DGS系列、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！
启元世界（Inspir.ai）技术浅析（一）爱研究的小牛 AIGC—游戏制作人工智能机器学习 AIGC 深度学习
启元世界（Inspir.ai）作为全球领先的通用人工智能平台公司，自2017年成立以来，一直致力于通过人工智能技术提升产业效能和生活体验。公司汇聚了来自全球顶尖公司和高等学府的技术专家，专注于深度强化学习、推荐算法以及机器学习系统平台等前沿领域，并成功将人工智能技术应用于数字娱乐、智能决策和机器人等多个领域。一、核心技术启元世界在人工智能领域取得了多项突破性进展，其核心技术涵盖了以下几个方面：1.
数据结构与算法课后题整理（三）ミッタン数据结构算法
第三章1.(2分)串是任意有限个（）。A.符号构成的集合B.符号构成的序列C.字符构成的集合D.字符构成的序列2.(2分)串是一种特殊的线性表，其特殊性体现在（）。A.可以顺序存储B.数据元素是一个字符C.可以链式存储D.数据元素可以是多个字符3.(2分)两个串相等必有串长度相等且（）。A.串的各位置字符任意B.串中各位置字符均对应相等C.两个串含有相同的字符D.两个串所含字符任意4.(2分)设有
数据结构与算法课后题整理（四）ミッタン数据结构算法二叉树
1.(2分)具有10个叶结点的二叉树中有（）个度为2的结点。A.9B.10C.8D.112.(2分)一棵完全二叉树上有1001个结点，其中叶子结点的个数是(）。A.250B.501C.505D.2543.一棵二叉树高度为h（只有根结点时的高度为1）,所有结点的度或为0，或为2，则这棵二叉树最少有（）个结点。A.2hB.h+1C.2h+1D.2h-14.高度为K（只有根结点时的高度为1）的二叉树最大
Python实现复原毫米波雷达呼吸波形的示例 go5463158465 python 算法机器学习 python 开发语言
以下是一个使用Python实现复原毫米波雷达呼吸波形的示例，该示例将涉及模型算法在重建损失和KL（Kullback-Leibler）损失之间的平衡问题。我们将使用深度学习中的变分自编码器（VAE）作为模型来进行呼吸波形的复原，因为VAE可以很好地处理重建和潜在空间分布的问题。步骤概述数据准备：生成或加载毫米波雷达的呼吸波形数据。定义VAE模型：包括编码器和解码器。定义损失函数：结合重建损失和KL损
大数据技术在数据安全治理中的应用罗思付之技术屋综合技术探讨及方案专栏大数据
摘要面对新形势下的数据安全治理挑战，顺应数据安全领域的技术发展趋势，针对大型国企在数据安全治理实际应用中突出的关键权限人员识别问题，提出了一种基于图算法的关键权限人员识别技术。该技术可以发现系统中潜在的权限影响因素，并可从多个角度衡量不同含义的权重影响力，识别结果可解释性强。针对数据安全治理中的用户与实体行为异常检测问题，提出一种基于生成对抗网络的用户与实体行为异常检测方法，实验结果表明，所提方法
阶乘的六种实现代码 ← Python hnjzsyjyj Python程序设计 Python 阶乘
阶乘是一个常见的数学概念。一个正整数n的阶乘是所有小于等于n的正整数的乘积。阶乘通常用符号n!来表示。其中n是一个正整数。【算法代码一：for循环】deffac(n):p=1foriinrange(1,n+1):p=p*ireturnpx=eval(input())print(fac(x))【算法代码二：while循环】Python中没有++和--这两个运算符。deffac(n):i=1p=1wh
代码随想录算法训练营第五十九天| 503.下一个更大元素II、42. 接雨水 Joanna-升代码随想录训练营算法 leetcode 数据结构
代码随想录算法训练营第五十九天|503.下一个更大元素II、42.接雨水503.下一个更大元素II解题代码42.接雨水解题代码503.下一个更大元素II题目链接：503.下一个更大元素II解题代码funcnextGreaterElements(nums[]int)[]int{length:=len(nums)result:=make([]int,length,length)fori:=0;i0&&
LeetCode-第一题 Joanna-升 LeetCode解题篇 leetcode c语言
LeetCode1.求两数之和开篇心得题目复述思考历程解题代码（C语言）结题结语开篇心得刷算法题一直是一件在计划中的事情，从未接触C语言时就拥有这样的冲动，直到现在学完数据结构，才有了略为正式的开始。之前从没有接触过算法题的训练，也深知自己几斤几两，所以博客里可能会有很多不成熟的、不正确的想法和观点，十分欢迎混圈的大神们赐教，但更多的还是想记录自己青涩的成长之路。叨叨半天的废话，下面还是开始进入正
如何使用深度学习中的 Transformer 算法进行视频目标检测 go5463158465 python 算法深度学习 python 开发语言
以下将介绍如何使用深度学习中的Transformer算法进行视频目标检测，并给出一个复现相关论文思路及示例代码。这里以DETR（End-to-EndObjectDetectionwithTransformers）为基础进行说明，它是将Transformer引入目标检测领域的经典论文。步骤概述环境准备：安装必要的库，如PyTorch、torchvision等。数据准备：使用公开的视频目标检测数据集，
数据结构---数组与链表 GOV_D 数据结构数据结构
文章目录一、数组二、链表三、数组和链表的选择四、链表的基本使用和算法一、数组数组的特点1.在内存中，数组是一块连续的区域2.数组需要预留空间，在使用前需要提前申请所占内存的大小，不知道需要多大的空间，可能会浪费内存空间，即数组空间利用率低3.在数组起始位置处，插入数据和删除数据效率低。插入数据时，待插入位置的的元素和它后面的所有元素都需要向后搬移删除数据时，待删除位置后面的所有元素都需要向前搬移4
SpringBoot中运行Yolov5程序 eqa11 spring boot YOLO 后端
文章目录SpringBoot中运行Yolov5程序一、引言二、环境搭建1、SpringBoot项目创建2、YOLOv5环境配置三、SpringBoot与YOLOv5集成1、创建Python服务2、SpringBoot调用Python服务四、使用示例1、创建控制器五、总结SpringBoot中运行Yolov5程序一、引言在人工智能领域，目标检测是一个热门且实用的技术。YOLOv5作为目标检测算法中的
模型架构选择：从传统NLP到Transformer AI天才研究院 AI大模型应用入门实战与进阶大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
模型架构选择：从传统NLP到Transformer关键词：自然语言处理(NLP),模型架构,传统NLP,Transformer,RNN,CNN,预训练模型文章目录模型架构选择：从传统NLP到Transformer1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.1.1传统NLP模型3.1.2RNN模型3.1.
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他