哆啦A梦PLUS

python实现kd树以及最近邻查找算法

一、kd树简介
二、kd树生成
- 1.确定切分域
- 2.确定数据域
- 3.理解递归树
- 4.python实现递归树代码
三、kd树上的最近邻查找算法
- 1.生成搜索路径
- 2.搜索路径回溯
- 3.最近邻查找算法代码

一、kd树简介

kd树是一种树形结构，树的每个节点存放一个k维数据，某一节点的子节点可以看作是由过该节点一个平面切割后产生的（想象一下切蛋糕的过程），如此反复产生切割平面，就能为每个数据在空间中建立索引，如下图所示：

由于采用这种特殊的分割方式，使得在利用kd树做最近邻查找时，可以避开一些距离很远的点，查找速度得到了较大的提升，对于空间中N个k维数据，穷举法的算法复杂度为O(Nk)，而使用kd树查找的算法复杂度只有O(klog(N))。kd树是一种典型的空间换时间的方式，即花费存储空间为数据建立索引，这样使得后续查找时速度更快，花费时间更少。

二、kd树生成

具体的算法实现主要参考的是这篇文章：https://www.cnblogs.com/eyeszjwang/articles/2429382.html，实现时有少量改动。生成kd树有两个关键的中间过程，即：

1.确定切分域

（1）确定split域：对于所有描述子数据（特征矢量），统计它们在每个维上的数据方差。以SURF特征为例，描述子为64维，可计算64个方差。挑选出最大值，对应的维就是split域的值。数据方差大表明沿该坐标轴方向上的数据分散得比较开，在这个方向上进行数据分割有较好的分辨率；

这段文字用通俗一点的语言来说就是：对于二维的情况，每一次做数据切分的时候，沿着x轴还是y轴做切分是一个问题，那么我们要怎么确定呢？我们可以统计这些二维数据的x值和y值的方差，方差越大说明数据在这一方向上越离散，而数据越离散说明沿着这一方向上数据之间的距离区分度越大，简单点来说就是相互之间隔得更远，我们就用这个方向做切分。
确定了切分域之后，我们就需要来对数据做切分了。

2.确定数据域

（2）确定Node-data域：数据点集Data-set按其第split域的值排序。位于正中间的那个数据点被选为Node-data。此时新的Data-set’ = Data-set\Node-data（除去其中Node-data这一点）。

简单来说，这句话的意思是：现在我们已经确定了沿着x轴做切分，那么我们要怎么决定在x轴哪里做切分呢？我们可以将所有数据根据x值的大小做一个排序，然后选取正中间那个数据的x值作为切分的位置。注意，这里有一个关键的问题是：如果我们有偶数个数据，怎么确定中间那个数据？难道我们选取中间两个数做一下平均？？？如果没有记错的话这应该是中位数的定义。。。如果这样完全就是自找麻烦！因为我们要确保至少有一个数据的x值落在切分点上，但是取平均之后并不能保证！！！所以更好的办法是，在有两个中间数据的情况下，随便选取一个数据的x值就行了。
决定了在x轴哪里做切分之后，我们就需要把数据做切分了，这里根据数据的x值相对于切分位置的大小，可以归为左节点和右节点，同时不要忘了：当前主节点也要保存一个数据，选取一个x值大小和切分位置相等的数据保存就行（如果有多个随便选一个就行，关键之处在于这个数据的x值落在切割线上。）

3.理解递归树

前面提到过，kd树是一种树形结构，因此可以递归生成，这是树形结构的共性，用程序语言来说，递归就是函数自己调用自己，在理解上也是很自然的。对于一组数据，我们通过找到的一个切分线把数据一分为二，而这个切分线的确定只和这组数据有关，左边的数据归为左节点，右边的数据归为右节点，更进一步，对于左边或者右边的这组数据，我们又可以将其看作一个整体，找到一个切分线把它一分为二，这样将一组数据一分为二的过程反复进行，相当于这个过程函数不断地调用自身，最终生成二叉树，将所有的数据分开。

4.python实现递归树代码

###建立kd树和实现查询功能
import numpy as np
import matplotlib.pyplot as plt

class kdTree:
    def __init__(self, parent_node):
        '''
        节点初始化
        '''
        self.nodedata = None   ###当前节点的数据值，二维数据
        self.split = None ###分割平面的方向轴序号,0代表沿着x轴分割，1代表沿着y轴分割
        self.range = None  ###分割临界值
        self.left = None    ###左子树节点
        self.right = None   ###右子树节点
        self.parent = parent_node  ###父节点
        self.leftdata = None  ###保留左边节点的所有数据
        self.rightdata = None ###保留右边节点的所有数据
        self.isinvted = False ###记录当前节点是否被访问过

    def print(self):
        '''
        打印当前节点信息
        '''
        print(self.nodedata, self.split, self.range)

    def getSplitAxis(self, all_data):
        '''
        根据方差决定分割轴
        '''
        var_all_data = np.var(all_data, axis=0)
        if var_all_data[0] > var_all_data[1]:
            return 0
        else:
            return 1
    

    def getRange(self, split_axis, all_data):
        '''
        获取对应分割轴上的中位数据值大小
        '''
        split_all_data = all_data[:, split_axis]
        data_count = split_all_data.shape[0]
        med_index = int(data_count/2)
        sort_split_all_data = np.sort(split_all_data)
        range_data = sort_split_all_data[med_index]
        return range_data


    def getNodeLeftRigthData(self, all_data):
        '''
        将数据划分到左子树，右子树以及得到当前节点
        '''
        data_count = all_data.shape[0]
        ls_leftdata = []
        ls_rightdata = []
        for i in range(data_count):
            now_data = all_data[i]
            if now_data[self.split] < self.range:
                ls_leftdata.append(now_data)
            elif now_data[self.split] == self.range and self.nodedata == None:
                self.nodedata = now_data
            else:
                ls_rightdata.append(now_data)
        self.leftdata = np.array(ls_leftdata)
        self.rightdata = np.array(ls_rightdata)


    def createNextNode(self,all_data):
        '''
        迭代创建节点，生成kd树
        '''
        if all_data.shape[0] == 0:
            print("create kd tree finished!")
            return None
        self.split = self.getSplitAxis(all_data)
        self.range = self.getRange(self.split, all_data)
        self.getNodeLeftRigthData(all_data)
        if self.leftdata.shape[0] != 0:
            self.left = kdTree(self)
            self.left.createNextNode(self.leftdata)
        if self.rightdata.shape[0] != 0:
            self.right = kdTree(self)
            self.right.createNextNode(self.rightdata)

    def plotKdTree(self):
        '''
        在图上画出来树形结构的递归迭代过程
        '''
        if self.parent == None:
            plt.figure(dpi=300)
            plt.xlim([0.0, 10.0])
            plt.ylim([0.0, 10.0])
        color = np.random.random(3)
        if self.left != None:
            plt.plot([self.nodedata[0], self.left.nodedata[0]],[self.nodedata[1], self.left.nodedata[1]], '-o', color=color)
            plt.arrow(x=self.nodedata[0], y=self.nodedata[1], dx=(self.left.nodedata[0]-self.nodedata[0])/2.0, dy=(self.left.nodedata[1]-self.nodedata[1])/2.0, color=color, head_width=0.2)
            self.left.plotKdTree()
        if self.right != None:
            plt.plot([self.nodedata[0], self.right.nodedata[0]],[self.nodedata[1], self.right.nodedata[1]], '-o', color=color)
            plt.arrow(x=self.nodedata[0], y=self.nodedata[1], dx=(self.right.nodedata[0]-self.nodedata[0])/2.0, dy=(self.right.nodedata[1]-self.nodedata[1])/2.0, color=color, head_width=0.2)
            self.right.plotKdTree()
        # if self.split == 0:
        #     x = self.range
        #     plt.vlines(x, 0, 10, color=color, linestyles='--')
        # else:
        #     y = self.range
        #     plt.hlines(y, 0, 10, color=color, linestyles='--')


test_array = 10.0*np.random.random([30,2])
my_kd_tree = kdTree(None)
my_kd_tree.createNextNode(test_array)
my_kd_tree.plotKdTree()

这里代码中使用了Python面向对象技术，kdTree类的重要参数和前面给出的参考文章中的参数大致相同，具体代码细节不再说明，这里随机生成了30个范围在0-10之内的2维数据作为测试数据，下图是一次运行得到的结果：

可以很容易看到中间橙色的点就是根节点，以及每个节点的迭代过程，运行过程无误。

三、kd树上的最近邻查找算法

加快对目标数据的最近邻数据的搜索过程，是kd树这种特殊存储结构的最主要功能，尤其是在数据量非常大时，其速度优势更加明显。kd树上的最近邻查找算法主要涉及两个过程，即：

1.生成搜索路径

这一过程相对容易，也很好理解。由于我们之前已经根据不同的切分线，生成了包含所有数据点的kd树，那么现在给我们一个新的数据，我们首先当然是根据这些切分线来判断待查找的数据是属于哪个分区的，我们当然有理由相信与这个数据同属一个分区的数据点(即某个叶节点)是其最近邻点的概率比不同分区的点的概率要大。因此，我们通过对目标数据的二叉查找，可以确定出一条搜索路径以及初始的最近邻点，但是要注意的是，通过二叉查找找到的叶节点是目标点的最近邻点的可能性较大，但不是一定的，如下图：

目标点落在了y=4的上半平面，但是其最近邻点却在y=4的下半平面，所以这里我们初步搜索出来的一个叶节点并不一定是目标点的最近邻点，我们还需要不断地沿着搜索路径回溯，确定同一主节点的其它子节点中是否存在与目标点距离更近的点。

2.搜索路径回溯

为了实现路径回溯的功能，这里需要使用栈来存储搜索路径，具体说来，当回溯到某一节点的父节点时，需要判断目标点到该父节点对应切分线的距离是否小于当前的最小距离，如果比最短距离还小，说明在该父节点对应的另一分支中有可能存在与目标点距离更小的点，因此就需要搜索该分支中的节点。
为了更加形象地说明，还是以上图为例。首先通过二分查找我们确定目标点与(4,7)点落在同一域内，因此将(4,7)作为初始最近邻点，然后向上回溯到(5,4)点，而(5,4)点对应的切分线是y=4，通过计算发现目标点到直线y=4的距离小于当前最短距离，因此在目标点的对侧即(5,4)节点的另一分支可能存在与目标点距离更近的点，因此我们需要跳到另一分支中重新检索，这里由于另一分支的深度不一定和前一分支相同，因此在跳到另一分支的头节点之后，我们还需要在此基础之上重复第1步中的路径搜索过程，到达该分支的叶节点，然后重复向上回溯查找直到将搜索路径全部回溯完成，我们就可以得到目标点的最近邻点。
这其中还有一个值得注意的地方，就是向上回溯时为了避免路径在两个分支之间来回跳跃导致死循环，需要将整个回溯过程中访问过的节点从路径中去掉，用一个标签来指示就可以，上述代码中使用的是isinvted来标记当前节点是否被访问过。

3.最近邻查找算法代码

具体代码实现是在以上kdTree类的基础上在添加几个内部函数就可以了，具体添加的函数为：

	def divDataToLeftOrRight(self, find_data):
        '''
        根据传入的数据将其分给左节点(0)或右节点(1)
        '''
        data_value = find_data[self.split]
        if data_value < self.range:
            return 0
        else:
            return 1

    def getSearchPath(self, ls_path, find_data):
        '''
        二叉查找到叶节点上
        '''
        now_node = ls_path[-1]
        if now_node == None:
            return ls_path
        now_split = now_node.divDataToLeftOrRight(find_data)
        if now_split == 0:
            next_node = now_node.left
        else:
            next_node = now_node.right
        while(next_node!=None):
            ls_path.append(next_node)
            next_split = next_node.divDataToLeftOrRight(find_data)
            if next_split == 0:
                next_node = next_node.left
            else:
                next_node = next_node.right
        return ls_path
            
    def getNestNode(self, find_data, min_dist, min_data):
        '''
        回溯查找目标点的最近邻距离
        '''
        ls_path = []
        ls_path.append(self)
        self.getSearchPath(ls_path, find_data)
        now_node = ls_path.pop()
        now_node.isinvted = True
        min_data = now_node.nodedata
        min_dist = np.linalg.norm(find_data-min_data)
        while(len(ls_path)!=0):
            back_node = ls_path.pop()   ### 向上回溯一个节点
            if back_node.isinvted == True:
                continue
            else:
                back_node.isinvted = True
            back_dist = np.linalg.norm(find_data-back_node.nodedata)
            if back_dist < min_dist:
                min_data = back_node.nodedata
                min_dist = back_dist
            if np.abs(find_data[back_node.split]-back_node.range) < min_dist:
                ls_path.append(back_node)
                if back_node.left.isinvted == True:
                    if back_node.right == None:
                        continue
                    ls_path.append(back_node.right)
                else:
                    if back_node.left == None:
                        continue
                    ls_path.append(back_node.left)
                ls_path = back_node.getSearchPath(ls_path, find_data)
                now_node = ls_path.pop()
                now_node.isinvted = True
                now_dist = np.linalg.norm(find_data-now_node.nodedata)
                if now_dist < min_dist:
                    min_data = now_node.nodedata
                    min_dist = now_dist
        print("min distance:{}  min data:{}".format(min_dist, min_data))
        return min_dist

    def getNestDistByEx(self, test_array, find_data, min_dist, min_data):
        '''
        穷举法得到目标点的最近邻距离
        '''
        data_count = test_array.shape[0]
        min_data = test_array[0]
        min_dist = np.linalg.norm(find_data-min_data)
        for i in range(data_count):
            now_data = test_array[i]
            now_dist = np.linalg.norm(find_data-now_data)
            if now_dist < min_dist:
                min_dist = now_dist
                min_data = now_data
        print("min distance:{}  min data:{}".format(min_dist, min_data))
        return min_dist

代码的对齐格式是一致的，直接加入以上类中就可以，当然为了对比以及验证结果的正确性，在类中还实现了穷举查找算法。首先用50个点测试了一下回溯查找结果的正确性，绘制的结果如下：

查找的目标点是(5.0, 5.0)，查找到的最近邻点在目标点左下角，从图上来看结果是正确的。为了对比穷举法和利用kd树回溯查找的速度，数据点设置为10000个，代码为:

test_array = 10.0*np.random.random([10000,2])   ### 随机生成n个2维0-10以内的数据点
my_kd_tree = kdTree(None)                    ### kd树实例化
my_kd_tree.createNextNode(test_array)        ### 生成kd树
# my_kd_tree.plotKdTree()   
find_data = np.array([5.0, 5.0])             ### 待查找目标点
min_dist = 0                                 ### 临时变量，存储最短距离
min_data = np.array([0.0, 0.0])              ### 临时变量，存储取到最短距离时对应的数据点

%time min_dist = my_kd_tree.getNestNode(find_data, min_dist, min_data)        ### 利用kd树回溯查找
%time min_dist = my_kd_tree.getNestDistByEx(test_array, find_data, min_dist, min_data)    ### 穷举法查找

用%time命令来显示单步运行查找算法所需的时间，运行结果如下：

可以看到两种算法最终查找到的最短距离以及最近邻数据点都是一样的，证明了算法的正确性。同时kd树查找过程只用了1ms左右，而穷举法查找用了70ms左右，二者相差了70倍，当然随着数据量增大这个差距还会继续增加的，最终应该会趋于某个极限值。

代码随想录算法训练营第 20 天 | LeetCode235. 二叉搜索树的最近公共祖先 LeetCode701.二叉搜索树中的插入操作 LeetCode 450.删除二叉搜索树中的节点 HIT最菜电控代码随想录算法训练营算法 leetcode 数据结构 c++
代码随想录算法训练营Day20代码随想录算法训练营第20天|LeetCode235.二叉搜索树的最近公共祖先LeetCode701.二叉搜索树中的插入操作LeetCode450.删除二叉搜索树中的节点目录代码随想录算法训练营前言LeetCode235.二叉搜索树的最近公共祖先LeetCode701.二叉搜索树中的插入操作LeetCode450.删除二叉搜索树中的节点一、LeetCode235.二叉
《零代码调用最强开源模型DeepSeek-Lite：15分钟实战案例解析》煜bart 人工智能
一、突破性技术揭秘DeepSeek-Lite-16K作为当前中文开源模型的性能冠军，在CLUE评测中超越GPT-4的表现令人震惊。该模型采用独特的动态窗口技术，支持最大16ktokens的上下文处理能力，在智能客服、法律文书处理、医疗诊断等场景展现惊人潜力。##二、三步极速接入指南```python#实战代码片段（基于HuggingFace平台）fromtransformersimportAuto
vscode--工作区和相对路径一头大学牲程序--编程记录 vscode ide 编辑器
vscode的相对路径使用vscode编辑python项目时发现，它的相对路径是相对于当前工作根目录来定位的，也就是从工作文件夹的最顶级目录开始查找，而非是从当前执行文件开始查找。例子：根目录：F:\deep-learning-for-image-processing执行文件路径：F:\deep-learning-for-image-processing\pytorch_classificatio
Linux和RTOS简析 niuTaylor linux 运维服务器 macos macbook air 换硬盘扩内存
以下是针对Linux驱动开发、RTOS（实时操作系统）任务状态（就绪态）以及互斥锁的详细解释：一、Linux设备驱动1.什么是设备驱动？定义：设备驱动是操作系统内核的一部分，用于管理和控制硬件设备（如摄像头、键盘、传感器等）。作用：充当硬件与操作系统/应用程序之间的“翻译官”，将操作系统的指令转换为硬件能理解的信号，反之亦然。2.驱动分类字符设备驱动：按字节流访问的设备（如键盘、鼠标）。块设备驱动
基于python+mysql+vue的医院门诊管理系统自不量力的A同学 mysql
主要使用技术环境需要1.运行环境：python3.82.IDE环境：pycharm+mysql5.73.数据库工具：Navicat154.硬件环境：windows10/118G内存以上；或者MacOS；5.数据库：MySql5.7版本；技术栈后端：python+django前端：vue+CSS+JavaScript+jQuery+antdesign代码结构server目录是后端代码web目录是前端
基于python的家政预约管理系统源码+运行步骤冷琴1996 Python系统设计 python 开发语言
功能介绍平台采用B/S结构，后端采用主流的Python语言进行开发，前端采用主流的Vue.js进行开发。学习技术问题可以留言。整个平台包括前台和后台两个部分。前台功能包括：首页、详情页、用户中心、家政入驻模块。后台功能包括：总览、家政管理、分类管理、标签管理、评论管理、用户管理、运营管理、日志管理、系统信息模块。源码地址https://github.com/geeeeeeeek/python_ji
基于python+django+vue.js开发的健身房管理系统源码+运行步骤冷琴1996 Python系统设计 python django vue.js
功能介绍平台采用B/S结构，后端采用主流的Python语言进行开发，前端采用主流的Vue.js进行开发。技术学习中的问题可以留言。功能包括：教练管理、会员管理、场地管理、设备管理、用户管理、日志管理、系统信息模块。源码地址https://github.com/geeeeeeeek/python_fitness演示地址http://fitness.gitapp.cn演示帐号：用户名：admin123
数据分析面试全攻略：项目经验篇代码CC 数据分析（包括各种面试题）数据分析面试 python
引言：为什么项目经验是数据分析面试的“敲门砖”？在数据分析岗位的面试中，项目经验是最核心的竞争力证明。HR视角：80%的面试官会通过项目细节判断候选人的真实能力技术视角：项目是数据清洗、建模分析、业务落地的综合体现误区警示：单纯罗列工具名称（如Python/SQL）≠具备实战能力本文将系统讲解如何用STAR法则包装项目、如何选择高含金量数据集、以及如何通过和鲸社区快速积累实战经验。文末提供10个可
vue2和vue3的diff算法有什么区别？浮生无聊 vue.js javascript 前端面试
1、diff算法是什么？diff算法是一种通过同层的树节点进行比较的高效算法。其有两个特点：只会在同层进行比较，不会跨层比较在diff比较过程中，循环从两边向中间比较diff算法在很多场景下都有应用，在vue中，作用于虚拟dom渲染成真实dom的新旧虚拟节点比较。diff整体策略为：深度优先，同层比较。Vue2和Vue3中的diff算法的主要区别：1、vue2的diff算法vue2使用了经典的di
Python-Django毕业设计医院门诊管理信息系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
【设计模式】（22）模板方法模式 xiyubaby.17 设计模式 Java教程设计模式模板方法模式
模板方法模式（TemplateMethodPattern）教程一、模式定义模板方法模式在父类中定义了一个算法的骨架，允许子类在不改变算法结构的前提下重写某些特定步骤。核心目标：复用公共流程，差异化实现细节，确保算法步骤的稳定性和扩展性。二、适用场景统一流程，差异细节：多个类有相同流程但某些步骤实现不同（如数据解析、文档生成）。框架设计：框架定义核心流程，用户通过子类扩展具体行为（如SpringJd
python+django+vue医院门诊挂号预约管理系统57wsx QQ_402205496 django pycharm python
开发语言：Python框架：django/flaskPython版本：python3.7.7数据库：mysql数据库工具：Navicat开发软件：PyCharm主要功能有：管理员功能：系统首页、个人中心、用户管理、医生管理、疫情公告管理、行动轨迹管理、异样报告管理、科室信息管理、异常报告管理、系统管理、医院信息管理、预约信息管理、在线聊天管理、聊天回复管理、我的收藏管理。用户功能模块：系统首页、个
Python 入门『六哥』 Python python 开发语言
Python安装检测许多PC和Mac都已经安装了python。如果需要检查是否已在WindowsPC上安装了python，请在开始栏中寻找Python或在命令行（cmd.exe）上运行以下命令:C:\Users\YourName>python--version如果是检查是否在Linux或Mac上安装了python，请在Linux上打开命令行或在Mac上打开终端并键入:python--version
Python爬虫|获取大麦网演出信息最好的药物是乌梅 python 爬虫开发语言
使用Selenium库自动化浏览器操作，从大麦网的搜索结果页面抓取演唱会信息，并将这些信息保存到一个CSV文件中代码的主要步骤包括：1.初始化WebDriver。2.打开指定的URL。3.模拟点击“全部”按钮。4.循环抓取每一页的演唱会信息，并写入CSV文件。5.关闭WebDriver。代码拆分讲解1.导入相关库fromselenium.webdriver.supportimportexpecte
数码管绘制程序(python) 最好的药物是乌梅 python 开发语言
题目自行设计界面上的输出信息"加上班级姓名学号,日期的年月日等"包括字体、颜色、样式均可自行编辑.将——————————的每一行补充正确的代码。importturtle,datetimedefdrawLine(draw):#绘制单段数码管turtle.pendown()ifdrawelseturtle.penup()turtle.fd(40)——————————————————————（1）———
【蓝桥杯速成】| 3.数据结构最好的药物是乌梅算法数据结构蓝桥杯
题目一：两数之和问题描述1.两数之和-力扣（LeetCode）给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以按任意顺序返回答案。解题步骤从数组中找出和为目标值的两个数字，返回其数组下标用最简单的思维就是嵌套循环来一套，遍历到一个以后，再去遍历下
tensorflow 不支持python3以下的版本辽宁大学神经网络神经网络
小白一枚，没用过tensorflow，所以在安装的时候导致版本错误安装不上。遇到这种情况建议换python的版本。
第5篇：从入门到精通：深入详解Python模块与包管理的应用猿享天开 python 开发语言
第5篇：模块与包管理目录模块概述什么是模块导入模块标准库简介创建与使用自定义模块创建模块导入自定义模块模块搜索路径包（Packages）什么是包创建包导入包中的模块常用内置模块介绍math模块datetime模块os模块sys模块模块与包的最佳实践命名规范组织结构避免循环导入示例代码常见问题及解决方法总结模块概述什么是模块模块是Python中组织代码的一种方式。一个模块就是一个包含Python定义
SpringBoot实战系列之发送短信验证码 m0_67401660 面试学习路线阿里巴巴 android 前端后端
大家好，我是??大二在读作业侠系列最新文章??Java实现聊天程序SpringBoot实战系列??SpringBoot实战系列之发送短信验证码一起刷算法与数据结构最新文章??一起刷算法与数据结构-树篇1环境搭建大集合环境搭建大集合(持续更新）内容速览:1.短信验证码平台选择考虑点2.短信平台3.实战发送短信验证码1.短信验证码平台选择考虑点各个类型短信价格短信到达率、到达时间短信内容变量灵活，便持
用Python打造智能姓名生成器：从数据分离到AI赋能灏瀚星空 python 人工智能开发语言经验分享笔记
用Python打造智能姓名生成器：从数据分离到AI赋能目录项目概述与功能清单环境准备与工具选择项目架构设计核心代码实现AI古文解析模块交互界面开发使用示例与效果展示扩展思路与优化建议1.项目概述与功能清单核心功能数据管理CSV文件存储姓氏/名字库支持用户导入/导出数据交互界面姓名生成与实时预览已选名单管理（增删改查）排除词输入框（黑名单过滤）AI赋能从古文中提取字词及注解自动生成姓名寓意解析扩展功
Python常用10个模块详解：提升开发效率的利器 Python_trys python microsoft 数据库开发语言 Python入门 Python基础 Python教程
包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取！】Python作为一门功能强大且易于学习的编程语言，拥有丰富的标准库和第三方模块，能够帮助开发者快速实现各种功能。本文将详细介绍Python中常用的10个模块，帮助你在开发中更高效地完成任务。1.os模块：操作系统交互os模块提供了与操作系统交互的功能，包括文件操作、目录管理、环境变量等。常用功能：文件与目录操作：importos#获取当前
掌握Conda的艺术：精通channels管理 2401_85702623 conda
掌握Conda的艺术：精通channels管理Conda作为Python和其他科学计算包的包管理器，其强大的包管理能力很大程度上依赖于channels。channels是Conda用来查找和安装包的源。默认情况下，Conda会从Anaconda的官方源安装包，但有时我们需要添加额外的channels来获取更多的包或者特定版本的包。本文将详细介绍如何在Conda中使用condaconfig--add
区间合并问题六七_Shmily 数据结构与算法分析算法区间合并
在算法中遇到区间合并问题时，可以从以下角度进行分析和解决：一、核心思路：排序与贪心策略排序预处理将区间按照起始端点升序排序，确保后续处理时相邻区间可能重叠。这是解决区间合并问题的关键预处理步骤[。排序后，重叠或相邻的区间会连续排列，便于合并（例如，区间[1,3]和[2,6]会相邻）。贪心合并逻辑遍历排序后的区间，逐个判断是否与结果集中的最后一个区间重叠：重叠条件：当前区间的起始点≤结果集最后一个区
Python模块详解：定义、操作方法与高级特性编程咕咕gu- python 数据库开发语言学习路线数据分析
如果你正在学习Python，那么你需要的话可以点击这里Python重磅福利：入门&进阶全套学习资料、电子书、软件包、项目源码等等免费分享！在Python中，模块是一个包含Python定义和语句的文件。模块可以定义函数、类和变量。模块也可以包含可执行的代码。你可以通过import语句将一个模块中的函数、类等导入到当前的程序中，以便能够重复使用代码，提高代码的可维护性。模块定义一个Python文件（.
STL学习笔记 2301_76962440 c++学习笔记
包含数据结构和数学函数#includeusingnamespacestd;boolcmp(paira,pairb){//第二位从小到大if(a.second!=b.second)returna.secondb.first;}intgcd(inta,intb){if(!b)returna;elsereturngcd(b,a%b);}intlcm(inta,intb){returna/gcd(a,b)
3.13.0 python 配置tensorflow（CPU版本） m0_Gattuso tensorflow 人工智能 python
condacreate--nametestpython=3.12activatetestpipinstalltensorflow上面3步骤在condaprompt里完成退出时记得condadeactivate来源：Windows下tensorflow/pytorch环境配置_pycharm怎么配置tensorflow环境-CSDN博客然后问题出现了：condaenvironment里什么都没有，理
2021-05-21 python中curses基本用法 zerfew python curses cli
有时候linux系统没有界面，可能需要在terminal终端完成程序的交互和状态显示，C语言的ncurses支持命令行界面程序开发，curses是基于ncurses实现的python终端界面库。本文实现一个简单的demo小程序，方便初学者学习和使用。首先上demo主程序#-*-coding:UTF-8-*-importcursesimportlocalelocale.setlocale(local
构建可扩展的Python API与框架：实践与指南清水白石008 Python题库 python 计算机 python 开发语言
构建可扩展的PythonAPI与框架：实践与指南一、引言在当今的软件开发中，可扩展性已成为一个不可或缺的特性。一个可扩展的API或框架不仅能够满足当前的需求，还能轻松应对未来的变化和增长。本文将深入探讨在Python中如何设计一个可扩展的API或框架，通过实际例子和详细步骤，为您提供一个实用的指南。二、理解可扩展性可扩展性指的是系统或软件能够容易地适应变化，包括但不限于新功能的添加、现有功能的修改
在 Python 中实现 RESTful API 的完整指南清水白石008 python Python题库 python restful 开发语言
在Python中实现RESTfulAPI的完整指南随着互联网的发展，RESTfulAPI（RepresentationalStateTransfer）已成为现代应用程序架构的重要组成部分。RESTfulAPI允许不同系统之间通过HTTP协议进行通信，提供了一种简单而灵活的方式来访问和操作资源。在这篇文章中，我们将深入探讨如何在Python中实现RESTfulAPI，并提供简单的示例代码。一、什么是
MIE 1622H Risk-Based and Robust 后端
MIE1622H:Assignment2–Risk-BasedandRobustPortfolioSelectionStrategiesDr.OleksandrRomanko,MohammadrezaMohammadiFebruary10,2025Due:Friday,March7,2025,notlaterthan11:59p.m.UsePythonforallMIE1622Hassignmen
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

python实现kd树以及最近邻查找算法