机智的冷露

KNN算法详解并自主构建kd树及sklearn简单实现

k-近邻算法（KNN）

一、简介

1、定义

核心思想：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。（近朱者赤，近墨者黑）

2、分类

有监督学习、多分类算法

3、简单流程

（1）计算已知类别数据集中的样本与当前样本的距离。
（2）按顺序递增排序。
（3）选取距离最小的k个点。
（4）统计这k个样本类别出现的频率最高的类别。
（5）出现的频率最高的类别即为预测分类。

4、优缺点

优
简单有效
重新训练代价低
适合类域交叉样本
适合大样本自动分类（不适合类域较小的样本）
缺
惰性学习
类别评分不是规格化
输出可解释性不强
对不均衡的样本不擅长（一般若达到4：1，就说不均衡）
计算量较大

二、距离公式

1、欧氏距离：

在m维空间中两个点之间的真实距离
欧氏距离体现数值上的绝对差异
缺点：它将样品的不同量纲之间的差别等同看待

2、曼哈顿距离（城市街区距离）

用以标明两个点在标准坐标系上的绝对轴距总和

3、切比雪夫距离

各坐标数值差绝对值的最大值

4、闵可夫斯基距离

闵可夫斯基距离不是一种距离，而是一组距离的定义，是对多个距离度量公式的概括性的表述。

p=1时为曼哈顿距离
p=2时为欧氏距离
p=无穷大时为切比雪夫距离

注意：
（1）闵氏距离与特征参数的量纲（单位）有关，有不同量纲的特征参数的闵氏距离常常是无意义的。
（2）闵氏距离没有考虑特征参数间的相关性，而马哈拉诺比斯距离解决了这个问题。

5、标准化欧氏距离

解决了欧氏距离将样品的不同量纲之间的差别等同看待的缺点

Sk：当前分量标准差
eg：求（0，5）（1，6）（2，7）中（0，5）（1，6）的距离，Sk1=0，1，2标准差，Sk2=5，6，7标准差。
ps：若将1/Sk^2看作一个权重，也可称为加权欧氏距离。

6、余弦距离

余弦距离体现方向上的相对差异。将数据映射为高维度的向量，余弦值接近1，夹角趋于0，表明两个向量越相似，余弦值接近于0，夹角趋于90度，表明两个向量越不相似。

7、汉明距离

两个不同字符串，将其中一个变为另一个所需要做的最小字符替换数。
对两个字符串进行异或运算，并统计结果为1的个数，那么这个数就是汉明距离。
ps：汉明重量是字符串相对于同样长度的零字符串的汉明距离，也就是说，它是字符串中非零的元素个数：对于二进制字符串来说，就是 1 的个数，所以 11101 的汉明重量是 4。
汉明距离更多的用于信号处理，表明一个信号变成另一个信号需要的最小操作。

8、杰卡德距离

杰卡德距离(Jaccard Distance) 是用来衡量两个集合差异性的一种指标，它是杰卡德相似系数的补集，被定义为1减去Jaccard相似系数。而杰卡德相似系数(Jaccard similarity coefficient)，也称杰卡德指数(Jaccard Index)，是用来衡量两个集合相似度的一种指标。

9、马氏距离

表示点与一个分布之间的距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是，它考虑到各种特性之间的联系（例如：一条关于身高的信息会带来一条关于体重的信息，因为两者是有关联的），并且是尺度无关的(scale-invariant)，即独立于测量尺度。
马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为Σ的随机变量之间的差异程度。
如果协方差矩阵为单位矩阵，那么马氏距离就简化为欧氏距离，如果协方差矩阵为对角阵，则其也可称为正规化的欧氏距离。

μ：均值
Σ：协方差矩阵
协方差矩阵：
设

为n维随机变量，称矩阵
为n维随机变量的协方差矩阵（covariance matrix），也记为D（X）
，其中

为 X的分量Xi 和 Xj的协方差（设它们都存在）。
例如，二维随机变量的协方差矩阵为
所以协方差矩阵为对称非负定矩阵。

性质：

二、Scikit-learn

针对Python 编程语言的免费软件机器学习库。它具有各种分类，回归和聚类算法，包括支持向量机，随机森林，梯度提升，k均值和DBSCAN，并且旨在与Python数值科学库NumPy和SciPy联合使用。（依赖NumPy和SciPy）
. 分类、聚类、回归
. 特征工程
. 模型选择、调优
sklearn中文社区
sklearn官方文档中文版

三、k值大小选取

在实际应用中，K值一般取一个比较小的数值，例如采用交叉验证法（简单来说，就是一部分样本做训练集，一部分做测试集）来选择最优的K值。

过大：减小估计误差，受到样本均衡的问题，模型简单，增大近似误差。
过小：减小近似误差，容易受异常点的影响，模型复杂，过拟合，增大估计误差。
误差分析：

四、kd树

k近邻法最简单的实现是线性扫描（穷举搜索），即要计算输入实例与每一个训练实例的距离。计算并存储好以后，再查找K近邻。当训练集很大时，计算非常耗时。

1、简介

为了避免每次都重新计算一遍距离，算法会把距离信息保存在一棵树里，这样在计算之前从树里查询距离信息，尽量避免重新计算。其基本原理是，如果A和B距离很远，B和C距离很近，那么A和C的距离也很远。有了这个信息，就可以在合适的时候跳过距离远的点。（减少距离值的计算）

2、原理

构造kd树相当于不断地用垂直于坐标轴的超平面将K维空间切分，构成一系列的K维超矩形区域。kd树的每个结点对应于一个k维超矩形区域。利用kd树可以省去对大部分数据点的搜索，从而减少搜索的计算量。
其原理有点类似于“二分查找”：给出一组数据：[9 1 4 7 2 5 0 3 8]，要查找8。如果挨个查找（线性扫描），那么将会把数据集都遍历一遍。而如果排一下序那数据集就变成了：[0 1 2 3 4 5 6 7 8 9]，按前一种方式我们进行了很多没有必要的查找，现在如果我们以5为分界点，那么数据集就被划分为了左右两个“簇” [0 1 2 3 4]和[6 7 8 9]。因此，根本就没有必要进入第一个簇，可以直接进入第二个簇进行查找。把二分查找中的数据点换成k维数据点，这样的划分就变成了用超平面对k维空间的划分。空间划分就是对数据点进行分类，“挨得近”的数据点就在一个空间里面。

3、构建

（1）构建根节点，使根节点对应K维空间中包含所有实例的超矩形区域。
（2）构建子节点，使用递归的方法对K维空间进行切分，生成子节点。
（3）重复上述过程，直到子区域内没有实例。
（4）通常循环选择坐标轴对空间进行切分，选择坐标轴上的中位数为切分点，这样得出的kd树是平衡的。（左子树和右子树深度之差绝对值不超过一）
主要问题：
（1）选择向量的哪一维进行划分：最好在数据比较分散的那一维进行划分（方差较大的）
（2）如何划分：一般选择中位数划分

4、查询

从root节点开始，DFS搜索直到叶子节点，同时创建回溯队列，按顺序存储已经访问的节点。
如果搜索到叶子节点，当前的叶子节点被设为最近邻节点。
然后通过队列回溯:
如果当前点的距离比最近邻点距离近，更新最近邻节点.
然后检查以最近距离为半径的圆是否和父节点的超平面相交.
如果相交，则必须到父节点的另外一侧，用同样的DFS搜索法，开始检查最近邻节点。
如果不相交，则继续往上回溯，而父节点的另一侧子节点都被淘汰，不再考虑的范围中.
当搜索回到root节点时，搜索完成，得到最近邻节点。

DFS：
深度优先搜索算法（Depth First Search，简称DFS）：一种用于遍历或搜索树或图的算法。沿着树的深度遍历树的节点，尽可能深的搜索树的分支。当节点v的所在边都己被探寻过或者在搜寻时结点不满足条件，搜索将回溯到发现节点v的那条边的起始节点。整个进程反复进行直到所有节点都被访问为止。

5、kd树构建及查询实现

 import numpy as np
    class TreeNode:
        def __init__(self, s, d):
            self.vec = s  # 特征向量
            self.Dimension = d  # 即划分空间时的特征维度,这里选取方差最大的维度
            self.left = None  # 左子节点
            self.right = None  # 右子节点
            self.father = None  # 父节点（搜索时需要往回退）

        def __str__(self):
            return str(self.vec)  # print 一个 Node 类时会打印其特征向量
#求欧式距离
    def distance(arr1, arr2):
        res = 0
        for a, b in zip(arr1, arr2):
            res += (a - b) ** 2
        return res ** 0.5
#求出最大方差对应下标
    def myvar(data):
        data=np.array(data).T
        maxvar=0
        varindex=0
        index=0
        for i in data:
            if np.var(i)>maxvar:
                maxvar=np.var(i)
                varindex=index
            index+=1
        return varindex
#构建kd树
    def build(arr,  father):
        if len(arr) == 0:  # 样本空间为空则返回
            return None
        #确认分割维度
        l=myvar(data=arr)
        # 找x^l的中位数和对应特征向量,即arr[:][l]的中位数及arr[x][:]
        #取长度
        size = len(arr)
        # 直接对arr进行排序，因为要得到特征向量和划分子空间，由此直接对arr排序最便捷
        # 对l列进行排序
        arr.sort(key=(lambda x: x[l]))
        # 中位数的下标值
        mid = int((size - 1) / 2)
        # 创建节点
        root = TreeNode(arr[mid], l)
        root.father = father
        # 递归创建左右节点
        root.left = build(arr[0:mid] , root)  # 0:mid不包括mid，即[0,mid)
        root.right = build(arr[mid + 1:] , root)
        print(root.left, root.right,root.vec,root.Dimension)
        return root

#dfs寻找当前最近节点
    #root：kd树节点、father：父节点，stack：回溯队列、depth：深度
    def dfs(depth, root, father, stack,target):
        if root == None:
            return father
        stack.append(root)
        if target[root.Dimension]<root.vec[root.Dimension]:
            return dfs(depth + 1, root.left, root, stack,target)
        else:
            return dfs(depth + 1, root.right, root, stack,target)

    #获得回溯队列与当前最近节点
    def mykd(root,target):
        depth=0
        father=None
        mystack=[]
        dfs(depth,root,father,mystack,target)
        return mystack,root

#获得最近邻
    def mynearest(root, target):
        # 获取当前最近邻与回溯队列
        stack, nearest = mykd(root, target)
        # nearest_dis为当前最近邻离target的距离，即最小距离，也是超球体的半径
        nearest_dis = distance(nearest.vec, target)
        visited = {}  # 用来判断兄弟节点是否已经讨论过
        # 利用stack进行回溯，而非递归
        while stack[-1] != root:
            # 取出当前节点
            cur = stack[-1]
            # 将当前节点移出队列
            stack.pop()
            # 定义父亲节点father
            father = cur.father
            # 定义兄弟节点bro
            bro = father.left
            if father.left == cur:
                bro = father.right
            # 如果当前节点与target的距离小于最近距离，则更新最近结点和最近距离
            if distance(cur.vec, target) < nearest_dis:
                nearest = cur
                nearest_dis = distance(cur.vec, target)
            # 若当前节点没有递归过
            if visited.get(hash(cur)) == None:
                # 若超球体和父节点的超平面相交，相交则父节点的另一侧，即兄弟节点所在划分域可能存在更近的节点
                if father.vec[father.Dimension] - target[father.Dimension] < nearest_dis:
                    visited.update({hash(bro): 'yes'})
                    dfs(father.Dimension, bro, father, stack, target)
        return nearest_dis,nearest

    Featureset = [[1, 6, 2],
                  [2, 9, 3],
                  [5, 1, 4],
                  [9, 4, 7],
                  [4, 2, 6],
                  [6, 3, 5],
                  [7, 2, 5],
                  [9, 1, 4]]
    target = [1, 4, 5]

    # 递归构造kd树
    root = build(Featureset,  None)
    #获取最近距离及最近邻
    nearest_dis,nearest=mynearest(root,target)
    print("最近距离：", nearest_dis)
    print("最近邻：", nearest)

五、特征预处理

有时特征的数值或单位相差较大，容易影响预测结果，使得算法无法学习到其他的特征需要进行无量纲化，使其转移到统一规格（归一化，标准化）

1、归一化

对数据进行处理，使其同意映射在某一区间内（默认0~1）

鲁棒性较差，易受到异常点的影响，适合传统精确小数据。
API：sklearn.preprocessing.MinMaxScaler（feature_range=[0,1]）
feature_range：范围

#实例化转换器类(归一化)
transfer=sklearn.preprocessing.MinMaxScaler(feature_range=[2,3])
#导入数据
iris_data=transfer.fit_transform(iris.data)

# 把数据转换为dataframe格式
iris_data=pd.DataFrame(data=iris_data,columns=iris.feature_names)
iris_data['Specials']=iris.target

2、标准化

把数据变换到均值为0，标准差为一的范围内

API：sklearn.preprocessing.StandardScaler()

#实例化转换器类(归一化)
transfer=sklearn.preprocessing.StandardScaler()
#导入数据
iris_data=transfer.fit_transform(iris.data)
print(iris_data)

# 把数据转换为dataframe格式
iris_data=pd.DataFrame(data=iris_data,columns=iris.feature_names)
iris_data['Specials']=iris.target

可通过

transfer.var_
transfer.mean_`

查看每一列的方差及均值

六、交叉验证与网格搜索

将训练集再分为n份，每一份都分别作为验证集，
分成几份就叫几折交叉验证。
为了使模型更加准确可信（并不能提高准确率）

超参数：需要手动输入的参数eg：KNN算法的k值
可设置多组超参数，用交叉验证来寻找最优参数组合来建立模型。
API: sklearn.model_selection.GridSearchCV(estimator,param_grid,cv)
estimator：估计器对象
param_grid：估计器对象所需参数（字典）eg：{‘n_neighbors’:[1,2,3]}
cv：几折交叉验证
n_jobs:运行的cpu个数

七、简单示例

1、

（1）导入KNN的api

from sklearn.neighbors import KNeighborsClassifier as KNN

sklearn.neighbors.KNeighborsClassifier（self, n_neighbors=5, *,
weights=‘uniform’, algorithm=‘auto’, leaf_size=30,
p=2, metric=‘minkowski’, metric_params=None, n_jobs=None,
**kwargs)
常用参数： n_neighbors=5 k-近邻算法中k值
algorithm=‘auto’ 选择搜索算法
auto：自动选择
brute：暴力检索
kd tree：kd树，20维以下效率较高
ball tree：克服kd树高位失效问题，每一个节点都是一个超球体

（2）生成简单数据

index0=[ '电影'+str(i) for i in range(1,8)]
columns0=[ chr(ord('A')+i)+'镜头' for i in range(8)]+['电影类型']
data=pd.DataFrame(data=np.random.randint(0,100,(7,9)),index=index0,columns=columns0)
data['电影类型']=['动作类','动作类','喜剧类','喜剧类','喜剧类','爱情类','动作类']
print(data)


>>>
     A镜头  B镜头  C镜头  D镜头  E镜头  F镜头  G镜头  H镜头 电影类型
电影1   99    1   95   47   15   62   45    5  动作类
电影2   94    9   40   18   84   46   84    2  动作类
电影3   20   87   77    9   34   41   56    2  喜剧类
电影4   65   77   25   51   54   81   51   97  喜剧类
电影5   26   12   19   76   27   89   87   59  喜剧类
电影6   23   21   86   70    5   50   24   10  爱情类
电影7   75   20    3   23   65   34   34   96  动作类

（3）训练模型

 #实例化API
    estimator=KNN(n_neighbors=2)
    #使用fit(x,y)方法进行训练:x为特征值，y为目标值
    estimator.fit(X=data.iloc[:,:-1].values,y=data['电影类型'])

（4）数据预测

  #使用模型预测分类
    data2=np.random.randint(0,100,(3,8))
    print(estimator.predict(data2))


>>>
['动作类' '喜剧类' '动作类']

2、

（1）导入数据集及查看

sklearn自带一些小数据集,可直接导出

 sklearn.datasets.load_[name]

也可下载一些sklearn较大的数据集

 sklearn.datasets.fetch_[name]

他们的返回值为sklearn.utils.Bunch，类字典型，主要包含
data：特征数据数组，numpy.ndarry二维数组
target：标签数组，numpy.ndarry一维数组
DESCR：数据描述
feature_names:特征数据名
target_names:标签名（）新闻数据、手写数字、回归数据集没有
此次我们使用鸢尾花数据集

    from sklearn.datasets import load_iris
    iris=load_iris()

查看

def data_descr():
    print(iris.feature_names)
    print(iris.data)
    print(iris.target_names)
    print(iris.target)
    print(iris.DESCR)


data_descr()

使用sepal length (cm), sepal width (cm), petal length (cm),petal width (cm)四个特征值对鸢尾花的种类（Specials）进行预测

（2）查看数据分布

**Seaborn：**基于matplotlib的图形可视化python包。它提供了一种高度交互式界面，便于用户能够做出各种有吸引力的统计图表。
Seaborn是在matplotlib的基础上进行了更高级的API封装，从而使得作图更加容易，在大多数情况下使用seaborn能做出很具有吸引力的图，而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充，而不是替代物。同时它能高度兼容numpy与pandas数据结构以及scipy与statsmodels等统计模式。

导入所需包
ps:seaborn绘图时使用DataFrame，所以需要pandas

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

使用seaborn.lmplot绘图
lmplot(
*,
x=None, y=None,
data=None,
hue=None, col=None, row=None, # TODO move before data once * is enforced
palette=None, col_wrap=None, height=5, aspect=1, markers=“o”,
sharex=None, sharey=None, hue_order=None, col_order=None, row_order=None,
legend=True, legend_out=None, x_estimator=None, x_bins=None,
x_ci=“ci”, scatter=True, fit_reg=True, ci=95, n_boot=1000,
units=None, seed=None, order=1, logistic=False, lowess=False,
robust=False, logx=False, x_partial=None, y_partial=None,
truncate=True, x_jitter=None, y_jitter=None, scatter_kws=None,
line_kws=None, facet_kws=None, size=None,
)
data：关联到数据集
x、y：对应坐标轴列名
fit_reg=True：是否进行线性回归
col_wrap:指定每行的列数，最多等于col参数所对应的不同类别的数量
aspect:控制图的长宽比
sharex:共享x轴刻度（默认为True）
sharey:共享y轴刻度（默认为True）
hue:用于分类
ci:控制回归的置信区间
x_jitter:给x轴随机增加噪音点
y_jitter:给y轴随机增加噪音点
order:控制进行回归的幂次

# 把数据转换为dataframe格式
iris_data=pd.DataFrame(data=iris.data,columns=iris.feature_names)
iris_data['Specials']=iris.target

def show_dataset(data,col1,col2):
    sns.lmplot(x=col1,y=col2,data=data,hue=data.columns[-1],fit_reg=False)
    plt.xlabel=col1
    plt.ylabel=col2
    plt.title('鸢尾花种类分布图')
    plt.show()
show_dataset(iris_data,iris_data.columns[1],iris_data.columns[2])

（3）数据集划分

API：

sklearn.model_selection.train_test_split()

train_test_split(*arrays，test_size=None,train_size=None,random_state=None,shuffle=True,stratify=None)

return:x_train,x_test,y_train,y_test
arrays：分割对象同样长度的列表或者numpy 的ndarray。
test_size：两种指定方法。1：指定小数。小数范围在0.0~0.1之间，它代表test集占据的比例。2：指定整数。整数的大小必须在这个数据集个数范围内，要是test_size在没有指定的场合，可以通过train_size来指定。（两个是对应关系），默认25%
train_size：和test_size相似。
random_state:随机种子

（4）完整代码

    from sklearn.datasets import load_iris
    from sklearn.neighbors import KNeighborsClassifier
    from sklearn.preprocessing import StandardScaler
    from sklearn.model_selection import train_test_split
    from sklearn.model_selection import GridSearchCV
    #导入数据集
    iris=load_iris()
    #数据集划分
    x_train,x_test,y_train,y_test=train_test_split(iris['data'],iris['target'],test_size=0.2,random_state=2)
    #标准化
    transfer=StandardScaler()
    x_train=transfer.fit_transform(x_train)
    x_test=transfer.fit_transform(x_test)
    #实例化估计器
    esitmator=KNeighborsClassifier(algorithm='auto')
    #参数调优
    param_grid={'n_neighbors':[1,2,3]}
    esitmator=GridSearchCV(estimator=esitmator,param_grid=param_grid,cv=3)
    #训练模型
    esitmator.fit(x_train,y_train)
    #模型评估
    #1、直接比较
    pre=esitmator.predict(x_test)
    print(pre)
    print(pre==y_test)
    #2、模型评分(准确率)
    esitmator.score(x_test,y_test)
    #查看参数调优结果
    print('交叉验证最好结果',esitmator.best_score_)
    print('交叉验证最好估计器',esitmator.best_estimator_)
    print('每次的结果',esitmator.cv_results_)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
UNIX域套接字
1、UNIX域套接字的定义UNIX域套接字是进程间通信（IPC）的一种方式，不涉及网络协议栈，因此在同一台主机上的通信中，它比基于TCP/IP协议的网络套接字更快速、更高效。2、UNIX域套接字的分类字节流套接字（SOCK_STREAM）：提供面向连接的、可靠的数据传输服务。数据报套接字（SOCK_DGRAM）：提供无连接的数据传输服务，数据以独立的数据报形式传输。3、UNIX套接字与TCP/IP
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite