helton_yann

【机器学习实验一】手撕 kNN(K-Nearest Neighbor, k最邻近算法)

文章目录

kNN算法
- 1.算法简介
- 2.算法思想
- 3.算法流程
- - kNN算法的一般流程
  - 伪代码
  - - 时间复杂度
- 4.代码部分
- - kNN算法的python实现
  - kNN实现手写数字分类(书上的例子)
  - kNN实现约会网站配对(书上的例子)
  - kNN实现手写数字分类(sklearn的例子)
  - - 数据集部分可视化
    - 预测，计算accuracy
    - 预测结果评估，可视化混淆矩阵(k = 200)，计算precision， recall值
- 5.实验部分
- - 数据归一化对预测精度的影响(基于约会网站的例子)
  - k的取值对决策的影响
  - 实验结论
  - 实验代码
- 6.算法优缺点总结

kNN算法

本次博客的所有源代码均已上传个人github仓库，若对您有帮助，欢迎给个star
https://github.com/Scienthusiasts/Machine-Learning

1.算法简介

kNN算法全称叫k-Nearest Neighbors，即k最近邻算法。1968年由 Cover和 Hart 提出。在机器学习算法中，kNN算法的思想简洁，可解释性强，同时也是一个有监督学习通用算法(既适用于分类问题也适用于回归问题)。不过一般情况下kNN在分类领域更为常用。

2.算法思想

kNN的思想非常容易理解：即对于一个待预测样本，该样本的类别可以用距离它最近的k个带有标签的邻居来表示：

图中X_μ为待预测点，与其最近的k个点中(k=5)，红色的点占了4个，因此该点被分类为红色。就是这么简单！

kNN算法有一个特点，那就是相对于其他分类或回归算法，kNN算法本身是无参的，不会对数据的分布做出任何假设。什么意思呢，比如说，像一般的多元线性回归或者Softmax多分类算法，算法本身是自带学习权重的，权重参数需要通过优化算法(梯度下降)学习得来，而kNN算法本身不带参数，只需要通过比较就能给出分类结果。

不过，kNN算法也并不是"一无所有"，它仍然具有两个非常重要的超参数，一个是算法的距离度量方式，另一个就是k值的选取。对于距离度量方式，最常用的就是欧式距离度量(L2)，除此之外，距离公式的选择还可以是曼哈顿距离(L1)，闵可夫斯基距离(Lp), 余弦距离等等。距离度量的选择可以根据算法实现具体任务的不同而不同。而对于K值的选取，则关系到算法的泛化能力，这一细节我们将会在后续的部分详细讨论。

3.算法流程

kNN算法的一般流程

1.计算待预测数据与各个训练数据之间的距离；
2.按照距离的递增关系进行排序；
3.选取与待预测数据距离最小前K个点；
4.确定前K个点所在类别的出现频率；
5.返回前K个点中出现频率最高的类别作为测试数据的预测分类；

伪代码

时间复杂度

由于kNN算法无需训练，因此在算法的预测过程中，时间复杂度主要来源于两方面，一是对于数据集的遍历，另一个就是距离的计算，假设数据集的size为(m,n),即包含m个数据点，每个数据的维度为n，因此距离度量产生的时间复杂度为O(n),遍历数据集产生的时间复杂度为O(m),算法的时间复杂度为两者相乘O(mn).。(忽略排序的最小时间复杂度O(mlogm))

4.代码部分

kNN算法的python实现

import numpy as np


class kNN():
    def __init__(self, k, X_train, y_train, X_test):
        self.k = k
        self.X_train = X_train
        self.y_train = y_train
        self.X_test = X_test
        self.neighbors = np.zeros((len(self.X_test), len(self.X_train)))

    # 欧氏距离
    def EuclDist(self, x0, x1):
        return np.sum(np.square(x1 - x0))

    # 计算当前数据与标签数据的距离
    def Allneighbors(self):
        for i in range(len(self.X_test)):
            for j in range(len(self.X_train)):
                self.neighbors[i, j] = self.EuclDist(self.X_test[i], self.X_train[j]) # 计算欧式距离

    # 下标转为类别(分类问题)
    def index2label(self, index):
        knearest = self.y_train[index][:self.X_test.shape[0]] # 获取下标对应的标签
        # 统计K近邻的大多数:
        predict = []
        for i in range(self.X_test.shape[0]):
            predict.append(np.argmax(np.bincount(knearest[i]))) # 统计出现次数最多的类别
        return np.array(predict)

    # 下标转为数值(回归问题)
    def index2value(self, index):
        knearest = self.y_train[index][:self.X_test.shape[0]] # 获取下标对应的标签
        # 统计K近邻的大多数:
        predict = np.mean(knearest, axis=1) # 预测结果为k近邻的均值
        return predict.reshape(-1)

    # kNN算法主干
    def kNN(self, mode="classification"):
        # 1.计算距离
        self.Allneighbors() 
        # 2.按距离从小到大排序
        self.sort_index = np.argsort(self.neighbors, axis=1, kind='quicksort', order=None) 
        # 3.取前k个近邻
        self.sort_index = self.sort_index[:, 0:self.k] 
        # 4.确定前K个点所在类别的出现频率
        # 5.返回前K个点中出现频率最高的类别
        if mode == "classification":   # 分类
            return self.index2label(self.sort_index)
        if mode == "regression":       # 回归
            return self.index2value(self.sort_index)

kNN实现手写数字分类(书上的例子)

使用书本上的例子,原始文件采用txt文本文件以二值化01存储：

将原始文件压缩为(batches, h, w)的numpy矩阵格式转储：

def txt2img(path):
    X, y = [], []
    for files in os.listdir(path):
        file = open(path + files)
        data = []
        for line in file.readlines():
            row = []
            for pix in line[:-1]:
                row.append(int(pix))
            data.append(np.array(row))
        X.append(np.array(data))
        y.append(int(files.split('_')[0]))

    return np.array(X), np.array(y)


path = './testDigits/'
X, y = txt2img(path)
np.save('X_test.npy', X)
np.save('y_test.npy', y)

digit_recognize.py

import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split  # 划分训练集和验证集

# 导入自定义评估模块:
import sys; sys.path.append('../')
from kNN import kNN
sys.path.append('../../metrics')
from metrics import metrics



# 读取数据集
X_train = np.load('X_train.npy')
y_train = np.load('y_train.npy')
X_test = np.load('X_test.npy')
y_test = np.load('y_test.npy')


# 数据集可视化
for i in range(32):
    plt.subplot(4, 8, i+1)
    img = X_train[i*60,:]
    plt.imshow(img)
    plt.title(y_train[i*60])
    plt.axis("off")                
    plt.subplots_adjust(hspace = 0.3)  # 微调行间距
plt.show()



# KNN最近邻进行分类
knn = kNN(3, X_train, y_train, X_test)
pred = knn.kNN()
# 分类准确率
accuracy = np.mean(pred == y_test)
print(pred.shape)
print('准确率:', accuracy)

准确率: 0.9894291754756871

kNN实现约会网站配对(书上的例子)

读取约会数据集并可视化

# 读取约会数据集
def draw(X, y):
    # 数据集3D可视化
    fig = plt.figure()
    # 3D绘图
    ax = fig.add_subplot(111, projection='3d')
    # 按类别分类
    X_sort = [np.where(y==i+1) for i in range(3)]
    color = ["red", "green", "blue"]
    label = ["不喜欢", "一般", "极具魅力"]
    for i in range(3):
        ax.scatter(X[X_sort[i], 0], X[X_sort[i], 1], X[X_sort[i], 2], s=5, c=color[i], label=label[i]) 
        ax.legend()
    plt.show()

if __name__ == '__main__':
    path = './datingTestSet2.txt'
    # 读取数据
    X, y = read_datasets(path)
    # 划分训练集验证集
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
    # 标准归一化
    scaler = StandardScaler()
    scaler.fit(X_train)
    X_train = scaler.transform(X_train)
    X_test  = scaler.transform(X_test)
    # 数据集3D可视化
    draw(X_train, y_train)

kNN最近邻分类：

    # KNN 最近邻进行分类
    knn = kNN(10, X_train, y_train, X_test)
    pred = knn.kNN()
    # 分类准确率
    accuracy = np.mean(pred == y_test)
    print(pred.shape)
    print('准确率:', accuracy)

准确率: 0.9533333333333334

kNN实现手写数字分类(sklearn的例子)

数据集来源：sklearn.datasets.load_digits

sklearn 是python下的一个机器学习库，本次数据集使用sklearn下自带的手写数字数据集：load_digits

和家喻户晓的MNIST数据集相比，sklearn下的手写数字是8x8大小，数据集的特征维度有所减少。

数据集信息：

Each datapoint is a 8x8 image of a digit.

================= ==============

Classes 10

Samples per class ~180

Samples total 1797

Dimensionality 64

================= ==============

数据集部分可视化

import numpy as np
import matplotlib.pyplot as plt
import sklearn.datasets as datasets  # 数据集模块

# 读取数据集
X, y = datasets.load_digits(return_X_y=True)


for i in range(32):
    plt.subplot(4, 8, i+1)
    img = X[i,:].reshape(8, 8)
    plt.imshow(img)
    plt.title(y[i])
    plt.axis("off")                
    plt.subplots_adjust(hspace = 0.3)  # 微调行间距
plt.show()

预测，计算accuracy

import numpy as np
import matplotlib.pyplot as plt
import sklearn.datasets as datasets  # 数据集模块
from sklearn.model_selection import train_test_split  # 划分训练集和验证集

from kNN import kNN
# 读取数据集
X, y = datasets.load_digits(return_X_y=True)
# 随机划分训练集和验证集,使用sklearn中的方法
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# KNN最近邻进行分类(k=6)
knn = kNN(6, X_train, y_train, X_test)
pred = knn.kNN()
# 分类准确率
accuracy = np.mean(pred == y_test)
print('准确率:', accuracy)

准确率: 0.9805555555555555

可以看到算法的识别准确率还是比较可观的，然而代价就是算法需要将每一个样本点与训练集数据一一进行距离的计算，时间复杂度大约在O(nm)。

预测结果评估，可视化混淆矩阵(k = 200)，计算precision， recall值

class metrics():

    '''混淆矩阵可视化'''
    # y_hat.shape = [datasize,]
    # y.shape = [datasize,]
    # label.shape = [classes,]
    @staticmethod 
    def confusion_matrix_vis(y, y_hat, label):
        conf_mat = confusion_matrix(y, y_hat)
        # print(conf_mat)
        df_cm = pd.DataFrame(conf_mat, index = label, columns = label)
        heatmap = sns.heatmap(df_cm, annot = True, fmt = 'd', cmap = "hot")
        heatmap.yaxis.set_ticklabels(heatmap.yaxis.get_ticklabels(), rotation = 0, ha = 'right')
        heatmap.xaxis.set_ticklabels(heatmap.xaxis.get_ticklabels(), rotation = 50, ha = 'right')
        plt.ylabel('Ground Truth')
        plt.xlabel('Prediction')
        plt.show()


    '''评估分类模型的查准率与召回率'''
    @staticmethod 
    def precision_recall(y, y_hat, classes):
        conf_mat = confusion_matrix(y, y_hat)
        # total_num = np.sum(conf_mat)

        TP = [conf_mat[i,i] for i in range(classes)]
        FP = [np.sum(conf_mat[:,i]) - TP[i] for i in range(classes)]
        FN = [np.sum(conf_mat[i,:]) - TP[i] for i in range(classes)]
        # TN = [total_num - FN[i] - FP[i] - TP[i] for i in range(classes)]

        precision = [TP[i] / (TP[i] + FP[i]) for i in range(classes)]
        recall = [TP[i] / (TP[i] + FN[i]) for i in range(classes)]

        return precision, recall



label = [0,1,2,3,4,5,6,7,8,9]
# 绘制混淆矩阵
metrics.confusion_matrix_vis(y_test, pred, label)
precision, recall = metrics.precision_recall(y_test, pred, 10)
for i in range(10):
    print('类别%d: 查准率:%f, 召回率:%f' % (i, precision[i], recall[i]))

(540,)
准确率: 0.8907407407407407
类别0: 查准率:0.963636, 召回率:0.981481
类别1: 查准率:0.847826, 召回率:0.709091
类别2: 查准率:0.808511, 召回率:0.950000
类别3: 查准率:0.892857, 召回率:0.980392
类别4: 查准率:0.920635, 召回率:0.906250
类别5: 查准率:0.934783, 召回率:0.843137
类别6: 查准率:0.906250, 召回率:0.983051
类别7: 查准率:0.910448, 召回率:0.968254
类别8: 查准率:0.953488, 召回率:0.788462
类别9: 查准率:0.754717, 召回率:0.784314

5.实验部分

数据归一化对预测精度的影响(基于约会网站的例子)

一般情况下，机器学习算法对于输入的数据都有一个普遍的要求，那就是输入数据的量纲必须尽可能的一致，即输入特征不同特征维度之间的尺度范围应尽量保持一致。

在约会网站的例子中，每年获得的飞行常客里程数与其他维度的量纲存在数量级别的差距，因此在计算过程中，量纲较大的维度的损失将主导数据的总损失(损失类比kNN的距离计算)，宏观来看就是，数据的分布在量纲大的维度十分突出，其余的维度分布不明显，仿佛数据被降维了：

经过多次实验，未归一化数据与归一化数据在预测精度上的比值大约在0.83左右(k=200)：

… …
未归一化准确率: 0.8033333333333333
归一化后准确率: 0.96
比值：0.8368055555555556
… …

可见，数据归一化能够提升kNN算法的预测精度。

k的取值对决策的影响

在算法思想部分我们稍微提到了kNN算法一个非常重要的超参数k，k的值决定了算法做出最终决策需要参考的近邻数，由于k是算法的一个超参，因此我们可以通过将k的值设置为一个自变量，通过绘制k-acc曲线来寻找一个比较合适的k值：

实验结论

上面这张图仍然是基于sklearn.datasets.load_digits数据集所绘制的，实验采取将数据集以4：1的比例划分为训练集和验证集，横轴表示算法的k的取值(1-100)，纵轴表示最终验证集的识别准确率。实验表明，当k的取值在5左右时，算法会有较好的准确率，当k值逐渐增大时，准确率明显呈现下降的趋势。

一个可能的解释是k值反映了kNN模型的复杂程度，这个解释实际上是相对于有参机器学习算法而言。

k值越小，代表模型的‘感受野’越小，待分类数据对于近邻数据的依赖程度也就越大，模型也就越复杂。一旦近邻数据存在噪声或是特征不够一般，模型就有极大的概率出错。这在有参机器学习上实则是一个过拟合概念。

相反的，k值越大，模型的‘感受野’也就越大，待分类数据对于近邻数据的依赖程度也就越小(因为参与决策的数据增多了），这时候表示模型越简单，比较不容易受到异常点或是噪声的影响，模型的泛化能力更好。然而实验结果表明k值也不能太大，k值越大，模型的归纳能力也就越差，这实际上也一种欠拟合现象。一个极端的情况是，当k值等于训练样本数时，对于任意输入样本，模型的决策都相同，这时候模型的归纳能力为0

对于上面的描述，使用一个可视化的例子可能会更直观些：

上面的图示中，我使用kNN算法来完成一个函数回归任务(回归方法为取k近邻的均值)，每一张图表示一个等高线地形图，每张图的采样点均为2500。

待预测函数：
$y)=\sin \left(\sqrt{x^{2}+y^{2}}\right)+\cos (x)$
左侧的GT表示函数的真值，右侧依次表示当k=(1, 50, 300, 500, 1000, 2000, 2300, 2500)时算法的回归效果。可见随着k值的增大，算法预测结果越“平滑”，预测样本之间的特征也越相似。当k=2500时，算法相当于求取数据点的均值，所有数据点被回归到了同样的值。

实验代码

生成回归数据：

import numpy as np
import matplotlib.pyplot as plt

class datasets():

    def F(self, x, y):
        return np.sin(np.sqrt(x**2 + y**2)) + np.cos(x)

    def gen_data(self):
        # 生成x,y的数据
        n = 50
        x, y = np.linspace(-30, 30, n), np.linspace(-30, 30, n)
        # 把x,y数据生成mesh网格状的数据
        X, Y = np.meshgrid(x, y)
        Z = self.F(X, Y)

        x = X.reshape(-1, 1) 
        y = Y.reshape(-1, 1)
        z = Z.reshape(-1)
        data = np.c_[x, y]
        
        return X, Y, Z, data, z

预测与数据可视化：

def save_prediction():
    # 读取数据集
    data = datasets()
    X_grid, Y_grid, Z, X, y = data.gen_data()
    # 划分训练集和验证集,使用sklearn中的方法
    # KNN最近邻进行分类
    knn = kNN(1, X, y, X)
    pred = knn.kNN(mode="regression").reshape(50, 50)
    np.save('k=1.npy', pred)

def k_regression_visualize():
    k = ['1', '50', '300', '500', '1000', '2000', '2300', '2500']
    data = datasets()
    X_grid, Y_grid, Z, _, _ = data.gen_data()

    plt.figure(figsize=(26, 13))
    for i in range(8):
        plt.subplot(2,4,i+1)
        plt.title('k='+k[i])
        pred = np.load('k='+k[i]+'.npy')
        contour = plt.contourf(X_grid, Y_grid, pred, 100, cmap='bwr')
        plt.colorbar(contour)
    plt.subplots_adjust(left=0.02,bottom=0.05,right=0.98,top=0.95,wspace=0.07,hspace=0.1)
    plt.savefig('./kNN.png',dpi=100)
    # plt.show()

6.算法优缺点总结

优点：

算法简洁，易于理解，可解释性强。

kNN属于一种惰性算法，因此不需要训练。

缺点：

算法需要在内存中存储所有的数据集，内存占用高

算法预测阶段的时间复杂度高，存在维度灾难问题

对k值敏感，超参数k不好确定

机器学习实验专栏系列文章：
【机器学习实验一】手撕 kNN(K-Nearest Neighbor, k最邻近算法)
【机器学习实验二】决策树(Decision Tree)及其在图像识别任务上的应用
【机器学习实验三】纯手撕三种朴素贝叶斯算法(Naive Bayes)，并进行IMDB影评数据集分类及手写数字识别

Streamlit，一个超强的 Python 应用开发库！一行玩python python 开发语言
大家好，我是“一行”。今天，我们要来聊一个非常酷的Python库——Streamlit。如果你有过构建Web应用的经验，或者你对快速搭建交互式应用感兴趣，那么Streamlit会是一个非常棒的工具。它可以让你用极少的代码，快速创建出功能强大且美观的Web应用。无论你是数据分析师、机器学习工程师，还是Python初学者，Streamlit都能帮你轻松实现数据可视化、模型展示等功能。今天我们就从基础开
python 开发app 三希 python 开发语言
在Python中开发应用程序（通常指的是移动应用）有多种方法。以下是两种常见的技术栈：KivyKivy是一个开源Python库，用于快速开发跨平台的触控应用。它支持Android、iOS、Windows、MacOS和Linux。以下是使用Kivy开发的基本步骤：1.安装Kivy:在命令行中使用pip安装Kivy：pipinstallkivy2.创建你的应用:创建一个简单的Python文件，比如ma
数据结构——查找二叉树 xb1132 数据结构算法
二叉搜索树的概念如图所示，二叉搜索树（binarysearchtree）满足以下条件。对于根节点，左子树中所有节点的值num，说明目标节点在cur的左子树中，因此执行cur=cur.left。若cur.val=num，说明找到目标节点，跳出循环并返回该节点。二叉搜索树的查找操作与二分查找算法的工作原理一致，都是每轮排除一半情况。循环次数最多为二叉树的高度，当二叉树平衡时，使用O(log⁡n)时间。
在Python中实现一个简单的社交媒体应用清水白石008 Python题库 python python 媒体开发语言
在Python中实现一个简单的社交媒体应用社交媒体应用是现代互联网的重要组成部分，允许用户分享信息、交流和互动。在这篇博文中，我们将使用Python构建一个简单的社交媒体应用，涵盖用户注册、发布动态、评论和查看动态等基本功能。我们将使用Flask框架作为后端，SQLite作为数据库，前端使用HTML和Bootstrap进行简单的界面设计。一、项目准备1.环境设置首先，确保你已经安装了Python和
Python的那些事第二篇：编程界的“交通规则”基本语法与编程的“食材”和“容器”数据类型与变量暮雨哀尘 Python的那些事 python vscode visual studio pycharm 开发语言 windows
摘要Python以其简洁易懂的语法和强大的功能，成为了编程界的“小白福音”。本文将带你从Python的基本语法入手，深入探讨标识符命名规则、缩进的重要性、注释的使用，以及数据类型与变量的定义和操作。通过幽默的语言和丰富的实例代码，我们将一步步揭开Python的神秘面纱，让你在轻松愉快的氛围中掌握这门强大的编程语言。1.Python基本语法1.1标识符命名规则在Python的世界里，标识符就像是给变
【使用PyQt创建美观和功能丰富界面】 Dreams°123 pyqt microsoft python
使用PyQt创建美观和功能丰富界面-适用于APP一、基本概念与环境搭建二、布局管理三、部件使用与定制四、信号与槽机制深入应用五、样式表（stylesheet）和主题应用一、基本概念与环境搭建安装PyQt使用以下命令安装PyQt：pipinstallPyQt5（如果使用Python3）。理解信号与槽机制信号（Signal）：是对象发出的事件通知，例如按钮的点击、文本框内容的改变等。槽（Slot）：是
python+selenium获取cookie session_Python3+Selenium获取session和token供Requests使用教程 weixin_39997695 session
#!/usr/bin/python3#coding:utf-8importtimefromseleniumimportwebdriverfromselenium.webdriver.support.waitimportWebDriverWaitfromselenium.webdriver.supportimportexpected_conditionsasECfromselenium.webdri
python聊天软件_python开发简单的聊天工具 weixin_39644139 python聊天软件
python太强大了，以至于它什么都可以做，哈哈，开个玩笑。但是今天要讲的真的是一个非常神奇的应用。使用python写一个聊天工具其实大家平时用的QQ类似的聊天工具，也是使用socket进行聊天，只是它还包含了更加复杂的功能。基本原理是一样的。python实现聊天功能，主要用到了socket模块。下面直接上实例吧server端importsockets=socket.socket()#建立sock
JWT（3）JWT的签名算法 w_t_y_y 安全安全
在JWT（JSONWebToken）中，涉及到两种主要的算法类型：加密算法和签名算法。签名算法用于确保JWT数据的完整性和真实性，必须使用；而加密算法用于保护JWT内容的机密性，选择性使用。这里看下签名算法。一、介绍1、简介签名算法的主要目的是确保JWT的内容未被篡改，并验证其来源。签名算法用于生成一个数字签名，接收方使用相同的算法来验证签名，从而确认数据的完整性。2、jwt常见的签名算法不同的j
RAG理论到实践：高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(Advanced RAG✨) 汀、人工智能 LLM工业级落地实践人工智能 AI Agent RAG 知识问答智能问答
RAG理论到实践：高级、模块化RAG在AI工程架构中的行业通用解决方案与实施策略(AdvancedRAG✨)1.RAG简介词汇解释说明embedding嵌入（embedding）是指将高维数据映射为低维表示的过程。在机器学习和自然语言处理中，嵌入通常用于将离散的符号或对象表示为连续的向量空间中的点。在自然语言处理中，词嵌入（wordembedding）是一种常见的技术，它将单词映射到实数向量，以便
Centos安装python3详细教程 Circle square 自学 python centos linux
文章目录Centos安装python3详细教程1、先查看系统python的位置在哪儿2、下载python3的包之前，要先安装相关的依赖包，用于下载编译python3：3、默认的centos7是没有安装pip，先添加epel扩展源4、安装pip5、用pip装wget6、用wget下载python3的源码包，或者自己先下载好，上传到服务器再安装，如果网络快可以直接安装7、编译python3源码包，解压
nvdia triton server运行pt文件滑稽的柴犬神经网络机器学习 python
tritonserver默认都是tensorrt推理。但也会出现有操作不支持，导致无法转模型为engine的情况。可以选择直接运行pytorch的pt文件，以下为操作步骤。1.pytorch后端环境编译步骤原理是使用pytorchC++API运行pt文件模型。安装依赖项apt-getinstallpatchelfrapidjson-devpython3-dev构建NGC的PyTorch容器。例如，
golang工程组件篇轻量级认证机制jwt之HS、RS. ES、ED签名与验证 SMILY12138 golang 开发语言后端
JWT（JSONWebToken）是一种轻量级的认证机制，它可以用于身份验证和授权。在JWT中，令牌被加密并使用数字签名进行保护，以确保其完整性和安全性。在本文中，我们将介绍如何在Golang中使用HS、RS.ES、ED签名算法对JWT进行签名和验证。HS签名与验证HS（HMAC-SHA）是一种对称加密算法，它需要一个共享密钥来进行加解密操作。在JWT中，我们可以使用HS256、HS384和HS5
golang工程组件篇轻量级认证机制jwt之HS、RS. ES、ED签名密钥生成 SMILY12138 golang 开发语言后端
在使用JWT（JSONWebToken）进行身份验证时，我们需要使用签名算法对令牌进行加密。在JWT中，常用的签名算法有HS、RS、ES和ED等。本文将介绍这些签名算法的基本概念以及如何在Golang中生成相应的密钥。HS签名算法HS（HMAC-SHA）是一种对称加密算法，它需要一个共享密钥来进行加解密操作。在JWT中，我们可以使用HS256、HS384和HS512三种不同长度的哈希值作为加密算法
FPGA实现图像处理算法的创新点芯作者 DD：日记 1024程序员节硬件工程图像处理人工智能
以下是FPGA（现场可编程门阵列）实现图像处理算法的一些创新点：一、并行处理能力大规模并行运算创新点描述：FPGA具有丰富的逻辑资源，可以构建大量的并行处理单元。在图像处理算法中，许多操作（如滤波、边缘检测等）可以并行执行。例如，对于一个3×3的图像滤波操作，FPGA可以同时对图像中的多个像素点进行滤波计算，而不像传统的CPU那样需要顺序处理每个像素。这大大提高了处理速度，能够满足实时图像处理的需
学习 C++(1 月 21 日) 小鱼984 学习
一.时空复杂度（一）语句（基本单位）（二）语句执行次数（反映程序的运行时间）1.T(x,y,⋯)：语句数2.注意循环中语句的次数（三）时间复杂度（衡量程序效率/语句执行次数T的化简结果）1.T->O(f)化简规则：常数->1；各项系数化为1；只保留最高阶的项；logan应化为logn（即算法的运行时间与输入规模n的对数成正比）2.时间复杂度（最大时间复杂度）的分类（1）最大（坏）时间复杂度O(f)
【小黑送书—第十八期】＞＞让工作自动化起来！无所不能的Python(文末送书） 2401_84302628 程序员自动化 python 运维
随着我国企业数字化和信息化的深入，企业对办公自动化的效率和灵活性要求越来越高。Python作为一种开源的软件应用开发方式，通过提供强大丰富的库文件包，极大地简化了应用开发过程，降低了技术门槛。Python开发有哪些优势、挑战以及实践方法呢？一、Python是办公自动化的重要工具在我们的日常工作中，有不少工作是重复的，例如不少办公文档的处理工作等，这些重复工作如果用Python来实现办公自动化，效率
2024年网络安全最全让工作自动化起来！无所不能的Python(1) 2401_84281638 程序员自动化 python 运维
1.3.2多攒代码71.3.3学会并且精通代码调试81.3.4伤其五指不如断其一指8第2章Python的工作环境102.1Python工作环境的构成102.1.1Python的核心软件102.1.2Anaconda112.1.3IDE工具122.2安装过程中的常见问题122.3Python中的两种解释器132.4包的安装202.4.1在线安装202.4.2离线安装212.5Pycharm中的解释器
广工Anyview离散数学第七章墨染夜雨笺离散数学算法广东工业大学离散数学学习
注：网络资源整理，并非本人代码，离散数学对初学者比较抽象，希望对你有所帮助。请注意对应题目，每年题目可能有小变动。目录试设计一算法，对某集合A上的一个二元关系R，判断R是否为等价关系试设计一算法，对某集合A上的一个二元关系R，求商集A/R试设计一算法，求某集合A上的模n同余关系试设计一算法，对某集合A上的一个二元关系R，判断R是否为偏序关系试设计一算法，对某集合A上的一个二元关系R，判断R是否为等
广工Anyview离散数学第八章墨染夜雨笺离散数学学习算法离散数学广东工业大学
注：网络资源整理，并非本人代码，离散数学对初学者比较抽象，希望对你有所帮助。请注意对应题目，每年题目可能有小变动。目录试设计一算法，对于一个从集合A到集合B的二元关系R，判断R是否为函数判断一个关系是否为函数，如果是函数，则是什么类型：单射、满射、双射、变换、非单射非满射。判断一个关系是否为函数，如果是函数并且该函数存在逆函数，则求出其逆函数试设计一算法，对于一个从集合A到集合B的二元关系R，判断
【Python进阶】5步掌握Pandas数据结构，你真的学会了吗？墨瑾轩 Python入门~精通 python pandas 数据结构
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣5步掌握Pandas数据结构，你真的学会了吗？引言❓亲爱的小伙伴们，你们有没有遇到过这样的情况：在处理结构化数据时，总是觉得Python内置的列表和字典不够灵活？别担心，今天我们就来一场“Pandas数据结构大挑战”，手把手教你如何使用Pandas的两大核心数
Python3 搭建本地 PyPi 源极客点儿 #Python python pip
搭建本地PyPi源的方式有很多，也有很多软件，较常用就是在官方PyPi中自带的pypiserver包。1.安装pypiserverpipinstallpypiserver2.启动pypiserverpypi-server3.上传Python包将我们打包好的Python包放到~/packages目录下，tar和whl都可以。4.远程上传Python包创建~/.pypirc文件，添加如下内容：[dis
数据结构c语言版上海交通大学出版社项目三《稀疏矩阵相加》友人.227 数据结构 c语言开发语言
两个稀疏矩阵A和B采用十字链表方式存储，计算C=A+B，C也采用十字链表方式存储。根据矩阵相加的运算法则，若将矩阵B加到矩阵A上，对于A的十字链表来说，可能进行的操作有:①当aij与bij均不等于0，且aij+bij≠0时，改变结点的value值;②当aij≠0且bij=0时，value值不变;③当aij=0且bij≠0时，插入一个新结点;④当aij与bij均不等于0，且aij+bij=0时，删除
Python从0到100（六十一）：机器学习实战-实现客户细分是Dream呀 python 机器学习开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Python数据获取：从基础到实践，一场数据探索之旅傻啦嘿哟关于python那些事儿 python oracle 开发语言
目录一、引言二、理解数据获取的基本概念三、使用Python进行网络数据抓取3.1基础工具：requests库3.2解析HTML：BeautifulSoup库3.3实战案例：抓取网页新闻列表四、从文件中读取数据4.1使用pandas读取CSV文件4.2读取Excel文件五、数据库数据访问六、数据清洗与预处理6.1处理缺失值6.2处理异常值6.3处理重复值6.4数据格式化与编码6.5数据标准化与归一化
使用Python进行高并发压测：技术指南与实战案例傻啦嘿哟关于python那些事儿 python 开发语言
目录一、引言二、压测基础知识压测的目的与类型压测工具的选择三、使用Python进行压测Python压测框架的选择压测脚本的编写压测的执行与监控四、实战案例分析案例背景介绍压测计划制定压测实施过程结果分析与优化建议五、常见问题与解决方案六、总结一、引言在软件开发过程中，性能测试是确保软件系统质量的关键环节之一。高并发压测作为性能测试的一种重要形式，通过模拟大量用户同时访问系统，以检验系统在极限负载下
python 获取windows管理员权限天涯望小楼 python 开发语言
Python,Windows相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shelPython获取Windows管理员权限在Windows操作系统中，有时我们需要运行一些需要管理员权限的任务，例如修改系统设置、安装软件等。在Python中，我们可以通过一些方法来获取管理
python可执行程序必须以管理员_Python实现管理员权限运行CMD指令 weixin_39977488
一、subprocess.PopenPython执行cmd指令属于外部调用，subprocess.Popen方法即可，实现如下：#!/usr/bin/python3#coding:utf-8importsubprocessdefcommand(cmd,timeout=1800000):try:sp=subprocess.Popen(cmd,shell=True,stdout=subprocess.
搭建python本地源 weixin_34234829 python 开发工具
1.安装pip工具[root@tongc-yum162~]#wgethttps://files.pythonhosted.org/packages/d3/3e/1d74cdcb393b68ab9ee18d78c11ae6df8447099f55fe86ee842f9c5b166c/setuptools-40.0.0.zip[root@tongc-yum162~]#cdsetuptools-40.0
解决python -m pip install --upgrade pip更新失败 svygh123 python pip 开发语言
C:\Users\Administrator>python-mpipinstall--upgradepipLookinginindexes:https://pypi.tuna.tsinghua.edu.cn/simpleCollectingpipERROR:HTTPerror403whilegettinghttps://pypi.tuna.tsinghua.edu.cn/packages/8a/6
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n