juanjuanyou

ML刻意练习第1周之KNN算法

k近邻法(k-nearest neighbor, k-NN)是1967年由Cover T和Hart P提出的一种基本分类与回归方法。它的工作原理是：存在一个样本数据集合，也称作为训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后，将新的数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本最相似数据(最近邻)的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据，这就是k-近邻算法中k的出处，通常k是不大于20的整数。最后，选择k个最相似数据中出现次数最多的分类，作为新数据的分类。

KNN实战之一

1.导入算法所用的numpy和operate模块。

import numpy as np
import operator

2.创建最简单的带标签的数据集，并将其封装在函数creatDateSet（）中。

def creatDateSet():
    group = np.array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])#创建一个数组
    labels = ['A','A','B','B']
    return group,labels

3.实现最简单的KNN算法，并将其封装在函数classify0（）中。
①.首先定义classify0（）函数，有四个参数，inx表示待分类的新数据，dataset表示已知标签的数据集，labels为数据对应的标签，k表示待分类样本的分类取决于k个最相近的数据。

def classify0(inX, dataSet, labels, k):

②.函数的实现：首先把数据集中的点放入矩阵中，然后复制n倍（等同于dateset中样本的数目），再与dateset中的数据求距离。相当于将待分类数据与所有样本的距离存储在一个数组distances中。

dataSetSize = dataSet.shape[0]#第一维的个数（多少行）
diffMat = np.tile(inX, (dataSetSize,1)) - dataSet
    #将inX重复1次形成datasetsize行的数组，与原来的dataset的坐标差值
sqDiffMat = diffMat**2#坐标差的平方
sqDistances = sqDiffMat.sum(axis = 1)#距离的平方
distances = sqDistances**0.5#一个数组

之后返回距离从小到大排列后的索引，放入数组sortedDistIndicies中。

sortedDistIndicies = np.argsort(distances)#返回的数组从小到大排序后对应的数组索引

创建字典classCount，统计距离待分类样本最相似的k个样本的类别及每类的样本个数，最后返回最相似的那个类别。

  classCount={}#创建字典
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]] #距离最近的k个点分别是哪一类
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1#例如{'B': 2, 'A': 1}；统计了最近的k个点分别有多少属于哪类
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)#按字典内容降序排列
    return sortedClassCount[0][0]

4.综上：完整代码如下

import numpy as np
import operator
def creatDateSet():
    group = np.array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])#创建一个数组
    labels = ['A','A','B','B']
    return group,labels

def classify0(inX, dataSet, labels, k):
    #inX是待分类的样本，dataset为数据集，labels为样本数据对应的标签，k为距离最近的k个样本
    dataSetSize = dataSet.shape[0]#第一维的个数（多少行）

    diffMat = np.tile(inX, (dataSetSize,1)) - dataSet
    #将inX重复1次形成datasetsize行的数组，与原来的dataset的坐标差值
    sqDiffMat = diffMat**2#坐标差的平方
    sqDistances = sqDiffMat.sum(axis = 1)#距离的平方
    distances = sqDistances**0.5#一个数组
    sortedDistIndicies = np.argsort(distances)#返回的数组从小到大排序后对应的数组索引
    classCount={}#创建字典
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]] #距离最近的k个点分别是哪一类
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1#{'B': 2, 'A': 1}统计了最近的k个点分别有多少属于哪类
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)#按字典内容降序排列
    return sortedClassCount[0][0]
def main():
    group,labels = creatDateSet()
    result = classify0([0,0], group ,labels,3)
    print(result)
if __name__ == '__main__':
    main()

5.运行结果：

E:\anaconda\envs\tf1\python.exe "C:/Users/范淑卷/Desktop/ML实战练习代码/P19 最简单的KNN算法/knn.py"
B

Process finished with exit code 0

得知待分类的点[0,0]应该为类别‘B’。

6.学习心得：
①.KNN算法的实现；
②.numpy模块下tile函数用来形成矩阵，从而便于用矩阵对特征运算；
③.shape函数用来返回矩阵或者数组的大小；
④.numpy模块下的argsort函数用于返回数组的索引；
⑤.内置的sorted函数实现对字典类型数据的排序。

KNN实战之二：约会网站

分析：该场景的例子共有三个特征值：1.每年获得的飞行常客里程数；2.玩游戏所耗时间百分比；3.每周消费的冰淇淋公升数。但是由于特征1比另外两个特征的数值要大很多，所以直接计算时特征1势必会成为影响分类的决定性因素，然而本题的三个特征同等重要，所以首先需要对数据进行归一化处理。又因为只给了一组数据，所以我们要挑选一部分作为测试数据（本例题挑选了前百分之10的数据作为测试）。
1.首先，先将txt文件中的数据导入，并封装在函数file2matrix（）中。

def file2matrix(filename):
    fr = open(filename)
    numberOfLines = len(fr.readlines())         #get the number of lines in the file
    returnMat = np.zeros((numberOfLines,3))        #prepare matrix to return
    classLabelVector = [] #prepare labels return
    fr.close()

    fr = open(filename)
    index = 0
    for line in fr.readlines():#按行读入
        line = line.strip()#去掉每一行回车键
        listFromLine = line.split('\t')#按制表符分隔
        returnMat[index,0:3] = listFromLine[0:3]#将特征存入returnMat中
        classLabelVector.append(int(listFromLine[-1]))#将标签存入classLabelVector中
        #此处的listFromLine[-1]用listFromLine[3]也可以，不过一般习惯用-1表示数组中的最后一个
        index += 1#遍历文件，index用来控制数据特征在returnMat中的位置
    fr.close()
    return returnMat,classLabelVector#返回数据特征矩阵和标签数组

程序中，下面代码的作用是去掉txt文件中所有的回车键，并根据制表符分隔读取的每一行。

line = line.strip()#去掉每一行最后的回车键
        listFromLine = line.split('\t')

2.在将数据导入之后，应当对数据进行归一化处理，归一化后的数据的各特征分布在0到1之间.

def autoNorm(dataSet):
    minVals = dataSet.min(0)#dataset中的最小值
    maxVals = dataSet.max(0)#dataset中的最大值
    ranges = maxVals - minVals#最大差（为了将结果归一化到零到壹之间）
    # normDataSet = zeros(shape(dataSet))
    m = dataSet.shape[0]#dataset中的数据量
    normDataSet = dataSet - np.tile(minVals, (m,1))#将该区间规范到0开始
    normDataSet = normDataSet/ np.tile(ranges, (m,1))  #将结果归一化到零到壹之间
    return normDataSet, ranges, minVals
#返回归一化后的数据集，数据极限差值和最小值（归一化前）

3.实现kNN算法，类比实战一中的实现。

def classify0(inX, dataSet, labels, k):
    #inX是待分类的样本，dataset为数据集，labels为样本数据对应的标签，k为距离最近的k个样本
    dataSetSize = dataSet.shape[0]#第一维的个数（多少行）

    diffMat = np.tile(inX, (dataSetSize,1)) - dataSet
    #将inX重复1次形成datasetsize行的数组，与原来的dataset的坐标差值
    sqDiffMat = diffMat**2#坐标差的平方
    sqDistances = sqDiffMat.sum(axis = 1)#距离的平方
    distances = sqDistances**0.5#一个数组
    sortedDistIndicies = np.argsort(distances)#返回的数组从小到大排序后对应的数组索引
    classCount={}#创建字典
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]] #距离最近的k个点分别是哪一类
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1#{'B': 2, 'A': 1}统计了最近的k个点分别有多少属于哪类
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)#按字典内容降序排列
    return sortedClassCount[0][0]

4.将txt文件中的前百分之10数据用来测试，返回每个数据的分类情况以及测试数据的错误个数和错误率。

def datingClassTest():
    hoRatio = 0.10  # hold out 10%
    datingDataMat, datingLabels = file2matrix('E:\机器学习算法刻意练习\机器学习实战书电子版'
                                                 '\machinelearninginaction\Ch02\datingTestSet2.txt')# 导入数据
    normMat, ranges, minVals = autoNorm(datingDataMat)#首先先归一化
    m = normMat.shape[0]
    numTestVecs = int(m * hoRatio)#拿出百分之10的数据用于测试
    errorCount = 0.0
    for i in range(numTestVecs):
        classifierResult = classify0(normMat[i, :], normMat[numTestVecs:m, :], datingLabels[numTestVecs:m], 5)
        print("the classifier came back with:{}, the real answer is: {}" .format(classifierResult, datingLabels[i]))
        if classifierResult != datingLabels[i]:
            errorCount += 1.0
    print("the total error rate is: {}" .format(errorCount / float(numTestVecs)))
    print(errorCount)

5.综上，实战二之约会网站的完整代码如下（此例中取的k=5）：

import numpy as np
import matplotlib.pyplot as plt
import operator

def file2matrix(filename):
    fr = open(filename)
    numberOfLines = len(fr.readlines())         #get the number of lines in the file
    returnMat = np.zeros((numberOfLines,3))        #prepare matrix to return
    classLabelVector = [] #prepare labels return
    fr.close()

    fr = open(filename)
    index = 0
    for line in fr.readlines():
        line = line.strip()#去掉所有回车键
        listFromLine = line.split('\t')
        returnMat[index,0:3] = listFromLine[0:3]#将特征存入returnMat中
        classLabelVector.append(int(listFromLine[-1]))#将标签存入classLabelVector中
        index += 1
    fr.close()
    return returnMat,classLabelVector

def autoNorm(dataSet):
    minVals = dataSet.min(0)#dataset中的最小值
    maxVals = dataSet.max(0)#dataset中的最大值
    ranges = maxVals - minVals#最大差（为了将结果归一化到零到壹之间）
    # normDataSet = zeros(shape(dataSet))
    m = dataSet.shape[0]#dataset中的数据量
    normDataSet = dataSet - np.tile(minVals, (m,1))#将该区间规范到0开始
    normDataSet = normDataSet/ np.tile(ranges, (m,1))  #将结果归一化到零到壹之间
    return normDataSet, ranges, minVals
#返回归一化后的数据集，最大最小差和最小值（归一化前）

def classify0(inX, dataSet, labels, k):
    #inX是待分类的样本，dataset为数据集，labels为样本数据对应的标签，k为距离最近的k个样本
    dataSetSize = dataSet.shape[0]#第一维的个数（多少行）
    diffMat = np.tile(inX, (dataSetSize,1)) - dataSet
    #将inX重复1次形成datasetsize行的数组，与原来的dataset的坐标差值
    sqDiffMat = diffMat**2#坐标差的平方
    sqDistances = sqDiffMat.sum(axis = 1)#距离的平方
    distances = sqDistances**0.5#一个数组
    sortedDistIndicies = np.argsort(distances)#返回的数组从小到大排序后对应的数组索引
    classCount={}#创建字典
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]] #距离最近的k个点分别是哪一类
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1#{'B': 2, 'A': 1}统计了最近的k个点分别有多少属于哪类
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)#按字典内容降序排列
    return sortedClassCount[0][0]

def datingClassTest():
    hoRatio = 0.10  # hold out 10%
    datingDataMat, datingLabels = file2matrix('E:\机器学习算法刻意练习\机器学习实战书电子版'
                                                 '\machinelearninginaction\Ch02\datingTestSet2.txt')# 导入数据
    normMat, ranges, minVals = autoNorm(datingDataMat)#首先先归一化
    m = normMat.shape[0]
    numTestVecs = int(m * hoRatio)#拿出百分之10的数据用于测试
    errorCount = 0.0
    for i in range(numTestVecs):
        classifierResult = classify0(normMat[i, :], normMat[numTestVecs:m, :], datingLabels[numTestVecs:m], 5)
        print("the classifier came back with:{}, the real answer is: {}" .format(classifierResult, datingLabels[i]))
        if classifierResult != datingLabels[i]:
            errorCount += 1.0

    print("the total error rate is: {}" .format(errorCount / float(numTestVecs)))
    print(errorCount)
    
def main():
    datingClassTest()
    
if __name__ == '__main__':
    main()

6.运行的部分结果如下（测试集数据个数过多，无法一一列出）：

the classifier came back with:3, the real answer is: 3
the classifier came back with:2, the real answer is: 2
the classifier came back with:2, the real answer is: 1
the classifier came back with:1, the real answer is: 1
the total error rate is: 0.05
5.0

Process finished with exit code 0

可知KNN在测试集上的错误率为5%。

7.学习心得：
①.如何将单文件的数据的特征与标签存储在矩阵和数组中；
②.数据的归一化处理；
③.取数据中的一部分作为测试数据。

KNN实战之三：手写字体识别

分析：具体的预测分类实现方法与前两个实例没什么区别，最大的难点可能是如何将不同文件中的各类“图形文件”的特征和标签读入。
1.重点and难点：多文件的读入
此题与实战二不同。实战二是将三个特征与标签放入了文件的每一行中，每一行包含了三个特征与分类标签；而这个题每一个txt文件都包含了32×32个特征值，而每一个样本的类别则是文件名字的第一个数字。因此要将其分两步读入，首先完成对单文件特征的读入，再次完成多文件特征与类别标签的读入。
①单文件特征的读入：将32×32的特征转换存储到1×1024的矩阵中，每一行都是一个数据的所有特征值。

def img2vector(filename):
    returnVect = np.zeros((1,1024))#创建一个1*1024的矩阵
    fr = open(filename)
    for i in range(32):  #依次读入每个文件的32行数据
        lineStr = fr.readline()
        for j in range(32):
            returnVect[0,32*i+j] = int(lineStr[j])#读入每行的32个字符，并转化为int型存储在矩阵returnVect中
    fr.close()
    return returnVect

②类别标签的读入：用listdir函数遍历多个txt文件存储的文件夹，获得各个txt文件的名字，然后通过split函数获得文件名的第一个数字（即该数据的类别），存储在列表hwLabels中。

    hwLabels = []
    trainingFileList = listdir('E:\机器学习算法刻意练习\算法所用数据\\2.KNN\\trainingDigits')    #样本文件的文件名
    m = len(trainingFileList)   #m表示有多少训练文件（数据样本）
    trainingMat = np.zeros((m,1024))
    for i in range(m):
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]     #去掉文件名后的 .txt
        classNumStr = int(fileStr.split('_')[0])#得到该文件数据的类别
        hwLabels.append(classNumStr)#存储所有文件的类别

数据集与测试集读取方法想同，在此不再赘述。

多文件数据特征的读入:路径前半部分相同，可以固定为’E:\机器学习算法刻意练习\算法所用数据\2.KNN\trainingDigits\’，最后的即txt文件的文件名，可以通过遍历由listdir函数获得的列表获得。

    for i in range(m):
        fileNameStr = trainingFileList[i]
        trainingMat[i,:] = img2vector('E:\机器学习算法刻意练习\算法所用数据\\2.KNN\\trainingDigits\\'+fileNameStr)
        #将所有训练数据文件依次读入并存储在矩阵trainingMat中

2.KNN算法同上，不再赘述。
3.最后通过比较测试数据的真实分类与预测分类给出KNN算法预测错误的个数以及预测错误率。（此题取K=5）

mTest = len(testFileList)#表示有多少个测试文件（数据）
    for i in range(mTest):
        fileNameStr2 = testFileList[i]
        fileStr2 = fileNameStr2.split('.')[0]     #take off .txt
        classNumStr2 = int(fileStr2.split('_')[0])
        vectorUnderTest = img2vector('E:\机器学习算法刻意练习\算法所用数据\\2.KNN\\trainingDigits\\'+fileNameStr2)
        # 将所有训练测试文件依次读入并存储在矩阵trainingMat中
        classifierResult = classify0(vectorUnderTest, trainingMat, hwLabels, 5)
        print("the classifier came back with:{}, the real answer is:{}".format(classifierResult, classNumStr2))
        if classifierResult != classNumStr2: #如果分类与KNN预测的结果不一样，则错误个数++
            errorCount += 1.0
    print("the total number of errors is: {}" .format(errorCount))
    print("the total error rate is:{}" .format(errorCount/float(mTest)))

4.综上：完整的程序代码如下：

import numpy as np
import matplotlib.pyplot as plt
import operator
from os import listdir

def img2vector(filename):
    returnVect = np.zeros((1,1024))#创建一个1024维度的数组
    fr = open(filename)
    for i in range(32):  #依次读入每个文件的32行数据
        lineStr = fr.readline()
        for j in range(32):
            returnVect[0,32*i+j] = int(lineStr[j])#读入每行的32个字符，并转化为int型存储在数组returnVect中
    fr.close()
    return returnVect

def classify0(inX, dataSet, labels, k):
    #inX是待分类的样本，dataset为数据集，labels为样本数据对应的标签，k为距离最近的k个样本
    dataSetSize = dataSet.shape[0]#第一维的个数（多少行）

    diffMat = np.tile(inX, (dataSetSize,1)) - dataSet
    #将inX重复1次形成datasetsize行的数组，与原来的dataset的坐标差值
    sqDiffMat = diffMat**2#坐标差的平方
    sqDistances = sqDiffMat.sum(axis = 1)#距离的平方
    distances = sqDistances**0.5#一个数组
    sortedDistIndicies = np.argsort(distances)#返回的数组从小到大排序后对应的数组索引
    classCount={}#创建字典
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]] #距离最近的k个点分别是哪一类
        classCount[voteIlabel] = classCount.get(voteIlabel,0) + 1#{'B': 2, 'A': 1}统计了最近的k个点分别有多少属于哪类
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)#按字典内容降序排列
    return sortedClassCount[0][0]

def handwritingClassTest():
    hwLabels = []
    trainingFileList = listdir('E:\机器学习算法刻意练习\算法所用数据\\2.KNN\\trainingDigits')    #样本文件的文件名
    m = len(trainingFileList)   #m表示有多少训练文件（数据样本）
    trainingMat = np.zeros((m,1024))
    for i in range(m):
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]     #去掉文件名后的 .txt
        classNumStr = int(fileStr.split('_')[0])#得到该文件数据的类别
        hwLabels.append(classNumStr)#存储所有文件的类别
        trainingMat[i,:] = img2vector('E:\机器学习算法刻意练习\算法所用数据\\2.KNN\\trainingDigits\\'+fileNameStr)
        #将所有训练数据文件依次读入并存储在矩阵trainingMat中
    testFileList = listdir('E:\机器学习算法刻意练习\算法所用数据\\2.KNN\\testDigits')        #iterate through the test set
    errorCount = 0.0
    mTest = len(testFileList)#表示有多少个测试文件（数据）
    for i in range(mTest):
        fileNameStr2 = testFileList[i]
        fileStr2 = fileNameStr2.split('.')[0]     #take off .txt
        classNumStr2 = int(fileStr2.split('_')[0])
        vectorUnderTest = img2vector('E:\机器学习算法刻意练习\算法所用数据\\2.KNN\\trainingDigits\\'+fileNameStr2)
        # 将所有训练测试文件依次读入并存储在矩阵trainingMat中
        classifierResult = classify0(vectorUnderTest, trainingMat, hwLabels, 5)
        print("the classifier came back with:{}, the real answer is:{}".format(classifierResult, classNumStr2))
        if classifierResult != classNumStr2: #如果分类与KNN预测的结果不一样，则错误个数++
            errorCount += 1.0
    print("the total number of errors is: {}" .format(errorCount))
    print("the total error rate is:{}" .format(errorCount/float(mTest)))

def main():
    handwritingClassTest()

if __name__ == '__main__':
    main()

5.运行的部分结果为：

the classifier came back with:9, the real answer is:9
the classifier came back with:9, the real answer is:9
the classifier came back with:9, the real answer is:9
the total number of errors is: 17.0
the total error rate is:0.017970401691331923

Process finished with exit code 0

可知共有17个数据预测错误，错误率为1.797%。
6.学习心得：
①.多文件的遍历与特征读取；
②.多文件的遍历与分类标签的读取。

table点击行事件，且点击行高亮爱吃玉米的兔子 vue.js javascript elementui
consttableData=[{id:1,date:"2025-03-20",name:"Tom",},{id:2,date:"2025-03-21",name:"Hom",},{id:3,date:"2025-03-22",name:"Rem",},];constselectedRow=ref(null);//储存选中的行//点击行操作事件constrowChange=(row)=>{sele
大数据最新大数据StarRocks(七)：数据表创建(2) 2401_84182271 程序员大数据
2.1表分为内部表和外部表默认未内部表，3.0版本开始集成外部数据建议使用catalog，外部表的建表方式将被弃用2.2列定义语法：col_namecol_type[agg_type][NULL|NOTNULL][DEFAULT"default\_value"][AUTO_INCREMENT][ASgeneration_expr]col_name：列名称注意，在一般情况下，不能直接创建以以__op
算法入门——二分法 Able Zhao 650829 算法数据结构 c++蓝桥杯
二分法真的很容易出错！！！在用dp学习之后总结了一下二分法二分查找关键总结一、核心思想分治策略：每次将搜索范围缩小一半，适用于有序数组。时间复杂度：O(logn)，比线性查找高效得多。二、关键点前提条件有序性：数组必须有序（升序或降序），否则需先排序（但排序成本O(nlogn)）。静态性：适合静态数据或低频更新的数据（高频更新建议用哈希表或树结构）。两种边界问题左边界：第一个等于目标的位置（或第一
PTA天梯赛Python7-52 古风排版胡同Alley python
中国的古人写文字，是从右向左竖向排版的。本题就请你编写程序，把一段文字按古风排版。输入格式：输入在第一行给出一个正整数N（<100），是每一列的字符数。第二行给出一个长度不超过1000的非空字符串，以回车结束。输出格式：按古风格式排版给定的字符串，每列N个字符（除了最后一列可能不足N个）。输入样例：4Thisisatestcase输出样例：asaTstihetsices代码长度限制16KB时间限制
STM32HAL库，解决串口UART中断接收到的第一个字节数据丢失 IT.小航 STM32-—hal库 stm32 单片机嵌入式硬件
1.问题描述：只有上电后第一次接收到的第一字节数据会丢失，往后再接收也不会存在问题了。2.先贴出来重写UART中断回调函数我在接收到第一字节数据后开启定时器中断的，做一个超时处理，每次接收到数据会对定时器计数值清零，如果超过6ms则认为一帧数据接收完毕。voidHAL_UART_RxCpltCallback(UART_HandleTypeDef*huart){if(huart->Instance=
详细介绍 Jupyter nbconvert 工具及其用法：如何将 Notebook 转换为 Python 脚本源代码杀手 python使用技巧 python jupyter ide
nbconvert是Jupyter提供的一个非常强大的工具，允许用户将JupyterNotebook文件（.ipynb）转换成多种格式，包括Python脚本（.py）、HTML、PDF、LaTeX等。你可以通过命令行来运行nbconvert，也可以在JupyterNotebook中通过一些自定义的设置来实现转换。安装nbconvert通常情况下，nbconvert会随Jupyter一起安装，因此不
Beekeeper Studio：高颜值且免费的SQL开发工具开源项目精选 sql 数据库
BeekeeperStudio是一款免费开源的SQL开发和数据库管理工具，具有美观高效、简单易用的特点。BeekeeperStudio基于Vue.js开发，遵循MIT开源协议，支持Windows、Linux以及macOS平台。Stars数17842Forks数1170主要特点安全连接：除了正常的连接，也可以使用SSL加密连接或通过SSH隧道连接；SQL自动补全：代码编辑器支持语法高亮和表名自动补全
## PCDN中的网络拥塞控制技术探讨 yczykjyxgs pcdn 网络智能路由器
随着互联网视频流量的爆发式增长，传统CDN面临着成本高、扩展性差等挑战。P2PCDN（PCDN）作为一种新兴的内容分发网络架构，通过利用边缘节点的闲置带宽和存储资源，有效降低了内容分发成本，并提升了网络扩展性。然而，PCDN中节点动态性强、网络环境复杂，传统的网络拥塞控制技术难以直接适用，因此需要针对PCDN的特点设计新的拥塞控制机制。PCDN网络拥塞控制面临的挑战1.节点异构性:PCDN节点性能
我所认识的区块链 whg1016 区块链
什么是区块链区块链是一个多节点共同参与，共同确认的记账系统，账本由是由一串串数据块组成的，下一个数据块记录了上个数据的hash，所有的块按照顺序形成一个完整的数据链条。每个节点都有完全一致的账本数据，记录的数据不可篡改和不可伪造。这个链条被保存在所有的服务器中，只要整个系统中有一台服务器可以工作，整条区块链就是安全的。区块链的由来区块链起源于Bitcoin，2008年11月1日，一位自称中本聪(S
CTF杂项挑战：使用已知字典破解ZIP文件密码 0dayNu1L Web安全 CTF web安全网络安全
在CTF比赛中，杂项挑战通常包含一些非传统的题目，其中破解ZIP文件密码是一个常见的任务。本文将介绍两种在已知密码字典文件的情况下，破解ZIP文件密码的方法：一种是使用Python脚本进行暴力破解，另一种是通过zip2john和john命令结合进行破解。0dayNu1L-CSDN博客请一键三连吧！！！❤❤❤目录方法一：使用Python脚本进行暴力破解步骤方法二：使用zip2john和john命令结
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
oracle当前耗时sql语句,查看Oracle最耗时的SQL weixin_39846553 oracle当前耗时sql语句
有很多种方法可以用来找出哪些sql语句需要优化，但是很久以来，最简单的方法都是分析保存在V$sql视图中的缓存的sql信息。通过V$sql视图，可以确定具有高消耗时间、CUP和IO读取的sql语句。1.查看总消耗时间最多的前10条sql语句select*from(selectv.sql_id,v.child_number,v.sql_text,last_load_time,v.PARSING_US
DevOps中集成自动化测试的具体案例 Zachary AI CICD相关 devops 运维
在DevOps中集成自动化测试的具体案例可以从多个角度进行分析，包括金融行业、分布式系统、大型企业等不同领域的实践。以下是几个具体的案例：金融行业的DevOps实践：在金融行业中，DevOps被广泛应用于提升软件开发和运营的效率。例如，通过解析后台接口代码日志格式，自动化生成接口测试案例，解决了接口自动化测试过程中各交易输入值难以确定的问题，从而提高了接口测试效率[14]。此外，农行手机银行系统存
技术沙龙 | 从高并发架构到企业级区块链探索零售创新 weixin_33984032 区块链 python 数据库
2019独角兽企业重金招聘Python工程师标准>>>伴随消费新理念的不断升级和技术创新发展，零售业逐渐被推到风口浪尖，对此京东曾表示，推动“无界零售”时代的到来理念，倡导实现成本、效率、体验的升级才是终极目标。此概念一出，零售行业的侧重点开始由销售端向技术端倾斜，趁着一年一度618来临之际，京东云特别在上海举办了主题为"从高并发架构到企业级区块链，探索无界零售的数字化创新"的技术沙龙活动。本次活
【Spring AI】基于专属知识库的RAG智能问答小程序开发——代码逐行精讲：核心交互函数及RAG知识库构建 un_fired spring 人工智能 java
系列文章目录【SpringAI】基于专属知识库的RAG智能问答小程序开发——完整项目（含完整前端+后端代码）【SpringAI】基于专属知识库的RAG智能问答小程序开发——代码逐行精讲：核心ChatClient对象相关构造函数【SpringAI】基于专属知识库的RAG智能问答小程序开发——代码逐行精讲：核心交互函数及RAG知识库构建文章目录系列文章目录前言1.Service层知识库构建与检索函数详
Android开发哈哈哈隔 android
AndroidAdapter是将数据绑定到UI界面上的桥接类比如:当lambada中只有一个参数时，可以用it指代@Target和@Retention是由Java提供的元注解，所谓元注解就是标记其他注解的注解，下面分别介绍https://blog.csdn.net/javazejian/article/details/71860633#%E5%A3%B0%E6%98%8E%E6%B3%A8%E8%
转USDT手续费太贵？我教你！ Trx能量租赁闪兑比特币区块链智能合约能源物联网
什么是TRX能量闪租？还不明白就来看看1.当我们在波场转u的时候，是需要矿工费那么这个矿工费可以理解为能量和带宽2.能量和TRX是两个概念，不要混淆3.转账的时候首先是需要消耗能量和带宽，当我们能量不足转账所需时，就会燃烧相应的TRX作为能量。对方账户有u需要65000的能量=13.7TRX，对方账户没有u或者交易所地址需要131000的能量=27.3TRX4.为了节省一定的trx.能量可以找我们
某智慧医养服务平台Uploads存在任意文件上传漏洞(DVB-2025-8968) Byp0ss403 漏洞复现集合文件上传 web安全
免责声明本文所描述的漏洞及其复现步骤仅供网络安全研究与教育目的使用。任何人不得将本文提供的信息用于非法目的或未经授权的系统测试。作者不对任何由于使用本文信息而导致的直接或间接损害承担责任。如涉及侵权，请及时与我们联系，我们将尽快处理并删除相关内容。0x01产品介绍广西金中软件集团有限公司前身成立于1999年，隶属于广西电信下的三产公司金中信息产业有限公司，是一家集软件开发、网站建设、网络工程、系统
大整数加、减法（Java实现）与debug找错 gfu_ java 算法数据结构
前言这篇文章主要内容涉及大整数加法的实现以及debug使用的简单记录。以前当我碰到程序报错时，总是想找别人帮忙，感觉debug太难了，自己根本看不懂。这次，自己在做一道算法题时，程序能够运行，结果却出错了。本来想找别人帮忙，但想着学习还是要脚踏实地，于是自己硬着头皮上了，先在网上了解如何debug，然后一步一步找到了错误所在。主要是想记录下第一次debug找到问题的快乐。一、大整数加法（java）
谷歌准备斥资 230 亿收购网络安全初创公司 Wiz 网络研究观网络研究观谷歌
Alphabet正在就收购Wiz进行深入谈判，这将显著增强其安全能力。这将是谷歌母公司有史以来最大规模的收购。这是路透社根据匿名消息来源撰写的内容。目标收购金额为230亿美元，即211亿欧元。Wiz拥有实时检测和响应网络威胁的技术。通过实施人工智能，Wiz能够在短时间内吸引许多公司作为客户。Alphabet的收购目标定于2020年初。到2023年，Wiz的收入将达到3.5亿美元。当时，全球40%的
Web自动化测试（一）树的鲨鱼前端自动化功能测试
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档Web自动化测试（一）前言一、自动化相关理论1.什么是自动化以及它的好处2.什么是软件测试3.什么是自动化测试4.自动化测试能解决什么问题4.自动化测试分类5.什么Web项目适合做自动化测试6.Web自动化测试所属分类7.主流的Web自动化测试化工具二、Selenium1.特点2.发展历程3.环境搭建4.第一个案例三、Selenium
使用 Python 的 pyttsx3 库进行文本转语音 Bingjia_Hu python 开发语言 pyttsx3
1.什么是pyttsx3？1.1pyttsx3是一个Python库，它可以将文本转换为语音。与其他文本转语音库（如gTTS）不同，pyttsx3不依赖于网络服务，它使用本地的TTS（Text-to-Speech）引擎，这使得它在离线状态下也能正常工作1.2pyttsx3支持多平台（Windows、Linux和macOS），且可以对语音的音量、语速以及语音类型等进行控制2.安装pyttsx3要使用p
【从零开始学习计算机科学】信息安全（十三）区块链贫苦游商学习区块链 hash 公有链私有链信息安全网络安全
【从零开始学习计算机科学】信息安全（十三）区块链区块链区块链概述区块链的主要特性开放，共识交易透明，双方匿名不可篡改，可追溯区块链的主要类别公有链私有链联盟链区块链核心技术Hash指针Merkle（梅根）树SPV交易验证过程区块链网络分叉解决机制51%攻击问题基于比特币的区块链的优势与不足常用的区块链区块链区块链概述能否在互联网环境（开放环境）下，创造一种技术，使得在无法保证人们相互信任的前提下，
数学领域的跨时代进化与升级：从公理化到智能化的破茧之路夏末之花算法
作者：夏末之花|发布时间：2025-03-16|阅读量：10万+|点赞数：5.6万引言：数学的“破茧时刻”与文明跃迁人类历史上，数学的每一次重大突破都像一次“破茧时刻”，推动文明跨越式发展。从古希腊的几何公理化到牛顿的微积分，再到20世纪的计算机理论，数学始终是科学革命的基石。而在21世纪的今天，随着量子计算、人工智能、生物信息等技术的爆发，数学正迎来新一轮的进化与升级——从纯粹的逻辑工具，演变为
高频SQL50题第一天 | 1757. 可回收且低脂的产品、584. 寻找用户推荐人、595. 大的国家、1683. 无效的推文、1148. 文章浏览 I 榛果咖啡有点苦高频 SQL 50 题 mysql
1757.可回收且低脂的产品题目链接：https://leetcode.cn/problems/recyclable-and-low-fat-products/description/?envType=study-plan-v2&envId=sql-free-50状态：已完成考点：无selectproduct_idfromProductswherelow_fats='Y'andrecyclable
谷歌母公司Alphabet拟斥资230亿美元收购网络安全公司Wiz leijianping_ce
雷递网乐天7月15日据知情人士透露，谷歌母公司Alphabet正在就收购网络安全初创公司Wiz进行谈判。此次交易总额可能高达230亿美元。这将使其成为Alphabet迄今为止最大的一笔收购。双方尚未达成协议，谈判仍有可能以失败告终。近期，Alphabet搁置收购客户关系管理公司HubSpotInc.的努力，随后进行此次谈判。与HubSpot交易一样，对于像Alphabet这样的大型科技公司来说，收
C++：std::move() / std::forward() 我什么都没有3 C++c++开发语言
移动语义和完美转发是C++11中引入的两个重要技术。熟练的掌握移动语义与完美转发，有益于设计安全、高性能的程序。其头文件均为。移动语义：增强了程序对数据所有权的控制，通过std::move标准库函数实现。完美转发：为实现通用的模板函数奠定了基础。通过std::forward库函数实现。基础1：右值引用C++表达式有两个属性：类型和值类型。这里的“值类型”指的就是左值（lvalue）与右值（rval
大话C++之：左右值引用和std::move Kelvin7_Feng c++
大话C++之：左右值引用和std::move什么是左值和右值什么是左值引用和右值引用std::move的应用场景在C++11引入右值引用后，一直对其使用缺乏深入理解，特别是结合std::move移动语义。恰逢最近工作里有相关优化代码使用到，可以趁机会重新学习，加深理解。什么是左值和右值从命名来理解，既然命名区分左右，左右值是相对于赋值号“=”来作锚点。左值(LValue)：可以位于等号左边，有持久
如何在 Python 中将语音转换为文本无水先生语音处理人工智能综合 python xcode 开发语言
一、说明学习如何使用语音识别Python库执行语音识别，以在Python中将音频语音转换为文本。想要更快地编码吗？我们的Python代码生成器让您只需点击几下即可创建Python脚本。现在就现在试试！二、语言AI库2.1相当给力的转文字库语音识别是计算机软件识别口语中的单词和短语并将其转换为人类可读文本的能力。在本教程中，您将学习如何使用SpeechRecognition库在Python中
numpy学习笔记2：ones = np.ones((2, 4)) 的详解宁宁可可 #机器学习 #Python基础与进阶 numpy python 开发语言
numpy学习笔记2：ones=np.ones((2,4))的详解np.ones()是NumPy中用于创建全1数组的核心函数，其用法和参数与np.zeros()类似，但生成的数组元素值全部为1。以下是详细解释：1、语法numpy.ones(shape,dtype=float,order='C')作用：生成一个指定形状和数据类型的全1数组。参数：shape：数组的形状，以元组形式传递（如(2,4)表
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

ML刻意练习第1周之KNN算法

KNN实战之一

KNN实战之二：约会网站

KNN实战之三：手写字体识别

你可能感兴趣的:(ML刻意练习第1周之KNN算法)