DreamWendy

机器学习——K-近邻算法实例实战

实例一：使用k近邻算法改进约会网站的配对效果

1.1 实例分析

1.2 流程步骤

1.3 准备数据：从文本文件中解析数据

1.4 分析数据：用Matplotlib创建散点图

1.5 准备数据：数据归一化

1.6 测试算法：作为完整程序验证分类器

1.7 使用算法：构建完整可用系统

1.8 实例一：实验总结

实例二：手写识别系统

2.1 案例分析

2.2 流程步骤

2.3 准备数据：将图像转换为测试向量

2.4 测试算法：使用K-近邻算法识别手写数字

2.5 实例二：实验总结

实例一：使用k近邻算法改进约会网站的配对效果

1.1 实例分析

我的朋友海伦一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的
人选，但她没有从中找到喜欢的人。经过一番总结，她发现曾交往过三种类型的人：

不喜欢的人
魅力一般的人
极其魅力的人

尽管发现了上述规律，但海伦依然无法将约会网站推荐的匹配对象归入恰当的分类。她觉得可以在周一到周五约会那些魅力一般的人，而周末更喜欢与那些极具魅力的人为伴。海伦希望我们的分类软件可以更好地帮助她将匹配对象划分到确切的分类中。此外海伦还收集了一些约会网站未曾记录的数据信息，她认为这些数据更有助于匹配对象的归类。

1.2 流程步骤

(1) 收集数据：提供文本文件。
(2) 准备数据：使用Python解析文本文件。
(3) 分析数据：使用Matplotlib画二维扩散图。
(4) 训练算法：此步驟不适用于k近邻算法。
(5) 测试算法：使用海伦提供的部分数据作为测试样本。

测试样本和非测试样本的区别：测试样本是已经完成分类的数据，如果预测分类与实际类别不同，则标记为一个错误。
(6) 使用算法：产生简单的命令行程序，然后海伦可以输入一些特征数据以判断对方是否为自己喜欢的类型。

1.3 准备数据：从文本文件中解析数据

约会数据收集存放在文本文件datingTestSet2.txt中，每个样本数据占据一行，总共有1000行。样本主要包含以下3中特征：

每年获得的飞行常客里程数
玩视频游戏所耗时间百分比
每周消费的冰淇淋公斤数

在将上述特征数据输入到分类器之前，必须将待处理数据的格式改变为分类器可以接受的格式。在kNN.py中创建名为fileMatrix的函数，以此来处理输入格式问题。该函数的输入为文件名字符串，输出为训练样本矩阵和类标签向量。

代码实现：

def fileMatrix(filename):
    file = open(filename)
    arrayOLines = file.readlines()
    numberOfLines = len(arrayOLines)
    returnMat = zeros((numberOfLines, 3))
    classLabelVector = []
    index = 0
    for line in arrayOLines:
        line = line.strip()
        listFromLine = line.split('\t')
        returnMat[index,:] = listFromLine[0:3]
        classLabelVector.append(int(listFromLine[-1]))
        index += 1
    return returnMat,classLabelVector

知识总结：

①readlines()：用于读取文件中的一行，包含最后的换行符“\n”。方法读取整个文件所有行，保存在一个列表(list)变量中，每行作为一个元素，但读取大文件会比较占内存。

②readline()：用于读取文件中的所有行，它和调用不指定 size 参数的 read() 函数类似，该方法每次读出一行内容，所以，读取时占用内存小，比较适合大文件，该方法返回一个字符串对象。

③read()：从文件当前位置起读取size个字节，若无参数size，则表示读取至文件结束为止，它范围为字符串对象

④zeros()：返回给定形状和类型的新数组，用0填充；zeros((2,3))，返回两行三列值为0的数组。

⑤strip()：方法用于移除字符串头尾指定的字符（默认为空格或换行符）或字符序列。该方法只能删除开头或是结尾的字符，不能删除中间部分的字符。

⑥split() ：通过指定分隔符对字符串进行切片，返回分割后的字符串列表。

⑦数组切片：逗号“,”分隔各个维度，“:”表示各个维度内的切片，只有:表示取这个维度的全部值。

一维数组

X[i:j] 表示获取X[i]到X[j-1]

X[:-n]取到最后n个字符

X[-n:]取最后n个字符

X[i:j:k]下标i，j与上面的一样，k表示步长，默认为1

X[::-1]是从最后一个元素到第一个元素反向复制一遍

二维数组

X[:,0] 取所有行的第0个数据，即第二维下标位0的所有数据，第0列（数组从0开始）

X[:,1] 取所有行的第1个数据，即第二维下标位1的所有数据，第1列（数组从0开始）

X[:,1:]第一维全部取，即所有行，列上从第一列开始往后取，不取第0列

X[1,:] 是取第1维中下标为1的元素的所有数据，第1行列全部取

X[:2,1:]第一维取下标2之前的元素，即第2行之前，下标为0和1的两行，列从第一列开始取

1.4 分析数据：用Matplotlib创建散点图

Matplotlib 是 Python 的绘图库，类似 MATLAB 的绘图工具。它可与 NumPy 一起使用，提供了一种有效的 MatLab 开源替代方案，它也可以和图形工具包一起使用。

代码实现：

def showdatas(datingDatMat, datingLabels, numScatter, xylabel):
    fig = plt.figure()
    font = {'family': 'MicroSoft YaHei'}
    matplotlib.rc("font", **font)
    ax = fig.add_subplot(111)
    ax.scatter(datingDatMat[:, numScatter[0]], datingDatMat[:, numScatter[1]], 15.0 * array(datingLabels), 15.0 * array(datingLabels))
    ax.set_xlabel(xylabel[1])
    ax.set_ylabel(xylabel[2])
    plt.title(xylabel[0])
    plt.show()

datingDatMat, datingLabels = fileMatrix('datingTestSet2.txt')
numScatter = array([[0, 1], [0, 2], [1, 2]])
xylabel = array([['每年获得飞行常客里程数与玩视频游戏所消耗占比', '每年获得的飞行常客里程数', '玩视频游戏所消耗时间占'],
                 ['每年获得飞行常客里程数与每周消费的冰激淋公升数', '每年获得的飞行常客里程数', '每周消费的冰激淋公升数'],
                 ['玩视频游戏所消耗时间占比与每周消费的冰激淋公升数', '玩视频游戏所消耗时间占比','每周消费的冰激淋公升数']])
showdatas(datingDatMat, datingLabels, numScatter[0], xylabel[0])
showdatas(datingDatMat, datingLabels, numScatter[1], xylabel[1])
showdatas(datingDatMat, datingLabels, numScatter[2], xylabel[2])

操作过程中遇到的问题是，散点图的标题及横纵坐标中文显示不出来，应该是散点图默认字体不支持显示中文，所以解决办法是自己设置字体MicroSoft YaHei微软雅黑。

散点图展示：

1.5 准备数据：数据归一化

表1 约会网站原始数据改进之后的样本数据
序号	玩视频游戏所耗时间百分比	每年获得的飞行常客里程数	每周消费的冰淇淋公斤数	样本分类
1	0.8	400	0.5	1
2	12	134000	039	3
3	0	20000	1.1	2
4	67	32000	0.1	2

若计算样本1和样本4之间的距离，按照K-近邻算法的工作原理使用如下面的公式：

容易发现，上面方程中数字差值最大的属性对计算结果的影响最大，也就是说，每年获得的飞行常客里程数对于计算结果的影响将远远大于其他两个特征：玩视频游戏所耗时间百分比和每周消费的冰淇淋公斤数的影响。而差生这种现象的唯一原因，仅仅是因为飞行常客里程数远大于其他特征值。但海伦认为这三种特征是同等重要的，因此作为三个等权重的特征之前，飞行常客里程数并不应该如此严重地影响到计算结果。

在处理这种不同取值范围的特征值时，我们通常采用的方法是将数据归一化，如将取值范围处理为0到1或者-1到1之间。这样的再次使用公式计算起来的话，就不会存在个别数值的差非常大的情况。我们可以使用下面的公式将任意取值范围的特征值转化为0到1区间内的值：

newValue = (oldValue-min)/(max-min)

其中min和max分别是数据集中的最小特征值和最大特征值。虽然改变数值取值范围增加了分类器的复杂程度，但为了得到准确结果，我们必须这样做。编写一个autoNorm函数，该函数会自动的将数字特征值转化为0到1的区间。

代码实现：

def autoNorm(dataSet):
    minVals = dataSet.min(0)
    maxVals = dataSet.max(0)
    ranges = maxVals - minVals
    normDataSet = zeros(shape(dataSet))
    m = dataSet.shape[0]
    normDataSet = dataSet - tile(minVals, (m, 1))  #相减
    normDataSet = normDataSet/tile(ranges, (m, 1)) #特征值相除
    return normDataSet, ranges, minVals

运行结果：

datingDatMat, datingLabels = fileMatrix('datingTestSet2.txt')
normData, ranges, minVals = autoNorm(datingDatMat)
print('normData')
print(normData)
print('ranges')
print(ranges)
print('minVals')
print(minVals)

1.6 测试算法：作为完整程序验证分类器

机器学习算法一个很重要的工作就是评估算法的正确率，通常我们只提供已有数据的90%作为训练样本来训练分类器，而使用其余的10%数据去测试分类器，检测分类器的正确率。10%数据应该是随机选择的。

代码实现：

def datingClassTest():
    hoRatio = 0.1    #10%的测试数据
    datingDatMat, datingLabels = fileMatrix('datingTestSet2.txt')  #从文件读数据
    normMat, ranges, minVals = autoNorm(datingDatMat)              #数据的归一化
    m = normMat.shape[0]
    numTestVecs = int(m*hoRatio)                                   #测试数据数量
    errorCount = 0.0                                               #错误数量统计
    for i in range(numTestVecs):
        classifierResult = classify(normMat[i, :], normMat[numTestVecs:m, :], datingLabels[numTestVecs:m], 3)
        print("分类器返回的结果是：%d，真实结果是：%d"%(classifierResult, datingLabels[i]))
        if(classifierResult != datingLabels[i]):
            errorCount += 1.0
    print('分类器处理约会数据集的错误率是：%f'%(errorCount/float(numTestVecs)))

实验结果：

我们可以从中看到，在1000条数据中将前100条数据分别使用分类器去进行分类，然后与数据的真实类别进行比较，分类器处理约会数据的错误率为：0.05，即错误率是5%，正确率就是95%，已经能够满足要求了。

1.7 使用算法：构建完整可用系统

以上的步骤，我们已经在数据上对分类器进行了测试，现在终于可用使用这个分类器为海伦来对人们分类了。通过构建完整可用系统，给出完整的程序，海伦会在约会网站上找到某个人并输入他的信息，程序会给出她对对方喜欢程度的预测值。

代码实现：

def classifyPerson():
    resultList = ['不喜欢的人', '魅力一般的人', '极具魅力的人']
    precentTats = float(input('玩视频游戏所耗时间百分比：'))           #用户输入三个特征
    ffMiles = float(input('每年获得的飞行常客里程数：')) 
    iceCream = float(input('每周消费的冰淇淋公升数：'))
    datingDatMat, datingLabels = fileMatrix('datingTestSet2.txt')    #文件数据读入
    normMat, ranges, minVals = autoNorm(datingDatMat)               
    inArr = array([precentTats, ffMiles, iceCream])                  #生成测试集                
    norminArr = (inArr-minVals)/ranges                               #数据归一化
    classifierResult = classify(norminArr, normMat, datingLabels, 5) #分类器分类
    print('这个人可能是你%'%(resultList[classifierResult-1]))

实验结果：

1.8 实例一：实验总结

在使用K-近邻算法改进约会网站的配对效果的实例中，我体会到了KNN算法的思想，同时也感觉到了python语言的简便性和强大性，比如对于KNN算法的核心部分代码，计算距离远近，数组dataSet训练样本集可以兼容计算任意维度距离，因为前一次博客简单实现KNN算法，只用了简单的分类电影类型例子，只有两个特征值，即用二维数组计算就好，而约会网站的配对有三个特征值，距离值是三个维度的，还担心之前写的KNN算法不能用，但是经过仔细研究思考后发现，因为python语言的强大性，array()函数，可以创建二维数组，即利用数学矩阵知识，就可以解决问题。

实例二：手写识别系统

2.1 实例分析

使用K-近邻分类器的手写识别系统。简单起见，这里构造的系统只能识别数字0到9。需要识别的数字已经使用图形处理软件，处理成具有相同的色彩和大小：宽高是32像素x32像素的黑白图像。当前使用文本格式存储图像，即使不能有效的利用空间，但是为了方便理解，还是将图像转换成文本格式。

2.2 流程步骤

（1）收集数据：提供文本文件。

（2）处理数据：编写imgVector()函数，将图像格式转换成分类器使用的向量格式。

（3）分析数据：在Python命令提示符中检查数据，确保它符合要求。

（4）训练算法：此步骤不适用于k-近邻算法。

（5）测试算法：编写函数使用提供的部分数据集作为测试样本，对学习算法进行测试。

（6）使用算法：本例没有完成此步骤

2.3 准备数据：将图像转换为测试向量

目录trainingDigits中包含了大约2000个例子，每个数字大约有200个样本；测试文件testDigits中包含了大约900个测试数据。两组数据没有重叠。使用trainingDigits中的数据训练分类器，使用testDigits的数据测试分类器效果。为了使用kNN算法分类器必须将一个32x32的二进制矩阵转换为1x1024的向量，以便我们使用分类器处理数字图像信息。

如下，三幅图是手写数据集的例子：

代码实现：

#定义imgVector()函数，将32*32的二进制矩阵转换成1*1024的矩阵并返回
def imgVector(filename):
    returnVect = zeros((1, 1024))
    file = open(filename)
    for i in range(32):
        lineStr = file.readline()
        for j in range(32):
            returnVect[0, 32*i+j] = int(lineStr[j])
    return returnVect

输出测试：

testVector = imgVector('testDigits/8_13.txt')
print(testVector[0, 0:31])
print(testVector[0, 32:63])

2.4 测试算法：使用K-近邻算法识别手写数字

现在这一步，需要构造handWriteClassTest( )函数进行分类器测试。为了处理大量的文本文件我们需要from os import listdir用于列出指定目录的文件名，读取多个数字文本文件。

代码实现：

#K-近邻算法
def classify(inX, dataSet, labels, k):
    dataSetSize = dataSet.shape[0]
    diffMat = tile(inX, (dataSetSize, 1)) - dataSet
    sqDiffMat = diffMat ** 2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances ** 0.5
    sortedDistIndicies = distances.argsort()
    classCount = {}
    for i in range(k):
        voteILabel = labels[sortedDistIndicies[i]]
        classCount[voteILabel] = classCount.get(voteILabel, 0) + 1
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]

# 手写识别系统测试代码
def handWriteClassTest():
    hwLabels = []
    trainingFileList = listdir('trainingDigits')   #获取trainingDigits文件子目录的列表
    m = len(trainingFileList)                      #获得训练样本集总数
    trainingMat = zeros((m, 1024))                 #初始化训练样本集
    for i in range(m):                             #循环将trainingDigits目录下的训练样本集的文本文件放入矩阵traningMat中，真实值放入hwLabels中
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]        #将获得的字符串按分隔符'.'分隔并取第一个字符串即去掉拓展名的文件名
        classNumStr = int(fileStr.split('_')[0])   #获取训练样本集的真实值，非numpy数据需要指定数据类型int
        hwLabels.append(classNumStr)               #将得到的单个真实值按加入到真实值列表hwLabels中
        trainingMat[i, :] = imgVector('trainingDigits/%s' % fileNameStr) #把32行*32列的二进制文本文件转换成1行*1024列矩阵并按行存储到训练数据总矩阵中
    testFileList = listdir('testDigits')           #获取testDigits文件子目录的列表
    errorCount = 0.0                               #预测错误计数器
    mTest = len(testFileList)                      #测试样本集总量
    for i in range(mTest):
        fileNameStr = trainingFileList[i]
        fileStr = fileNameStr.split('.')[0]
        classNumStr = int(fileStr.split('_')[0])
        vectorUnderTest = imgVector('trainingDigits/%s' % fileNameStr)
        classifierResult = classify(vectorUnderTest, trainingMat, hwLabels, 3) #用K-近邻算法对测试样本集分类
        print("分类器得到得预测值为：%d ,真实值为：%d " % (classifierResult, classNumStr))
        if(classifierResult != classNumStr):        #判断预测是否正确，如果错误预测，则errorCount加1
            errorCount += 1.0
    print("测试总数：%d，预测错误总数：%d，错误率为：%f" % (mTest, errorCount, errorCount/float(mTest)))

实验结果：

. . . . . .

2.5 实例二：实验总结

上面的实例二实验中，可以知道当K = 3时，使用K-近邻算法识别手写数据集的错误率大约为百分之一。但是从运行效果看，实际使用这个算法的时候，算法的执行效率并不高。我们需要进行2000次距离计算，每个距离计算包括了1024个维度的浮点数，总计执行900次，此外，我们还要为测试向量准备很大的存储空间。

我觉得中手写数字识别的系统可以做的更好一点，比如做出一个程序界面，给窗口在画板上手写数字，然后程序能够识别出手写数字，后期继续吧自己的想法实现！

Python 中无穷的表示梦想是优秀社畜 Python python 编程语言经验分享
我们在python编程过程中可能需要设定一个无穷大的值来辅助我们的逻辑语句，下面展示python中无穷大的表示，和无穷的判断方法。上代码！！！#无穷的判断需要导入math模块importmath#正无穷zheng_wq=float('inf')#负无穷fu_wq=-float('inf')#float('-inf')#判断是否无穷math.isinf(zhengwq)#最终结果是True希望我的笔
ubuntu安装miniconda MWbayern ubuntu
Anaconda是一个开源的Python包管理器，而Miniconda则是轻量级的Anaconda下载地址ubuntu安装在下载地址里面下载相应文件或者sudoapt-getinstallwgetwgethttps://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh之后运行该文件bashMiniconda3-latest-
python中drop用法去重_如何使用drop_duplicates进行简单去重（入门篇） weixin_39991055 python中drop用法去重
什么是去重呢？简单来说，数据去重指的是删除重复数据。在一个数字文件集合中，找出重复的数据并将其删除，只保存唯一的数据单元。在我们的数据预处理过程中，这是一项我们经常需要进行的操作。去重有哪些好处？节省存储空间提升写入性能提高模型精度今天我们就来简单介绍一下，在pandas中如何使用drop_duplicates进行去重。一、函数体及主要参数函数体：df.drop_duplicates(subset
python中legend设置_如何使用python legend()函数？ weixin_39906130 python中legend设置
当我们需要去设置一个图示，并且在细节掌控上需要我们对于背景的颜色，以及边框颜色等属性，需要去做处理的时候，一般大家想到的模块或者函数都只能解决部分。结合起来可以完成上述所说的要求，但是有一个函数是专门为制定个性化的图例而工作的，这就是本章要跟大家介绍的legend()函数。函数功能：设置图例的字体、大小、颜色等属性，制定个性化。函数语法：plt.legend()函数参数：Loc，指代地理位置实例代
python中数字应该用什么表示_python的特殊数字类型（无穷大、无穷小等） weixin_39646018
float('inf')表示正无穷-float('inf')或float('-inf')表示负无穷其中，inf均可以写成Inf起步python中整型不用担心溢出，因为python理论上可以表示无限大的整数，直到把内存挤爆。而无穷大在编程中常常需要的。比如，从一组数字中筛选出最小的数字。一般使用一个临时变量用于存储最后结果，变量去逐个比较和不断地更新。而这临时变量一般要初始无穷大或者去第一个元素的值
基于人工智能的Python面试题请一直在路上 python 开发语言
基于人工智能的Python面试题1.Python中的元组与列表区别是什么？列表是可变类型，元组不是。列表是引用类型，元组不是。列表使用场景更宽泛，元组更多用于一些数据不可变的场景，例如参数、或者返回值。2.Python中的字典是否有序？python3.6之前字典是无序的，之后是有序的。原因可以参考下这个帖子https://blog.csdn.net/weixin_48629601/article/
17-7 向量数据库之野望7 - PostgreSQL 和pgvector 拉达曼迪斯II AIGC学习数据库管理工具 AI创业数据库 postgresql 人工智能机器学习 AIGC 搜索引擎
PostgreSQL是一款功能强大的开源对象关系数据库系统，它已将其功能扩展到传统数据管理之外，通过pgvector扩展支持矢量数据。这一新增功能满足了对高效处理高维矢量数据日益增长的需求，这些数据通常用于机器学习、自然语言处理(NLP)和推荐系统等应用。https://github.com/mazzasaverio/find-your-opensource-project什么是pgvector？
matlab实现一个雷达信号处理的程序，涉及到对原始图像的模拟、加权、加噪以及通过迭代算法对图像进行恢复和优化处理 max500600 MATLAB 算法算法 matlab 信号处理
clcclearcloseallloadscene3.mat%加载原始图像，自己设计设计为一个300*400的矩阵300是距离向长度，400是方位向长度Map_ori=scene3;[M,N_K]=size(Map_ori);figureimagesc(scene3)v=100;%机载速度，单位m/sbandwidth=30*1e6;%信号带宽，决定距离分辨率，单位Hzc=3*1e8;%光速R_R
海外抖音技术深度解析：算法、AI与全球化的挑战神探阿航计算机产业科普与思考算法人工智能机器学习数据挖掘深度学习
引言2025年1月19日，在美国宣布暂停服务，这一事件引发了全球用户的广泛关注。作为全球最受欢迎的短视频平台之一，其成功离不开其强大的技术支撑，尤其是其个性化推荐算法和AI驱动的创作工具。然而，随着全球市场环境的变化，它面临的技术与运营挑战也日益凸显。本文将深入分析其技术核心、全球化运营中的挑战及其未来发展方向。核心：个性化推荐引擎其算法是其成功的关键，其核心在于个性化推荐引擎。该引擎采用深度学习
JAVA 反射(JAVA面试题) geejkse_seff java 开发语言
5.1.2.JAVA反射5.1.2.1.动态语言动态语言，是指程序在运行时可以改变其结构：新的函数可以引进，已有的函数可以被删除等结构上的变化。比如常见的JavaScript就是动态语言，除此之外Ruby,Python等也属于动态语言，而C、C++则不属于动态语言。从反射角度说JAVA属于半动态语言。5.1.2.2.反射机制概念（运行状态中知道类所有的属性和方法）在Java中的反射机制是指在运行状
如何运用Python爬虫快速获得1688商品详情数据小爬虫程序猿 API python 爬虫开发语言
在数字化时代，数据的价值日益凸显，尤其是在电商领域。对于企业来说，获取竞争对手的商品信息是分析市场趋势、制定营销策略的重要手段。1688作为中国领先的B2B电商平台，拥有海量的商品数据。本文将介绍如何使用Python编写爬虫程序，以合法合规的方式快速获取1688商品详情，为电商企业提供数据支持。1.环境准备在开始编写代码之前，我们需要准备以下开发环境：Python3.x：确保已安装Python3.
如何使用Java爬虫获取阿里巴巴热卖商品推荐：代码示例与实践指南小爬虫程序猿 Java java 爬虫 python
在电商领域，获取热卖商品推荐对于商家和开发者来说至关重要。阿里巴巴提供了热卖商品推荐API接口，能够根据消费者的购买历史、浏览行为、搜索习惯等数据，自动推荐符合其需求的商品。以下将详细介绍如何使用Java爬虫获取阿里巴巴热卖商品推荐，并提供相关的代码示例。一、阿里巴巴热卖商品推荐API接口简介阿里巴巴热卖商品推荐API接口是一种基于人工智能算法的推荐系统，能够根据消费者的购买历史、浏览行为、搜索习
AI与API的融合：构建智能互联技术世界的基石 IT数据V+I7809804594 人工智能数据分析 python 爬虫大数据
在当今科技飞速发展的时代，人工智能（AI）与应用程序接口（API）的融合正在开启智能应用的新纪元。AI以其强大的数据处理和分析能力，正在改变各行各业的工作方式，而API则作为连接技术与应用的桥梁，为AI技术的普及和应用提供了无限可能。本文将深入探讨AI与API的融合如何推动智能应用的创新和发展，以及其在各个领域的应用和前景。一、AI与API融合的背景随着大数据、云计算、物联网等技术的快速发展，人工
python微博关键词爬虫嵌入式开发项目 2025年爬虫精通专栏 python 爬虫开发语言媒体
目录记一次阿里云盾滑块验证分析并通过操作环境数据接口proxy配置根据关键词获取userid根据userid获取信息数据保存数据：记一次阿里云盾滑块验证分析并通过操作环境win10、macPython3.9数据接口搜索https://**********?containerid=100103type%3D{chanenl}%26q%3D{quote(self.words)}&page_type=s
python matplotlib legend()参数详解请一直在路上 python matplotlib 开发语言
在Python的Matplotlib库中，legend函数用于添加图例，帮助解释图表中不同数据系列或数据点的含义。legend函数有很多参数，可以自定义图例的各个方面，从位置到样式，从字体大小到边框。下面是一些常用参数的详细解释：importmatplotlib.pyplotasplt#创建一些数据x=[1,2,3,4]y1=[1,4,9,16]y2=[1,2,3,4]#绘制数据plt.plot(
YOLOv8与Transformer：探索目标检测的新架构 AI架构设计之禅 AI大模型应用入门实战与进阶大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
YOLOv8与Transformer：探索目标检测的新架构关键词：目标检测，深度学习，YOLOv8，Transformer，计算机视觉，卷积神经网络摘要：目标检测是计算机视觉领域的一项重要任务，其目标是从图像或视频中识别和定位特定对象。近年来，YOLO（YouOnlyLookOnce）系列算法以其高精度和高速度成为目标检测领域的佼佼者。最新版本的YOLOv8引入了Transformer架构，进一步
Python+Pytest+Allure+Git+Jenkins数据驱动接口自动化测试框架_python+pytest+allure+jenkins架构 2401_87378716 python pytest git
接口测试流程1、需求评审，熟悉业务和需求2、开发提供接口文档3、编写接口测试用例4、用例评审5、提测后开始测试6、提交测试报告两种常见的HTTP请求方法：GET和POST二、项目说明本框架是一套基于Python+Pytest+Requests+Allure+Jenkins而设计的数据驱动接口自动化测试的框架。技术栈Python、Pytest、Requests、Pactverity、Excel、Js
python运行方式威胁情报收集站 pycharm ide python
#python代码运行方式第一种：交互式解释器。第二种：命令行运行python源代码。第三种：使用编辑器或集成开发环境（IDE）。比如：pycharm。（IDE：IntegratedDevelopmentEnvironment）详细教程：https://edu.csdn.net/job/pythonbe_01/python-3-3
【强化学习】PyTorch-RL框架大雨淅淅人工智能 pytorch 人工智能 python 深度学习机器学习
目录一、框架简介二、核心功能三、学习环境配置四、学习资源五、实践与应用六、常见问题与解决方案七、深入理解强化学习概念八、构建自己的强化学习环境九、调试与优化十、参与社区与持续学习一、框架简介PyTorch-RL是一个基于PyTorch框架的深度强化学习项目。它充分利用了PyTorch的强大功能，提供了易于使用且高效的深度强化学习算法实现。该项目的主要编程语言是Python，旨在帮助开发者快速实现和
蓝桥杯备赛笔记（九）动态规划（一）小魏´•ﻌ•` 蓝桥杯C++蓝桥杯笔记动态规划
1.动态规划基础(1)线性DP1）什么是DP（动态规划）DP（动态规划）全称DynamicProgramming，是运筹学的一个分支，是一种将复杂问题分解成很多重叠的子问题，并通过子问题的解得到整个问题的解的算法。在动态规划中有一些概念：状态：就是形如dp[i][j]=val的取值，其中i，j为下标，也是用于描述、确定状态所需的变量，val为状态值。状态转移：状态与状态之间的转移关系，一般可以表示
两万字探讨时间轮算法 Damon_0411 算法 java spring
1.引言1.1背景介绍随着分布式系统、微服务架构的流行以及高并发场景的广泛应用，系统中处理延时任务的需求变得愈发重要。延时任务的常见场景包括：任务调度：某些任务需要按照预定时间执行，比如每天的定时数据备份。超时控制：网络连接的超时检测、数据库锁的释放延迟等。缓存管理：缓存数据的过期清理策略。事件驱动场景：如日志系统中，只有当所有日志接收完毕并经过一定延迟后才能触发归档。延时任务的本质是系统需要管理
运行python程序的两种方式交互式和文件式_执行Python程序的两种方式 weixin_39610085
交互式(了解)交互式环境下，敲完一条命令按下enter键马上能看到结果，调试程序方便。程序无法永久保存，关掉cmd窗口数据就消失了。命令行式(了解)打开文本编辑器，在文本编辑器中写入一串字符。文本编辑器写的代码毫无意义，只是一堆字符，并且文件的后缀名没有影响。由于python语言是解释型语言，我们直接使用python打开文件，python会读一行翻译一行，并且这个文件是永久保存在硬盘中的。但是需要
基于Spring Boot和Vue的人脸识别项目（源码） AI人H哥会Java JAVA大作业项目实战 spring boot vue.js java 人工智能计算机视觉后端 sql
背景随着人工智能技术的迅猛发展，生物识别技术的迅猛发展，人脸识别已经成为最具潜力的人工智能应用之一。它不仅在安全监控、金融支付、智能家居等多个领域得到了广泛应用，也逐渐进入日常生活场景。人脸识别作为一种生物特征识别技术，能够通过分析人脸图像中的特征点，实现对个体的身份识别。利用计算机视觉技术，系统能够快速从大量图片中定位并识别特定人脸，实现身份验证和信息检索。这一技术的应用，不仅提高了安全性，还提
【python基础】python GIL(全局解释器锁) 和多线程锁 shengnan_wsn python python 开发语言后端
文章目录什么是GIL？有了GIL还需要线程锁吗？参考资料1：[终于有人把GIL全局解释器说清楚了](https://zhuanlan.zhihu.com/p/311877485)2：[浅谈Python多线程之GIL描述](https://blog.csdn.net/qq_34359754/article/details/115209158)3：[多线程锁机制](https://www.cnblog
windows下python运行的方法好烦好烦方法
python有2中运行模式，一种是交互运行模式，一种是脚本运行模式。（假设用户已经安装好，网上很多例子）交互运行方和matlab命令窗口有点类似，有2中方法，一种是用它自带的开发环境IDLE，一种是在命令窗口下运行，建议2种方法都掌握，因为我们要在命令窗口模式下运行脚本文件。用开始菜单键win+r直接打开命令窗口，输入python字符回车，应该会出现如下提示： ![打开](https://im
【WRF后处理】基于NCL处理wrf运行结果wrfout_d01 WW、forever WRF模型原理及应用 WRF NCL
【WRF后处理】基于NCL处理wrf运行结果wrfout_d01NCL概述wrf-python和NCL总结WRF后处理数据信息查看诊断变量的获取插值参考NCL概述NCARCommandLanguage（NCL）是由美国大气研究中心（NCAR）推出的一款用于科学数据计算和可视化的免费软件。它有着非常强大的文件输入和输出功能，可读写netCDF-3、netCDF-4classic、HDF4、binar
常用Python GUI库推荐！老男孩IT教育 python 开发语言
tkinter的全称是TkInterface，是Python自带的GUI库，支持跨平台的GUl程序开发，只要安装了python就可以直接使用它。那么pythontkinter是什么?常用PythonGUI库有哪些?具体请看下文。pythontkinter是什么?tkinter是Python的标准GUI库。Python使用tkinter可以快速的创建GUI应用程序。由于tkinter是内置到Pyth
人工智能伦理：技术发展背后的思考 m0_72547478 人工智能
近年来，人工智能技术呈爆发式发展，在医疗、交通、金融等诸多领域取得惊人成果，但与此同时，人工智能伦理问题日益凸显，引发广泛关注。数据隐私与安全首当其冲。AI系统依赖海量数据训练，这些数据包含个人信息、医疗记录等敏感内容。若数据保护不当，极易引发数据泄露风险，侵犯个人隐私。例如，某些智能健康APP，若未能加密传输用户健康数据，一旦遭受黑客攻击，用户的隐私将暴露无遗。算法偏见也是一大痛点。AI算法基于
第 7 课Python 容器类型与相关操作嵌入式老牛 Python入门 python 开发语言
1.容器介绍对象是Python中对数据的抽象，Python程序中的所有数据都是由对象或对象间关系来表示的。Python中，可包含其他对象的引用的对象，称之为“容器”。容器的例子有元组、列表和字典等。这些引用的对象是容器对象值的组成部分。常用的容器主要划分为两种：序列（如：列表、元组等）和映射（如：字典）。序列中，每个元素都有下标，它们是有序的。映射中，每个元素都有名称（又称“键”），它们是无序的。
Python在WRF模型自动化运行及前后处理中实践技术应用数字化信息化智能化解决方案 python
Python在WRF（WeatherResearchandForecasting）模型自动化运行及前后处理中的实践技术应用如下：自动化运行WRF模型：使用Python脚本可以自动化执行WRF模型的运行过程。通过编写脚本来调用WRF模型的输入文件、运行模型并收集输出结果。这样可以在短时间内运行多个模拟，提高工作效率。数据预处理：在运行WRF模型之前，需要进行数据预处理，包括数据格式转换、坐标转换、数
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

机器学习——K-近邻算法实例实战

实例一：使用k近邻算法改进约会网站的配对效果

1.1 实例分析

1.2 流程步骤

1.3 准备数据：从文本文件中解析数据

1.4 分析数据：用Matplotlib创建散点图

1.5 准备数据：数据归一化

1.6 测试算法：作为完整程序验证分类器

1.7 使用算法：构建完整可用系统

1.8 实例一：实验总结

实例二：手写识别系统

2.1 实例分析

2.2 流程步骤

2.3 准备数据：将图像转换为测试向量

​

2.4 测试算法：使用K-近邻算法识别手写数字

2.5 实例二：实验总结

你可能感兴趣的:(机器学习,人工智能,K-近邻算法,机器学习,人工智能,python)