VernonJsn

KNN算法实战

1.1 最近邻算法

最近邻算法（NN)：为了判定未知样本的类别，以全部训练样本作为代表点计算位置样本与所有训练样本的距离，并以最邻近这的类别作为决策位置样本的唯一依据。但是最近邻算法作为分类原则是存下明显缺陷的。

最近邻算法的缺点---对噪声数据过于敏感

为了解决这个额问题，我们可以把位置样本周边的多个样本算在内，扩大与决策的样本量，以避免个别数据直接决定决策结果。

1.2 K-邻近算法

K近邻算法思想：K-近邻算法是最紧邻算法的一个延伸。基本思路是：选择未知样本一定范围内确定个数的K个样本，该K个样本大多数属于某一类型，则未知样本判定为该类型。

2.算法步骤：

2.1 KNN算法步骤：

2.2 KNN算法步骤：

◆计算距离:计算测试对象与训练集中的每个对象的距离。距离的度量有很多种计算方法，如欧氏距离(欧几里得距离)和曼哈顿距离等。

欧式距离:

◆选取近邻:将距离升序排序，选择距离最近的K个样本点。

◆分类决策:根据这K个近邻归属的类别，采用多数表决的方法，由这K个点来投票决定测试对象归为哪一类。

2.3 KNN算法步骤：

Step.1--准备数据，分析数据，对数据进行预处理，归一化处理;

Step.2--划分训练集和测试集;

Step.3--计算未知样本和每个训练集样本的距离;

Step.4--设定参数，k值;

Step.5--将距离升序排列;

Step.6--选取距离最小的k个点;

Step.7--统计前k个最近邻样本点所在类别出现的次数;

Step.8--多数表决，选择出现频率最大的类别作为未知样本的类别。

2.4 KNN算法中的K

问题:有一-个未知形状X(图中绿色的圆点)，如何判断X是什么形状?

若K=3，判定绿色待分类点属于红色的三角形- -类。

若K=5，判定绿色待分类点属于蓝色的正方形一类。

问:“ 分类器何种情况下会出错?”或者“答案是否总是正确的?”

答案是否定的，分类器并不会得到百分百正确的结果。

分类器的性能也会受到多种因素的影响，比如K的取值就在很大程度上影响了KNN分类器的预测结果，还有数据集本身也会影响

为了测试分类器的效果，我们将原始数据集分为两部分，训练集和测试集。通过大量的测试数据，我们可以得到分类器的错误率，即分类器给出错误结果的次数除以测试执行的总数。同时，我们也不难发现，KNN算法没有进行数据的训练，直接使用未知的数据与已知的数据进行比较，得到结果.因此，可以说KNN算法不具有显式的学习过程.

3. KNN算法实战

3.1 实例分析算法步骤

Step.1--准备数据，分析数据，对数据进行预处理;

Step.2--划分训练集和测试集;

Step.3--计算未知样本和每个训练集样本的距离;

Step.5-将距离升序排列;

(1) Beautiful W oman

(2) He's Not Really into Dudes

(3) California Man

(4) Kevin Longblade

(5) Robo Slayer 3000

(6) Amped II

Step.6- .选取距离最小的k个点;

K=3

( 1 ) Beautiful Woman

(2) He's Not Really into Dudes

(3) California Man

Step.7-统计前k个最近邻样本点所在类别出现的次数;

爱情电影: 3次;

动作电影: 0次。

Step.8--多数表决，选择出现频率最大的类别作为未知样本的类别。

未知电影属于:爱情电影。

3.2程序实现

(1)构建数据集

import numpy as np

import matplotlib.pyplot as plt

fight=[3,2,1,101,99,98]

kiss=[104,100,81,10,5,2]

filmtype=[1,1,1,2,2,2]

plt.scatter(fight,kiss,c=filmtype)

plt.xlabel('fight')

plt.ylabel('kiss')

plt.title('movie)

plt.show()

x=np.array([fght,kiss])

x=x.T

y=np.array(filmtype)

print(x)

print(y)

结果：

(2)计算未知样本和每个训练集样本的距离

欧氏距离：

Python代码:

#求【18,90】与各个数据点的距离

xx=np.array([18,90])

dist+(((x-xx)** 2).sum(1))**0.5

print(dist)

得出结果：

[1.35273929 1.34144385 1.34403348 1.60758748 1.61054148 1.61260727]

（3）将距离升序排序

Python代码：

sortedDist=dist.argsort()

print(sortedDist)

得到排序索引：

[1 2 0 3 4 5]

(4) 选取距离最小的k个点，统计前k个点所在类别出现的次数

Python代码:

k=4

classCount={}

for i in range(k):

voteLabel = y[sortedDist[i]] #得到排序后的标签

classCount[voteLabel] =classCount.get(voteLabel,0)+1 #不同标签统计几次

print('class: count',classCount)

得到结果：例如1表示爱情片，统计了三次；2表示动作片统计了1次

class: count {1: 3, 2: 1}

(5)多数表决，输出结果

Python代码:

maxType=0

maxCount=- 1

for key,value in classCount.items():

if value>maxCount:

maxType=key

maxCount=value

print('output: ',maxType)

得出结果：属于爱情片

output: 1

2.封装KNN函数

函数说明: KNN算法分类器

输入参数:

inX -未知样本(测试集)

dataSet -训练样本的特征矩阵(训练集)

labels -训练集分类标签向量

k -选择距离最小的k个点

maxType -分类结果

Python代码:

KNN函数部分：

import numpy as np



def knn(inX,dataSet,labels,k):

dist=(((dataSet-inX)**2).sum(1))**0.5

sortedDist=dist.argsort()

classCount={}

for i in range(k):

    voteLabel = labels[sortedDist[i]]

    classCount[voteLabel]=classCount.get(voteLabel,0)+1

    maxType=0

    maxCount=-1

for key,value in classCount.items():

    if value > maxCount:

        maxType = key
    
        maxCount = value

return maxType

测试部分：

import numpy as np
import matplotlib.pyplot as plt
import knn as K

fight=(3,2,1,101,99,98)
kiss=(104,100,81,10,5,2)
filmtype=(1,1,1,2,2,2)
plt.scatter(fight,kiss,c=filmtype)

x=np.array([fight,kiss])
y=np.array(filmtype)
x=x.T
print(x)
print(y)

xx=np.array([18,90])

result = K.knn(xx,x,y,4)

print('result:',result)

3.3 案例实战

3.约会网站配对数据
        海伦女士一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的任
选，但她并不是喜欢每-一个人。经过一番总结，她发现自己交往过的人可以进行如下分类:
        ●不喜欢
        ●魅力一般
        ●极具魅力
        海伦收集约会数据已经有了一段时间，她把这些数据存放在文本文件datingTestSet.txt中，
每个样本数据占据一-行，总共有1000行。海伦收集的样本数据主要包含以下3种特征:
        ●每年出行的里程数
        ●玩游戏的时间占比
        ●每周吃冰淇淋的公升数

数据集解释：

(1)读取数据集
将样本数据的格式转换为分类模型可以接收的格式。需要将数据分为特征矩阵和对应的分类标签向量。

file2matrix函数说明:打开并解析文件，
        对数据进行分类: 1代表不喜欢,2代
        表魅力-般,3代表极具魅力
输入参数:
        filename-文件名
返回:
        returnMat -特征矩阵
        classLabelVector -分类标签向量

Python代码:

import numpy as np
def file2matrix(filename):
    fr = open(filename)#打开文件
    #初始化
    numberOfLines = len(fr.readlines())#读出文件多少行
    returnMat = np.zeros((numberOfLines,3))#文件总共多少行，加3列的矩阵
    classLabelVector= []
    fr = open(filename)
    index= 0#定位到第一行
    for line in fr.readlines():#读出所有行
        line = line.strip()#清理每行数据，空格符
        listFromLine = line.split('\t')#切分数据
        returnMat[index,:] = listFromLine[0:3]#读出一行，切前三列
        #将文本类型转为数字1,2,3
        if listFromLine[-1] == 'didntLike':
            classLabelVector.append(1)
        elif listFromLine[-1] == 'smallDoses':
            classLabelVector.append(2)
        elif listFromLine[-1]== 'largeDoses':
            classLabelVector.append(3)
        index += 1
    return returnMat,classLabelVector

datingDataMat,datingLabels=file2matrix('datingTestSet.txt')
print(datingDataMat)
print(datingLabels)

得出结果：

(2)分析数据

# (2)分析数据
# Python代码:
import numpy as np
import matplotlib.pyplot as plt
datingDataMat,datingLabels=file2matrix('datingTestSet.txt')
plt.scatter(datingDataMat[:,0],datingDataMat[:,1],c=datingLabels)#横轴是里程数纵轴是游戏时间
plt.show()

得出结果：

(3)数据归一化处理
下表提取了四组样本数据，计算样本1和样本2之间的距离，使用欧式距离公式:

每年出行里程数对于计算结果的影响远远大于表中其他两个特征

归一化的处理方法有很多种，如0-1标准化， Z-score标准化，sigmoid压缩法等等。

0-1标准化公式:

autoNorm函数说明:对数据进行归- -化
输入参数:
dataSet -特征矩阵
返回:
normDataSet -归-化后的特征矩阵

Python代码:

import numpy as np
def autoNorm(dataSet):
    minVals = dataSet.min(0)#0表示按列获取最小值
    maxVals = dataSet.max(0)#按列获取最大值
    normDataSet = np.zeros(dataSet.shape)#创建于原数据同行同列的数据
    normDataSet = (dataSet - minVals)/(maxVals-minVals)#归一化
    return normDataSet
#测试
dataSet=autoNorm(datingDataMat)
print(dataSet)

得到归一化后的特征矩阵：

(4)测试KNN分类器模型
Python代码:

# (4)测试KNN分类器模型
import numpy as np
import knn as K
dataSet,labels=file2matrix('datingTestSet.txt')
normalSet= autoNorm(dataSet)
m=0.8#表示训练集占总共集合的占比
dataSize= normalSet.shape[0]
print('数据集总行数: ',dataSize)
trainSize=int(m* dataSize)
testSize=int((1-m)* dataSize)
k=5
results=[]
error=0
for i in range(testSize):
    results=K.knn(normalSet[trainSize+i-1,:],normalSet[0:trainSize,:],labels[0:trainSize],k)
    if results!=labels[trainSize+i-1]:
        error=error+1
print('错误率: ',error/testSize)

得出结果：

数据集总行数:  1000
错误率:  0.05527638190954774

可以改变函数训练集与测试集的占比( 改变变量m)和分类器k的值，观察检测错误率是否随着变量值的变化而变化。

4. KNN算法的探讨

观察下面的例子，我们看到，对于位置样本X,通过KNN算法，我们显然可以得到X应属于红点，但对于位置样本Y,通过KNN算法我们似乎得到了Y应属于蓝点的结论，而这个结论直观来看并没有说服力。

由上面的例子可见：该算法在分类时有个重要的不足是，当样本不平衡时，即：一个类的样本容量很大，而其他类样本数量很小时，很有可能导致当输入一个未知样本时，该样本的K个邻居中大数量类的样本占多数。但是这类样本并不接近目标样本，而数量小的这类样本很靠近目标样本。这个时候，我们有理由认为该位置样本属于数量小的样本所属的一类，但是，KNN却不关心这个问题，它只关心哪类样本的数量最多，而不去把距离远近考虑在内，因此，我们可以采用权值的方法来改进。和该样本距离小的邻居权值大，和该样本距离大的邻居权值则相对较小，由此，将距离远近的因素也考虑在内，避免因一个样本过大导致误判的情况。

和该样本距离小的邻居权值大，和该样本距离大的邻居权值则相对较小，由此，将距离远近的因素也考虑在内，避免因一个样本过大导致误判的情况。

思考：

从算法实现的过程大家可以发现，该算法存两个严重的问题：
第一个是需要存储全部的训练样本
第二个是需要进行繁重的距离计算量。

4.1 算法优点

●简单好用，容易理解，易于实现，既可以用来做分类也可以用来做回归;
●可用于数值型数据和离散型数据;
●适合对稀有事件进行分类;
●特别适合于多分类问题(对象具有多个类别标签)。

4.2 算法缺点

(1)样本库容量依赖性较强;
        样本小时误差难以控制
(2) 无法给出数据的基础结构信息;
        无法给出数据的内在含义，无法知晓平均实例样本和典型实例样本具有什么特征。
(3) 分类计算量大，速度慢，空间复杂度高;
        KNN算法的计算复杂度和存储空间会随着训练集规模和特征维数的增大而迅速增加。对每- -个待分类的未知样本都要计算它与全体训练集样本点的距离，才能求出它的K个最近邻点。

(4)K值不好确定;
K值选择过小，得到的近邻数过少那么将会对数据中存在的噪声(特例)过于敏感，会降低分类
精度，容易发生过拟合;K值选择过大，并且待分类样本属于训练集中数据较少的那类,那么在选择K个近邻的时候，实际.上并不相似的数据也会被包含进来造成噪声增加而导致分类效果降低，容易发生欠拟合。

思考：KNN算法有哪些改进策略？

资源下载：KNN算法实战.zip-Python文档类资源-CSDN下载

【深度学习】softmax 回归的从零开始实现与简洁实现 Douglassssssss 深度学习深度学习回归人工智能 softmax回归交叉熵损失函数
前言小时候听过一个小孩练琴的故事，老师让他先弹最简单的第一小节，小孩练了两天后弹不出。接着，老师让他直接去练更难的第二小节，小孩练习了几天后还是弹不出，开始感觉到挫败和烦躁了。小孩以为老师之后会让他从简单的开始练，谁知老师直接让他开始练最难的一小节。小孩不干了，问老师是不是故意刁难他。老师笑笑，让他现在弹弹第一小节试试。神奇的是，小孩竟然发现自己已经能完整弹出来了。这有点像我现在的学习状况，前些天
数据集标准化:软件2.0的基石工程 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
数据集标准化,软件工程,数据质量,机器学习,人工智能,数据治理,数据可信度1.背景介绍在当今数据爆炸的时代，数据已成为企业和组织的核心资产。然而，海量的原始数据往往杂乱无章，格式不统一，质量参差不齐，这严重阻碍了数据价值的挖掘和应用。数据标准化作为解决这一问题的关键技术，已成为软件2.0时代不可或缺的基石工程。软件2.0时代，人工智能、机器学习等技术蓬勃发展，对数据质量提出了更高的要求。传统的软件
李开复：AI 2.0 时代的意义 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，伦理问题，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从最初的局限于特定领域的应用，逐渐发展到能够处理更复杂的任务，甚至展现出一些类似人类智能的能力。2010年以来，深度学习技术的兴起，特别是Transformer模型的出现，为AI发展带来了新的突破。这些模型能够处理海量数据，学习复杂的模式，并在自然语言处理
美欧通胀爆表！老美放低姿态示好沙特，油价要降下来啦？李云飞
作者：李云飞｜来源：原创一位久经商场的创业老司机，关注我，每天分享一点财富干货，让你的人生少走弯路。美国和沙特、阿联酋等一些中东大国召开了一场重要的会议。这次会议成为了全世界关注的焦点，更是各路资本密切关注的对象。这是一场什么会议这么重要呢？再说这次会议主要的内容又是什么呢？不用我说，大家用脚趾头都能够猜出来，那肯定就是商讨中东石油加量供应的问题。现在美国是真的急了。我们来看一组数据：美国6月份C
解密 Python 的 MRO：C3 线性化如何优雅解决多重继承的菱形难题》
《解密Python的MRO：C3线性化如何优雅解决多重继承的菱形难题》引言：继承的优雅与复杂在Python的面向对象编程中，继承是一种强大的机制，它让我们能够复用代码、构建抽象层次、实现多态行为。然而，当我们引入多重继承时，继承体系的复杂性也随之而来，尤其是著名的“菱形继承问题”。Python通过一种称为C3线性化（C3Linearization）的算法来解决方法解析顺序（MethodResolu
力量从哪里来 Coco加油
一个读书群里书友的推荐，打开《力量从哪里来》，忍不住看了200多页，里面有很多的文字触动到我。作者李一诺的勇敢和坚韧，她把真我与外在活成一体，也就有了生命的绽放。一诺的特别，在于她身上巨大的对比反差。她是世俗意义上绝对的牛人：清华大学学士、加州大学洛杉矶分校博士，曾任麦肯锡公司全球董事合伙人、盖茨基金会中国办公室首席代表，是公众号“奴隶社会”和创新教育机构一土学校的联合创始人……随便哪一项摆出来，
系统学习图像算法Day.9——OpenCV学习——形态学滤波敏而好学无止境 OpenCV学习图像算法
形态学滤波定义：在我们图像处理中的形态学，往往指的时数学形态学——是一门建立在格论和拓扑学基础上的图像分析学科。形态学基本操作：膨胀、腐蚀膨胀dilate介绍：膨胀就是求局部最大值的操作。从数学角度讲，膨胀就是讲图像与核进行卷积。核与图像卷积，即计算核覆盖的区域的像素点的最大值，并把这个最大值赋值给参考点指定的像素。这样会使图像中的高亮区域逐渐增长。函数调用举例：Matimage=imread("
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
云深不知处(谢雁宁顾长卿)完结热门小说_免费小说阅读云深不知处谢雁宁顾长卿喵喵美文
小说：《云深不知处》主角：谢雁宁顾长卿简介：成婚第三年，谢雁宁决定和离了，不过，是瞒着她的夫君。盛朝，大多是男子休妻，但往往被休之女子，必定要经受流言蜚语。而若是男女和离，便须得双方皆在和离书上签字，这本就是难事，遑论，她的夫君还是权倾朝野的当朝太傅。他不会同意和离的。尽管，他并不爱她。可她心意已决，必须离开他，看样子，只能用点计策。成婚第三年，谢雁宁决定和离了，不过，是瞒着她的夫君。盛朝，大多是
读《如何给孩子读绘本》——松居直燕纪事
读《如何给孩子读绘本》很是激动。里面提及的关于绘本的种种都让人为之振奋。好希望身边的家长也能接触它，并“喂”孩子多一些绘本。人的生命价值在于体验。而幼年时的体验对人一生的影响是巨大的。如同纯白的画布，那幼年的体验是生命的底色。在读“用耳朵听童谣的体验”这一章节，看到作者描述妈妈总在睡前给他读《儿童之国》，想到我小时候，妈妈给我们姐弟们唱的那首“牵牛花，吹喇叭，叫醒小灰兔，叫醒小猪鸭，我也早早起，喂
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
人的价值就是能让别人生活得更有价值——读荆志强老师的书有感花婆婆
最近读了荆志强老师的专著《快乐地做教育》，前言就提到：教育的本真，就是通过激励为学生赋能，帮助学生产生足够的“自我效能感”，让学生主动获取知识技能、培育情感态度；帮助学生建立自主深度学习的能力。荆志强老师倡导的“赋能教育”主要从两个方面建构：激励型课堂、自主化管理。其中，他还谈到生本教育的学习观：学习是生命成长的过程，它是人自身的一种需要，而不是外在压力的结果。教育的一切行为都应该是为了满足儿童的
人间三月乃毅
想把笑容印在这春天的画里。这个早春的三月，尽管感觉还有一丝的寒意，但春已不觉间挤进了季节的门槛，带着些许的微温，漾开了人们脸上的一丝笑意。三月的细语随淌，化了柳梢的轻柔，燕子的呢喃，春光的明媚。古人说：“三月桃花，两人一马，明日天涯”。三月，是一个浪漫的时节。二月时分，寒冷还在依依惜别，春风还未吹盛繁花。三月不同是，“好雨知时节，当春乃发生”，春水如潮，桃花烂漫，丛林尽染，春光旖旎。人间三月天，春
5minites Echarts 大地缸
title:"5minitesEcharts"date:2021-01-27T20:33:42+08:00draft:truetags:['echarts']author:"dadigang"author_cn:"大地缸"personal:"http://www.real007.cn"关于作者http://www.real007.cn/about获取ECharts你可以通过以下几种方式获取Apac
基于Qt+libVLC内核设计视频播放器-完整版源码(WinID-D3D渲染) 鱼弦音视频开发系列实践 qt 音视频 3d
鱼弦：公众号【红尘灯塔】，CSDN博客专家、内容合伙人、新星导师、全栈领域优质创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）基于Qt+libVLC内核设计视频播放器-完整版源码(WinID-D3D渲染)1.介绍基于Qt+libVLC内核设计视频播放器是一种功能强大、易于使用且可扩展
2023-03-11 阿雪_14c1
《水浒传》是我国的四大名著之一，是作者施耐庵，花了多年时间呕心沥血完成的一部创作，书中精彩的内容像磁石一样，把我牢牢的吸引住。整个故事跌宕起伏。梁山泊好汉行侠仗义，后来，全体招安归顺国家，帮国家打败了国虎、方腊等农民起义军，定平战乱。在攻打方腊起义军时，许多好汉战死，宋江被高俅、董贯、杨戬、蔡京这四个贼臣毒害，吴用与花荣也自杀身亡。故事悲壮感人，催人泪下。故事人物众多，情节复杂，背景恢宏，社会形象
QCC系列显示交互层的自研技术突破与实践 TengTaiTech QCC308X/QCC518X QCC3091 /QCC3095 qcc304x 蓝牙 QCC ldac
在音频设备智能化进程中，显示交互的流畅度与兼容性已成为用户体验的核心指标。传统方案中，TFT彩屏与多语言适配常面临硬件驱动冲突、功耗失控、字符显示错乱等问题。作为高通平台十年级方案商，腾泰技术在QCC系列中聚焦显示交互层的自研技术突破，形成了一套完整的软硬件协同方案。自研屏显驱动框架：从硬件适配到算法创新腾泰QCC系列的核心竞争力集中在显示交互层的全栈自研技术，其架构可通过「屏显驱动技术栈架构图」
深入理解设计模式：策略模式的艺术与实践 vvilkin的学习备忘设计模式设计模式策略模式
在软件开发中，我们经常会遇到需要根据不同情况选择不同算法或行为的场景。传统的做法可能是使用大量的条件语句（if-else或switch-case），但随着需求的增加和变化，这种硬编码的方式会导致代码难以维护和扩展。策略模式（StrategyPattern）正是为了解决这类问题而诞生的一种优雅的设计模式。策略模式属于行为型设计模式，它定义了一系列算法，并将每个算法封装起来，使它们可以相互替换。这种模
嵌入式开发王明列 zynq fpga开发
逻辑开发与软件开发，皆为高度专业化的技术领域，能在两者之间自由穿梭、解决复杂问题的工程师，凤毛麟角。然而，“精通”本身并无边界。在实际工程中，无论是算法实现、高速接口，还是雷达系统、电机控制，每一个方向都深邃如海，足以让人终身钻研。真正重要的，从来不是“掌握一切”，而是在关键问题域中，构建起可闭环的解决路径，持续迭代，稳步积累。因为：再庞大的系统，也由一个个“可掌握的知识点”组成；再高的门槛，也能
OpenCV直线段检测算法类cv::line_descriptor::LSDDetector 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该类用于实现LSD(LineSegmentDetector)直线段检测算法。LSD是一种快速、准确的直线检测方法，能够在不依赖边缘检测的前提下直接从图像中提取出直线段。它是OpenCV的line_descriptor模块的一部分，常用于计算机视觉任务如图像拼接、S
分布式锁特点、以及用python3实现redis分布式锁数据知道 python3案例和总结分布式 redis 数据库 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录一、Redis分布式锁核心原理1.1Redis锁机制1.2锁释放二、基础实现代码2.1使用`redis-py`客户端2.2分布式锁类三、使用示例3.1基础锁操作3.2装饰器模式四、高级特性实现4.1Redlock算法（高可用方案）五、生产环境最佳实践5.1锁粒度控制5.2异常处理5.3监控与调试5.4重试机制六、测试代码6.1并发测试6
领域驱动设计精要我是廖志伟 Java场景面试宝典 DDD Domain-Driven Design Software Architecture
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
DDD核心知识解析我是廖志伟 Java场景面试宝典 DDD Software Design Business Logic
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
ShardingSphere核心机制解析我是廖志伟 Java场景面试宝典 Database Middleware Distributed Database ShardingSphere
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
JVM与Spring Boot核心解析我是廖志伟 Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域驱动设计（DDD）实践解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring框架核心技术解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域驱动设计实践解析我是廖志伟 Java场景面试宝典 DDD Domain-Driven Design Strategic Design
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring MVC 框架解析我是廖志伟 Java场景面试宝典 Spring MVC Web Development Frameworks
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
云服务器性能优化全攻略：CPU、内存、磁盘IO调优实战 Gloria歌洛莉亚 c语言数据库服务器 python 性能优化
在云计算时代，服务器性能直接影响应用响应速度、用户体验和运营成本。无论是高并发网站、实时数据分析还是机器学习训练，优化云服务器性能都是开发者必须掌握的核心技能。本攻略将从CPU调度、内存管理、磁盘IO三个维度，结合Linux系统特性和实际场景，提供可落地的优化方案。一、CPU性能调优：从调度策略到并行计算1.1CPU资源监控与瓶颈定位实时监控工具：top-c#动态查看进程CPU占用（按P键按CPU
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&

KNN算法实战

目录

1.1 最近邻算法

1.2 K-邻近算法

2.算法步骤：

3. KNN算法实战

3.1 实例分析算法步骤

3.2程序实现

4. KNN算法的探讨

4.1 算法优点

4.2 算法缺点

你可能感兴趣的:(机器学习,作者：饶吉盛,算法,机器学习,深度学习)