一只丁小丁呐

K近邻算法【OpenCV&Python】

K近邻算法—入门

0、引言
1、理论基础
3、计算
- 3.1 归一化
- 3.2 距离计算
4、手写数字识别的原理
- 4.1 数据初始化
- 4.2 读取特征图像
- 4.3 提取特征图像的特征值
- 4.4 计算待识别图像的特征值
- 4.5 计算待识别图像与特征图像之间的距离
- 4.6 获取k个最短距离及索引
- 4.7 识别
- 4.8 完整程序
5、K近邻模块的基本使用
6、K近邻手写数字识别

0、引言

参考书籍《OpenCV轻松入门——面向Python》李立宗著，电子工业出版社出版
机器学习算法是从数据中产生模型，也就是进行学习的算法。我们把经验提供算法，它能够根据经验数据产生模型。在面对新的情况时，模型就会为我们提供判断结果。
从数据中学得模型的过程称为学习（Learning）或者训练（Training），在训练过程中所使用的数据称为训练数据，其中的每个样本称为训练样本，训练样本所组成的合集称为训练集。
当然，如果希望获得一个模型，除了有数据还需要给样本贴上标签（Label），本章从理论基础、手写数字识别算法、手写数字识别实例等角度介绍K-近邻算法。

1、理论基础

K近邻算法的本质是将指定对象根据已知特征值分类。为了确定分类，需要定义特征。
例1:为一段运动视频分类，判断视频是乒乓球比赛还是足球比赛。

步骤：
这里定义两个特征，一个是“挥手”特征，一个是“踢脚”特征；
将数据绘制散点图；
从图中可以看出，数据点呈现聚集特征。
此时，有一个Test视频，统计其“挥手”、“踢脚”的次数，发现视频Test最近的邻居是乒乓球比赛视频，因此判断Test是乒乓球比赛视频。
Tips:例1是一个相对极端的例子，非黑即白，而实际分类数据中的参数比较多，判断起来相对复杂。因此，为了提高算法的可靠性，在实施时会取k个邻近点这k个邻近点中属于哪一类的较多，然后将当前待识别点划分为哪一类。为了方便判断，k值通常取奇数。

下面用一个例子解释K近邻算法的基本思想。

例2:已知某知名双胞胎艺人A和B长得很像，判断一张图片T上的人物到底是A还是B，则采用K近邻算法的具体步骤如下。

（1）收集艺人A和B的照片各100张；
（2）确定几个用来识别人物的重要特征，并使用这些特征来标注艺人A和B的照片。例如，根据某四个特征，可以将每张照片表示为[156,34,890,457]这样的形式（即一个样本点）。简而言之，就是使用数值来表示照片，得到艺人A的数据集FA、艺人B的数据集FB。
（3）计算待识别图像T的特征，并使用特征值表示图像T。
（4）计算图像T的特征值TF与FA、FB中各特征值之间的距离。
（5）找出产生其中k个最短距离的样本点（找出离T最近的k个邻居），统计k个样本点钟属于FA和FB的样本点个数，属于哪个数据集的样本点多，就将T确定为哪个艺人的图像。

3、计算

K近邻算法在获取各个样本的特征值后，计算待识别样本的特征值与已知分类的样本特征值之间的距离，然后找出k个最邻近的样本，根据k个最邻近样本中占比最高的样本所属的分类，来确定待识别样本的分类。

3.1 归一化

对于简单的情况，直接计算与特征值的距离（差距）即可。
当有多个参数时，一般将这些参数构成**列表（数组）**进行综合判断。

由于实际情况中，参数具有不同的量纲，需要对参数进行处理。一般情况下，对参数进行**归一化处理**=即可。

3.2 距离计算

（1）差距
先将特征值中对应的元素相减，然后再求和；
（2）曼哈顿距离（避免正负相抵消的情况）
先取绝对值，再求和；
（3）平方和
计算距离的平方和；
（4）欧氏距离（广泛使用）
计算平方和的平方根。

4、手写数字识别的原理

4.1 数据初始化

本例中，特征图像存储在当前路径的“image”下；用于判断分类的特征值有100个；特征图像的行数和列数可以通过程序来获取，也可以在图像上单击鼠标右键后通过查找属性值来获取。
数据初始化程序如下：

##### 数据初始化
# 涉及的数据主要有路径信息、图像大小、特征值数量、用来存储所有特征值的数据等。
s = 'image\\' # 图像所在的路径
num = 100 # 共有特征值的数量
row = 240 # 特征图像的行数
col = 240 # 特征图像的列数
a = np.zeros((num,row,col)) # a用来存储所有特征的值
print (a.shape)

4.2 读取特征图像

##### 读取特征图像
# 本步骤将所有的特征图像读入到 a中，共有10个数字，每个数字有10个特征图像，采用嵌套循环语句来读取。
n = 0 # n用来存储当前图像
for i in range(0,10):
    for j in range(1,11):
        a[n,:,:] = cv2.imread(s+str(i)+'\\'+str(i)+'-'+str(j)+'.bmp',0)
        n = n+1

4.3 提取特征图像的特征值

##### 提取特征图像的特征值
# 在提取特征值时，可以计算每个子块内黑色像素点的个数，也可以计算每个子块内白色像素点的个数
feature = np.zeros((num,round(row/5),round(col/5))) # feature存储所有样本的特征值
print(feature.shape) # 在必要时查看feature的形状是什么样子
print(row) # 在必要时查看row的值，有多少个特征值（100个）

for ni in range(0,num):
    for nr in range(0,row):
        for nc in range(0,col):
            if a[ni,nr,nc] == 255:
               feature[ni,int(nr/5),int(nc/5)] += 1 
#如果原图像内位于（row，col）位置的像素点是白色，则要把对应特征值内位于（row/5，col/5处的值加1）            
f = feature # 简化变量名称

4.4 计算待识别图像的特征值

##### 计算待识别图像的特征值
# 读取待识别图像的特征值，然后计算该图像的特征值
o = cv2.imread('image\\test\\9.bmp',0)
# 读取图像的值
of = np.zeros((round(row/5),round(col/5))) # 用来存储待识别图像的特征值
for nr in range(0,row):
    for nc in range(0,col):
        if o[nr,nc] == 255:
            of[int(nr/5),int(nc/5)] += 1

4.5 计算待识别图像与特征图像之间的距离

##### 计算待识别图像与特征图像之间的距离
# 依次计算待识别图像与特征图像之间的距离            
d = np.zeros(100)
for i in range(0,100):
    d[i] = np.sum((of-f[i,:,:])*(of-f[i,:,:])) # 欧氏距离
# 数据集f中依次存储的是数字0~9的共计100个图像的特征值，所以数组d中的索引号对应着各特征图像的编号。    
# d[mn]表示待识别图像与数字“m”的第n个特征图像的距离。
# 如果将索引号整除10，得到的值正好是其对应的特征图像上的数字。
# 确定了索引与特征图像的关系，下一步可以通过计算索引达到数字识别的目的。

4.6 获取k个最短距离及索引

##### 获取k个最短距离及索引
# 具体实现方式：每次找出最短距离（最小值）及其索引（下标），然后将该最小值替换为最大值；
# 重复上述过程k次，得到k个最短距离的索引
d = d.tolist
temp = []
Inf = max(d)
print (Inf) # 必要时查看最大值
k = 7
for i in range(k):
    temp.append(d.index(min(d)))
    d[d.index(min(d))] = Inf

4.7 识别

已知将索引整除10，就能得到对应特征图像上的数字。
（66,60,65,68,69,67,78,89,96,32）=(6,6,6,6,6,6,7,8,9,3)
为了叙述上的方便，将上述整除结果标记为dr,在dr中出现次数最多的数字，就是识别结果。

##### 识别
# 根据计算出来的索引值
temp = [i/10 for i in temp]
# 数组r用来存储结果，r[0]表示K近邻中“0”的个数，r[n]表示K近邻中n的个数
r = np.zeros(10) # 建立一个数组r,使其初始值均为0
for i in temp:
    r[int(i)] += 1 # 依次从dr中取数字n,将数组r索引位置为n的值加1
print ("当前可能的数字结果为：‘+str(np.argmax(r))")

4.8 完整程序

# K邻近算法识别手写数字
import cv2
import numpy as np
import matplotlib.pyplot as plt

##### 数据初始化
# 涉及的数据主要有路径信息、图像大小、特征值数量、用来存储所有特征值的数据等。
s = 'image\\' # 图像所在的路径
num = 100 # 共有特征值的数量
row = 240 # 特征图像的行数
col = 240 # 特征图像的列数
a = np.zeros((num,row,col)) # a用来存储所有特征的值
print (a.shape)

##### 读取特征图像
# 本步骤将所有的特征图像读入到 a中，共有10个数字，每个数字有10个特征图像，采用嵌套循环语句来读取。
n = 0 # n用来存储当前图像
for i in range(0,10):
    for j in range(1,11):
        a[n,:,:] = cv2.imread(s+str(i)+'\\'+str(i)+'-'+str(j)+'.bmp',0)
        n = n+1

##### 提取特征图像的特征值
# 在提取特征值时，可以计算每个子块内黑色像素点的个数，也可以计算每个子块内白色像素点的个数
feature = np.zeros((num,round(row/5),round(col/5))) # feature存储所有样本的特征值
print(feature.shape) # 在必要时查看feature的形状是什么样子
print(row) # 在必要时查看row的值，有多少个特征值（100个）

for ni in range(0,num):
    for nr in range(0,row):
        for nc in range(0,col):
            if a[ni,nr,nc] == 255:
               feature[ni,int(nr/5),int(nc/5)] += 1 
#如果原图像内位于（row，col）位置的像素点是白色，则要把对应特征值内位于（row/5，col/5处的值加1）            
f = feature # 简化变量名称

##### 计算待识别图像的特征值
# 读取待识别图像的特征值，然后计算该图像的特征值
o = cv2.imread('image\\test\\9.bmp',0)
# 读取图像的值
of = np.zeros((round(row/5),round(col/5))) # 用来存储待识别图像的特征值
for nr in range(0,row):
    for nc in range(0,col):
        if o[nr,nc] == 255:
            of[int(nr/5),int(nc/5)] += 1

##### 计算待识别图像与特征图像之间的距离
# 依次计算待识别图像与特征图像之间的距离            
d = np.zeros(100)
for i in range(0,100):
    d[i] = np.sum((of-f[i,:,:])*(of-f[i,:,:])) # 欧氏距离
# 数据集f中依次存储的是数字0~9的共计100个图像的特征值，所以数组d中的索引号对应着各特征图像的编号。    
# d[mn]表示待识别图像与数字“m”的第n个特征图像的距离。
# 如果将索引号整除10，得到的值正好是其对应的特征图像上的数字。
# 确定了索引与特征图像的关系，下一步可以通过计算索引达到数字识别的目的。

##### 获取k个最短距离及索引
# 具体实现方式：每次找出最短距离（最小值）及其索引（下标），然后将该最小值替换为最大值；
# 重复上述过程k次，得到k个最短距离的索引
d = d.tolist
temp = []
Inf = max(d)
print (Inf) # 必要时查看最大值
k = 7
for i in range(k):
    temp.append(d.index(min(d)))
    d[d.index(min(d))] = Inf
    
##### 识别
# 根据计算出来的索引值
temp = [i/10 for i in temp]
# 数组r用来存储结果，r[0]表示K近邻中“0”的个数，r[n]表示K近邻中n的个数
r = np.zeros(10)
for i in temp:
    r[int(i)] += 1
print ("当前可能的数字结果为：‘+str(np.argmax(r))")

5、K近邻模块的基本使用

在OpenCV中，不需要自己编写复杂的函数实现K近邻算法，直接调用其自带的模块函数即可。

import cv2
import numpy as np
import matplotlib.pyplot as plt

##### 创建两组数据，每组数据包含20对随机数：
# rand1数据位于(0,30)
rand1 = np.random.randint(0,30,(20,2)).astype(np.float32)
# rand2数据位于(70,100)   
rand2 = np.random.randint(70,100,(20,2)).astype(np.float32)

##### 将rand1和rand2拼接为训练数据
trainData = np.vstack((rand1,rand2))

##### 数据标签，共两类：0和1
# r1对应着rand1的标签，为类型0
r1Label = np.zeros((20,1)).astype(np.float32)
# r2对应着rand2的标签，为类型1
r2Label = np.ones((20,1)).astype(np.float32)
tdLabel = np.vstack((r1Label,r2Label))

# 使用绿色标注类型0
g = trainData[tdLabel.ravel() == 0]
plt.scatter(g[:,0],g[:,1],80,'g','o')
# 使用蓝色标注类型1
b = trainData[tdLabel.ravel() == 1]
plt.scatter(b[:,0],b[:,1],80,'b','s')
# plt.show()

##### test为用于测试的随机数，该数在0到100之间
test = np.random.randint(0,100,(1,2)).astype(np.float32)
plt.scatter(test[:,0],test[:,1],80,'r','*')

##### 调用OpenCV内的K近邻模块，并进行训练
knn = cv2.ml.KNearest_create()
knn.train(trainData,cv2.ml.ROW_SAMPLE,tdLabel)

##### 使用K近邻算法分类
ret,results,neighbours,dist = knn.findNearest(test,5)

##### 显示处理结果
print("当前随机数可以判定为类型：",results)
print("距离当前点最近的5个邻居是：",neighbours)
print("5个最近邻居的距离：",dist)ous
 
# 观察运行结果，对比上述输出
plt.show()

运行结果1：

运行结果2：

注 :由于test是0到100的随机数，因此每次运行的结果不一定完全相同。

6、K近邻手写数字识别

使用OpenCV自带的K近邻算法识别手写程序。

############ K邻近算法识别手写数字
import cv2
import numpy as np
import matplotlib.pyplot as plt

##### 数据初始化
# 涉及的数据主要有路径信息、图像大小、特征值数量、用来存储所有特征值的数据等。
s = 'image\\' # 图像所在的路径
num = 100 # 共有特征值的数量
row = 240 # 特征图像的行数
col = 240 # 特征图像的列数
a = np.zeros((num,row,col)) # a用来存储所有特征的值
# print (a.shape)

##### 读取特征图像
# 本步骤将所有的特征图像读入到 a中，共有10个数字，每个数字有10个特征图像，采用嵌套循环语句来读取。
n = 0 # n用来存储当前图像
for i in range(0,10):
    for j in range(1,11):
        a[n,:,:] = cv2.imread(s+str(i)+'\\'+str(i)+'-'+str(j)+'.bmp',0)
        n = n+1

##### 提取特征图像的特征值
# 在提取特征值时，可以计算每个子块内黑色像素点的个数，也可以计算每个子块内白色像素点的个数
feature = np.zeros((num,round(row/5),round(col/5))) # feature存储所有样本的特征值
# print(feature.shape) # 在必要时查看feature的形状是什么样子
# print(row) # 在必要时查看row的值，有多少个特征值（100个）

for ni in range(0,num):
    for nr in range(0,row):
        for nc in range(0,col):
            if a[ni,nr,nc] == 255:
               feature[ni,int(nr/5),int(nc/5)] += 1 
#如果原图像内位于（row，col）位置的像素点是白色，则要把对应特征值内位于（row/5，col/5处的值加1）            
f = feature # 简化变量名称

##### 将feature处理为单行形式
train = feature[:,:].reshape(-1,round(row/5)*round(col/5)).astype(np.float32)
# print (train.shape)

##### 贴标签，要注意，是range(0,100),而不是range(0,101)
trainLabels = [int(i/10)]
for i in range (0,100):
    trainLabels = np.asarray(trainLabels)
# print(*trainLabels) #打印测试看看标签值
    
 ###### 读取图像值
o = cv2.imread('image\\test\\5.bmp',0) # 读取待识别图像
of = np.zeros(round(row/5),round(col/5))) # 用来存储待识别图像的特征值
for nr in range(0,row):
    for nc in range(0,col):
        if o[nr,nc] == 255:
            of[int(nr/5),int(nc/5)] += 1
test = of.shape(-1,round(5/row),round(5/col)).astype(np.float32)

##### 调用OpenCV内的K近邻模块，并进行训练
knn = cv2.ml.KNearest_create()
knn.train(train,cv2.ml.ROW_SAMPLE,traindLabels)

##### 使用K近邻算法分类
ret,results,neighbours,dist = knn.findNearest(test,k=5)

##### 显示处理结果
print("当前随机数可以判定为类型：",results)
print("距离当前点最近的5个邻居是：",neighbours)
print("5个最近邻居的距离：",dist)

python 解决 ‘win32api’ 模块找不到的问题 xybf python python 开发语言
出现这个问题可能是因为升级至python3.10之后，会遗漏两个重要的dll:`pythoncom310.dll`和`pywintypes310.dll`。解决方案就是在python目录下运行`pythonScripts/pywin32_postinstall.py-install`，然后这两个文件就会被创建在`C:\Windows\System32`或者是python目录下。如果这两个地方都找不
AI编程篇-python基础篇 cv工程师(ctrl+c\v) AI编程 python
转型AI算法后的总结-python基础篇python基础AI算法工程师的日常开发工作离不开python这门语言。python的优点：开源免费、简单易学、丰富的库。以下是我总结的python的一些基础：1.python及IDE工具安装对于初学者来说，python的安装是必不可少的，但是为了方便代码编辑和查看结果及debug，可以安装pycharm社区版暂时用来前期学习：python安装及注意事项：下
torch-torchvision-python版本对应问题 Thirtyaoe python 深度学习 pytorch
module‘torch.onnx.symbolic_helper’hasnoattribute‘quantized_args’今日在联系pytorch时，importtorchvision时报错：module‘torch.onnx.symbolic_helper’hasnoattribute‘quantized_args’查阅后发现是版本不兼容的问题，于是查看了正确的对应版本，对自己的进行修改。
torchvision与torch的版本冲突 RanGriffin python pytorch
在importtorchvision时报错：UserWarning:FailedtoloadimagePythonextension:[WinError127]解决在晚上查询之后，问题在于自己的torchvision版本与torch版本不对应。首先查询自己的torch和torchvision版本importtorchprint(torch.__version__)importtorchvision
xodooIP地址定位 odoo实施 XODOO PRO Xodoo odoo python
//src/packages/python/geoip2.rs实现特点：跨平台支持：通过Rust原生实现，兼容Windows、Linux、macOS等主流操作系统类型安全：使用Rust的Option类型处理可能缺失的字段严格校验IP地址格式自动处理编码转换性能优化：数据库文件只加载一次内存映射方式读取数据零拷贝解析技术错误处理：明确的错误类型（IOError/ValueError）友好的错误提示信
警告 torch.nn.utils.weight_norm is deprecate 的参考解决方法 wongHome 深度学习相关调试问题 Ubuntu pytorch
文章目录写在前面一、问题描述二、解决方法参考链接写在前面自己的测试环境：Ubuntu20.04一、问题描述运行pytorch程序，如下如下警告/home/wong/ProgramFiles/anaconda3/envs/pytorch_env/lib/python3.8/site-packages/torch/nn/utils/weight_norm.py:30:UserWarning:torch
如何用Python绘制柱状图堆叠图？上官美丽技术分享 python 开发语言
在数据分析和可视化的过程中，柱状图是一种非常常用的图表类型。它能清晰地展示不同类别之间的比较。而堆叠柱状图则是在此基础上，能够展示各个部分在整体中的占比！今天，我们来聊聊如何使用Python绘制堆叠柱状图，帮助你更好地理解数据。我们将使用一个非常流行的库：Matplotlib。准备工作首先，你需要确保安装了Matplotlib库。如果还没有安装，可以通过以下命令来安装：pipinstallmatp
python socket库详解 mosquito_lover1 python websocket
socket是Python标准库中的一个模块，提供了对底层网络通信的接口，允许开发者进行网络编程。通过socket你可以创建客户端和服务器应用程序，实现网络通信。1.基本概念-Socket：是网络通信的端点，用于在不同主机之间或同一主机上的不同进程之间进行数据传输。-IP地址：标识网络中的设备。-端口号：标识设备上的特定进程或服务。-协议：常用的协议有TCP（传输控制协议）和UDP（用户数据报协议
使用Python和LangChain创建可调用工具的智能对话机器人：全面指南 m0_57781768 python langchain 机器人
使用Python和LangChain创建可调用工具的智能对话机器人：全面指南在当今技术迅猛发展的时代，人工智能（AI）和自然语言处理（NLP）技术的应用范围越来越广。尤其是对话机器人，它们不仅能与人类进行自然交互，还能通过调用外部API与各种系统对接，为用户提供更加智能和灵活的服务。本文将通过一系列实例和代码演示，向您展示如何利用Python编程语言和LangChain框架，创建能够使用外部工具（
踩坑：VirtualBox：安装提示缺少python core和win32 api 过去的了 linux python
一、安装OracleVirtualBox时出现以下现象内容提示：安装OracleVMVirtualBox7.0.24的Python绑定需要先安装PythonCore包和win32api绑定。如果现在继续安装OracleVMVirtualBox7.0.24的Python绑定，那么这些依赖项需要在之后手动设置。用户可以参考OracleVMVirtualBox7.0.24SDK手册获取更多信息。如果忽视
YOLO11 环境安装你喜欢喝可乐吗？ conda deep learning 人工智能 conda
1.安装Anaconda/Miniconda在Ubuntu中安装MinicondaAnaconda/Minicondapip配置清华镜像源Anaconda/Miniconda基本操作命令2.创建python虚拟环境#创建condacreate-nyolo11_envpython=3.12#激活condaactivateyolo11_env3.安装pytorch#Pytorchhttps://pyt
Python3 【项目实战】深度解析：赛跑成绩统计分析工具李智 - 重庆 Python 精讲精练 -从入门到实战 python 案例学习编程技巧时间处理项目实战
Python3【项目实战】深度解析：赛跑成绩统计分析工具一、项目概述1.开发背景：田径比赛的成绩统计需要快速准确的计算选手成绩，传统人工计时和统计效率低且易出错。本工具通过程序化处理赛跑数据，自动计算各选手成绩及整体统计指标，主要应用于：学校运动会成绩实时统计田径锦标赛的自动化成绩公示运动员训练数据分析2.技术定位：时间数据处理与统计计算的典型案例字典数据结构的实践应用面向过程编程的教学范例二、项
默默的学python——两个重要的函数dir()、help() xiaoli_panpan #python基础 python
一、dir()函数dir()函数在Python中用于返回一个对象的所有属性和方法的列表，当你对一个函数使用dir()时，它会返回函数对象的所有可访问的属性和方法的名字列表。具体的说，dir()函数获取的内容包括：1.特殊方法和魔法方法如call、code、defaults、doc、globals、__name__等，这些方法和属性是函数对象的一部分，提供了对函数元数据的访问。2.基础自基类的属性和
python xpath定位元素方法_关于python中的xpath解析定位 weixin_39975366 python xpath定位元素方法
爬取的网站：http://jbk.39.net/chancegz/这里只针对个别属性值：#例如：'别名'下的span标签文本，‘发病部位'下的span标签文本以及‘挂号科室‘下的span标签文本#defdisease(url):text=get_html(url)tree=etree.HTML(text)bm=tree.xpath('//ul[@class="information_ul"]/li
通过Python使用json库写一个更新josn文件中某个字段中数组数据的函数焦虑肇事者 json
你可以使用Python中的json库来读取json文件，然后使用Python字典的方式来更新json文件中的某个字段。最后，使用json库的写入功能将更新后的字典写回json文件。例如，你可以使用以下代码来实现这个功能：importjsondefupdate_json_array(json_file,field,new_data):#读取json文件withopen(json_file,'r')a
ros如何编译python文件_（二）ROS入门——4.如何编写ROS的第一个程序hello_world weixin_39935903 ros如何编译python文件
ROS机器人操作系统在机器人应用领域很流行，依托代码开源和模块间协作等特性，给机器人开发者带来了很大的方便。我们的机器人“miiboo”中的大部分程序也采用ROS进行开发，所以本文就重点对ROS基础知识进行详细的讲解，给不熟悉ROS的朋友起到一个抛砖引玉的作用。本章节主要内容：1.ROS是什么2.ROS系统整体架构3.在ubuntu16.04中安装ROSkinetic4.如何编写ROS的第一个程序
基于深度学习的个性化新闻推荐系统设计与实现计算机毕设 sj52abcd 深度学习课程设计人工智能毕业设计
博主介绍：✌专注于VUE,小程序，安卓，Java,python,物联网专业，有17年开发经验，长年从事毕业指导，项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题，我会尽力帮助你。研究的背景:随着互联网技术的发展和普及,人们越来越依赖互联网获取信息。然而,随着信息量的不断增加,用户在查找新闻时面临着信息过载的问题。为了解决这个问题,个性化新闻推荐系统被广泛应用。个性化新闻推荐系
用Python提取json数据到Excel文件中程序媛了了 python json excel
本文介绍基于Python，读取JSON文件数据，并将JSON文件中指定的键值对数据转换为.csv格式文件的方法。在之前的文章疯狂学习GIS：Python读取JSON数据并存储为CSV表格中，我们就介绍过将JSON文件数据保存到.csv格式或.xlsx格式的表格文件中的方法；而本文我们将针对不同的待提取数据特征，给出另一种方法。首先，我们来明确一下具体的需求。我们现有一个JSON文件数据，是一个包含
python 人工智能实战案例 2401_86114612 pygame python java
大家好，今天我们要分享，python编程人工智能小例子python人工智能100例子，一起探索吧！1.背景介绍概述在这个世纪，人类已经处于数字化的时代，而这也让很多其他行业都进入了数字化领域python列表有哪些基本操作,python列表功能很重要吗。其中包括游戏行业。游戏行业的蓬勃发展促使机器学习的产生，通过计算机能够进行高效率地模拟人类的学习、决策过程，不断升级提升人类的能力。游戏领域中的AI
Python 在人工智能领域的实际6大案例 Solomon_肖哥弹架构人工智能机器学习 python
Python作为一种功能强大且易于学习的编程语言，在人工智能（AI）领域得到了广泛的应用。从机器学习到深度学习，从自然语言处理到计算机视觉，Python提供了丰富的库和框架，使得开发者能够快速实现各种AI应用。本文将通过多个实际案例，展示Python在人工智能领域的强大功能和应用前景。二、案例一：手写数字识别（MNIST）1.背景介绍手写数字识别是机器学习领域的经典入门项目，MNIST数据集包含了
房产租赁数据分析与可视化学习只是用户态数据分析信息可视化数据挖掘
【实训目的】通过本次实训，要求了解Python用于数据可视化的常用包：matplotlib、seaborn、pyecharts等基本使用，及各种图形的使用。【实训环境】 Jupyter环境、Pandas、NumPy、Matplotlib。【实训内容】 1.数据统计与分析方面的可视化； 2.数据分析与预测方面的可视化； 3.数据多类型的可视化。本次实验以温州市三区房屋租赁数据（res
基于AI算法实现的情感倾向分析的方法程序员奇奇计算机毕设人工智能算法
完整代码：https://download.csdn.net/download/pythonyanyan/87430621背景目前，情感倾向分析的方法主要分为两类：一种是基于情感词典的方法；一种是基于机器学习的方法，如基于大规模语料库的机器学习。前者需要用到标注好的情感词典，英文的词典有很多，中文主要有知网整理的情感词典Hownet和台湾大学整理发布的NTUSD两个情感词典，还有哈工大信息检索研究
AI开发 - 算法基础递归的概念和入门（三）递归的进阶学习 minstbe Python AI应用与观察算法学习深度优先
前面我们通过2篇文章，一起了解了递归，以及使用递归来解决汉诺塔问题。今天我们在这个基础上，进一步地熟悉和学习递归。这篇学习笔记将涵盖递归的基本概念、应用、优化技巧、陷阱及与迭代的对比，并通过具体的Python代码示例和大家一起来深入理解递归的使用。一、巩固基础1.递归的概念递归，简单来说就是函数自己调用自己。听起来有点绕，但其实就像俄罗斯套娃，一层套一层，直到遇到最小的那个娃娃（基线条件）才停止。
《Python深度学习》第四讲：计算机视觉中的深度学习 earthzhang2021 2025讲书课专栏 python 深度学习计算机视觉 1024程序员节 numpy 算法人工智能
计算机视觉是深度学习中最酷的应用之一，它让计算机能够像人类一样“看”和理解图像。想象一下，计算机可以自动识别照片中的物体、人脸，甚至可以读懂交通标志。这一切听起来是不是很神奇？其实，这一切都离不开深度学习中的卷积神经网络（CNN）。今天，我们就来深入了解一下CNN是如何工作的。5.1卷积神经网络简介先来看下卷积神经网络（CNN）是什么。CNN是一种专门用于处理图像数据的神经网络。它的灵感来源于人类
DeepSeek结合Python炒股：编写量化交易策略的5个关键技巧财云量化程序化交易量化交易 python炒股自动化 python DeepSeek 股票量化接口股票程序化交易
python炒股(0):申请官方API接口,个人账户无门槛python炒股自动化(1):量化交易接口区别Python炒股自动化(2):取股票实时数据和历史数据Python炒股自动化(3):分析实时数据和历史数据Python炒股自动化(4):通过接口向交易所报单炒股自动化(5):通过接口查单查账炒股自动化：散户也可以申请官方API接口量化交易的核心在于将策略思想转化为可执行的代码，本文结合券商的AP
Python的那些事第四十五篇：继承自Nose的测试框架Nose2 暮雨哀尘 Python的那些事服务器开发语言 bootstrap 前端 html python redis
Nose2：继承自Nose的测试框架摘要本文深入探讨了Nose2这一继承自Nose的测试框架。在软件开发过程中，测试是确保代码质量和稳定性的重要环节，而测试框架为测试工作的开展提供了有力支持。Nose2作为Nose的继承者，在保留Nose优势的基础上进行了诸多改进和扩展，为Python测试领域带来了新的活力和可能性。本文将从Nose2的基本特性、优势、应用场景、代码实例等方面进行详细阐述，通过与N
华为OD机试 - 代码编辑器（Java & JS & Python）清水乐园华为OD机考 java javascript 开发语言华为
题目描述某公司为了更高效的编写代码，邀请你开发一款代码编辑器程序。程序的输入为已有的代码文本和指令序列，程序需输出编辑后的最终文本。指针初始位置位于文本的开头。支持的指令(X为大于等于0的整数,word为无空格的字符串)：FORWARDX指针向前(右)移动X,如果指针移动位置超过了文本末尾，则将指针移动到文本末尾BACKWARDX指针向后(左)移动X,如果指针移动位置超过了文本开头，则将指针移动到
Python PyQt5 简单的信号和槽多线程传数据热爱生活热爱你 python3 qt python qt 开发语言
注：pythonqt的信号与槽和c++qt还是有一些区别的，尤其是在connect方面；pythonqt信号和槽需要关注下对象的生命周期，不然信号发送后槽是接受不到的；1、a.py:多线程及定义信号和发送信号；importtimefromPyQt5.QtCoreimportpyqtSignal,QThread#发送信号classSender(QThread):my_signal=pyqtSigna
第5课树莓派的Python IDE—Thonny 嵌入式老牛树莓派之基本应用树莓派 Thonny IDE
1.Thonny的特点Thonny是一款面向初学者的PythonIDE。它由爱沙尼亚的Tartu大学开发，其调试器是专为学习和教学编程而设计的。Thonny具有如下特点易于上手。Thonny内置了Python3.7，因此只需要一个简单的安装程序，你就可以开始学习编程了（如有必要，您还可以使用单独的Python安装）。初始的用户界面会删除可能分散初学者注意力的所有功能。查看变量方便。当写完代码后，可
2025华为OD机试（Python/JS/C/C++）真题【E卷+A卷+B卷+C卷+D卷】目录哪吒搬砖工逆袭Java架构师华为od python javascript
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2024年8月14日，华为官方已经将华为OD机试（D卷）切换为E卷。目前正在考的是E卷，按照华为OD往常的操作，E卷题目是由往
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比