我有两颗糖

机器学习笔记 2 —— K 近邻法与 kd 树

文章目录

1. 理论部分
- 1.1 K近邻法
- 1.2 距离度量
2. k 近邻法的 Python 实现
- 2.1 数据集的预处理
- 2.2 模型构建
- 2.3 测试模型
- 2.4 scikit-learn
3. kd 树
- 3.1 构造平衡kd树算法
- 3.2 kd 树的 Python 实现

1. 理论部分

1.1 K近邻法

1． $k$ 近邻法是基本且简单的分类与回归方法。 $k$ 近邻法的基本做法是：对给定的训练实例点和输入实例点，首先确定输入实例点的 $k$ 个最近邻训练实例点，然后利用这 $k$ 个训练实例点的类的多数来预测输入实例点的类。

2． $k$ 近邻模型对应于基于训练数据集对特征空间的一个划分。 $k$ 近邻法中，当训练集、距离度量、 $k$ 值及分类决策规则确定后，其结果唯一确定。

3． $k$ 近邻法三要素：距离度量、 $k$ 值的选择和分类决策规则。常用的距离度量是欧氏距离及更一般的 $L_p$ 距离。 $k$ 值小时， $k$ 近邻模型更复杂； $k$ 值大时， $k$ 近邻模型更简单。 $k$ 值的选择反映了对近似误差与估计误差之间的权衡，通常由交叉验证选择最优的 $k$ 。

常用的分类决策规则是多数表决，对应于经验风险最小化。

4． $k$ 近邻法的实现需要考虑如何快速搜索k个最近邻点。kd 树是一种便于对 k 维空间中的数据进行快速检索的数据结构。kd 树是二叉树，表示对 $k$ 维空间的一个划分，其每个结点对应于 $k$ 维空间划分中的一个超矩形区域。利用 kd 树可以省去对大部分数据点的搜索，从而减少搜索的计算量。

1.2 距离度量

设特征空间 $x$ 是 $n$ 维实数向量空间 $x_{i}, x_{j} \in \mathcal{X}$

$x_{i}=\left(x_{i}^{(1)}, x_{i}^{(2)}, \cdots, x_{i}^{(n)}\right)^{\mathrm{T}}$
$x_{j}=\left(x_{j}^{(1)}, x_{j}^{(2)}, \cdots, x_{j}^{(n)}\right)^{\mathrm{T}}$

则 $x_i$ , $x_j$ 的 $L_p$ 距离定义为:

$L_{p}\left(x_{i}, x_{j}\right)=\left(\sum_{i=1}^{n}\left|x_{i}^{(i)}-x_{j}^{(l)}\right|^{p}\right)^{\frac{1}{p}}$

$p = 1$ 曼哈顿距离
$p = 2$ 欧氏距离
$\infty$ 切比雪夫距离

Python 代码实现：

import math

def L(x, y, p=2):
	sum = 0
	for i in range(len(x)):
		sum += math.pow(abs(x[i] - y[i]), p)
	return math.pow(sum, 1/p)

2. k 近邻法的 Python 实现

2.1 数据集的预处理

为了方便，我们使用了鸢尾花数据集：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from collections import Counter
from sklearn.model_selection import train_test_split

iris = load_iris()
df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
df['label'] = iris.target
df.columns = ['sepal length', 'sepal width', 'petal length', 'petal width', 'label']

data = np.array(df.iloc[:100, [0, 1, -1]])
X, y = data[:, :-1], data[:, -1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
print(f'data.shape: {data.shape}')
print(f'X_train.shape: {X_train.shape}')
print(f'X_test.shape: {X_test.shape}')
print(f'y_train.shape: {y_train.shape}')
print(f'y_test.shape: {y_test.shape}')

我们采用了前 100 行数据，包含 2 类花，每一类 50 个样本，每一个样本有 4 个特征值

接着我们使用了 sklearn.model_selection 模块的 train_test_split 方法将数据集划分为训练数据和测试数据，其中 20% 划分为测试数据。具体的使用方法可以参考：sklearn.model_selection.train_test_split

输出结果如下：

data.shape: (100, 3)
X_train.shape: (80, 2)
X_test.shape: (20, 2)
y_train.shape: (80,)
y_test.shape: (20,)

2.2 模型构建

该模型包括了初始化构造 KNN()、预测 predict(X) 和预测正确率 score(X_test, y_test) 三个方法：

from functools import cmp_to_key

class KNN:
	def __init__(self, X_train, y_train, n_neighbors=3, p=2):
		self.n = n_neighbors
		self.p = p
		self.X_train = X_train
		self.y_train = y_train

	def predict(self, X):
		# n nearest neighbors
		knn_list = []
		# distance from X to all neighbors
		distances = [L(X, point, self.p) for point in X_train]
		# sort by distance
		items = list(zip(X_train, y_train, distances))
		items.sort(key=cmp_to_key(lambda item1, item2: item1[-1]-item2[-1]))

		# decide
		knn_list = [item[0] for item in items[:self.n]]
		class_list = [item[1] for item in items[:self.n]]
		c = Counter(class_list).most_common()
		return Counter(class_list).most_common()[0][0]

	def score(self, X_test, y_test):
		right_count = 0
		for X, y in zip(X_test, y_test):
			if self.predict(X) == y:
				right_count += 1
			else:
				print(X, y)
		return right_count / len(X_test)

其中使用了Counter() 容器、zip() 方法和 list 的 sort() 排序，使用方法举例:

from collections import Counter
from functools import cmp_to_key

L = list('eabcdabcaba')
c = Counter(L)
print(c)
print(c.most_common())

words = [item[0] for item in c.most_common()]
freqc = [item[1] for item in c.most_common()]
print(words, freqc)

items = list(zip(words, freqc))
print(items)

items.sort(key=cmp_to_key(lambda x, y: x[1] - y[1]))
print(items)

结果为：

Counter({'a': 4, 'b': 3, 'c': 2, 'e': 1, 'd': 1})
[('a', 4), ('b', 3), ('c', 2), ('e', 1), ('d', 1)]
['a', 'b', 'c', 'e', 'd']
[4, 3, 2, 1, 1]

2.3 测试模型

使用剩下 20% 的数据用于测试：

clf = KNN(X_train, y_train)
score = clf.score(X_test, y_test)
print(score)	# 1.0

print(clf.predict([6.2, 3]))	# 1.0
plt.scatter(df[:50]['sepal length'], df[:50]['sepal width'], label='0')
plt.scatter(df[50:100]['sepal length'], df[50:100]['sepal width'], label='1')
plt.scatter(6.2, 3, label='test')
plt.xlabel('sepal length')
plt.ylabel('sepal width')
plt.legend()
plt.show()

预测成功率达到了 100%

机器学习笔记 2 —— K 近邻法与 kd 树_第2张图片

进一步，我们可以绘制出空间划分的图：（图略）

2.4 scikit-learn

sklearn.neighbors 定义了最近邻算法，我们需要使用的是 sklearn.neighbors.KNeighborsClassifier 分类器：

from sklearn.neighbors import KNeighborsClassifier

clf = KNeighborsClassifier(n_neighbors=3, p=2)
clf.fit(X_train, y_train)
score = clf.score(X_test, y_test)
print(f'score = {score}')	# 1.0

KNeighborsClassifier() 的主要参数如下（参考官网为准）：

n_neighbors: 临近点个数
p: 距离度量
algorithm: 近邻算法，可选{‘auto’, ‘ball_tree’, ‘kd_tree’, ‘brute’}
weights: 确定近邻的权重

3. kd 树

kd 树是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。kd 树是二叉树，表示对维空间的一个划分（partition）。构造 kd 树相当于不断地用垂直于坐标轴的超平面将维空间切分，构成一系列的k维超矩形区域。kd 树的每个结点对应于一个维超矩形区域。

3.1 构造平衡kd树算法

输入： $k$ 维空间数据集 $T＝{x_1, x_2,…,x_N}$ ，

其中 $x_i=(x_{i}^{(1)},_i^{(2)},⋯,x_i^{(k)})^T, i＝1,2,…,N$ ；

输出：kd树

开始

构造根结点，根结点对应于包含 $T$ 的 $k$ 维空间的超矩形区域。
选择 $x^{(1)}$ 为坐标轴，以T中所有实例的 $x^{(1)}$ 坐标的中位数为切分点，将根结点对应的超矩形区域切分为两个子区域。切分由通过切分点并与坐标轴 $x^{(1)}$ 垂直的超平面实现。
由根结点生成深度为 1 的左、右子结点：左子结点对应坐标 $x^{(1)}$ 小于切分点的子区域，右子结点对应于坐标 $x^{(1)}$ 大于切分点的子区域。
将落在切分超平面上的实例点保存在根结点。

重复

对深度为 $j$ 的结点，选择 $x^{(l)}$ 为切分的坐标轴， $l ＝ j (m o d k) + 1$ ，以该结点的区域中所有实例的 $x^{(l)}$ 坐标的中位数为切分点，将该结点对应的超矩形区域切分为两个子区域。切分由通过切分点并与坐标轴 $x^{(l)}$ 垂直的超平面实现。
由该结点生成深度为 $j + 1$ 的左、右子结点：左子结点对应坐标 $x^{(l)}$ 小于切分点的子区域，右子结点对应坐标 $x^{(l)}$ 大于切分点的子区域。
将落在切分超平面上的实例点保存在该结点。

结束

直到两个子区域没有实例存在时停止。从而形成kd树的区域划分。

3.2 kd 树的 Python 实现

kd 树节点

每一个节点存储了当前的空间划分的维度，节点的元素、左子节点和右子节点：

class Node:
	def __init__(self, elem, split, left, right):
		self.elem = elem
		self.split = split	# dimension-id
		self.left = left
		self.right = right

构建 kd 树

首先记录下空间划分的维度总数，接着采用 递归 的方式从根节点出发，向左右子节点递归：

每一个节点存储的是当前空间划分条件下的 “中点”，对于每一个带划分的序列，首先按照划分维度进行排序，取出中位数放入节点，把剩下的序列分别放入左子节点和右子节点进行递归 (空间划分的维度进行自增 split = (split + 1) % k )

class KdTree:
	def __init__(self, data):
		k = len(data[0])	# dimentions

		def createNode(split, data_set):
			if not data_set:
				return None
			data_set.sort(key=lambda x: x[split])
			split_pos = len(data_set) // 2
			median = data_set[split_pos]
			split_next = (split + 1) % k
			return Node(
				median,
				split,
				createNode(split_next, data_set[:split_pos]),
				createNode(split_next, data_set[split_pos+1:]))

		self.root = createNode(0, data)

接着我们创建一颗 kd 树，层次遍历查看结果：

def levelorder(root):
	queue = []
	queue.append(root)
	while queue != []:
		curr = queue.pop(0)
		if curr.left:
			queue.append(curr.left)
		if curr.right:
			queue.append(curr.right)
		print(curr.elem)

L = [[2, 3], [5, 4], [9, 6], [4, 7], [8, 1], [7, 2]]
tree = KdTree(L)
levelorder(tree.root)

结果如下：

[7, 2]
[5, 4]
[9, 6]
[2, 3]
[4, 7]
[8, 1]

预测

利用 kd 树寻找最临近点：

首先从根节点向下寻找，若当前划分维度的值小于节点的值，则向左寻找，否则向右寻找，直到到达根节点，将该点当作 nearest
从当前叶节点向上回退，若该节点距离目标更近，则更新 nearest；寻找当前最近邻节点另一子节点有无更近的点（检测另一子节点对于的区域划分是否与以目标点和 nearest 间距为半径构成的球体有相交），有的话跳转到另一节点寻找最近邻点；没有的话，继续向上回退；
重复上一步直到到达根节点，返回 nearest

REFERENCES:

李航统计学习方法
scikit-learn
Introduction to Machine Learning with Python
lihang-code-master

你可能感兴趣的:(机器学习,python,机器学习,算法)

python str byte 转换 LI4836 Python 字符串 python
bytes转字符串方式一b=b'\xe9\x80\x86\xe7\x81\xab'string=str(b,'utf-8')print(string)#逆火bytes转字符串方式二b=b'\xe9\x80\x86\xe7\x81\xab'string=b.decode()#第一参数默认utf8，第二参数默认strictprint(string)#逆火bytes转字符串方式三b=b'\xe9\x80
【拒绝算法PUA】3065. 超过阈值的最少操作数 I BigDark的笔记 #LEETCODE #每日一题算法
系列文章目录【拒绝算法PUA】0x00-位运算【拒绝算法PUA】0x01-区间比较技巧【拒绝算法PUA】0x02-区间合并技巧【拒绝算法PUA】0x03-LeetCode排序类型刷题【拒绝算法PUA】LeetCode每日一题系列刷题汇总-2025年持续刷新中C++刷题技巧总结：[温习C/C++]0x04刷题基础编码技巧文章目录系列文章目录LeetCode3065.超过阈值的最少操作数I链接题目解题
Python 网络爬虫高级教程：分布式爬取与大规模数据处理 Milk夜雨 python python 爬虫网络
经过基础爬虫和进阶爬虫的学习，我们已经掌握了爬虫的基本原理、动态内容处理及反爬机制的应对。然而，当我们面对海量数据或需要高效爬取多个站点时，分布式爬虫和数据存储、处理能力就显得尤为重要。本篇博客将带你迈向网络爬虫的高级阶段，学习分布式爬取、大规模数据处理以及性能优化。一、分布式爬虫的概念1.什么是分布式爬虫？分布式爬虫是指通过多个节点协作完成大规模网页爬取任务的爬虫架构。它能有效解决以下问题：单台
2025年01月19日Github流行趋势油泼辣子多加 GitHub每日趋势 github
项目名称：MiniCPM-o项目地址url：https://github.com/OpenBMB/MiniCPM-o项目语言：Python历史star数：15826今日star数：959项目维护者：yiranyyu,iceflame89,yaoyuanTHU,LDLINGLINGLING,tc-mb项目简介：MiniCPM-o2.6:一个适用于视觉、语音和多模态直播的GPT-4o级别模型，可在手机
python取列表前3个元素_Python3基础 list pop(含参) 取出列表中的指定索引的元素 weixin_39848097 python取列表前3个元素
Python:3.7.0OS:Ubuntu18.04.1LTSIDE:PyCharm2018.2.4Conda:4.5.11typesetting:Markdowncode"""@Author:行初心@Date:18-9-23@Blog:www.cnblogs.com/xingchuxin@Gitee:gitee.com/zhichengjiu"""defmain():member=['黄帝内经'
python统计列表中元素个数_python中计算一个列表中连续相同的元素个数方法 weixin_39611008 python统计列表中元素个数
python中计算一个列表中连续相同的元素个数方法最简单的例子：a=[1,1,1,1,2,2,2,3,3,1,1,1,3]#问：计算a中最多有几个连续的1很明显，答案是4如果用代码实现，最先想到的就是itertools：importitertoolsa=[1,1,1,1,2,2,2,3,3,1,1,1,3]printmax([len(list(v))fork,vinitertools.groupb
python中水量_python 画降水量色斑图问题张少壮 python中水量
#引用部分importnumpyasnpimportpandasaspdfromscipy.interpolateimportRbf#径向基函数：将站点信息插到格点上用于绘制等值线importmatplotlib.pyplotaspltimportmatplotlib.colorsascolorsimportmatplotlibasmplimportcartopy.crsasccrsimportc
python获取字典第一个元素,从字典中获取第一个元素 CHM单 python获取字典第一个元素
Ihavethefollowingdeclaration:Dictionary>like=newDictionary>();Ineedtogetthefirstelementout,butdonotknowthekeyorvalue.What'sthebestwaytodothis?解决方案EditTosatisfythecommenters.NotethattocallFirsthereisac
人工智能：人形机器人的开发需求会创造哪些热门的就业岗位？ InnoLink_1024 机器学习 AGI 人工智能人工智能机器人 ai
人形机器人的开发需求会创造以下热门的就业岗位：研发设计类机械结构工程师：负责设计人形机器人的机械本体结构，包括关节、骨架、外壳等，需要对机械原理、力学知识有深入理解，熟悉使用CAD、SolidWorks等设计软件。电子电气工程师：设计和开发人形机器人的电子电路系统，包括传感器电路、控制电路、电源电路等，需要掌握电子技术、电路设计、PCB绘制等技能。算法工程师：运动控制算法工程师：负责移动机器人运动
Python-玩转数据-数据分析之分析思维人猿宇宙数据分析 python big data
一、说明当下时代的社会生产发展，人们都开始习惯于用数据来说明某个观点和反映事物的内在规律或享用自动化和人工智能带来的便利。但这些轻松快捷的方便背后，都是相关工作者的专业流程作为源源不断的支撑。二、大数据思维自从几年前大数据开始兴起，大数据思维已经逐渐被更动的人接受，随着其进一步发展，产生了巨大的生产效果。三、数据驱动的生产力作为一个数据工程师，仅仅知道跑数据是不够的，还需要通过数据发现生产环节出现
Python 中模拟键盘输入在线码BUG python 开发语言后端
键盘编码对照表在日常学习编程的过程中，特别是一些自动化处理时，我们需要模拟键盘进行一些输入这是我们就需要代码来模拟我们进行物理键盘输入。在Python中我们要模拟键盘进行一些输入首先我们需要进行导入模块importwin32apiimportwin32con这两个模块可以帮助我们进行模拟物理键盘的输入，接下来我们就要进行代码的编辑：win32api.keybd_event(17,0,0,0)#Ct
python 操作excel的模块总结技术求知者 python excel 开发语言
python操作excel的模块总结1Pythonxlrd读取操作Excel1.1xlrd模块介绍（1）什么是xlrd模块？python操作excel主要用到xlrd和xlwt这两个库，即xlrd是读excel，xlwt是写excel的库。（2）为什么使用xlrd模块？在UI自动化或者接口自动化中数据维护是一个核心，所以此模块非常实用。xlrd模块可以用于读取Excel的数据，速度非常快，推荐使用
用java 实现 Add Two Numbers 两数相加（LeetCode算法）用心去追梦算法 java leetcode
LeetCode上的“AddTwoNumbers”问题要求我们实现一个函数，该函数接收两个非空链表作为输入，每个链表表示一个非负整数的逆序表示（即个位在链表头），链表中的每个节点包含一个数字（0-9）。任务是将这两个数相加，并以同样的链表格式返回和。下面是用Java实现这个算法的方法：classListNode{intval;ListNodenext;ListNode(intx){val=x;}}
通俗易懂之样条函数的原理、计算、案例、python实现智识小站可解释机器学习 python 算法
理解样条函数（SplineFunctions）是掌握广义加性模型（GAMs）及其他非线性回归技术的关键。样条函数通过分段多项式的形式，在不同区间内灵活地拟合数据，从而捕捉复杂的非线性关系。本文将更为详细地讲解样条函数的原理、具体示例以及在Python中的实现方法。如果这篇文章对你有一点点的帮助，欢迎点赞、关注、收藏、转发、评论哦！我也会在微信公众号“智识小站”坚持分享更多内容，以期记录成长、普及技
第9篇：从入门到精通：深入理解Python中的类与对象猿享天开 python从入门到精通 python 开发语言
第9篇：类与对象内容简介本篇文章将深入探讨Python中的类与对象概念。您将学习如何定义类、创建对象，理解属性与方法的区别与用法，掌握构造函数的使用，以及了解self关键字的作用。通过丰富的代码示例，您将能够熟练运用面向对象编程（OOP）在Python中的核心概念，提升您的编程能力和代码组织水平。目录类与对象概述什么是类与对象面向对象编程的优势定义类与创建对象类的基本结构创建对象实例属性与方法类属
解放双手，提高生产力，看我如何用 Python 实现自动化剪视频程序猿-小菜 python
人类和动物最本质的区别就是人类懂的制造并使用工具，这是由上古时代一直延续至今的基因所决定的。前段时间朋友的一个业务需要大量的原创短视频，问我是否可以帮忙弄下，我了解了具体需求之后发现不需要很高质量的内容，操作也不是很复杂，完全可以通过Python实现自动化操作，也是就把这个事给应承了下来。我们知道PyAutoGUI是一个通过编程方式来控制鼠标和键盘的Python库，那么就从它身上下手了
Python 包与模块：深入理解与实践 kdayjj966 python 开发语言 windows
一、引言在Python编程的广阔领域中，包（Package）和模块（Module）是构建大型、可维护项目的重要基石。它们不仅提供了一种组织代码的有效方式，还能实现代码的复用与共享。想象一下，当我们编写一个复杂的应用程序时，如果所有的代码都堆积在一个文件中，那将是多么混乱和难以管理。而包和模块的出现，就如同为我们的代码提供了一个个有序的“文件夹”和“文件”，使得代码结构清晰，易于理解和维护。理解包和
华为OD机试E卷 - 数大雁（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od python java c语言 javascript c++华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述一群大雁往南飞，给定一个字符串记录地面上的游客听到的大雁叫声，请给出叫声最少由几只大雁发出。具体的:1.大雁发出的完整叫声为”quack“，因为有多只大雁同一时间嘎嘎作响，所以字符串中可能会混合多个”quack”。2.大雁会依次完整发出”quack”，即字符串中’q’,‘u’,‘a’,‘c’,‘k’这5个字母按顺序完整
Python lambda函数总结编程零零七 python python 开发语言 python基础 python学习 python教程
在Python中，lambda函数是一种快速定义匿名函数（即没有名字的函数）的方式。它们通常用于需要将一个简单函数作为参数传递的场合，或者在某些需要函数对象但又不希望正式定义一个完整函数的场景下。下面是对lambda函数的详细总结：基本语法lambda参数1,参数2,...:表达式lambda关键字用来声明一个匿名函数。参数列表可以包含多个参数，用逗号分隔。冒号后面是一个表达式，该表达式的结果就是
【深入解析】棋类游戏算法：Minimax, Negamax, 蒙特卡洛树搜索与AlphaZero wit_@ ai python negamax
深入解析棋类游戏算法：Minimax,Negamax,蒙特卡洛树搜索与AlphaZero在人工智能领域，棋类游戏一直是测试和展示智能算法的经典舞台。从最早的Minimax算法到如今的AlphaZero，这些算法通过不同的方式解决了棋局中的决策问题，让计算机能够在复杂的棋局中做出合理甚至超越人类的决策。本文将详细解析几种经典的棋类游戏算法：Minimax，Negamax，蒙特卡洛树搜索（MCTS）以
深入探索Python编程技术：从入门到精通的全方位学习指南小码快撩 python 开发语言
引言在当今信息技术飞速发展的时代，Python以其简洁优雅、功能强大、易于上手的特点，成为了众多开发者和初学者首选的编程语言。无论是数据科学、机器学习、Web开发、自动化脚本编写，还是桌面应用开发，Python都能发挥其独特优势，帮助开发者高效完成任务。本文旨在为Python学习者提供一个全面的学习路径与关键知识点概述，助您快速掌握这门强大的编程语言。一、基础语法1.变量定义与数据类型示例代码：#
获取列表中最后一个位置的元素内容 - Python 雪域Code python 开发语言 Python
获取列表中最后一个位置的元素内容-Python在Python编程中，经常需要对列表进行操作，其中一项常见的需求是获取列表中最后一个位置的元素内容。本文将介绍如何使用Python编程语言来实现这一功能，并提供相应的源代码示例。获取列表最后一个元素的方法有多种，下面将介绍其中的两种常见方法。方法一：使用索引在Python中，可以使用负数索引来获取列表中的元素，其中-1代表最后一个元素，-2代表倒数第二
Python人工智能在气象中的应用，包括：天气预测、气候模拟、降雨量和降水预测、气象数据分析、气象预警系统 xiao5kou4chang6kai4 气象气候预报天气预测气候模拟.降雨量和降水预测气象数据分析气象预警系统 python
Python人工智能在气象中有多种应用，包括：天气预测、气候模拟、降雨量和降水预测、气象数据分析、气象预警系统Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Python将成为的主流编程语言之一。人工智
华为OD机试E卷 --过滤组合字符串--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述数字0、1、2、3、4、5、6、7、8、9分别关联a~z26个英文字母。0关联“a”"b”"c1关联“d”"e”"f2关联“g"“h”“i”3关联“j","k"l”4关联“m”"n”“o”5关联“p""q”"r6关联“s”"t7关联“u”"v”8关联“w”“x”9关联“y”"
第8篇：从入门到精通：掌握Python异常处理猿享天开 python从入门到精通 python 开发语言
第8篇：异常处理内容简介本篇文章将深入探讨Python中的异常处理机制。您将学习异常的基本概念与类型，掌握使用try-except块处理异常的方法，了解finally语句的作用，以及如何抛出和定义自定义异常。通过丰富的代码示例，您将能够有效地管理程序中的错误，提高代码的健壮性和可维护性。目录异常处理概述什么是异常异常的类型异常处理的重要性使用try-except块处理异常try-except语法结
Python Turtle：绚丽多彩的烟花动画赵闪闪168 闪闪精选 python 开发语言
以下是一个使用Python的turtle库实现的烟花动画程序示例：收起python复制importturtleimportrandomimporttime#创建画布screen=turtle.Screen()screen.bgcolor("black")screen.title("FireworksAnimation")#烟花颜色列表colors=["red","orange","yellow",
Python自动化办公测试开发漫漫成长路 python办公自动化自动化
一、引言以下是一个完整的Python自动化办公框架的目录结构和详细的解释。该框架将结合多种工具和技术，涵盖从数据处理到任务调度、自动化邮件发送、网页抓取等常见办公自动化任务。二、常用框架与工具pandas：使用场景：数据处理与分析描述：pandas是一个强大的数据处理库，适用于读取、清理、分析、操作Excel、CSV等表格数据。它提供了DataFrame数据结构，便于处理复杂的数据任务。典型应用：
chatgpt赋能python：Python如何给微信群发消息？李自提 ChatGpt python chatgpt 开发语言计算机
Python如何给微信群发消息？概述微信是全球最受欢迎的聊天应用程序之一，拥有数十亿用户。在这些用户中，许多人都属于微信群。微信群是集体聊天，可以让您与朋友、同事或家人交流。您可以在群中分享照片、链接甚至语音消息，而且现在，您甚至可以使用Python自动给微信群发消息。Python实现微信群发消息使用Python给微信群发消息确实可能有些复杂，但是有很多库可以使用。其中最受欢迎的库之一是itcha
从零开始的 AI Infra 学习之路 SSS不知-道 MLSys 人工智能深度学习 pytorch
从零开始的AIInfra学习之路文章目录从零开始的AIInfra学习之路一、概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI训练框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM五、AI编译&计算架构5.1CUDA5.2CANN六、AI硬件&体系结构6.1INVIDIAGPU6.2AscendNPU一、概述AIInfra（AI
深入解析 Python 包调用原理与最佳实践 SSS不知-道 Python python pip 程序人生学习方法
深入解析Python包调用原理与最佳实践文章目录深入解析Python包调用原理与最佳实践一、引言二、什么是Python的包？三、深入解析Pythonimport原理3.1实验一3.2实验二3.3实验三3.4实验四四、循环依赖问题4.1实验五4.2实验六五、动态加载对象六、总结七、参考资料一、引言写下这篇文章的起因，是最近我在参与vLLM项目的开发过程中，发现其中使用了一种动态加载对象的方式值得学习
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他