小明同学YYDS

AI基础：KNN与K近邻距离度量说明、利用KNN手写字体识别分类实践

文章目录

KNN算法
K近邻中近邻的距离度量
- 欧式距离
- 标准化欧式距离
- 曼哈顿距离
- 汉明距离
- 夹角余弦
- 杰卡德相似系数
- 皮尔逊系数
- 切比雪夫距离
- 闵可夫斯基距离
- 马氏距离
- 巴氏距离
- 各种“距离”的应用场景
- 距离函数之间的等价关系
K近邻中K值的选择
KNN最近邻分类算法的过程
基于KNN的手写字体识别分类实践

KNN算法

何谓K近邻算法，即K-Nearest Neighbor algorithm，简称KNN算法，单从名字来猜想，可以简单粗暴的认为是：K个最近的邻居，当K=1时，算法便成了最近邻算法，即寻找最近的那个邻居。

用官方的话来说，所谓K近邻算法，即是给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的K个实例（也就是上面所说的K个邻居），这K个实例的多数属于某个类，就把该输入实例分类到这个类中。

如上图所示，有两类不同的样本数据，分别用蓝色的小正方形和红色的小三角形表示，而图正中间的那个绿色的圆所标示的数据则是待分类的数据。也就是说，现在，我们不知道中间那个绿色的数据是从属于哪一类（蓝色小正方形or红色小三角形），KNN就是解决这个问题的。
如果K=3，绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方形，少数从属于多数，基于统计的方法，判定绿色的这个待分类点属于红色的三角形一类。
如果K=5，绿色圆点的最近的5个邻居是2个红色三角形和3个蓝色的正方形，还是少数从属于多数，基于统计的方法，判定绿色的这个待分类点属于蓝色的正方形一类。

于此我们看到，当无法判定当前待分类点是从属于已知分类中的哪一类时，我们可以依据统计学的理论看它所处的位置特征，衡量它周围邻居的权重，而把它归为(或分配)到权重更大的那一类。这就是K近邻算法的核心思想。

K近邻中近邻的距离度量

我们看到，K近邻算法的核心在于找到实例点的邻居，这个时候，问题就接踵而至了，如何找到邻居，邻居的判定标准是什么，用什么来度量。这一系列问题便是下面要讲的距离度量表示法。

欧式距离

最常见的两点之间或多点之间的距离表示法，又称之为欧几里得度量，它定义于欧几里得空间中，如
$点x=(x_1,...,x_n)和y=(y_1,...,y_n)之间的距离为： \\ d\left( x,y \right) =\sqrt{\left( x_1-y_1 \right) ^2\,\,+\,\,\left( x_2-y_2 \right) ^2+..+\left( x_n-y_n \right) ^2}=\sqrt{\underset{i=1}{\overset{n}{\varSigma}}\left( x_i-y_i \right) ^2}$

二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离：

$d_{12}=\sqrt{\left( x_1-x_2 \right) ^2\,\,+\,\,\left( y_1-y_2 \right) ^2}$
三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离：

$d_{12}=\sqrt{\left( x_1-x_2 \right) ^2\,\,+\,\,\left( y_1-y_2 \right) ^2+\,\,\left( z_1-z_2 \right) ^2}$
两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的欧氏距离：

$d_{12}=\sqrt{\underset{k=1}{\overset{n}{\varSigma}}\left( x_{1k}-x_{2k} \right) ^2}$

也可以用表示成向量运算的形式：

$d_{12}=\sqrt{\left( a-b \right) \left( a-b \right) ^T}$

标准化欧式距离

准化欧氏距离是针对简单欧氏距离的缺点而作的一种改进方案。标准欧氏距离的思路：既然数据各维分量的分布不一样，那先将各个分量都“标准化”到均值、方差相等。至于均值和方差标准化到多少，先复习点统计学知识。

假设样本集X的数学期望或均值(mean)为m，标准差(standard deviation，方差开根)为s，那么X的“标准化变量”X*表示为：(X-m）/s，而且标准化变量的数学期望为0，方差为1。
即，样本集的标准化过程(standardization)用公式描述就是：

$X^*=\frac{X-m}{s}$

标准化后的值 = ( 标准d化前的值－分量的均值 ) /分量的标准差　　
经过简单的推导就可以得到两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的标准化欧氏距离的公式：
$d_{12}=\sqrt{\underset{k=1}{\overset{n}{\varSigma}}\left( \frac{x_{1k}-x_{2k}}{s_k} \right) ^2}$

曼哈顿距离

我们可以定义曼哈顿距离的正式意义为L1-距离或城市区块距离，也就是在欧几里得空间的固定直角坐标系上两点所形成的线段对轴产生的投影的距离总和。例如在平面上，坐标（x1, y1）的点P1与坐标（x2, y2）的点P2的曼哈顿距离为：，要注意的是，曼哈顿距离依赖座标系统的转度，而非系统在座标轴上的平移或映射。

通俗来讲，想象你在曼哈顿要从一个十字路口开车到另外一个十字路口，驾驶距离是两点间的直线距离吗？显然不是，除非你能穿越大楼。而实际驾驶距离就是这个“曼哈顿距离”，此即曼哈顿距离名称的来源，同时，曼哈顿距离也称为城市街区距离(City Block distance)。

二维平面两点a(x1,y1)与b(x2,y2)间的曼哈顿距离

$d_{12}=|x_1-x_2| +\,\,|y_1-y_2|$
两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的曼哈顿距离

$d_{12}=\underset{k=1}{\overset{n}{\varSigma}}|x_{1k}-x_{2k}|$

汉明距离

两个等长字符串s1与s2之间的汉明距离定义为将其中一个变为另外一个所需要作的最小替换次数。例如字符串“1111”与“1001”之间的汉明距离为2。应用：信息编码（为了增强容错性，应使得编码间的最小汉明距离尽可能大）。

夹角余弦

几何中夹角余弦可用来衡量两个向量方向的差异，机器学习中借用这一概念来衡量样本向量之间的差异。

在二维空间中向量A(x1,y1)与向量B(x2,y2)的夹角余弦公式：

$\cos \theta =\frac{x_1x_2+y_1y_2}{\sqrt{\left( {x_1}^2+{y_1}^2 \right)}\sqrt{\left( {x_2}^2+{y_2}^2 \right)}}$
两个n维样本点a(x11,x12,…,x1n)和b(x21,x22,…,x2n)的夹角余弦：

$\cos \theta =\frac{a\cdot b}{|a||b|}$

夹角余弦取值范围为[-1,1]。夹角余弦越大表示两个向量的夹角越小，夹角余弦越小表示两向量的夹角越大。当两个向量的方向重合时夹角余弦取最大值1，当两个向量的方向完全相反夹角余弦取最小值-1。

杰卡德相似系数

两个集合A和B的交集元素在A，B的并集中所占的比例，称为两个集合的杰卡德相似系数，用符号J(A,B)表示。杰卡德相似系数是衡量两个集合的相似度一种指标。
$J\left( A,B \right) =\frac{|A\cap B|}{|A\cup B|}$

与杰卡德相似系数相反的概念是杰卡德距离：
$J_{\delta}\left( A,B \right) =1-J\left( A,B \right) =\frac{|A\cup B|-|A\cap B|}{|A\cup B|}$

皮尔逊系数

统计学中，皮尔逊积矩相关系数用于度量两个变量X和Y之间的相关（线性相关），其值介于-1与1之间。通常情况下通过以下取值范围判断变量的相关强度：
皮尔森相关系数等于两个变量的协方差除于两个变量的标准差

0.8-1.0     极强相关
0.6-0.8     强相关
0.4-0.6     中等程度相关
0.2-0.4     弱相关
0.0-0.2     极弱相关或无相关

切比雪夫距离

若二个向量或二个点p 、and q，其座标分别为Pi及qi，则两者之间的切比雪夫距离定义如下：

这也等于以下Lp度量的极值：，因此切比雪夫距离也称为L∞度量。

以数学的观点来看，切比雪夫距离是由一致范数（uniform norm）（或称为上确界范数）所衍生的度量，也是超凸度量（injective metric space）的一种。

在平面几何中，若二点p及q的直角坐标系坐标为(x1,y1)及(x2,y2)，则切比雪夫距离为：

玩过国际象棋的朋友或许知道，国王走一步能够移动到相邻的8个方格中的任意一个。那么国王从格子(x1,y1)走到格子(x2,y2)最少需要多少步？。你会发现最少步数总是max( | x2-x1 | , | y2-y1 | ) 步。有一种类似的一种距离度量方法叫切比雪夫距离。

二维平面两点a(x1,y1)与b(x2,y2)间的切比雪夫距离：
两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的切比雪夫距离：

闵可夫斯基距离

(Minkowski Distance)，闵氏距离不是一种距离，而是一组距离的定义。

两个n维变量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的闵可夫斯基距离定义为：

其中p是一个变参数。
当p=1时，就是曼哈顿距离
当p=2时，就是欧氏距离
当p→∞时，就是切比雪夫距离
根据变参数的不同，闵氏距离可以表示一类的距离。

马氏距离

有M个样本向量X1~Xm，协方差矩阵记为S，均值记为向量μ，则其中样本向量X到u的马氏距离表示为：

若协方差矩阵是单位矩阵（各个样本向量之间独立同分布）,则公式就成了,也就是欧氏距离了：
若协方差矩阵是对角矩阵，公式变成了标准化欧氏距离。

马氏距离的优缺点：量纲无关，排除变量之间的相关性的干扰。

巴氏距离

在统计中，巴氏距离距离测量两个离散或连续概率分布的相似性。它与衡量两个统计样品或种群之间的重叠量的巴氏距离系数密切相关。巴氏距离距离和巴氏距离系数以20世纪30年代曾在印度统计研究所工作的一个统计学家A. Bhattacharya命名。同时，Bhattacharyya系数可以被用来确定两个样本被认为相对接近的，它是用来测量中的类分类的可分离性。

对于离散概率分布 p和q在同一域 X，它被定义为：

其中：

是Bhattacharyya系数。

各种“距离”的应用场景

空间：欧氏距离，
路径：曼哈顿距离，国际象棋国王：切比雪夫距离，
以上三种的统一形式:闵可夫斯基距离，
加权：标准化欧氏距离，
排除量纲和依存：马氏距离，
向量差距：夹角余弦，
编码差别：汉明距离，
集合近似度：杰卡德类似系数与距离，
相关：相关系数与相关距离。

距离函数之间的等价关系

经过标准化后的欧氏距离和余弦相似度，等价于皮尔森相关系数

K近邻中K值的选择

如果选择较小的K值，就相当于用较小的领域中的训练实例进行预测，“学习”近似误差会减小，只有与输入实例较近或相似的训练实例才会对预测结果起作用，与此同时带来的问题是“学习”的估计误差会增大，换句话说，K值的减小就意味着整体模型变得复杂，容易发生过拟合；
如果选择较大的K值，就相当于用较大领域中的训练实例进行预测，其优点是可以减少学习的估计误差，但缺点是学习的近似误差会增大。这时候，与输入实例较远（不相似的）训练实例也会对预测器作用，使预测发生错误，且K值的增大就意味着整体的模型变得简单。
K=N，则完全不足取，因为此时无论输入实例是什么，都只是简单的预测它属于在训练实例中最多的累，模型过于简单，忽略了训练实例中大量有用信息。

在实际应用中，K值一般取一个比较小的数值，例如采用交叉验证法（简单来说，就是一部分样本做训练集，一部分做测试集）来选择最优的K值。

KNN最近邻分类算法的过程

计算测试样本和训练样本中每个样本点的距离（常见的距离度量有欧式距离，马氏距离等）；
对上面所有的距离值进行排序；
选前 k 个最小距离的样本；
根据这 k 个样本的标签进行投票，得到最后的分类类别；

基于KNN的手写字体识别分类实践

from numpy import *
from os import listdir
from collections import Counter

def img2vector(filename):
    """
    将图像数据转换为向量
    :param filename: 图片文件 因为我们的输入数据的图片格式是 32 * 32的。这个可以打开输入数据文件看看就知道了
    :return: 一维矩阵
    该函数将图像转换为向量：该函数创建 1 * 1024 的NumPy数组，然后打开给定的文件，
    循环读出文件的前32行，并将每行的头32个字符值存储在NumPy数组中，最后返回数组。
    """
    # 创建一个 1 行 1024列 的都为0的一维矩阵
    returnVect = zeros((1, 1024))
    # 读取文件
    fr = open(filename)
    # 行循环
    for i in range(32):
        # 读一行数据
        lineStr = fr.readline()
        # 列循环
        for j in range(32):
            # 将每个数据转成int类型后放到矩阵里
            returnVect[0, 32 * i + j] = int(lineStr[j])
    return returnVect

# KNN分类
def classify(inX, dataSet, labels, k):
    """
    inx[1,2,3]
    DS=[[1,2,3],[1,2,0]]
    inX: 用于分类的输入向量
    dataSet: 输入的训练样本集
    labels: 标签向量
    k: 选择最近邻居的数目
    注意：labels元素数目和dataSet行数相同；程序使用欧式距离公式.
    """
    # 1.计算距离
    # 获得数据集大小（shape(0)，行数）
    dataSetSize = dataSet.shape[0]
    # tile表示将inX向量扩展成dataSetSize项，每项中对原数据集复制1次的数据集。例如，inx[1,2,3]，tile(inx,(2,1))=[[1,2,3],[1,2,3]]
    # diffMat 得到每inX 与 原数据集的差集
    diffMat = tile(inX, (dataSetSize, 1)) - dataSet
    # 取平方
    sqDiffMat = diffMat ** 2
    # 将矩阵的每一行相加
    sqDistances = sqDiffMat.sum(axis=1)
    # 开方
    distances = sqDistances ** 0.5
    # 根据距离排序从小到大的排序，返回对应的索引位置
    # argsort() 是将x中的元素从小到大排列，提取其对应的index（索引），然后输出到y。
    # x=np.array([1,4,3,-1,6,9])
    # y = x.argsort()
    # y=[3 0 2 1 4 5]
    sortedDistIndicies = distances.argsort()

    # 2. 选择距离最小的k个点
    # 初始化类别计数（计数个数相当于投票次数）
    classCount = {}
    for i in range(k):
        # 找到该样本的类型
        voteIlabel = labels[sortedDistIndicies[i]]
        # 对该类别进行计数累加
        classCount[voteIlabel] = classCount.get(voteIlabel, 0) + 1
    # 3. 排序并返回出现最多的那个类型 这里max方法是取dict类型的value最大值，并返回其对应的key
    maxClassCount = max(classCount, key=classCount.get)
    return maxClassCount

# 手写字体分类测试
def handwritingClassTest():
    # 1. 导入数据，准备好训练数据
    # hwLabels存储0～9对应的index位置， trainingMat存放的每个位置对应的图片向量
    hwLabels = []
    # load the training set
    trainingFileList = listdir('trainingDigits')  
    m = len(trainingFileList)
    trainingMat = zeros((m, 1024))
    # 对每个训练文件遍历
    for i in range(m):
        # 获取文件名（文件名长这样0_0.txt）
        fileNameStr = trainingFileList[i]
        # take off .txt
        fileStr = fileNameStr.split('.')[0]  
        # 获得文件对应类别
        classNumStr = int(fileStr.split('_')[0])
        # 类别存入标签组
        hwLabels.append(classNumStr)
        # 将 32*32的矩阵->1*1024的矩阵[i,:]表示第i行所有列
        trainingMat[i, :] = img2vector('trainingDigits/%s' % fileNameStr)

    # 2. 导入测试数据进行测试
    testFileList = listdir('testDigits')  
    errorCount = 0.0
    mTest = len(testFileList)
    # 遍历测试数据文件列表
    for i in range(mTest):
        fileNameStr = testFileList[i]
        fileStr = fileNameStr.split('.')[0]  # take off .txt
        classNumStr = int(fileStr.split('_')[0])
        # 将测试数据集的 32*32的矩阵->1*1024的一维矩阵
        vectorUnderTest = img2vector('testDigits/%s' % fileNameStr)
        # 分类
        classifierResult = classify(vectorUnderTest, trainingMat, hwLabels, 1)
        # 打印分类结果
        print("the classifier came back with: %d, the real answer is: %d" % (classifierResult, classNumStr))
        if (classifierResult != classNumStr): errorCount += 1.0
    print("\nthe total number of errors is: %d" % errorCount)
    print("\nthe total error rate is: %f" % (errorCount / float(mTest)))
    
    
# 测试执行
handwritingClassTest()

输出

.....
the classifier came back with: 9, the real answer is: 9
the classifier came back with: 9, the real answer is: 9
the classifier came back with: 9, the real answer is: 9
the classifier came back with: 9, the real answer is: 9

the total number of errors is: 13

the total error rate is: 0.013742

实际使用中，需要对不同的K进行测试，得到最佳的K

测试文件数据说明

测试文件名是例如0_0.txt、0_1.txt.。。9_0.txt，模式是具体分类数字_该分类的第几个样本.txt

其中一份文件数据如下

00000000000000111000000000000000
00000000000011111110100000000000
00000000001111011111110000000000
00000000001111011111111000000000
00000000111111111111111000000000
00000000111111111111111100000000
00000001111110000000111100000000
00000011111100000000111100000000
00000011111100000000011110000000
00000111111100000000011110000000
00000011111111000000000111000000
00000011111110000000000111000000
00000011111100000000000111000000
00000011111100000000000111000000
00000001111000000000001111000000
00000001111000000000001111000000
00000001111000000000001111000000
00000001111000000000001110000000
00000001111000000000001110000000
00000001110000000000011110000000
00000001110000000000011110000000
00000001110000000000111100000000
00000011110000000000111100000000
00000000111100000000111110000000
00000000111100000000111100000000
00000000111100000011111100000000
00000000111110000111111000000000
00000000011111111111111000000000
00000000011111111111110000000000
00000000001111111111000000000000
00000000001111111111000000000000
00000000000001101000000000000000

OK，以上有问题请及时指出

scala基础学习(数据类型)-集合百流 scala scala 学习开发语言
文章目录集合创建集合isEmpty获取数据添加元素删除元素常见方法交集&差集diff--并集++uniontostringtolisttoArraytoMap其余常用方法集合ScalaSet(集合)是没有重复的对象集合，所有的元素都是唯一的。Scala集合分为可变的和不可变的集合。默认情况下，Scala使用的是不可变集合，如果你想使用可变集合，需要引用scala.collection.mutabl
python 查询sqlserver 视图_SQL Server 2017 数据库教与学（教学大纲，含Python+SQL Server案例）... weixin_39724748 python 查询sqlserver 视图
原标题：SQLServer2017数据库教与学(教学大纲，含Python+SQLServer案例)本书提供Python+SQLServer案例SQLServer教学大纲一、课程的性质和教学目的课程性质：数据库技术是各类信息系统、管理系统的基础。SQLServer数据库是微软公司的一款数据库产品，它被广泛应用到各大软件公司。本课程适合在计算机专业、非计算机专业但需要数据库辅助科研的理工科专业。教学目
python连sql server学生管理系统_SQL Server 2017 数据库教与学（教学大纲，含Python+SQL Server案例）... weixin_39529302 python连sql server学生管理系统
原标题：SQLServer2017数据库教与学(教学大纲，含Python+SQLServer案例)本书提供Python+SQLServer案例SQLServer教学大纲一、课程的性质和教学目的课程性质：数据库技术是各类信息系统、管理系统的基础。SQLServer数据库是微软公司的一款数据库产品，它被广泛应用到各大软件公司。本课程适合在计算机专业、非计算机专业但需要数据库辅助科研的理工科专业。教学目
python查询sqlserver视图_SQL Server 2017 数据库教与学（教学大纲，含Python+SQL Server案例）... weixin_39614874
原标题：SQLServer2017数据库教与学(教学大纲，含Python+SQLServer案例)本书提供Python+SQLServer案例SQLServer教学大纲一、课程的性质和教学目的课程性质：数据库技术是各类信息系统、管理系统的基础。SQLServer数据库是微软公司的一款数据库产品，它被广泛应用到各大软件公司。本课程适合在计算机专业、非计算机专业但需要数据库辅助科研的理工科专业。教学目
android10adb模式命令大全,史上最全ADB命令使用大全，一步教你成为玩机大神熊仔仔仔仔
以下文章互联网博主：隔壁小胡ADB简介adb相信很多android开发者会用到它来进行调试手机，助手类软件也是依赖它来实现机型识别，软件安装，软件传送等功能。原版的adb由于在windows下各大手机助手类软件占用导致无法启动。具体adb介绍可以google或百度。ADB基本用法一、命令语法adb命令的基本语法如下：adb[-d|-e|-s]如果只有一个设备/模拟器连接时，可以省略掉[-d|-e|
git基础使用命令东锋1.3 开发与应用 elasticsearch 大数据搜索引擎
基础配置命令1.初始化配置配置用户信息是使用Git的第一步：#配置全局用户名和邮箱gitconfig--globaluser.name"FedJavaScript"gitconfig--globaluser.email"[email protected]"#查看配置信息gitconfig--list2.仓库初始化创建新的Git仓库：#初始化新仓库gitinit#克隆远程仓库gitc
ESP32开发日记4-来讲讲ESP32之外的东西(Valgrind 工具的使用) 我在武汉上早八开发工具笔记物联网 linux c语言 c++
目录简介安装Valgrind基本使用总结简介从第一篇文章我们知道，乐鑫官方给集成了一个调试工具，能够在程序异常时分层追踪到导致异常的地方。这个功能实际上很像Valgrind，她是一个在Linux环境下广泛使用的编程工具套件，主要用于内存调试、内存泄漏检测以及性能分析。它对于识别程序中的内存和线程问题非常有用，特别适用于C和C++程序的开发和调试。在实际的开发过程当中如果遇到不好找的问题特别是崩溃内
【20231214】银河麒麟系统（5.4.18-52-generic）ghost镜像还原失败问题风流倜傥小辣条丶 linux
【20231214】银河麒麟系统（5.4.18-52-generic）ghost镜像还原失败问题目录【20231214】银河麒麟系统（5.4.18-52-generic）ghost镜像还原失败问题0前言1问题概述1.1基础环境1.2问题现象2问题定位2.1日志分析2.22207系统验证2.3rsync工具3机理分析4解决措施5举一反三0前言转载请附上原文出处链接稀土掘金本文链接：https://j
小米Vela操作系统开源：AIoT时代的全新引擎 lilu8888888 开源前端
小米近日正式开源了其物联网嵌入式软件平台——Vela操作系统，并将其命名为OpenVela。这一举动在AIoT（人工智能物联网）领域掀起了不小的波澜，也为开发者们提供了一个强大的AI代码生成器和开发平台。OpenVela项目源代码已托管至GitHub和Gitee，采用Apache2.0开源协议，这意味着全球开发者都可以参与其中，共同推动物联网技术的进步。……Vela操作系统基于开源实时操作系统Nu
Python进阶与拾遗8：Python中的异常处理 jiongnima 进阶拾遗 Python python 面向对象编程大数据计算机视觉人工智能
Python进阶与拾遗8：Python中的异常处理异常相关概念异常的定义异常的角色常用的异常处理方法try/except/else/finally语句raise语句assert语句with/as环境管理器相关概念环境管理协议异常对象写在最后作为一门面向对象编程的语言，异常处理是Python中常用的技术。本篇博文主要讲解Python中的异常处理，下面开始干货。异常相关概念异常的定义异常，是可以改变程
XXPermissions：Android权限请求框架高喻尤King
XXPermissions：Android权限请求框架XXPermissionsAndroid权限请求框架，已适配Android14项目地址:https://gitcode.com/gh_mirrors/xx/XXPermissions项目基础介绍XXPermissions是一个由CSDN公司开发的Android权限请求框架，主要使用Java编程语言进行开发。该框架旨在简化Android应用中权限
TCL小蓝翼新风空调亮相CES2025，斩获智慧新风技术创新大奖 TMT星球家电人工智能大数据
1月7日-11日，被称为“科技界春晚”的CES2025（国际消费类电子产品展览会）在美国拉斯维加斯举行。本届CES，TCL小蓝翼新风空调更是惊艳亮相TCL展区，以领先的健康新风及AI技术，斩获CES2025智慧新风技术创新奖（SmartFreshAirTechnologyInnovationAward）。全球刮起健康新风，TCL小蓝翼新风空调惊艳拉斯维加斯作为“科技届春晚”，每年的国际消费类电子产
智源社区AI周刊：Hinton预测破解大脑机制时间；Gary Marcus批判追捧深度学习风潮；谷歌发布Imagen... 智源社区机器学习人工智能深度学习编程语言大数据
汇聚每周必看AI观点、研究和各类资源，不错过一条重要资讯！欢迎扫码订阅，获取邮件推送。观点“我们会在未来的五年内破解这些（人脑的）程序......现有的一切人工智能，都是建立在与大脑高层次上所做的事情完全不同的基础上......假设有数十亿的参数，这些神经元间的权重在大量训练实例的基础上去调整，会发生奇妙的事情。大脑是如此，深度学习也是如此。但问题在于，如何获得调整参数的梯度......目前我的信
Julia语言的计算机基础 Code侠客行包罗万象 golang 开发语言后端
Julia语言的计算机基础引言随着数据科学、机器学习和高性能计算的快速发展，对编程语言的需求也日益增加。在众多编程语言中，Julia语言因其独特的设计理念和高性能而迅速崛起。本文将详细探讨Julia语言的基础知识，包括其历史背景、安装与环境配置、基本语法、数据结构、函数与模块、以及性能优化等方面，旨在为对Julia感兴趣的读者提供一份全面的入门指南。一、Julia语言简介1.1历史背景Julia是
深度探索：SQL Server 技术学习之旅小码快撩数据库 sqlserver sql
引言在数字化时代，数据库管理系统作为企业信息系统的核心组件，承载着海量数据的存储、管理和分析重任。其中，MicrosoftSQLServer作为一款久经市场考验的企业级关系型数据库平台，凭借其强大的功能、卓越的性能以及与微软生态系统的深度集成，赢得了全球众多企业的青睐。本文旨在引导读者踏上深入学习SQLServer的旅程，全方位领略其核心技术要点，为构建高效、稳定且安全的数据库系统奠定坚实基础。一
第十五届蓝桥杯软件赛C/C++大学A组个人省赛题解 2301_78234743 java
题解|#压缩字符串(一)#/***代码中的类名、方法名、参数名已经指定，请勿修改，直接返回方法规定的值即可***@4月末字节offer，51可以放松一下了从三月初开始零碎的投递，到三月底开始海投，三月的时候面试的机会其实很少，到4月初面试机会才逐渐多了起题解|#四则运算#importjava.util.*;//注意类名必须为Main,不要有任何package众远智慧离谱电话面2月底投的写完了笔试，
MYSQL学习笔记(五)：单行函数(字符串、数学、日期时间、条件判断、信息、加密、进制转换函数)讲解羊小猪~~ MYSQL mysql 学习笔记 sql 数据库考研后端
前言：学习和使用数据库可以说是程序员必须具备能力，这里将更新关于MYSQL的使用讲解，大概应该会更新30篇+，涵盖入门、进阶、高级(一些原理分析);这一篇是讲解单行函数，当然mysql函数很多哈，只有多用才能记得住；这些函数，如果不用，记得再牢都会忘记(我是这样的)，但是可以先看一下，动手打一下，会现用现查即可，而且现在AI这么发达不是么；虽然MYSQL命令很多，但是自己去多敲一点，到后面忘记了，
生数科技携手央视新闻《文博日历》，推动AI视频技术的创新应用 TMT星球人工智能人工智能科技大数据
近日，生数科技携手央视新闻《文博日历》栏目，借助其旗下AI视频大模型及应用产品Vidu，共同打造AI版2025年文博日历联欢晚会，全面推动AI视频生成技术在媒体中的创新实践。《文博日历》是央视新闻客户端联合各大博物馆推出的文博科普产品，以新媒体形式为观众呈现丰富多彩的文博知识和历史文化。据「TMT星球」了解，此次合作中，生数科技为《文博日历》量身定制了AI视频生成方案，让文物们“动”起来，共同出演
Scala语言的循环实现 Code侠客行包罗万象 golang 开发语言后端
Scala语言的循环实现在编程中，循环是一个非常重要的概念，它允许我们重复执行某些代码块。Scala作为一种现代化的编程语言，融合了函数式编程和面向对象编程的特点，提供了多种方式来实现循环。在本文中，我们将深入探讨Scala中的循环实现，包括基本的循环结构、使用集合与高阶函数、以及如何利用递归来实现循环。一、基础循环结构Scala提供了几种基础的循环结构，包括for循环、while循环和dowhi
天天AI-20250121：全面解读 AI 实践课程：动手学大模型（含PDF课件） AI2AGI 天天AI 人工智能大数据 ai 文心一言百度
2AGI.NET|探索AI无限潜力，2AGI为您带来最前沿资讯。2AGI.NET：天天AI-20250121从开源版o1模型的发布到Adobe推出音乐模型DITTO-2，再到OpenAI为研究长寿推出的GPT-4b，AI技术正以前所未有的速度和规模影响着我们的世界。本文将为您梳理近期的技术热点，带您一探究竟。全面解读AI实践课程：动手学大模型（含PDF课件）该教程内容较为专业，理解起来有一定难度，
AI界的拼多多-中国人工智能初创公司DeepSeek如何与硅谷巨头竞争 xidianjiapei001 AI-人工智能与大模型人工智能 AI DeepSeek 大模型
这家公司打造出了一款成本更低且颇具竞争力的聊天机器人，其使用的高端计算机芯片数量少于谷歌和OpenAI等美国巨头企业，这凸显出芯片出口管制的局限性。圣诞节次日，一家名为DeepSeek的中国小型初创公司推出了一款新的人工智能系统，其性能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。仅此一点就堪称一个里程碑。但这个名为DeepSeek-V3系统的研发团队称，他们迈出了更大的一步。在一篇解释该技
SpringBoot3+Vue3+NaiveUI博客后台管理系统源码 | 小蚂蚁云小蚂蚁开源后端 vue 架构低代码
项目介绍基于SpringBoot3、SpringSecurity、MybatisPlus、Vue3、TypeScript、Vite、NaiveUI、MySQL等技术栈实现的单体前后端分离后台管理系统；后端基于Java语言采用SpringBoot3、SpringSecurity、MybatisPlus、MySQL等主流技术栈，前端基于Vue3、TypeScript、Vite等技术栈实现，采用Naiv
将josn字符串解析成实体努力，别失业 C#动态解析JSON json modal
dynamic_modal=Newtonsoft.Json.Linq.JToken.Parse(_json_data)asdynamic;将json字符_json_data动态解析成实体_modal,可以直接取_modal的属性字体。JsonResultResult=(JsonResult)Pay("","","","");varjsonStr=Newtonsoft.Json.JsonConver
学习AI职场应用技能的意义 Mieux718 学习人工智能
在智能化浪潮下，“人工智能+”通识必修课的普及，其核心并非在于培养人工智能领域的专家，而是旨在构建全民AI素养的基石。学习AI是可以让学生借助其技术力量，为各自的专业领域插上创新的翅膀。除了高校外，越来越多的企业也开始关注AI对企业业务的帮助，职场中掌握AI也变得越来越重要。随着人工智能技术的发展，许多行业都在引入相关技术和应用，人工智能应用场景已深度融入办公流程、项目管理、项目运营、客户服务等工
python批量转化pdf图片为jpg图片不懂python不懂R python python pdf
1.把pdf图片批量转为jpg；需要注意的是，需要先安装poppler这个软件，具体安装教程放在下面代码中了2.代码#poppler安装教程参考：https://blog.csdn.net/wy01415/article/details/110257130#windows上poppler下载链接：https://github.com/oschwartz10612/poppler-windowsfr
想转行到人工智能领域，我该学什么，怎么学？张登杰踩人工智能 python
转行到人工智能（AI）领域需要系统的学习和实践，以下是详细的路径建议，涵盖基础知识、技能学习、项目实践和求职准备：一、明确目标和领域方向人工智能领域广泛，建议先了解细分方向（如机器学习、深度学习、计算机视觉、自然语言处理、强化学习等），结合兴趣和职业规划选择切入点。二、构建基础知识1.数学基础线性代数：矩阵运算、特征值、向量空间。微积分：导数、梯度、优化理论。概率与统计：贝叶斯定理、分布、假设检验
tensorlow中tensorboard可视化展示训练过程张登杰踩 tensorflow tensorboard tensorflow mnist 神经网络
importtensorflowastffromtensorflow.examples.tutorials.mnistimportinput_datamax_steps=1000#训练步数learning_rate=0.001#设置学习率dropout=0.9#神经元保留比例data_dir='./MNIST_data'#数据存放路径#minist数据集下载链接:https://pan.baidu
Anaconda 安装以及命令总结文档张登杰踩人工智能 conda python 人工智能 pytorch
以下是一份详细的Anaconda命令总结文档，涵盖环境管理、包管理、配置、常用工具等核心操作：Anaconda命令总结1.安装与更新命令说明conda--version查看Conda版本condaupdatenumpy更新numpy自身condaupdateanaconda更新Anaconda元包（包括大部分科学计算库）condainstallnumpy=安装指定版本的numpy2.环境管理创建与
基于Langchain框架，采用Qwen2.5大模型，搭建自己的Agent，ReACT效果比RAG好张登杰踩 langchain python 人工智能语言模型
最近在做RAG，调研后发现ReACT好像更具有说服力，对最终结果的解释也更加合理。举个例子，我扔给大模型这样一个问题：15的平方是多少？另外，法国的首都是哪里？采用ReACT的运行结果如下：>EnteringnewAgentExecutorchain...我需要先计算15的平方，然后搜索法国的首都。Action:平方计算器ActionInput:"15"Observation:15的平方等于225
python程序中调用openai接口 MEMORYLORRY gpt openai gpt 人工智能机器学习 python transformer
调用openai接口1.openai例子（国内访问）2.解决思路3.搭建nginx3.1创建OpenSSL创建证书3.2nginx配置3.3验证效果4.python调用5.SSL:certificate_verify_failed错误1.openai例子（国内访问）fromopenaiimportOpenAIAPI_KEY='sk-api-key'client=OpenAI(api_key=API
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen