gdengden

Metric Learning——度量学习

2018年04月10日 15:30:29 敲代码的quant 阅读数：1567 标签：度量学习metric learning机器学习聚类更多

个人分类：机器学习

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/FrankieHello/article/details/79872607

看到一篇知乎大神Flood Sung发表在CVPR2018上的paper，介绍了一种基于metric的模式识别方法，创新之处在于它不同于常用的matric-based方法，使用人为定义的度量，像简单的欧式距离、马氏距离，而是采用了用神经网络去训练这个度量，模型虽然简单，但是效果却很显著。

1、度量(Metric)

先说一下关于度量这个概念：在数学中，一个度量（或距离函数）是一个定义集合中元素之间距离的函数。一个具有度量的集合被称为度量空间。

2、度量学习的作用

度量学习也叫作相似度学习，根据这个叫法作用就很明确了。

之所以要进行度量学习，一方面在一些算法中需要依赖给定的度量：如Kmeans在进行聚类的时候就用到了欧式距离来计算样本点到中心的距离、KNN算法也用到了欧式距离等。这里计算的度量，就是比较样本点与中心点的相似度。

这里的度量学习在模式识别领域，尤其是在图像识别这方面，在比较两张图片是否是相同的物体，就通过比较两张图片的相似度，相似度大可能性就高。

因为在研究时间序列这方面的问题，所以想到了在时间序列中度量学习的体现，如果是判断两个区间的相似性，通常用到的度量方式就是采用常用到的欧式或者其他人为定义的距离函数，这样也就局限于了这样一个二维或者多维的空间中，而如果是用到Flood Sung大神提出的方法的话，我们把思路拓宽，能不能也是用神经网络来训练这个度量，这样的好处就是：

长度不同的片段也可以进行比较。
可以拓宽维度，从其他维度上寻找关联。

以下摘自：https://blog.csdn.net/nehemiah_li/article/details/44230053

3、常用到的度量学习方法

从广义上将度量学习分为：通过线性变换的度量学习和度量学习的非线性模型。

3.1线性变换的度量学习

线性的度量学习问题也称为马氏度量学习问题，可以分为监督的和非监督的学习算法。

3.1.1监督的全局度量学习

Information-theoretic metric learning(ITML)
Mahalanobis Metric Learning for Clustering(MMC)
Maximally Collapsing Metric Learning (MCML)

3.1.2监督的局部度量学习

Neighbourhood Components Analysis (NCA)
Large-Margin Nearest Neighbors (LMNN)
Relevant Component Analysis(RCA)
Local Linear Discriminative Analysis(Local LDA)

3.1.3非监督的度量学习

主成分分析(Pricipal Components Analysis, PCA)
多维尺度变换(Multi-dimensional Scaling, MDS)
非负矩阵分解(Non-negative Matrix Factorization,NMF)
独立成分分析(Independent components analysis, ICA)
邻域保持嵌入(Neighborhood Preserving Embedding,NPE)
局部保留投影(Locality Preserving Projections. LPP)

3.2度量学习的非线性模型

非线性降维算法可以看作属于非线性度量学习：

等距映射(Isometric Mapping,ISOMAP)
局部线性嵌入(Locally Linear Embedding, LLE)
拉普拉斯特征映射(Laplacian Eigenmap，LE )

通过核方法来对线性映射进行扩展：

Non-Mahalanobis Local Distance Functions
Mahalanobis Local Distance Functions
Metric Learning with Neural Networks

4、论文推荐

Distance metric learning with application to clustering with side-information
Information-theoretic metric learning(关于ITML)
Distance metric learning for large margin nearest neighbor classification(关于LMNN)
Learning the parts of objects by non-negative matrix factorization（Nature关于RCA的文章）
Neighbourhood components analysis(关于NCA)
Metric Learning by Collapsing Classes(关于MCML)
Distance metric learning a comprehensive survey(一篇经典的综述)

个人总结

想了一下，度量学习定位的话应该是最基础的部分。现在在用的无论是深度学习、强化学习还是神经网络或是监督学习，为了避免结果发散或者收敛结果好些，在使用前一般需要一个特征转换或者聚类的处理，在进行特征转换或者聚类时最基本的和最容易忽略的部分就是关于度量的学习，使用人为定义的方法必然有其局限性，那么通过神经网络或者其他方法是否效果会更好呢，将这个可以进一步研究。

《Discriminative Deep Metric Learning for Face Verification in the Wild》阅读记录

简介

度量学习（Metric Learning）也就是常说的相似度学习。如果需要计算两张图片之间的相似度，如何度量图片之间的相似度使得不同类别的图片相似度小而相同类别的图片相似度大（maximize the inter-class variations and minimize the intra-class variations）就是度量学习的目标。
例如如果我们的目标是识别人脸，那么就需要构建一个距离函数去强化合适的特征（如发色，脸型等）；而如果我们的目标是识别姿势，那么就需要构建一个捕获姿势相似度的距离函数。为了处理各种各样的特征相似度，我们可以在特定的任务通过选择合适的特征并手动构建距离函数。然而这种方法会需要很大的人工投入，也可能对数据的改变非常不鲁棒。度量学习作为一个理想的替代，可以根据不同的任务来自主学习出针对某个特定任务的度量距离函数。

conventional Mahalanobis distance metric learning

传统马氏距离度量学习是从训练集XX中寻找矩阵M∈Rd×dM∈Rd×d，计算两个样本x1x1,x2x2之间的马氏距离：

dM(xi,xj)=(xi−xj)TM(xi−xj)−−−−−−−−−−−−−−−−−√dM(xi,xj)=(xi−xj)TM(xi−xj)

由于MM为对称半正定矩阵，因此可以分解为：

M=WTWM=WTW

其中W∈Rp×d,p

dM(xi,xj)=(xi−xj)TWTW(xi−xj)−−−−−−−−−−−−−−−−−−−−√=∥Wxi−Wxj∥2dM(xi,xj)=(xi−xj)TWTW(xi−xj)=‖Wxi−Wxj‖2

根据上面公式可知传统的马氏距离度量学习是通过寻找一个线性转换将每一个样本xixi投影到低维子空间中（因为 p

discriminative deep metric learning (DDML)

由于传统方法用到的线性变换不能够捕捉面部图片所依赖的非线性流形（nonlinear manifold）

线性流型
几何空间的直线或平面具有性质：集合中任意2点生成的直线一定包含在这个集合里，即直线和平面是平和直的。把平和直的概念推广到高维就能得到线性流形的概念。

为了解决传统方法的限制，论文提到将样本投影到高维特征空间中，在高维空间中进行距离度量。

度量学习之论文参考

2018.07.24 22:53 142浏览

字号

一. 传统的距离度量学习方法：

监督方法

1.NIPS 2005(LMNN):Distance Metric Learning for Large Margin Nearest Neighbor Classification

1.1 AAAI 2017(LMNN的拓展):Parameter Free Large Margin Nearest Neighbor for Distance Metric Learning

2. Lecture Notes(FLD（LDA的一种)，必看）：Fisher Linear Discriminant Analysis(FLD)

2.1 NIPS 2003(MMC,解决了LDA样本少出现不可逆的问题)：Efficient and Robust Feature Extraction by Maximum Margin Criterion

2.2 CVPR 2007(ANMM，注意与LDA的关系以及与MMC,LMNN的区别联系):Feature Extraction by Maximizing the Average Neighborhood Margin

2.3 ICCV 2005(SNMMC，同样是解决LDA出现的四大问题，逐步的思想以及margin的设定很不错)：Face Recognition By Stepwise Nonparametric Margin Maximum Criterion

2.4 ECML 2004(MMDA,将分类器与数据降维特征提取结合,非常棒的发现):Margin Maximizing Discriminant Analysis

3.NIPS 2009(相似度学习（Similarity Learning），放弃了对称和半定的约束，但实验效果也不变差，建议看一下):An Online Algorithm for Large Scale Image Similarity Learning

无监督方法：

1.Lecture Notes(PCA，必看）:Principal Component Analysis(PCA)

二. 深度距离度量学习：

1.CVPR 2014: Discriminative Deep Metric Learning for Face Verification in the Wild

2.CVPR 2015(注意与1的区别与联系):Multi-Manifold Deep Metric Learning for Image Set Classification

3.CVPR 2016(最大化使用batch)Deep Metric Learning via Lifted Structured Feature Embedding

4.NIPS 2016(注意与3的区别)Improved Deep Metric Learning with Multi-class N-pair Loss Objective

三. 辅助论文学习（上述距离度量论文中涉及的内容）：

1.CVPR2016（近似近邻搜索）: FANNG: Fast Approximate Nearest Neighbour Graphs

基于深度学习的Person Re-ID（度量学习）

度量学习 是指 距离度量学习，Distance Metric Learning，简称为 DML，做过人脸识别的童鞋想必对这个概念不陌生，度量学习是Eric Xing在NIPS 2002提出。

这并不是个新词，说的直白一点，metric learning 是通过特征变换得到特征子空间，通过使用度量学习，让类似的目标距离更近（PULL），不同的目标距离更远（push），也就是说，度量学习需要得到目标的某些核心特征（特点），比如区分两个人，2只眼睛1个鼻子－这是共性，柳叶弯眉樱桃口－这是特点。

我们可以把度量学习分为两种，一种是基于监督学习的，另外一种是基于非监督学习的。

一. 监督学习

1）LDA Fisher线性判别

2）Local LDA

Local Linear Discriminative Analysis

3）RCA 相关成分分析

Relevant Component Analysis

4）LPP 局部保留投影

Locality Preserving Projection

5）LMNN 大间隔最近邻

Large-Margin Nearest Neighbors

6）LLE 局部线性嵌入

Locally linear embedding

监督学习的方法应用比较多，包括上一节我们讲到的基于CNN的特征提取都属于监督学习的范畴。

二. 非监督学习

严格说来，非监督的度量学习（主要是指降维方法）不算真正的度量学习，我们也把他们列出来，方便读者记忆：

1）主成分分析(Pricipal Components Analysis, PCA)

2）多维尺度变换(Multi-dimensional Scaling, MDS)

3）独立成分分析(Independent components analysis, ICA)

4）拉普拉斯特征映射（Laplacian Eigenmaps）

ok，就讲到这里，剩下的需要大家具体了解每一个方法，然后提出自己的新方法！

你可能感兴趣的:(计算机视觉)

基于深度学习YOLOv8的海洋动物检测系统（Python+PySide6界面+训练代码）深度学习&目标检测实战项目深度学习 YOLO python 目标检测人工智能开发语言
引言近年来，计算机视觉技术在各行各业中得到了广泛的应用，特别是在智能监控、自动驾驶、医疗诊断等领域。深度学习，尤其是卷积神经网络（CNN）的出现，极大地提高了计算机处理图像和视频的能力。在这一领域，YOLO（YouOnlyLookOnce）系列模型以其高效且准确的目标检测能力，成为了当下最为流行的深度学习模型之一。在海洋生物保护、海洋环境监测等应用中，快速识别和检测海洋动物种类对于科学研究和保护工
CVPR2024最佳论文出炉！历年CVPR最佳论文盘点（2000 年—2024 年）沃恩智慧深度学习人工智能 CVPR 人工智能论文阅读深度学习
cvpr2024最佳论文出炉，本次论文可谓是万里挑一。作为计算机视觉领域的顶级学术会议CVPR，每年评选出的一篇或多篇最佳论文，不仅为计算机视觉领域的顶级学术荣誉，更代表了将对未来技术或行业发展产生重要影响的里程碑式研究成果。为了帮助大家对这批计算机领域的重要论文进行复习，沃恩智慧为大家精心整理了一份从2000年—2024年的CVPR最佳论文盘点。需要的同学关注公众号【沃的顶会】，回复“CVPR”
详解AI作画算法原理 Jimaks 后端 AI python ai作画 python 人工智能
在艺术与科技的交汇处，AI作画正以惊人的创造力刷新着我们对美的认知。这一领域融合了深度学习、计算机视觉和生成模型的前沿技术，让机器能够“想象”并创作出令人惊叹的图像。本文将深入浅出地探讨AI作画的核心算法原理，分析常见问题与易错点，并通过一个简单的代码示例，带领大家一窥AI艺术创作的奥秘。一、核心概念与原理1.生成对抗网络（GANs）GANs是AI作画中最著名的算法之一，由IanGoodfello
【深入探讨 ResNet：解决深度神经网络训练问题的革命性架构】机器学习司猫白深度学习人工智能 resnet 神经网络残差
深入探讨ResNet：解决深度神经网络训练问题的革命性架构随着深度学习的快速发展，卷积神经网络（CNN）已经成为图像识别、目标检测等计算机视觉任务的主力军。然而，随着网络层数的增加，训练深层网络变得愈加困难，主要问题是“梯度消失”和“梯度爆炸”问题。幸运的是，ResNet（ResidualNetworks）通过引入“残差学习”概念，成功地解决了这些问题，极大地推动了深度学习的发展。本文将详细介绍R
cnn以及例子阿拉斯攀登机器学习 cnn 人工智能神经网络
cnnCNN即卷积神经网络（ConvolutionalNeuralNetwork），是一种专门为处理具有网格结构数据（如图像、音频）而设计的深度学习模型，在计算机视觉、语音识别等诸多领域都有广泛应用。以下是CNN的详细介绍：基本原理卷积层：是CNN的核心组成部分，通过卷积核在数据上滑动进行卷积操作，自动提取数据中的局部特征。例如，在处理图像时，卷积核可以检测图像中的边缘、线条等简单特征。卷积操作大
计算机视觉四大任务模型汇总 Zero_one_ws 《神经网络与深度学习》理论计算机视觉人工智能深度学习图像分类图像目标检测目标分割关键点检测
计算机视觉中有四大核心任务：1-分类任务、2-目标检测任务、3-目标分割任务和4-关键点检测任务文章1：一文读懂计算机视觉4大任务文章2：图像的目标分割任务：语义分割和实例分割不同任务之间相关但不完全相同，因此不同的任务最好选择相应的模型，话不多说，看表：（注：表中github链接并不一定是模型的正式版本，只是本文用于展示模型的网络结构和应用）1-分类任务模型序号模型ipynb模型的github链
计算机视觉（Computer Vision，CV）四大基本任务--分类、检测、定位、分割明月光舞计算机视觉计算机视觉目标检测深度学习
文章目录前言一、计算机视觉任务一：目标分类常用数据集常见网络结构二、计算机视觉任务二：目标定位三、计算机视觉任务三：目标检测常用数据集常见网络结构四、计算机视觉任务四：目标分割常用数据集常见网络结构前言计算机视觉（ComputerVision，CV）是一门研究如何让机器具备“看”的能力的学科，以人或动物的视觉能力为参照，通过计算机对视觉数据（图像、视频等）的处理、学习、推理判断，复现出、模拟出甚至
计算机视觉核心任务飞瀑 AI yolo
1.计算机视频重要分类计算机视觉的重要任务可以大致分为以下几类：1.图像分类（ImageClassification）识别图像属于哪个类别，例如猫、狗、汽车等。应用场景：物品识别、人脸识别、医疗影像分类。代表模型：ResNet、EfficientNet、ViT（VisionTransformer）。2.目标检测（ObjectDetection）识别图像中目标的位置（边界框）及类别。应用场景：自动驾
COCO数据集是小果果蛋儿啊机器学习算法计算机视觉人工智能深度学习
官网地址：http://cocodataset.org/#downloadCOCO是一个大规模的物体检测、分割和描述数据集。COCO具有以下特点：物体分割上下文识别超像素材质分割33万张图片（超过20万张有标注）150万个物体实例80个物体类别91个材质类别每张图片有5个描述25万人的关键点COCO数据集是一个多用途的计算机视觉数据集，它支持多种任务，包括但不限于：物体检测（ObjectDetec
2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025) GSRA会务组房老师计算机视觉人工智能数据挖掘图像处理目标检测云计算语言模型
2025年计算机视觉研究进展与应用国际学术会议(ACVRA2025)2025InternationalConferenceonAdvancesinComputerVisionResearchandApplications重要信息2025年3月28-30日南京一轮截稿日期：2024年12月26日EI检索稳定早投稿，早审稿，早录用【会议简介】2025年计算机视觉研究进展与应用国际学术会议（ACVRA2
【学术投稿-2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025)】CSS样式解析：行内、内部与外部样式的区别与优先级分析禁默前端学术会议 css 前端
简介2025年计算机视觉研究进展与应用（ACVRA2025）将于2025年2月28-3月2日在中国广州召开，会议将汇聚世界各地的顶尖学者、研究人员和行业专家，聚焦计算机视觉领域的最新研究动态与应用成就。本次会议将探讨前沿技术，包括深度学习、多模态学习、图像和视频分析、3D重建等，以及其在智能交通、医疗影像、增强现实和自动化等多个实际应用中的创新转化。会议官网：www.acvra.org目录前言一、
位图的深入解析：从数据结构到图像处理与C++实现 Exhausted、机器学习计算机视觉人工智能图像处理 c++算法数据结构开发语言
在学习优选算法课程的时候，博主学习位运算了解到位运算的这个概念，之前没有接触过，就查找了相关的资料，丰富一下自身，当作课外知识来了解一下。位图（Bitmap）是一种用于表示图像的数据结构，它将图像分解为像素的二维网格，每个像素的颜色值存储在一个矩阵中。位图广泛应用于计算机图形学、图像处理和计算机视觉等领域。目录1.位图的基本概念1.1像素1.2分辨率1.3颜色深度2.位图的存储格式2.1BMP格式
计算机视觉国内外研究现状（综述）埃菲尔铁塔_CV算法计算机视觉
1.国内外研究进展1.2.1特征提取研究进展特征提取是图像处理的一个重要环节，是进行身份识别和行为识别的重要部分。近年来，针对不同特征的提取，国内外学者提出了许多特征提取算法，同样特征提取的效果大都不错。但是在复杂的猪舍环境中提取猪的特征还是比较困难的。下面针对几种目前常用的特征提取算法进行一些介绍。（1）传统的特征提取算法传统特征提取算法已经发展了很久，现阶段比较成熟，是深度学习算法出来之前研究
【深入探索-deepseek】高等数学与AI的因果关系我的青春不太冷人工智能机器学习数学
目录数学在AI不同领域的应用区别一、计算机视觉领域1.线性代数2.微积分3.概率论与统计二、自然语言处理领域三、语音识别领域四、数学在AI不同领域应用的逻辑图五、参考资料数学在AI不同领域的应用区别一、计算机视觉领域1.线性代数图像变换：想象我们有一张二维图片，图片里有个点，它的位置用坐标((x,y))表示。现在我们想把这个点绕着图片的原点（就像把纸钉在墙上，以钉子的位置为中心）逆时针旋转一定角度
图像分类与目标检测算法 BugNest AI 算法分类目标检测 ai 人工智能图像处理
在计算机视觉领域，图像分类与目标检测是两项至关重要的技术。它们通过对图像进行深入解析和理解，为各种应用场景提供了强大的支持。本文将详细介绍这两项技术的算法原理、技术进展以及当前的落地应用。一、图像分类算法图像分类是指将输入的图像划分为预定义的类别之一。这一过程的核心在于特征提取和分类器的设计。1.特征提取特征提取是图像分类的第一步，其目标是从图像中提取出能够区分不同类别的关键信息。传统的特征提取方
【鸿蒙在OpenHarmony系统上集成OpenCV，实现图片裁剪】萌虎不虎 OpenHarmony harmonyos opencv 华为
鸿蒙在OpenHarmony系统上集成OpenCV，实现图片裁剪OpenCV介绍OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。它由一系列的C函数和少量C++类构成，同时提供Python、Java和MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。OpenCV具有极广的应用领域，它包括但不限于：人脸识别和物
计算机视觉工业相机、镜头、接口、光源概览及选型参考坐望云起深度学习从入门到精通计算机视觉数码相机人工智能镜头接口数据接口镜头
一、相机1、分类按芯片类型分类：CCD相机、CMOS相机按传感器的结构特性分类：线阵相机、面阵相机按输出信号方式分类：模拟相机、数码相机按输出色彩方式分类：黑白相机、彩色相机2、重要参数芯片尺寸芯片尺寸表示图像传感器感光区域的面积大小，直接决定了整个系统的物理放大率。相机的芯片尺寸如图所示。分辨率分辨率表示每英寸包含的像素数。对于图像来说，分辨率是非常重要的，决定了图像是否能够清晰地呈现：相机的分
【人工智能】Python中的深度学习优化器：从SGD到Adam 蒙娜丽宁 Python杂谈人工智能人工智能 python 深度学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在深度学习模型的训练过程中，优化器起着至关重要的作用，它决定了模型的收敛速度以及最终的性能。本文将介绍深度学习中常用的优化器，从传统的随机梯度下降（SGD）到现代的自适应优化器（如Adam）。我们将深入探讨每种优化器的原理、优缺点，并通过Python实现
【人工智能】基于Python和OpenCV实现实时人脸识别系统：从基础到应用蒙娜丽宁 Python杂谈人工智能 python 开发语言
随着人工智能和计算机视觉的快速发展，人脸识别技术已广泛应用于监控、安全、社交媒体、金融和医疗等领域。本文将介绍如何利用Python和OpenCV库，结合dlib进行实时人脸识别的实现。通过构建一个基础的实时人脸识别系统，读者将深入了解人脸检测与识别的核心原理，掌握如何使用现有的计算机视觉工具快速开发一个有效的实时系统。本文将详细介绍如何通过OpenCV和dlib来实现人脸检测与识别，如何实时获取摄
【AI】人工智能没那么神秘！仇辉攻防人工智能 ai 语言模型自然语言处理机器学习深度学习网络安全
AI是什么？人工智能（ArtificialIntelligence），英文缩写为AI。AI人工智能不是简单的应用程序，而是一类技术，包含机器学习、自然语言处理、计算机视觉等多个领域。AI系统通常由算法、数据、模型和代码组成，其中代码用于实现算法，数据用于训练模型，最终形成智能决策能力。AI可以嵌入到应用程序中，但其本身是一个复杂的技术体系。AI为什么这么聪明？AI之所以看起来很聪明，主要是因为它通
双目立体视觉（1） 2501_90596733 双目立体视觉人工智能计算机视觉
1.背景计算机视觉技术，是以摄像头作为传感器来获取二维图像数据，并依靠计算机运用各类算法对这些图像数据展开处理。依据所采用视觉传感器数量的差异，可分为单目、双目以及多目视觉这几类。单目视觉依赖单摄像头获取二维平面图像，在知晓物体实际尺寸的前提下，结合相机成像模型能够计算出距离，但这种单一的2D图像在深度感知能力上存在局限，且较易受到动态背景的干扰，通常被应用于缺陷检测、目标识别等相关领域。多目视觉
深度学习练手小例子——cifar10数据集分类问题　☆cwlulu 深度学习分类人工智能
CIFAR-10是一个经典的计算机视觉数据集，广泛用于图像分类任务。它包含10个类别的60,000张彩色图像，每张图像的大小是32x32像素。数据集被分为50,000张训练图像和10,000张测试图像。每个类别包含6,000张图像，具体类别包括：飞机(airplane)汽车(automobile)鸟(bird)猫(cat)鹿(deer)狗(dog)青蛙(frog)马(horse)船(ship)卡车
DeepSeek计算机视觉（Computer Vision）基础与实践 Evaporator Core #DeepSeek快速入门计算机视觉计算机视觉人工智能
计算机视觉（ComputerVision）是人工智能领域的一个重要分支，专注于让计算机理解和处理图像和视频数据。计算机视觉技术广泛应用于图像分类、目标检测、图像分割、人脸识别等场景。DeepSeek提供了强大的工具和API，帮助我们高效地构建和训练计算机视觉模型。本文将详细介绍如何使用DeepSeek进行计算机视觉的基础与实践，并通过代码示例帮助你掌握这些技巧。1.计算机视觉的基本概念计算机视觉的
深度学习语义分割实战：ResNet 与 ViT 结合的模型解析高山仰星深度学习
1.引言语义分割是计算机视觉中的重要任务，其目标是将输入图像中的每个像素分类到特定的类别。本项目结合了ResNet（ResidualNetwork）和ViT（VisionTransformer），构建了高性能的语义分割模型。本文将详细解析该模型的架构、训练流程及其应用。2.语义分割模型解析本项目采用ResNet和ViT结合的方式进行语义分割，并使用CBAM注意力机制增强特征提取能力。涉及的核心文件
计算机视觉8：图像分割听说你还在搞什么原创～计算机视觉图像处理深度学习
1.图像分割概述图像分割主要分为阈值分割方法和边缘检测等方法。阈值分割方法是提出最早的一种方法。边缘检测方法是被研究的最多的一种分割方法，它试图通过检测包含不同区域的边缘来解决图像分割问题。比如微分算子边缘检测，以及为了降低噪声影响使用多尺度方法提取图像边缘。2.图像分割技术现状图像分割，是将一幅数字图像按照某种目的划分为两个或多个子图像区域。理想的图像分割算法，应该是对所有的图像都能够自动的划分
【2025版】最新AI大模型NLP全面解析，零基础入门到精通，收藏这篇就够了程序员二飞人工智能自然语言处理服务器学习知识图谱
近年来，随着深度学习技术的飞速发展，AI大模型作为人工智能领域的重要研究对象，正逐步成为学术界和产业界广泛关注的热点议题。AI大模型，作为一类具备庞大参数规模与卓越学习能力的神经网络模型，如BERT、GPT等，已在自然语言处理、计算机视觉等多个领域展现出卓越成效，极大地推动了相关领域的技术进步。前排提示，文末有大模型AGI-CSDN独家资料包哦！AI大模型的价值不仅体现于其庞大的参数规模与强大的学
轻量化网络模型调研报告云雨、网络人工智能深度学习
一、轻量化网络的为何诞生深度神经网络模型被广泛应用在图像分类、物体检测，目标跟踪等计算机视觉任务中，并取得了巨大成功。随着时代发展，人们更加关注深度神经网络的实际应用性能，人工智能技术的一个趋势是在边缘端平台上部署高性能的神经网络模型，并能在真实场景中实时(>30帧)运行，如移动端/嵌入式设备，这些平台的特点是内存资源少，处理器性能不高，功耗受限，这使得目前精度最高的模型根本无法在这些平台进行
探索计算机视觉的基石：PASCAL VOC 数据集卢姬铃Edric
探索计算机视觉的基石：PASCALVOC数据集1目标检测PASCALVOC数据集简介项目地址:https://gitcode.com/Resource-Bundle-Collection/dc7bf项目介绍PASCALVOC（PatternAnalysis,StatisticalModelingandComputationalLearningVisualObjectClasses）挑战赛是计算机视
Ada语言的人工智能赵旖琅包罗万象 golang 开发语言后端
Ada语言的人工智能引言在计算机科学和技术迅速发展的今天，人工智能（ArtificialIntelligence,AI）已成为各行各业的重要推动力。这一领域涵盖了机器学习、自然语言处理、计算机视觉等多个方面，而在这些技术的背后，一种历史悠久且极具实用性的编程语言——Ada，正逐渐引起人们的关注。尽管Ada语言并非时期内最为流行的语言，但它凭借其可靠性、安全性以及并发处理能力，愈发显示出在人工智能领
【自学笔记】AIGC基础知识点总览-持续更新 Long_poem 笔记 AIGC
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录AIGC基础知识点总览一、AIGC概述二、AIGC的核心要素三、AIGC的关键技术1.深度学习算法2.自然语言处理（NLP）3.计算机视觉（CV）4.多模态技术四、AIGC的应用领域五、AIGC的发展历程六、AIGC面临的挑战与未来展望七、知名AIGC产品与技术总结AIGC基础知识点总览一、AIGC概述定义：AIGC（AI-G
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他