松子茶

PCA-SIFT:一个更鲜明地局部图像描述符

本节主要对论文《PCA-SIFT: A More Distinctive Representation for Local Image　Descriptors》中，前5部分进行Transtion.

========================TRANS.===================================

摘要

稳定的局部特征检测和描述是很多图像配准和对象识别算法的基本组成部分。Mikolajczyk和Schmid[14]近日评估了不同方法并鉴定SIFT[11]算法是最耐久的一般图像变形算法。本文研究和提高SIFT使用的局部图像描述符。如同SIFT，我们的描述符编码了特征点附近图像梯度的突出方面；然而，代替使用SIFT的平滑加权直方图，我们应用主成分分析(PCA)为标准化梯度斑块。我们的实验证明基于PCA的局部描述符更出众，图像变形更强健，也比标准SIFT表达法更简洁。我们也有结果显示使用这些描述符在图像检索应用结果是精确度提高和更快匹配。

介绍

局部描述符[6,12,18]通常使用在许多实际的应用，如目标识别[3,11]和图像检索[13]因为他们计算效率高，耐局部阻塞，对检视点的改变相对不敏感。在这些应用中使用局部描述符有两个考量。第一，我们必须在位置和尺度上局部化兴趣点。通常，兴趣点在尺度空间搜索中被放置在局部峰值，并过滤保护只有在变形中可能保持稳定的。第二，我们必须建立一个对兴趣点的描述；最理想的状态是，这些描述应该独特（可靠从其他兴趣点中区别出特定兴趣点），简洁，并且变形中的不变式由摄像机姿势和光线决定。虽然定位和描述方面的兴趣点算法经常设计在一起，这两个问题的解决是独立的[14]。本文集中探讨第二个问题的方法:解释和评价局部描述符的表示.

Mikolajczyk和Schmid[14]提出一个针对个别局部描述符的比较研究，包括过滤器驱动[4] ，微分不变[9]，矩不变量[18]，复杂的滤波器[16]，SIFT[11]，和不同类型兴趣点的互相关[6,13]。他们的实验显示不同算法的精确度排名.相对不敏感，该方法采用在图像中找到兴趣点但是依赖于表征用于在兴趣点附近模型图像斑块。因为他们最匹配结果通过使用 SIFT 描述符获得，本文集中探讨算法和探索选择他的局部描述符表征。

本文接下来内容组织如下。第2节,主要是回顾SIFT算法相关方面。第3节,详细说明我们基于PCA对局部特征的表征(PCA-SIFT)。第4节,提出了我们的评估方法和性能指标。第5节,提供详细的实验结果比较PCA-SIFT和标准SIFT在特征匹配实验和在图像检索应用的情况下。第6节,研究PCA-SIFT准确性背后的原因通过探索不同部件在表征中的角色。最后一节简要说明了本文的贡献。

回顾SIFT算法

SIFT，在论文[12]中描述，由四个主要阶段：(1)尺度空间峰值选择；(2)局部关键点；(3)方向分配；(4)关键点描述符。在第一阶段，是通过扫描图像确定潜在兴趣点的位置和尺度。这是通过构造高斯金字塔和搜索局部峰值(称为关键点)在一系列高斯差分(DoG)图像有效实施。在第二阶段，候选关键点是基于像素准确性和如果被发现不稳定则淘汰。第三识别每个基于局部图像斑块的关键点的主导方向。方向分配，每个关键点的位置和尺度使得SIFT为关键点构造针对相似变形不变式的规范视图。最后阶段为每个关键点建立一个局部图像描述符，基于在它附近的图像梯度(下面更详细讨论)。前三个阶级，本文中不会深入讨论，因为我们的工作对这些领域没有贡献。

SIFT算法的最后(关键点描述符)阶段为每个关键点建立基于在其附近的斑块像素的表示法。注意斑块是预先围绕关键点位置，在主导方向的基础上旋转并取适当大小。目标是为紧凑的斑块创造一个描述符，高度独特(即，来源于不同关键点地图的斑块的不同表达法)而变化的强劲照明和摄像机视点(即，相同的关键点在不同图像地图中相似的表达法)。如[12]讨论，明显的方法像是归一化相关在图像斑块因为他们在登记错误上过分敏感而不工作和软性变形之间。SIFT使用的标准关键点描述符通过抽样数量和图像在关键点周围斑块的梯度朝向创建，并建立平滑方向直方图来捕获斑块的重要相位。一个4×4阵列直方图，每个有8个导向筒，抓住了粗糙的空间结构的斑块。然后把这 128个元素向量规范到单位长度并设定阈值来删除值小的元素。

标准SIFT关键点描述符表示法是在一些方面值得注意：(1)这个表示法精心设计以避免边界效应——位置上的连续变化——产生问题，方向和尺度不会引起特征矢量的彻底变化；(2)它相当紧凑，用128个元素向量表达这个斑块像素(3)虽然没有明确的不变式来仿射变换，这个表示法对变形有惊人的弹性例如透视效果。这些特性证明了它是具有极好的匹配性能竞争性算法[14]。

另一方面，标准SIFT特征矢量的结构复杂难懂，在其特殊设计（在[12]中给出）背后的选择不明确。我们最初的目标是探索更简单的代替案并以经验为主评估权衡。然而，在本文剩余部分的讨论中，我们发现我们的替代表示法是理论上比标准SIFT描述符更简单，更简洁，更快也更准确。为了保证我们的结果是对事实的准确反映，我们用原始的SIFT源代码并在第四阶段限制我们的改变。

基于PCA的SIFT描述符

我们的对局部描述符的算法(称为 PCA-SIFT)接受与标准SIFT描述符相同的输入：子像素位置，尺度，和关键点的主导方向。我们在给出的尺度上提取一个41×41的斑块，围绕关键点，旋转并对齐它的主导方向至规范方向。PCA-SIFT可以总结如下步骤：(1)前置计算一个特征空间来表示局部斑块的梯度图像；(2)给出一个斑块，计算图像梯度；(3)用特征空间投射梯度图像矢量导出紧凑的特征矢量。这个特征矢量比标准SIFT特征矢量在相当大的程度上更小，并可以用相同的匹配算法。两种特征矢量之间的欧几里德距离被用于确定两个特征矢量中哪个与不同图像中相同关键点符合。

主成分分析法(PCA)[7]是降低维度的标准技术，并被广泛应用于计算机视觉问题，包括特征选择(例如[5])，目标识别(例如[15])和人脸识别(例如[17])。虽然PCA有一些缺点[8,10]，例如它对高斯分布的隐含假定和它对正交线性组合的限制，它的广为流行归因于它的简单。在图像斑块应用PCA的想法不是痴人说梦(例如[3])。我们的贡献在于严格证明PCA很适合表现关键点斑块（一旦它们被转化为规范尺度，位置和方向），并且这个表示法在相当大的程度上提高了SIFT的匹配性能。PCA-SIFT 将在以下段落详细说明。

offline斑块特征空间的计算

PCA 是我们能够线性投射高维采样到低维特征空间。对于我们的应用，这种投射（斑块特征空间编码）能前置计算一次存储。

如上所述，输入矢量是由串联围绕关键点的41×41的斑块的水平和垂直梯度的地图创建的。因此，输入矢量有2×39×39=3042个元素。然后我们规范化矢量至单位大小以最小化照度变化的影响。重要的需注意的是，这41×41的斑块并不是跨越整个像素值空间的，也不是较小的从自然图像中提取的流形斑块；它由严肃制约的经由SIFT的前三个阶段得到的斑块集合组成。更准确的说，每个斑块都满足以下性质：（1）集中于尺度空间的局部极大值；（2）旋转至主导梯度方向垂直对齐；（3）只包含适用于关键点的尺度信息——即，这41×41的斑块可能由原始图像中更大的区域创建。输入矢量中剩余变量主要归因于关键点的特性（即，3D场景与位置相应）或与模型不符的失真（例如摄像机视点变化引起的透视影响）。相信这些剩余变量能用低维高斯分布合理建模是不合理的，使得PCA能准确用精简特征表示法表现他们。更重要的是，在低维空间凸出梯度斑块似乎在丢弃其他影响造成的扭曲诱导时保持同一相关变量。这种假设在第4和第6节的实验数据中被证明。

为了建立我们的特征空间，前三个阶段我们在不同集合的图像中运行SIFT算法并收集了21，000个斑块。每个都被处理成如上描述创建一个3042个元素的矢量，PCA被用于这些矢量的协方差矩阵。这个矩阵由前n个特征向量组成，并保存在磁盘中作为PCA-SIFT的投影矩阵被使用。用于建立特征空间的图像被丢弃且不用于任何匹配实验。

特征表示

为了找到给定图像斑块的特征矢量，我们简单建立它的3042元素规范化图像梯度矢量并投射到我们用来保存特征空间的特征空间。我们根据经验决定特征空间的最优维度，n；本文中描述的大多结果使用n=20（第六节讨论n对性能的影响）。标准SIFT表示法采用128元素矢量；采用PCA-SIFT有显著的空间效益。

如上所述，我们用两种特征矢量间的欧几里德距离来决定哪个属于不同图像的相同关键点。二值化此距离生成一个二元判定，并调整阈值使能够在假阳性和假阴性中选择适当变换。

评估Evaluation

首先，我们讨论用于量化结果的评估指标。然后概述实验步骤并讨论产生结果数据的原因。结果在第5节中提供。

评估指标

接收机工作特性(ROC)和召回率-精确度在文献中都是流行指标，有时交替使用。两者都能捕获我们想要增长的真阳性数目并极小化假阳性数目；然而，指标间微妙的不同应该由一个接一个具体场景的选择支配。如[2]所述，前者适合评估分析器，因为错误检出率是定义明确的；后者适用评估检测器，因为错误数量检测相对于总数检测用1−precision表达即使总数负数不能判定。

以下[14]，我们选择测量SIFT局部描述符表示法的性能在一个关键点匹配问题上。定义如下:给出一个兴趣点在一个图像中，在数据集中找出所有兴趣点配对。显然，这是一个检测而不是一个分类表任务(负数总数不是定义明确的)，因此适当度量是召回-精度。因此，尽管[14]使用ROC曲线，本文提供recallvs.1−precision图表。这些图表产生如下。所有图像的关键点在数据集中被定义(用SIFT算法的初始阶段)。成对的来自不同图像的关键点被检测。如果特征矢量之间的欧几里德距离对于一对特定关键点降到适当阈值一下，就把这一对成为一个配对。一个真阳性是一个两个关键点相当于相同物理位置的配对(通过地面真值确定为任一示踪图像，或用已知图像变形来合成图像变形测试)。一个假阳性是一个两个关键点来自不同物理位置的配对。阳性的总数对于给定数据集是先验的。从这些数字，我们可以决定recall和1−precision:

和

我们通过对每个算法变换阈值生成recallvs.1−precision图表。

实验计划

我们执行三个主要类型的实验来探索标准SIFT表示法和PCA-SIFT之间的不同。第一个类型检查每个描述符的稳健性（综合产生）增噪影响，在照度和图像变形应用上改变。我们搜集图像数据集并引用以下变形至每个图像：（1）高斯噪声(σ=0。05)，图像强度范围为0至1；（2）旋转45◦后缩放50%；（3）强度缩放50%；（4）投影弯曲等于视角改变约30◦。

三种描述符通过这些实验评估：（1）标准SIFT特征表示法(表示为“SIFT”)；（2）PCA-SIFT(n=20)如第3节中描述，在特征空间模拟局部梯度的地方(表示为“Grad PCA 20”)；（3）不同的PCA-SIFT在特征空间直接模拟局部图像斑块而不是局部梯度(表示为“Img PCA 20”)。对于（3），我们采用标准强度归一化技术减去平均值并缩放至单位方差；没有这一步，（3）中结果会更糟。第二种类型评估了描述符在真实图像摄于不同视点，例如INRIAMOVI Graffiti数据集[1]。第三种类型涉及整合SIFT和PCA-SIFT至一个图像检索应用。附加实验以调查关键点位置错误，PCA部件数，间隔度量的选择的影响，在第6节给出。

产生基础真实数据

我们运行SIFT的初始阶段在每个图像来确定关键点。目的是获得每部分图像一系列正确关键点配对。SIFT算法为每幅图产生成百上千的关键点，手动识别配对这个大数据集极端费时和容易出错。所幸，知道两图之间的映像使得我们能自动解决匹配问题。实验涉及合成目标图像,这些图像变形是已知推演的。实验涉及Graffiti数据集，两种匹配场景间的变形(表示成矩形)是给定的。我们使用如下信息。

Ti,j是绘制图像i中点到图像j对应点的变形。第一个图像中的一个兴趣点，绘制到第二幅图像中。理想状态下，期望匹配兴趣点到第二幅图Pj=Pi旁边。实际上，我们考虑到如果和在空间和尺度上十分接近时配对有效。两个点如果间距小于σ像素则被认为是在空间上十分接近，是用于生成DoG函数的高斯标准差。如果尺度在彼此内则被认为在尺度上十分接近。

结果Results

这一节提供比较PCA-SIFT与标准SIFT表示法在可控实验的结果，Graffiti数据集，和一个图像的检索任务。

控制转变

图1是显示出第一套匹配实验的结果，图像在可控条件下失真变形(图1:SIFT vs. PCA-SIFT图像在可控条件下变形或毁坏时的配对任务(a)目标图像被高斯噪声毁坏(强度范围σ=0.05)。(b)目标图像旋转45◦缩放50%。(c)目标图像投影弯曲来模拟视点改变30◦。(d)目标图像亮度减低50%。注意Recall轴从0.9开始，因为所有方法在此任务执行最好)。

图1a显示PCA-SIFT对于几乎所有1−precision在处理带噪图像上明显更好，PCA-SIFT(在梯度地图)支配局部图像斑块PCA表示法。标准SIFT表示法胜过PCA-SIFT只在极高假阳性比例能接受的情况下。这些结果并不令人惊讶因为PCA提供优秀的在高斯噪声影响下的重建。我们下个实验检测几何变换的影响。

图1b绘制了一个目标图像旋转45◦并缩放50%的实验结果。而图1c显示目标被扭曲以一个30◦平面外旋转相应的透视变形后的匹配。然而这些表示法中没有一个是特别适合这个任务的，PCA-SIFT显然优于其他两个算法。

图1d显示所有表示法都适合捕捉照度的简单变化（注意recall轴已经放大和偏移来强调不同）。仔细看，我们能看到标准SIFT表示法在大部分定义域稍好于PCA-SIFT。然而，考虑到所有算法显示召回率高于95%，这就没什么意义了。

INRIA Graffiti数据集

INRIA Graffiti[1]数据集包含取自不同摄像机视点的涂鸦覆盖墙图像。因为场景是二维的，图像之间的变形能被作为2D平面矩阵（在数据集中给出）建模我们的目标是配对不同图像之间的关键点。图2 显示两种算法在Graffiti6数据集中的配对性能。尽管绝对召回率相当低归因于投射扭曲的高地位，PCA-SIFT显然占优势。在真实世界的应用中高精度中低召回率是可接受的。例如，PCA-SIFT在1−precision为20%时，recall为5%；我们在图像中找出约1000个关键点，其中50个是可靠配对。这个可靠配对的数目足够应用于例如图像检索。

图像检索应用

我们整合SIFT和PCA-SIFT至一个图像检索应用用于取自不同视点的真实世界场景。不像Graffiti数据集，这些场景不是二维的，包含遮挡和反射表面。

使用SIFT的图像检索用公式表示如下。给出两幅图像，我们先提取相应特征矢量。对于每幅图像的每个特征矢量，我们对比其他图像的特征矢量并计算阈值范围内的特征数量。我们探讨作为图像间相似点的匹配数量。

在实验中，我们选择一个小的有30个图像（10个普通日常项目，摄于不同视点）的数据集。每幅图像都在数据库中用作查询。如果相应对象中另两幅都回到前三位，这个算法被获得2 pionts。如果相应对象中，只有一幅回到前三位，这个算法被获得1 point,否则，这个算法无法获得point.然后，对其得point分数除以60(正确匹配的总数)和在表1中给出。其中所述阈值距离为每个算法进行了调整，以提供最好的结果(SIFT阈值:141 ; PCA- SIFT阈值:2200)，在实践中，比较大地阈值比较好些，结果表明，PCA- SIFT的匹配精度的关键点水平也转化为更好的检索结果。

图3是SIFT应用于二个不同地具有挑战性的场景。设置阈值每个算法有10 matches.PCA- SIFT明显主导在这些实验中的标准表示。特别是后者似乎得到由多个物体的边缘相混淆。

图4是为详细了解本示例的关键点之一。潜在的匹配列于每种算法排名顺序。该标准表示率的正确匹配在第三的位置，而PCA-SIFT正确位列第一。

表2比较SIFT与PCA-SIFT之间的运行时间。大约2200兴趣点的图像的特征提取。第一row是localize的兴趣点（常见的两种算法）所需的时间。在第二和第三row表示来计算描述符表示所需的时间。我们观察到来计算表示所需要的时间是相当。该表的下部显示，PCA-SIFT是显著快于匹配阶段，PCA-SIFT(N=20)只需要1/3的时间做2.4 million 点比较.

关于Image Engineering & Computer Vision的更多讨论与交流，敬请关注本博客和新浪微博songzi_tea.

图像检索简介 handsomestWei AI 图像处理人工智能
图像检索主要分为两类，一类是基于文本的图像检索（TextBasedImageRetrieval），另一类是基于内容的图像检索（ContentBasedImageRetrieval）基于文本通过对图像进行文本描述（对内容分析进行自动标注和人工标注），提炼关键词等标签信息。后续在进行检索时，可以通过检索关键词的方式查找对应的图片。基于内容以图搜图。涉及图像特征提取、相似度计算、特征数据库存储和搜索。图
YOLOv10-1.1部分代码阅读笔记-loaders.py 红色的山茶花 YOLO 笔记深度学习
loaders.pyultralytics\data\loaders.py目录loaders.py1.所需的库和模块2.classSourceTypes:3.classLoadStreams:4.classLoadScreenshots:5.classLoadImagesAndVideos:6.classLoadPilAndNumpy:7.classLoadTensor:8.defautocast
使用QT+OpenCV+C++完成一个简单的图像处理工具 17´ 机器视觉 Qt c++qt opencv c++图像处理
目录前言初始化UI界面qss样式表优化界面QImage和Mat的类型转换按钮功能实现读取图像处理图像保存图像最终效果前言本项目在QtCreator中编写，使用qmake来配置OpenCV库，具体配置方法请看这篇文章从0到机器视觉工程师（六）:配置OpenCV和Qt环境-CSDN博客，UI界面使用代码的形式书写。接下来，让我们一起来完成这个项目吧。初始化UI界面代码boolMainWindow::I
4.opencv函数--cv2.findContours xf8964 openCV openCV python findContours
该函数是查找图片轮廓，函数接收二值图片，函数原型cv2.findContours(image,mode,method,contours=None,hierarchy=None,offset=None)参数说明：image：原图mode：轮廓的检索模式，有四种，常用的是cv2.RETR_EXTERNAL枚举说明cv2.RETR_EXTERNAL表示只检测外轮廓cv2.RETR_LIST检测的轮廓不建
matlab实现一个雷达信号处理的程序，涉及到对原始图像的模拟、加权、加噪以及通过迭代算法对图像进行恢复和优化处理 max500600 MATLAB 算法算法 matlab 信号处理
clcclearcloseallloadscene3.mat%加载原始图像，自己设计设计为一个300*400的矩阵300是距离向长度，400是方位向长度Map_ori=scene3;[M,N_K]=size(Map_ori);figureimagesc(scene3)v=100;%机载速度，单位m/sbandwidth=30*1e6;%信号带宽，决定距离分辨率，单位Hzc=3*1e8;%光速R_R
matlab代码实现了一个基于 SVM（支持向量机）的图像分割系统 go5463158465 MATLAB专栏算法深度学习 matlab 支持向量机开发语言
clear;clc;main();%1.数据加载和预处理function[features,labels]=prepareData(imageFolder)%获取所有图像和JSON文件imgFiles
图像生成大模型：Imagen 详解转角再相遇 imagen python 深度学习计算机视觉
近年来，图像生成技术取得了显著进展，推动了计算机视觉和生成对抗网络（GAN）等领域的发展。Imagen是一个新兴的图像生成大模型，其在生成高质量、逼真图像方面表现出色。本文将详细讲解Imagen的基本原理、架构、训练流程及应用场景。1.Imagen的基本原理1.1什么是Imagen？Imagen是一种基于深度学习的图像生成模型，结合了自注意力机制（Self-attentionMechanism）和
像素空间文生图之Imagen原理详解 funNLPer AI算法 Imagen stable diffusion AIGC
论文：PhotorealisticText-to-ImageDiffusionModelswithDeepLanguageUnderstanding项目地址：https://imagen.research.google/代码（非官方）：https://github.com/deep-floyd/IF模型权重：https://huggingface.co/DeepFloyd/IF-I-XL-v1.0
docker buildx 构建arm64架构镜像_docker buildx 创建arm镜像蓉城垡程序员 docker 架构容器
参考：Buildmulti-platformimages安装dockerrun--privileged--rmtonistiigi/binfmt--installall创建builderdockerbuildxcreate--use--namemybuilddefault构建镜像使用go语言为例子，参考这位大佬博客：cat>hello.goDockerfile<
Imagen架构详解：理解其背后的技术与创新范范0825 Imagen 架构
Imagen架构详解：理解其背后的技术与创新引言近年来，生成式人工智能技术取得了飞速发展，特别是在图像生成领域。作为这一领域的重要创新之一，Imagen是由谷歌开发的一种基于文本生成图像的模型。它在生成高质量、逼真的图像方面表现出色，并通过其先进的架构和技术手段推动了图像生成的技术进步。Imagen不仅在图像生成质量上具有显著优势，还能够通过自然语言描述生成细致复杂的图像。本文将详细剖析Image
flutter 装饰类【BoxDecoration】飞川001 Fluttter flutter dart android-studio
装饰类BoxDecorationBoxDecoration是Flutter中用于控制Container等组件外观的装饰类，它提供了丰富的属性来设置背景、边框、圆角、阴影等样式。BoxDecoration的主要属性1.color背景颜色。类型：Color?示例：color:Colors.blue,2.image背景图片。类型：DecorationImage?示例：image:DecorationIm
【Block总结】CDFA，对比驱动特征聚合模块|即插即用，极大增强特征表达！ AI浩 Block总结计算机视觉深度学习目标检测
论文信息标题:ConDSeg:AGeneralMedicalImageSegmentationFrameworkviaContrast-DrivenFeatureEnhancement作者:MengqiLei,HaochenWu,XinhuaLv,XinWang机构:中国地质大学（武汉），百度公司发表时间:2024年12月11日会议:AAAI2025论文:https://arxiv.org/pdf
matlab代码实现了对一幅沥青路面图像（可替换为其他图像）的处理，包括图像的读取、预处理（灰度化、对比度增强、低帽变换、滤波去噪等） pk_xz123456 MATLAB 算法 matlab 开发语言
%清除工作区和命令窗口clear;clc;closeall;%读取图像image_path='7876.jpg_wh860.jpg';%请将此路径替换为你的沥青路面图像的实际路径image1=imread(image_path);%图像预处理%1.灰度化image
Ubuntu20.04上安装Docker的两种方法，含最新国内镜像网址 docker教程linux
docker提供了容器化技术，可以将应用程序及其所有依赖项打包到一个容器中，免去配置环境的麻烦。方法一：通过apt安装sudoaptinstalldocker.io添加-y指令可实现自动化安装安装成功后，使用docker--version命令查看当前安装版本测试是否安装成功sudodockerrunhello-world可能报错：errorpullingimageconfiguration原因：无
人工智能OpenCV计算机视觉技术 yzx991013 OpenCV基础全集 opencv 计算机视觉人工智能
5.3cand可调节边缘检测完整代码：importcv2importnumpyasnp#载入图像，并处理可能的读取错误img_original=cv2.imread('./image/lena.jpg')ifimg_originalisNone:print("无法读取图像文件")raiseSystemExit#创建可调整大小的窗口cv2.namedWindow('Canny',cv2.WINDOW
element-ui上传图片组件封装风吹头皮凉前端 vue.js
//上传图片组件定义文件imageUpload=this.limit}">请上传大小不超过{{fileSize}}MB格式为{{fileType.join("/")}}的文件import{getToken}from"@/utils/auth";//接口apiimport{serviceApi}from"@/utils/serviceApi";exportdefault{props:{value:[
【cs.CV】25.1.14 arxiv更新速递 hinmer CV每日更新 arxiv chatgpt gpt 人工智能自然语言处理自动驾驶计算机视觉 ai
【cs.CV】25.1.14arxiv更新110篇—第1篇----=====Omni-RGPT:UnifyingImageandVideoRegion-levelUnderstandingviaTokenMarks关键词:计算机视觉,多模态大语言模型,区域级理解,TokenMark,视频理解链接1摘要:我们提出了Omni-RGPT，这是一种多模态大型语言模型，旨在促进图像和视频的区域级理解。为了在
避免检测:安卓模拟器/安卓虚拟机/root环境圣道寺日常使用 android
目录标题可选方案问题解决XposedInstallermagisk安装报错：Unabletodetecttargetimage如何避免模拟器被检测可选方案如果你想要避免某些安卓应用检测到你正在使用安卓虚拟机，你可以尝试以下方法。但请注意，这些操作可能违反了应用的使用条款，因此请在遵守相关法规和条款的前提下进行操作。修改虚拟机设备信息：一些应用会检查设备的制造商、型号等信息。你可以使用一些工具来修改
Android开发中图片处理 wayne214 android
图片优化：选择合适的图片格式：使用适当的图片格式（如PNG、JPEG或WebP）以获得最佳的图片质量和文件大小。通常，JPEG用于具有丰富颜色和细节的图片，PNG用于需要透明度的图片，而WebP则结合了JPEG和PNG的优点，且具有更小的文件大小。压缩图片：在不损失图像质量的前提下尽可能减小图像文件大小。可以使用AndroidStudio的ImageAssetStudio工具或在线工具（如Tiny
【Azure Redis 缓存】Azure Cache for Redis 是否记录具体读/写(Get/Set)或删除(Del)了哪些key呢？武昌库里写JAVA 面试题汇总与解析课程设计 spring boot layui 毕业设计 spring
问题描述在AzureRedis的门户活动日志中，可以查看到的是对于Redis资源本身的操作。但是对于客户端连接到Redis服务后，对服务所做出的读写，或删除操作，是否有日志可以查看到呢？Noalttextprovidedforthisimage问题回答Redis服务的日志中并不会记录客户端对于Redis服务本身所进行的每一次读写操作的日志，但是它会通过指标的形式来显示这一段时间Get/Set的统计
3DUnetCNN 项目常见问题解决方案魏纯漫
3DUnetCNN项目常见问题解决方案3DUnetCNNPytorch3DU-NetConvolutionNeuralNetwork(CNN)designedformedicalimagesegmentation项目地址:https://gitcode.com/gh_mirrors/3d/3DUnetCNN项目基础介绍3DUnetCNN是一个基于PyTorch的3DU-Net卷积神经网络（CNN）
3D U-Net CNN医学图像分割项目教程尤辰城Agatha
3DU-NetCNN医学图像分割项目教程3DUnetCNNPytorch3DU-NetConvolutionNeuralNetwork(CNN)designedformedicalimagesegmentation项目地址:https://gitcode.com/gh_mirrors/3d/3DUnetCNN1.项目介绍3DU-NetCNN是由Ellisdg开发的Python实现，专门用于医学图像
HarmonyOS Next应用开发——图像PixelMap变换
【高心星出品】图像变换图片处理指对PixelMap进行相关的操作，如获取图片信息、裁剪、缩放、偏移、旋转、翻转、设置透明度、读写像素数据等。图片处理主要包括图像变换、位图操作，本文介绍图像变换。图形裁剪//裁剪图片x，y为裁剪的起始坐标，size为裁剪的图片宽和高temp.cropSync({x:20,y:20,size:{width:this.imagewidth-20,height:this.
OpenCV基础学习 yzx991013 OpenCV基础全集学习
5.1开运算完整代码：importcv2importnumpyasnpdefcir():try:image=cv2.imread("./image/xingtai/cirrec.jpg")kernel=cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(11,11))src=cv2.morphologyEx(image,cv2.MORPH_OPEN,kerne
OpenCV实例应用 yzx991013 OpenCV基础全集 opencv 人工智能计算机视觉
5.0图像的腐蚀应用完整代码：importcv2importnumpyasnpdeferode():img=cv2.imread('./image/dige.png')kernel=np.ones((3,3),np.uint8)erosion=cv2.erode(img,kernel,iterations=1)erosion1=cv2.erode(img,kernel,iterations=2)r
opencv图像基础学习 yzx991013 OpenCV基础全集 opencv 人工智能计算机视觉
2.3图像的加密解密源码如下：importcv2importnumpyasnpimportmatplotlib.pyplotaspltdefpassImg():img=cv2.imread('./image/cat.jpg',0)h,w=img.shape#生成一个密码，加密key_img=np.random.randint(0,256,size=(h,w),dtype=np.uint8)img_
PyTorch机器学习与深度学习技术方法 Teacher.chenchong 机器学习 python 开发语言
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。Python基础知识串讲1、Python环境搭建（Python软件下载、安装与版本选择；PyCharm下载、安装；Python之HelloW
【OpenCV入门学习--python】绘图函数喜欢星星的田螺姑娘 OpenCV opencv python 学习
源代码：（查看教材《OpenCV-Python中文教程》段力辉译）importnumpyasnpimportcv2#Createablackimageimg=np.zeros((512,512,3),np.uint8)#将所有像素点的各通道数值赋0#其中“3”是三个通道的意思#np.zeros函数用于创建一个数值全为0的矩阵，np.ones用于创建一个数值全为1的矩阵#Drawadiagonalb
opencv基础学习 yzx991013 OpenCV基础全集 opencv 学习人工智能
3.3OTSU阈值代码：importcv2importnumpyasnpfrommatplotlibimportpyplotaspltimg=cv2.imread('./image/otus.png',0)#简单阈值ret1,th1=cv2.threshold(img,127,255,cv2.THRESH_BINARY)#二值化阈值ret2,th2=cv2.threshold(img,0,255,
OpenCV阈值 yzx991013 OpenCV基础全集 opencv 人工智能计算机视觉
3.1阈值代码：importcv2frommatplotlibimportpyplotasplt#读取图像img1=cv2.imread("./image/card10.png")#检查图像是否成功加载ifimg1isNone:print("Error:Imagenotfoundorunabletoread.")exit()#转换为灰度图gray=cv2.cvtColor(img1,cv2.COL
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST