乐心唯帅

基于内容的图像web检索系统

题目：基于内容的图像在线检索系统

简介：基于内容的图像在线检索系统（Content Based Online Image Retrieval , 以下简称 CBOIR），是计算机视觉领域中关注大规模数字图像内容检索的研究分支。典型的CBOIR系统，允许用户在线输入一张图像，在远程图像数据库中查找具有相同或相似内容的其它图片。
要求：本实训完成的系统要求实现基于视觉特征的在线图像检索。
该项目的实训内容主要包括：
1. 搭建一个Web系统，实现图像文件的在线提交、存储和检索结果展示。
2．系统调用基于特征工程方法的算法进程，算法能够利用颜色特征、纹理特征、形状特征及HOG\LBP\HARR等全局和局部特征实时从图像库中检索出和输入图像相同或相似的图像，结合机器学习的方法，计算图像相似度或直接进行图像类别分类，将结果显示在系统中。
3．系统调用基于深度学习方法的算法进程，通过搭建深度学习的网络对相似图像进行检索和分类，将结果显示在系统中。
4. 对于以上两类方法，各组（2-3人）分工完成，在线展示方法的横向和纵向比较，要求有丰富的实验设计和实验结果分析。

由于想挑战自己，故本次任务由本人独立完成，故可能有考虑不周的地方。

摘要

基于内容的图像在线检索系统（CBOIR）是一种用于大规模数字图像内容检索的研究分支。本实训旨在实现基于视觉特征的图像检索 Web 平台，要求实现的功能包括基于颜色信息、纹理特征、形状特征的图像检索。本文在以上全局特征、浮点特征的基础上，还使用了深度学习实现图像检索，并对检索方式进行拓广，实现了基于KDTree的数据结构进行高效查找，并对多种特征工程结果进行对比分析、不同神经网络之间的对比分析、特征工程和深度学习方式的结果进行对比分析。此外，系统还能在 Web 平台上进行图像展示。

关键词：CBOIR；颜色；纹理；形状；深度学习；KDTree；web

Abstract

Content Based Online Image Retrieval(CBIR) Web system is a research branch in the field of computer vision that focuses on large-scale digital image content retrieval. The objective of this project is to develop a web platform for image retrieval based on visual features. Specifically, the system aims to support image retrieval based on color information, texture features, and shape features. In addition to the aforementioned global and floating-point features, this paper also incorporates deep learning techniques for image retrieval. The retrieval methods are extended to include efficient search using a KD-Tree data structure. Comparative analysis is performed on the results of various feature engineering techniques, comparison between different neural networks, and the comparison of results between feature engineering and deep learning approaches. Moreover, the system provides image display functionality on the web platform.

Keywords: CBIR, color, texture, shape, deep learning, KD-Tree, web

实训目的与内容

基于内容的图像检索 Web 系统（Content Based Image Retrieval, 以下简称 CBIR），是计算视觉领域中关注大规模数字图像内容检索的研究分支。典型的 CBIR 系统，允许用户输入一张图像，在图像数据库（或本地机、或网络）中查找具有相同或相似内容的其它图片。本实训的基本功能要求是实现基于视觉特征的图像检索 Web 平台。

具体包括：

实现基于颜色信息的图像检索，可通过颜色直方图、颜色矩、颜色一致性矢量等方法来实现。
实现基于纹理特征的图像检索，可从四个方面进行：统计法、结构法、模型法、频谱法。
实现基于形状特征的图像检索，可分别从图像的边缘信息和区域信息来实现。
实现基于综合信息的图像检索。
实现在 Web 平台上的展示。

图像检索系统工作流程

获取数据集：首先需要准备一个包含大量图像的数据集作为检索的目标。可以来源于本地机器存储、网络图像库或者其他数据源。这些图像应该具有多样性并覆盖不同的内容和领域。本次实训我采用的是老师指定的 The CIFAR-10 dataset 数据集，
特征提取：对于每张图像，需要从中提取相关的视觉特征。常见的特征包括颜色、纹理、形状等。特征提取方法可以根据具体需求选择，我使用的是颜色矩、基于几何矩（mpq）、中心矩（mupq）和归一化的矩（nupq）计算得到的Hu不变矩、灰度共生矩阵等。提取到的特征会被用于后续的相似度计算和检索。
图像输入：用户通过系统的web界面将一张图像作为检索输入提交给系统。这张图像将作为查询图像，去寻找数据库中与之相似的图像。与此同时，把该图像保存到后端指定文件夹中保存起来。
相似度计算：系统将查询图像的特征与数据库中的图像特征进行相似度计算。常见的相似度计算方法包括欧氏距离、余弦相似度等。本文采用的是基于KDTree数据结构的搜索算法，实现了对数级时间复杂度内完成任务。根据指定特征的相似度计算结果，将数据库中与查询图像最相似的图像按照相似度排序。
搜索结果展示：最后，系统将相似度排名靠前的图像作为检索结果显示给用户。这里我们指定显示给前端12个最相似的图片。

图像检索系统框架

用户界面：提供用户与系统交互的界面，允许用户输入图像、选择搜索方式、浏览检索结果等。
特征提取模块：负责从输入图像中提取视觉特征。基于颜色信息的特征提取可以使用颜色直方图、颜色矩、颜色一致性矢量等方法，本实验使用的是基于颜色矩的方法；基于纹理特征的提取可以从统计法、结构法、模型法、频谱法等方面进行，本实验用的是基于Hu不变矩的方法；基于形状特征的提取可以从边缘信息、区域信息来实现，本实验使用的是基于灰度共生矩阵的方法。
相似度计算模块：根据提取的特征计算输入图像与数据库中图像的相似度。不同的相似度计算方法适用于不同类型的特征。常用的方法包括欧氏距离、余弦相似度等。为了提高搜索效率，本实验采用了KDTree数据结构，能实现对数级搜索。
数据库管理模块：用于管理图像数据库，包括图像的存储、索引和检索操作。数据库可以采用关系型数据库或者基于文件系统的存储方式。本实验两种数据都进行了保存和使用。
结果呈现模块：将相似度排名靠前的图像以合适的形式展示给用户，本实验指定能在搜索结果界面展示12张最相似的图像。

数据集获取和预处理

2.1 核心算法描述

通过处理CIFAR-10数据集的图像数据，并将其保存为JPEG格式的图像文件。代码从数据集中读取图像数据，对每个图像进行处理（还原RGB通道）和保存，以便后续的图像处理和分析。
根据指定的文件夹和类别名称，获取图像文件的路径，然后将这些路径保存到文本文件中。代码通过遍历文件夹和子文件夹中的文件，获取图像文件的绝对路径，并将路径中的指定前缀去除，生成相对路径，最后将相对路径保存至文件中。这样可以方便后续的路径处理和数据读取操作。
将从颜色、纹理、形状、深度学习方法中处理获得的特征分别保存在不同的数据库和对应的txt文件中，一式两份，便于后续检索工作。

2.2 数据存储方式

文件名	存储内容	存储方式
path.txt	图像位置	相对路径
colorjuData.txt	颜色特征	图像路径：颜色特征
greymatrixData.txt	纹理特征	图像路径：纹理特征
ShapeNchangeData.txt	形状特征	图像路径：形状特征
VGGData.txt	深度学习特征	图像路径：深度学习特征

2.3 数据库设计

本次实验有mysql和txt文件两种保存形式。

颜色特征表

颜色特征表Color保存的是数据集图像的颜色特征信息，即图像的一阶矩（均值）、二阶矩（标准差）和三阶矩（斜度）。

纹理特征表

纹理特征表Texture保存的是归一化后的灰度共生矩阵计算得到每个方向上的特征值的平均值和标准差。

形状特征表

形状特征表Shape保存的是 Hu 不变矩特征。

VGG特征表

VGG特征表保存在了txt文件中，保存的是神经网络的倒数第二层全连接层的特征值，一共512维，属于高维特征。文件总大小为132.2MB

第三章基于颜色信息的图像检索

3.1 核心算法描述

该算法通过将图像转换到HSI（色调、饱和度、亮度）颜色空间，并计算图像的一阶矩（均值）、二阶矩（标准差）和三阶矩（斜度）。颜色矩表征了图像颜色分布的集中程度和对比度。这些特征可用于图像分类、检索和分析。

3.2 系统架构说明

该算法在图像检索系统中的作用主要是提取图像颜色特征。这些特征可用于描述图像的整体颜色分布。特征提取后，将得到的特征值作为图像的描述，用于与数据库中的其他图像进行相似性计算和匹配。

该算法实现了两个核心函数：rgb_to_hsi和color_moments。

rgb_to_hsi函数：

该函数实现了将RGB图像转换为HSI（色相、饱和度、亮度）色彩空间的转换。函数接收一个RGB图像作为输入，并返回转换后的HSI图像。

具体流程：

从RGB图像中分离出R、G和B通道。
根据HSI转换的公式，计算色相（H）：根据R、G和B通道计算色相的角度值。
计算饱和度（S）：通过计算将最小值和最大值提取为图像的最小色彩饱和度。
计算亮度（I）：通过将R、G和B通道的平均值计算为亮度。
将计算得到的H、S和I通道重新组合为HSI图像并返回。

color_moments函数：

该函数实现了计算图像的颜色矩特征。函数接收一个图像文件路径作为输入，并返回一个包含颜色矩特征的列表。

具体流程：

读取图像文件并检查是否读取成功。
调用rgb_to_hsi函数将读取的图像转换为HSI色彩空间。
将HSI图像拆分为H、S和I三个通道。
计算一阶矩（均值）：分别计算H、S和I通道的均值，并将其存储到特征列表中。
计算二阶矩（标准差）：分别计算H、S和I通道的标准差，并将其存储到特征列表中。
计算三阶矩（斜度）：使用绝对值和平均值计算H、S和I通道的斜度，然后将其存储到特征列表中。
返回计算得到的颜色矩特征列表。

3.3 实验结果及分析

实验结果比较理想。颜色主体没有太大出入。物体或背景颜色均为白色。
该方法对图像进行了色彩空间转换，从RGB转换到HSI，以提取更具有意义和区分性的颜色特征。通过计算均值、标准差和斜度来捕捉图像的颜色信息。颜色矩特征计算过程相对简单，计算量较小，适用于快速获取图像颜色特征的场景。

优点：

算法使用了HSI颜色空间转换，有效地将RGB图像的颜色信息转换为更具意义的色调、饱和度和亮度信息，提取了更具描述性的颜色特征。
使用NumPy和OpenCV等高效的库和函数，对图像进行处理和计算，提高了算法的执行效率。

缺点：

目前的特征提取过程相对简单，没有考虑不同颜色通道的权重和相关性，可能导致提取的特征不够准确和区分度不够。

第四章基于纹理信息的图像检索

4.1 核心算法描述

该方法使用灰度共生矩阵（GLCM）来描述图像的纹理特征。GLCM能够捕捉像素之间的空间关系和灰度级的分布情况，用于描述图像的纹理信息。通过计算GLCM的特征值，如对比度（Con）、能量（Asm）、熵（Eng）和逆差矩（Idm），可以反映图像的纹理特征及其统计属性。提取的纹理特征包括四个方向的特征值，对应0度、45度、90度和135度的灰度共生矩阵。根据归一化后的灰度共生矩阵计算得到每个方向上的特征值的平均值和标准差，并将其作为纹理特征向量。

4.2 系统架构说明

该算法在图像检索系统中的作用主要是提取图像纹理特征。以函数的方式实现了纹理特征的提取。它可以作为图像检索系统中的一个模块，用于提取图像的纹理特征。特征提取后，将得到的特征值作为图像的描述，用于与数据库中的其他图像进行相似性计算和匹配。

该算法中实现了两个核心算法函数：feature_computer和glcm。

feature_computer函数：

该函数用于计算给定灰度共生矩阵的四个特征值：对比度（Con）、能量（Asm）、熵（Eng）和逆差矩（Idm）。

具体流程为：

使用两个循环遍历每个灰度级，用于计算每个特征的数值。
对比度：根据公式 (i - j) * (i - j) * p[i][j] 计算对比度的累加和。
能量：根据公式 p[i][j] * p[i][j] 计算能量的累加和。
熵：根据公式 p[i][j] * log(p[i][j]) 计算熵的累加和（注意添加 - 号）。
逆差矩：根据公式 p[i][j] / (1 + (i - j) * (i - j)) 计算逆差矩的累加和。
返回计算得到的四个特征值。

glcm函数：

该函数用于计算给定灰度图像的归一化灰度共生矩阵。

具体流程为：

获取灰度图像的最大灰度级，并确定图像的高度和宽度。
将图像的数据类型转换为 float64 类型，避免数据失真。
通过乘法运算使得图像的灰度级数目限制在 gray_level - 1 范围内。
创建一个大小为 gray_level × gray_level 的零矩阵。
使用两个嵌套循环计算灰度共生矩阵的值，根据给定的偏移量 (d_x, d_y) 更新对应的像素对位置上的计数。
根据偏移量的比较，对灰度共生矩阵进行归一化，得到一个0-1范围内的归一化灰度共生矩阵。
返回计算得到的归一化灰度共生矩阵。

extract_texture_feature函数：

该函数用于提取给定图像的纹理特征，并返回特征向量。

具体流程为：

读取图像，并将其转换为灰度图像。
使用不同的偏移量参数，调用glcm函数计算四个方向（0度、45度、90度和135度）的归一化灰度共生矩阵。
分别调用feature_computer函数计算四个方向上灰度共生矩阵的特征值。
计算每个特征值的平均值和标准差。
将平均值和标准差组成两个特征向量，并将它们连接起来。
返回包含纹理特征的特征向量。

4.3 实验结果及分析

该实验结果效果良好，搜索出来的图片纹理具有很高的相似性。

优点

该算法通过计算灰度共生矩阵（GLCM）以及相关的纹理特征，能够描述图像的纹理信息，对不同纹理类型的图像具有一定的区分能力。
算法简单直观，实现相对容易，计算效率较高。
纹理特征是图像的本质属性之一，这种算法可以用于纹理分析、图像检索和分类等任务。

缺点：

只使用了一个固定的灰度级数，可能无法充分表达不同图像数据集中的灰度范围和纹理细节。可使用可变的灰度级数，根据图像数据集的灰度范围和纹理细节进行自适应的灰度级数设置，以提高纹理特征的表达能力。但是因为时间原因暂时无法实现。

第五章基于形状信息的图像检索

5.1 核心算法描述

该函数使用 OpenCV 提供的函数计算图像的形状特征，特别是 Hu 不变矩。Hu 不变矩是一种通过对图像的几何、中心和归一化矩进行计算得到的形状特征，具有旋转、缩放和平移不变性。通过对计算得到的 Hu 不变矩进行对数转换，将其范围映射到可比较的区间。返回以 10 为底的对数化的 Hu 不变矩列表。

5.2 系统架构说明

该算法在图像检索系统中的作用主要是提取图像形状特征。以函数的方式实现了形状特征的提取。可以将该函数作为图像处理系统中的一个模块，用于提取图像的形状特征。特征提取后，将得到的特征值作为图像的描述，用于与数据库中的其他图像进行相似性计算和匹配。

该算法实现了一个核心函数 extract_shape_features，用于提取给定图像的形状特征。

extract_shape_features函数：

该函数使用 OpenCV 提供的函数计算给定灰度图像的形状特征。

具体流程如下：

加载图像文件，并将其转换为灰度图像。
使用 cv2.moments 函数计算图像的几何矩和中心矩。
返回的 moments 是一个字典，包括三阶及以下的几何矩（mpq）、中心矩（mupq）和归一化的矩（nupq）。
使用 cv2.HuMoments 函数基于计算得到的几何矩、中心矩和归一化的矩，计算得到 Hu 不变矩。
Hu 不变矩是一系列用于图像形状描述的特征，具有旋转、缩放和平移不变性。
将计算得到的 Hu 不变矩进行对数转换，以 10 为底。
对数转换的目的是将不变矩的值调整到一个可比较的范围，一般为负值，通过加负号将其变为正值。
将转换后的 Hu 不变矩存储到列表 m 中，并返回该列表。

5.3 实验结果及分析

该实验结果虽然种类不是同一个，但是他们都有共同的形状特征，用肉眼看，就是形状都具有一定程度的锥形。计算机能比人类具有更加复杂的形状识别系统，因而实验结果不是同一种类也是可以理解的。

优点：

使用灰度图像进行处理，可以减少计算量，并且大多数图像处理算法在灰度图像上效果更好。使用了OpenCV库，该库提供了许多用于计算图像特征的函数和工具。使用了NumPy库，可以方便地对数组进行处理和操作。

缺点：

算法只使用了Hu不变矩作为形状特征，可能无法捕捉到图像的其他重要特征信息。

第六章基于深度学习的图像检索

6.1 核心算法描述

该算法的核心思想是使用预训练的VGG16模型提取图像的特征。通过加载图像、调整图像尺寸和预处理等操作，将图像数据转换为适合VGG16模型输入的格式。然后，使用VGG16模型对处理后的图像进行预测，得到图像的特征向量。最后，对特征向量进行归一化处理，以使得特征向量具有可比性和稳定性。这样，我们可以利用这些特征向量进行图像检索、分类或其他相关任务。

引入库和模块：

代码开始处引入了所需的库和模块，包括 keras.utils.image_utils 和 keras.applications.vgg16.VGG16 。这些库和模块提供了图像处理和深度学习模型的功能。

定义VGGNet类：

VGGNet类是整个系统的核心，用于封装VGG16模型以及图像特征的提取过程。
构造函数 __init__ 初始化了一些参数，包括输入图像形状、权重（预训练模型的权重）、池化方法和模型本身（使用VGG16模型）。
方法 extract_feat 用于提取图像的特征。它接收一个图像路径作为输入，并输出归一化后的特征向量。

extract_feat提取特征过程：

加载图像：使用 image_utils 库加载指定路径的图像，并将其调整为预定义的输入图像形状。
图像转换：将加载的图像转换为数组形式，并通过 np.expand_dims 函数增加一个维度，将其变成一个四维数组。
图像预处理：使用 preprocess_input 函数对图像数据进行预处理，以便适应VGG16模型的输入要求。
特征提取：通过 self.model.predict 方法对预处理后的图像进行预测，得到图像的特征向量。
归一化处理：对特征向量进行归一化处理，将其除以其自身的L2范数，以确保特征向量具有统一的尺度和可比性。
返回特征向量：返回归一化后的特征向量作为结果。

主程序运行：

在主程序中，创建了一个VGGNet的实例对象 model 。
调用 model 的 extract_feat 方法，传入一个图像路径作为参数，对图像进行特征提取。
最后，将提取到的特征向量打印输出。

该算法实现了一个 VGG16 特征提取器，通过调用预训练的 VGG16 模型和对图像进行预处理，提取图像的特征向量。特征提取后，将得到的特征值作为图像的描述，用于与数据库中的其他图像进行相似性计算和匹配。

6.2 系统架构说明

整体系统架构可以分为几个模块：图像加载与预处理模块、特征提取模块、特征归一化模块。

图像加载与预处理模块负责将指定路径的图像加载到内存中，并进行必要的调整和预处理以适应VGG16模型的输入要求。

特征提取模块利用预训练的VGG16模型对预处理过的图像进行特征提取，得到原始的特征向量。

特征归一化模块对特征向量进行归一化处理，以确保特征向量具有统一的尺度和可比性。

该系统采用了面向对象的方式封装了特征提取过程，使得代码更加模块化和可复用。通过调用VGGNet类的方法，可以方便地提取图像的特征向量，并且可以根据实际需求对特征提取过程进行改进和优化。

6.3 实验结果及分析

通过对一组图像进行特征提取，并观察提取到的特征向量的性质和分布情况，可以分析其在特征空间中的可辨识能力和表达能力。可以观察不同类别图像的特征向量之间的相似性和差异性，以及同一类图像的特征向量的紧凑性和一致性。从实验结果来看，深度学习算法综合了颜色、形状、纹理多种特征，从肉眼观察，深度学习的检索结果更符合人类所期待的检索结果，总体效果要比特征工程好很多。
与传统的特征工程方法相比，利用预训练的VGG16模型进行特征提取通常具有更高的表达能力、更全面的特征捕捉和更好的泛化能力。然而，它也面临迁移性限制、计算复杂度和数据量要求等一些劣势。根据具体问题和场景的需求，可以综合考虑使用传统特征工程方法和深度学习模型进行特征提取，或对现有模型进行进一步优化和调整，以获得更好的特征表示和任务性能。

优点：

VGG16模型通过在大规模图像数据集上进行训练，自动学习到了一组有效的特征表示，具有较强的表达能力和泛化能力。这使得算法在不同的图像任务和数据集上都能取得较好的效果，无需手动设计和选择特征。因而很适合应用在该工程中。
VGG16模型是一个深度卷积神经网络，拥有多个卷积层和全连接层。这使得它能够在多个抽象级别上提取图像的特征，从低级视觉特征（边缘、纹理）到高级语义特征（形状、物体），更全面地捕捉图像的信息。
VGG16模型是在大规模图像数据集上进行了预训练的。这意味着模型经过了大量的图像样本的训练和优化，对各种图像特征具有较强的识别能力，尤其擅长处理自然图像。

缺点：

VGG16模型在预训练过程中的目标任务和实际应用场景的任务可能存在一定差异。因此，直接使用VGG16模型的特征可能无法完全符合当前需求，需要进行微调或重新训练以适应具体任务。
VGG16模型具有大量的参数和复杂的网络结构，因此在计算方面要求更高的计算资源和时间，尤其是在对大量图像进行特征提取时可能需要较长的时间和更高的硬件要求。
VGG16模型的预训练是基于大规模数据集的，而且模型对分类任务进行了训练。如果数据集的规模较小，或者应用场景与预训练任务差异较大，可能导致特征提取效果下降。

第七章基于KDTree的检索算法

7.1 核心算法描述

KD-Tree 是一种用于高效搜索 k 近邻点的数据结构，它在查找最近邻点时比传统的搜索方法（如线性搜索）具有一些优势。它一种用于存储 k 维空间中点的数据结构，其中 k 表示维度的数量。该数据结构通过将空间分割为垂直于坐标轴的超平面来组织点的集合。其中，根节点代表整个空间，子节点代表特定的子空间，直到叶子节点表示一个单独的数据点。

KD-Tree 通过将数据点进行空间划分，利用树结构减少搜索范围，快速找到给定点的最近邻点。通过递归的方式在树上进行搜索，并根据距离进行排序和剪枝，使得算法能够高效地找到最近的k个节点。

7.2 系统架构说明

KDNode 类

该类表示 KD-Tree 中的一个节点。

具体流程如下：

data: 节点的值，存储为列表。
left: 左子节点。
right: 右子节点。
axis: 节点所在的切分维度。
sel_axis: 下一次切分维度的选择函数。
dimensions: 数据点的维度数量。

create 函数

该函数根据给定的点列表创建一个 KD-Tree。

具体流程如下：

如果输入的点列表为空，则返回 None。
根据当前的切分维度对点列表进行排序。
找到中间位置的点作为当前节点的值。
递归地使用左侧子列表创建左子节点。
递归地使用右侧子列表创建右子节点。
返回创建的 KDNode，并设置相应的属性。

search_knn 函数

该函数用于寻找离给定点最近的 k 个节点，并返回以元组 (node, distance) 的形式表示的结果列表。

具体流程如下：

如果未提供距离函数，则默认使用欧氏距离。
创建一个堆来存储最近的 k 个节点，并以距离的负值作为排序依据，这样可以使堆中最大的距离位于堆顶。
调用 search_node 方法进行节点的搜索，搜索过程会更新堆中的节点。
最后按照距离从大到小排序堆，并返回结果。

search_node 函数

该函数用于在 KD-Tree 中递归搜索与给定点最近的 k 个节点。

具体流程如下：

如果当前节点为空，则直接返回。
计算当前节点与给定点之间的距离。
将当前节点及其距离封装为元组，然后将该元组插入结果列表中。
如果结果列表已满且当前节点的距离大于堆中最大距离，则直接返回，不再深入搜索。
获取当前切分维度的切分平面位置。
根据给定点与切分平面的关系，决定进入左子节点还是右子节点进行递归搜索。
检查另一个子节点与当前堆中节点的距离，决定是否进入另一个子节点进行递归搜索。

compute_similarity 函数

该函数用于计算两个向量之间的余弦相似度。

7.3 实验结果及分析

根据实验搜索过程，即用户体验，KD-Tree比传统余弦相似度算法的搜索速度要快很多。
在实际应用中，KD-Tree 可以用于许多搜索任务，如最近邻搜索、范围搜索等。通过对数据进行适当的组织和分割，KD-Tree 可以更高效地找到与给定点最接近的 k 个邻居。
可以优化改进的地方：

根据应用场景和数据分布的特点，可以尝试使用其他的切分策略和维度选择函数，以优化 KD-Tree 的构建和搜索过程。
可以探索并实现更高级的近似最近邻搜索算法，如 Locality Sensitive Hashing (LSH) 等，以更高效地处理高维数据集的近似最近邻搜索问题。
对于计算相似度的函数，可以选择其他适当的相似度度量方法，比如欧氏距离、余弦相似度等，或根据数据属性设计自定义的相似度度量方法。
还可以考虑使用其他的数据结构和算法来进行数据索引、搜索和匹配，如线性搜索、倒排索引、哈希表等。

第八章 web系统展示

8.1 技术栈

系统	技术栈
前端	HTML、CSS、Javascript
后端	python、flask web框架、opencv、keras、pymysql
数据库	mysql 8.0.33
操作系统	macOS Ventura 13.4.1

8.2 功能介绍

搜索界面为上传图像文件、基于图像颜色搜索、基于图像形状特征、基于图像纹理特征、基于深度学习搜索五个按钮，当用户点击选取文件后，可以从本地选取照片上传到后端服务器并保存在指定文件夹“static/images”下。然后从四个检索方法中选择一种，便可以完成指定搜索任务。按钮增加了悬停效果，在一定程度上优化了交互体验，
当点击检索按钮后，跳转到搜索结果界面。
考虑到优化用户的交互性，在搜索结果界面下方设置了返回按钮，用户点击返回按钮后可以再次跳转到搜索界面，选择其他检索方法或者重新上传图像。

总结与展望

9.1 遇到的困难

数据集的采集和转化

cifar-10数据集的下载和转化为图片的算法、以及将图片的路径批量导出到txt文本文件中。经过查阅各种资料，最终能够解决问题。

算法设计

关于基于特征工程的特征提取算法和深度学习的算法设计，经过查阅知网、csdn等前辈、大佬的代码、算法思想，最终总结出一套适合自己此次实训的算法。

后端框架

在此之前还没有用过python来做web系统，本次实训是我独立完成的后端flask框架搭建、路由配置、逻辑设计等。遇到了很多麻烦，比如对flask的基础很薄弱，基本上现学现卖，对于路由配置也是一知半解，但是通过查阅资料最终搞懂了，并且成功输出。

web前端设计

由于学校没有系统安排前端相关的课程，所以对于前端只是了解，没有怎么深切应用感受过，在本次实训中，button按钮、CSS样式、flex布局、javascript算法逻辑设计等几乎都是0基础起步，但是功夫不负有心人，最终成功克服了困难。

9.2 收获

通过本次独立完成实验，我系统地学习并深刻理解了一个web系统从数据集、后端、前端、数据库、路由的全过程，见证了从0到1，再到100的缓慢的过程。这次实验让我对web系统的开发有了更加深刻的理解，并且学习了相关的技能，比如flex布局、提高按钮交互性、前后端之间的路由配置、交互等等。

本次实验我掌握了基于内容的图像搜索系统的搭建，掌握了数据集的使用、数据预处理、图像颜色特征提取、图像形状特征提取、图像纹理特征提取、基于深度学习的特征提取、优化后的搜索算法（比如基于KDTree数据结构的搜索算法）等和数字图像处理、计算机视觉相关的理论知识和实践技能。

本次实验锻炼了我的自学能力和独立解决问题的能力。从数据集开始就是各种困难，但是在一步步的努力和坚持下，所有的困难都被一一克服，最终完成一张答卷。遇到困难不要畏惧，方法总比困难多，自学能力和独立解决问题的能力是一项很重要的品质，它能让我们不依赖于他人，极大地增强自信心。

本次实验是在老师的鼓励下，我才能坚持自己独立开发，老师说要相信自己的潜力，经过实践可得，老师的话是对的，虽然我做的系统还没有达到我最理想的状态，但是进展和成果也是很乐观的。

9.3 系统优点

本系统采用了KDTree数据结构，具有对数级的搜索效率，当数据集较大时可以大幅度提高搜索速度和效率。KDTree适用于大数据量高维度数据集，很适合本次实训的数据集对象。

本系统在处理纹理形状时使用了对数处理，即将计算得到的 Hu 不变矩进行对数转换，以 10 为底。对数转换的目的是将不变矩的值调整到一个可比较的范围，通过加负号将其变为正值，从而便于数据特征提取。

9.4 系统不足和优化

该系统还有很多不足，有很多可以再优化和进步的地方。

首先，可以使用更加丰富的数据集，通过大量的图像集，可以进一步提高检索结果的准确率和匹配度。

然后就是特征提取的算法可以进一步优化，本次系统在颜色、纹理、形状三个方向进行特征提取，还可以考虑其他方向，比如HOG，也可以将不同的特征提取算法结合，进行综合方法的特征提取。

搜索算法可以进一步优化，当数据集越来越大的时候，检索数据库中的数据就会成为一个瓶颈，只有更加高效的、更加优化的算法才能匹配更大的数据集，提高搜索效率，从而提高用户体验。

可以进一步进行系统架构的设计。比如本次实验采取的是前后端半分离，但是可以进一步设计成前后端完全分离，比如采用Vue3.0 + Element Plus的框架来进行设计，使得系统界面更加美观。

也可以考虑高并发、多线程、多进程等算法来进一步提高图像检索系统的检索效率和速度，提高用户体验。

你可能感兴趣的:(计算机视觉,深度学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

基于内容的图像web检索系统

摘要

Abstract

2.1 核心算法描述

2.2 数据存储方式

2.3 数据库设计

第三章 基于颜色信息的图像检索

3.1 核心算法描述

3.2 系统架构说明

3.3 实验结果及分析

第四章 基于纹理信息的图像检索

4.1 核心算法描述

4.2 系统架构说明

4.3 实验结果及分析

第五章 基于形状信息的图像检索

5.1 核心算法描述

5.2 系统架构说明

5.3 实验结果及分析

第六章 基于深度学习的图像检索

6.1 核心算法描述

6.2 系统架构说明

6.3 实验结果及分析

第七章 基于KDTree的检索算法

7.1 核心算法描述

7.2 系统架构说明

7.3 实验结果及分析

第八章 web系统展示​​​​​​​

8.1 技术栈

8.2 功能介绍

总结与展望

9.1 遇到的困难

9.2 收获

9.3 系统优点

9.4 系统不足和优化

你可能感兴趣的:(计算机视觉,深度学习)

第三章基于颜色信息的图像检索

第四章基于纹理信息的图像检索

第五章基于形状信息的图像检索

第六章基于深度学习的图像检索

第七章基于KDTree的检索算法

第八章 web系统展示