babyai996

两种特征提取方法与深度学习方法对比的小型金属物体分类分析研究

本文讨论了用于对包括螺丝、螺母、钥匙和硬币在内的小型金属物体进行分类的两种特征提取方法的效率：定向梯度直方图 (HOG) 和局部二进制模式 (LBP)。首先提取标记图像的所需特征并以特征矩阵的形式保存。使用三种不同的分类方法（非参数 K 最近邻算法、支持向量机和朴素贝叶斯方法），将图像分为四个不同的类别。然后，通过检查生成的混淆矩阵，比较这四个类的 HOG 和 LBP 方法的性能。这两种方法的有效性也与基于深度学习的“You Only Look Once”和更快的基于区域的卷积神经网络方法进行了比较。本文采集的图像集包括800张带标签的训练图像和180张测试图像。结果表明，使用 HOG 比使用 LBP 更有效。此外，HOG 和 LBP 的组合提供了比单独使用任何一个更好的结果。

介绍

目标分类是图像处理和机器视觉领域中最重要的问题之一 [ 1 , 2 ]。一般来说，分类方法分为参数方法和非参数方法。参数化方法寻求提取参数来描述基于训练数据分析的特定模型。创建所需模型后，可以对新样本进行分类 [ 3、4 ]。支持向量机 (SVM)和朴素贝叶斯 (NB)分类器是最重要的参数化方法[ 5、6、7、8、9]. 在参数方法中，对所有输入数据考虑单个模型。尽管将分类问题简化为寻找几个有限参数似乎是合乎逻辑的，但这种假设可能不正确，可能导致对输出的误诊。

非参数算法涉及基于合适的距离函数找到接近或相似的样本，然后进行插值以找到正确的输出。k 最近邻 ( KNN )算法是最流行的非参数方法之一[ 10、11、12]. 在非参数方法中，不需要在训练阶段计算参数；然而，算法是通过使用训练示例来对新数据进行分类来设计的。由于这些方法直接建立在数据之上，而不是估计或预测参数，因此它们通常比参数方法具有更高的准确性。特别是在训练数据的分布无法用有限数量的参数建模的情况下，使用非参数方法似乎更合乎逻辑。非参数方法（包括 KNN）的主要缺点是需要所有的训练样本才能对新样本做出决策。这会导致内存和计算成本增加，尤其是对于大型数据集。如果训练样本以简单简短的描述符形式表示，

深度学习和深度网络近年来取得了进展，并在许多应用中取得了可接受的结果，包括目标检测和识别[ 4、13、14、15、16、17、18、19 ]。与传统方法不同，这些方法不需要单独的步骤来手动提取必要的特征。

为使用深度学习 [ 16 ]进行对象检测而提出的最著名的架构之一是“You Only Look Once”（YOLO）[ 20 ]。深度学习对农业、医学、监视和监控系统等各种应用的重要性与日俱增 [ 21、22、23]. YOLO 算法于 2016 年首次推出，旨在高速准确地检测物体。这种方法为物体识别系统引入了一种新的结构。由于受到了极大的关注，已经实现了不同版本的 YOLO。YOLO 代表“你只看一次图像”。该术语指的是人类视觉系统一眼就能检测到物体的能力。因此，YOLO物体识别系统旨在提供一种类似于人类视觉系统的检测方法。YOLO 算法由一个用于特征提取的 24 层卷积神经网络 (CNN) 和两个用于预测对象概率和坐标的全连接层组成。

更快的基于区域的 CNN（更快的 R-CCN）[ 24 ] 是另一种最先进的基于深度学习的技术。它于 2015 年作为区域提议网络 (RPN) 引入，用于与检测网络共享全图像卷积特征，从而实现几乎无成本的区域提议。RPN 是一个全卷积网络，可同时预测每个位置的边界框和目标分数。它是基于区域的 CNN (R-CNN) [ 25 ]中使用最广泛的最新版本。

金属物体的检测和分类是机器图像和视觉处理的重要应用，尤其是在工业和商业领域 [ 26,27,28 ]。在参考。[ 26 ]，提出了一种基于深度 CNN 的技术来检测金属螺钉及其表面的微缺陷。使用工业相机拍摄了不同类型的金属螺钉的图像。然后使用所提出的深度网络架构来诊断和检查螺丝的无瑕疵。实验结果表明，该技术可以达到98%的检测准确率。然而，该方法仅针对螺丝图像进行训练，并未包括其他类别的金属物体。

参考文献中介绍了一种用于将硬币与纸币分开的自动移动识别系统。[ 27 ]。所提出的方法基于尺度不变的特征变换颜色描述符提取方法，并且可以在智能手机上运行。根据一组约旦常见的纸币和硬币图像审查了该方法的结果。尽管此方法在将硬币与纸币分离方面具有良好的准确性，但该问题（和方法）似乎更像是形状检测而不是对象分类。因为硬币都是圆形的，而钞票是矩形的，所以所提出的方法不能推广到检测其他物体。

参考文献中提出的方法。[ 28 ] 专注于用于各种行业，特别是汽车行业的螺丝识别系统。所提出的方法基于反向传播神经网络。实验结果表明，该系统能够以适当的精度检测生产线上的移动物体；然而，它仅限于检测两类（螺丝和螺母）。

对象分类中最关键的挑战之一是选择合适的特征提取方法 [ 13 ]。此阶段选择不当会影响分类的准确性，并导致决策失误。因此，有必要对各种特征提取方法的效率进行综合研究。一种特征提取方法可能适用于特定的分类算法，但如果用于其他分类器则可能效果不佳。因此，有必要比较几种分类算法的结果以进行详细的分析研究。鉴于上述情况，本研究的主要目的是综合比较方向梯度直方图（HOG）和局部二元模式（LBP）特征向量的性能。

本研究探讨了 HOG 和 LBP 方法在对四组金属物体（螺丝、螺母、钥匙和硬币）进行分类时的效率。为了详细研究这些特征，采用了三种不同的分类方法，即非参数 KNN 算法、SVM 和 NB 方法。使用 HOG 和 LBP 特征向量以及这两个特征向量的组合来研究每种方法的准确性。然后，将这些方法的有效性与 YOLO 和更快的 R-CNN 深度学习方法进行比较。

本研究的主要贡献包括：（1）提供了使用 HOG 和 LBP 方法对小物体进行分类的分析研究；(2) 使用三种常规方法（KNN、SVM 和NB）对HOG 和LBP 进行综合比较；（3）使用YOLO作为深度学习方法进行更详细的对比；(4) 提供多样化的金属物体图像集，可在未来的研究中用作比较不同方法的基准集。

下一节讨论所提出结构中的方法。结果和讨论部分分析了从传统技术和深度学习方法（例如 YOLO 和更快的 R-CNN）获得的结果。最后一节介绍了本研究的结论。

方法

图1显示了所提出的图像分类方法的一般结构。通过为每一个训练样本提取对应的描述符，所有的训练数据都是矩阵的形式，其中每一行代表一个样本的特征向量，每一列代表特征空间中的一个特征。训练数据被标记；因此，每个相关类在建议的算法开始时都是可用的。基于这些训练样本创建参数或非参数模型，用于预测测试图像的类别。如图1所示，特征提取涉及使用 HOG 或 LBP 方法之一，或这两种方法的组合。分类指的是上述三种方法中的一种：KNN、SVM、NB。随着新样本（测试图像）的到来，提取所需的特征，并使用创建的模型估计未知样本的标签。确定测试样本后，为每个分类模型生成一个混淆矩阵。使用混淆矩阵检查不同方法的效率。

要计算梯度的直方图，将 0-180° 之间的距离除以n 个相等的距离，表示梯度或直方图条的方向数。这些距离中的每一个都形成一个直方图通道。使用 0–180° 的范围而不是 360° 范围，因为通常需要额外的杆才能在 0–360° 的范围内提取。因此，较小的范围可以节省更多的特征提取时间。实验观察还表明，相对于 180° 范围，使用 360° 范围对改善结果的影响很小。正如参考文献中所讨论的。[ 29 ]，一个九柱直方图在实验中取得了更好的效果；因此，本研究使用相同数量的柱来计算 HOG。

为了计算直方图，图像被分成几个单元格。然后每个像素根据其梯度方向为直方图通道之一投票。这些投票根据该像素中梯度的大小进行加权。这会为每个单元格生成一个直方图，用于描述像素的梯度。在某些情况下，通过连接相邻单元格的直方图来计算块（由多个单元格组成）的 HOG（图2）。

图 2

灰度图像的 LBP 中的特征向量计算如下。

想要的图像被分成几个块，每个块又被分成几个单元格。
对单元格中的每个像素执行以下计算。
每个像素都与它的八个相邻像素进行比较。在特定方向（例如，顺时针）上单独检查相邻像素。
当中心像素大于相邻像素时，写入数字“0”；否则，写入数字“1”。以这种方式，通过将中心像素与其八个相邻像素进行比较来获得八位数。为方便起见，该数字通常转换为 0-255 之间的十进制数（图3）。
为每个单元格计算上一步中获得的数字的直方图。此直方图有 256 个条（从 0-255），每个条显示该单元格中特定数字的重复次数。
如有必要，对所需的直方图进行归一化。
整个块的直方图是通过连接相邻单元格的直方图得到的。因此，如果一个块包含四个单元格，则生成的特征向量的长度为 256 × 4。

图 3

图3显示了 3 × 3 邻域中的二进制模式计算示例。二进制模式 00010011 被分配给中心像素，左侧图像中的灰度级为“5”。在完成所有块的计算后，通过使用适当的模型对生成的特征向量进行处理以对所需图像进行分类。这些分类器可用于对象分类、人脸识别、纹理分析等。

已经提出了不同类型的 LBP 算法，相对于原始算法有各种变化。最有用和广泛使用的 LBP 类型之一是统一模式，它可以显着减少特征向量的长度 [ 35 ]。这个想法源于这样一个事实，即某些二进制模式（称为统一二进制模式）的出现次数特别重要。

如果一个像素生成的二进制模式最多有两个 0-1 或 1-0 转换，则称为统一模式。例如，00010000 是具有两个转换的统一模式，0-1 和 1-0，但具有五个转换的模式 01010111 是不统一的。具有最多事件数的统一二进制模式对应于图像的基本特征，例如图像的边缘、角和重要点 [ 34 ]。

因此，均匀的图案可以被认为是识别图像主要特征的因素。所有非均匀模式都分配给一个单独的容器，每个均匀模式都有一个单独的容器。由于 58 个统一模式在 0-255 范围内，因此统一 LBP 特征向量的长度为 59；这比普通 LBP 中 256 的长度显着减少。

以这种方式，通过比较局部邻域并计算统一的 LBP 直方图，创建图像签名来表示纹理的类型。生成的签名对于属于不同类别的图像来说足够独特。因此，LBP 可用于对纹理进行分类。

KNN算法

KNN 算法是最常见的非参数分类方法之一[ 10,11,12,38 ] 。在非参数方法中，不需要在学习阶段计算参数。使用数据本身，设计了一种算法来检查新数据是否属于训练类。这些方法的优点是不需要参数估计，通常比参数方法更准确；然而，它们的主要局限是它们需要所有的训练样本来对新样本进行分类。这会增加内存和计算成本，尤其是对于大型数据集。用于对图像进行分类的 KNN 分类步骤如下。

上传训练数据集和相关标签，然后选择 K 的值作为邻居数。
计算测试图像和每个训练样本之间的距离。
根据上一步计算的距离，训练样本按升序排序。
前 K 个项目是从排序集中选择的。
在上一步中检查所选项目的标签。
选择最频繁标记的类作为测试样本的预测类。

图4显示了使用 KNN 算法进行二分类的示例。在这种情况下，如果k = 3，则测试样本被认为属于 B 类，因为在三个近邻中，两个邻居被标记为 B，一个邻居被标记为 A。

图 4

如果k = 6，情况会有所不同，因为在这种情况下，四个邻居被标记为 A，两个邻居被标记为 B；因此，测试样本被归为A类。分类算法的准确性可以通过将预测标签与测试样本的实际标签进行比较来验证。

基于 SVM 的分类器

SVM是目前广泛使用的分类方法之一[ 5 , 6 ]。SVM 方法目前的流行程度可以与过去十年神经网络的流行程度相提并论。SVM 基于数据的线性分类。图5显示了一个可以线性分类的数据集示例。绘制了几条线来对数据进行分类。在数据的线性划分中，试图选择具有更可靠余量的行。二次规划用于寻找最优线性分离器；这是解决有限问题的已知方法。

SVM的基本思想是，假设类别是线性可分的，得到一条具有最大边距的线来分隔类别。为了找到这样的分隔符，两条边界线平行于分隔线绘制，并且被分开使得它们与数据碰撞。最大化线性分隔符之间训练数据余量的分隔最小化泛化误差。最靠近分隔线的训练数据称为支持向量（图5）。值得注意的是，对于大于二的维度，使用术语“超平面”而不是“线”。超平面是一个几何概念，表示n维平面概念的推广。换句话说，超平面定义了后续的kn维空间中的子空间，使得k < n。

SVM 的最佳特性之一是，在数据不可线性分离的情况下，SVM 使用非线性映射函数 Φ 将数据映射到更大的维度。这样，数据就可以在这个新的空间中线性分离。

这意味着在其原始空间中不可线性分离的样本移至称为 F 的新特征空间以创建用于分离它们的超平面。当这个超平面回到原来的空间I时，它形成了一条非线性曲线。如图6所示，输入数据不是线性可分的，没有一条线可以准确地表示两个类之间的边界。然而，通过将它们从二维空间映射到三维空间，可以创建一个超平面来分隔这两个类的边界。

注意类别

NB是一种基于概率的机器学习算法，可用于广泛的分类问题 [ 7、8、9 ]。NB 算法的常见应用包括垃圾邮件过滤、文档分类和情绪预测。

这种 NB 算法使用贝叶斯定理来产生结果，基于特征之间强独立性的假设。这意味着更改一个特征的值不会直接影响任何其他特征的值。尽管这个假设对于真实世界的数据集来说过于简单（正如算法的名称所暗示的那样），但 NB 分类器仍然在分类算法中找到了一个有价值的位置。

假设X = ( x 1 , x 2 , .. x n ) 将数据样本表示为n 个独立变量的向量。计算概率P [ C k | ( x 1 , x 2 , .. x n )]，使用联合概率就足够了，并使用关于变量独立性的条件概率来简化它。

深度学习方法

YOLO 是最先进的实时目标检测系统。它使用单个神经网络来获取完整图像。该网络将图像划分为区域，并预测每个区域的边界框和概率。使用预测概率对这些边界框进行加权。

要使用YOLO算法，首先需要准备训练图像。

为 YOLO 算法准备训练集的方法不同于传统方法，例如 SVM 或 KNN。需要在每个对象周围绘制一个边界框，对应的类由用户确定。可以使用各种程序来绘制边界框并对其进行标记。在这项研究中，MAKESENSE ( Make Sense ) 程序用于标记训练图像。

以这种方式，为每个训练图像创建一个文本文件，其中每一行都写有对象的规格。第一个数字与对象的类别有关；然后写入矩形中心的坐标及其长度和宽度。文件中的行数等于图像中的对象数。图7显示了来自 MAKESENSE 程序输出的训练数据和生成文件的示例。该程序还用于为另一种深度学习方法（更快的 R-CNN）标记图像。

图 7

Faster R-CNN 是一种用于对象检测的深度卷积网络，作为用户使用的单个端到端统一网络。该网络可以在短时间内预测多个物体的位置。加州大学伯克利分校的研究人员于 2014 年开发了 R-CNN [ 25 ]。R-CNN 是一种深度卷积网络，能够检测图像中的 80 种不同类型的对象。与目标检测方法的通用管道相比，R-CNN 最重要的贡献是基于 CNN 的特征提取。

R-CNN 由三个主要模块组成。第一个模块使用选择性搜索算法生成 2000 个区域建议。在调整到固定的预定义大小后，下一个模块从每个候选区域中提取长度为 4096 的特征向量。第三个模块利用预训练的 SVM 算法将区域提议分类为对象类之一，或作为背景。R-CNN 模型有一些弱点：它是一个多阶段模型，其中每个阶段都是一个独立的部分。因此，它不能进行端到端的训练。它从磁盘上预训练的 CNN 中捕获提取的特征来训练 SVM。这需要千兆字节量级的大容量存储。R-CNN 依赖于选择性搜索算法来创建区域建议，这需要很长时间。此外，该算法不能针对检测问题进行定制。每个区域提案都在不依赖 CNN 的情况下进行特征提取，因此不适合实时运行 R-CNN。作为R-CNN模型的扩展，提出了fast R-CNN模型[24 ] 来克服其中的一些限制。

结果与讨论

在本研究中，使用 MATLAB 软件 2019 版实现了传统分类方法（SVM、KNN 和 NB）。准备了一组图像，包括 800 张训练图像和 180 张测试图像，用于分析 HOG 和 LBP 方法的效率。更具体地说，为四个类别（螺丝、螺母、钥匙和硬币）中的每一个考虑了 200 个训练图像和 45 个测试图像。

在 HOG 的情况下，每个单元格的大小为 64 × 64 像素，每个块包含 2 × 2 个单元格，方向直方图中的 bin 数量为 10，HOG 特征向量的长度为 360。对于LBP，单元格大小为64，采用长度为160的旋转不变均匀特征向量。因此，组合特征向量 (HOG-LBP) 的长度为 520。尝试在对象类型和照明条件方面提供足够的多样性。图8显示了收集的数据集中的图像示例。

在检测坚果时，使用 HOG 得到 34 次正确检测，但 LBP 的这个值为 36。该表还表明，使用 HOG-LBP 特征向量组合（由两个单独的特征向量的连接产生）比单独使用这些特征中的任何一个产生更好的结果。图9显示了 SVM 的接收器操作特性 (ROC) 曲线和三个不同特征向量的曲线下面积 (AUC) 值。该图表明，组合特征向量 (HOG-LBP) 比单独使用 HOG 和 LBP 取得了更好的结果。

在实施深度学习方法时，10% 的训练图像被用作验证集。表4显示了使用 YOLO 版本 5 和更快的 R-CNN 获得的混淆矩阵。如表4所示，这两种方法的分类精度都很高。在 YOLO 中，一个 nut 没有被放置在任何一个类中。所示. YOLO 和 Faster R-CNN 等深度学习方法的优势之一是它们能够识别对象的位置并在多对象条件下对它们进行分类，即一帧中有多个对象。相比之下，在传统方法中，这种能力是不存在的，需要使用辅助算法来检测物体的位置。图12中示出了多次检测的示例。

值得注意的是，YOLO 和更快的 R-CNN 算法不需要单独的步骤来提取特征向量。在这方面，它们可能优于基于特征的方法，如 KNN 和 SVM。然而，与基于特征的提取方法相比，实施深度学习算法对硬件的要求更高。在本研究中，YOLO 和更快的 R-CNN 算法是使用 Google Colab 实现的。YOLO 和 Faster R-CNN 的另一个缺点是标记训练数据的方法，这使得这些算法的训练阶段比传统方法更加困难和耗时。

考察表1、2、3、4中的混淆矩阵表明，一般来说，HOG方法的特征提取性能优于LBP方法，但它们的组合特征向量（HOG- LBP）比单独使用更准确用于对小型金属物体进行分类。此外，基于 SVM 的方法比基于 KNN 和基于 NB 的方法表现更好，而基于 NB 的方法的精度低于其他方法。尽管基于 SVM 的方法不如 YOLO 和更快的 R-CNN 准确，但与深度学习方法相比，它对硬件的要求更少，训练阶段也更容易。

结论

在这项研究中，评估了两种特征提取方法（HOG 和 LBP）在对螺丝、螺母、钥匙和硬币等小金属物体进行分类时的效率。使用了三种不同的分类，包括基于 KNN、SVM 和 NB 的方法。实验表明，一般来说，HOG 优于 LBP，并且使用它们的组合特征向量（HOG-LBP）优于单独使用它们。还将这两种方法的有效性与基于深度学习的 YOLO 和 Faster R-CNN 的方法进行了比较。尽管深度学习方法不需要单独的特征提取步骤，但它们需要比传统方法更强大的平台。

传统的特征提取方法，如 HOG 和 LBP，其优势在于提取的特征向量可以用于不同的分类器，以选择更准确的分类器。然而，这些方法的缺点是它们只能对检测到的对象进行分类。换句话说，它们无法检测图像中前景物体的位置。在这种情况下，必须应用前景提取方法，然后可以使用传统方法（如HOG）为每个前景区域生成特征向量。相比之下，深度学习方法确定图像中的对象位置，并对这些对象进行分类。这是 YOLO 和 Faster R-CNN 算法最积极的地方，但它们的缺点是在训练阶段需要手动图像标注，这对于大型数据集来说既费时又费力。尽管如此，深度学习方法在各种应用中的重要性正在增加，例如农业、医学和监控系统。

在继续本研究中所做的研究时，可以检查其他纹理特征分析，例如 Gabor 滤波器。可以发展四级分类以对更大的数进行分类。此外，可以采用集成方法来考虑各种大小的对象。与其他深度学习方法的比较将更好地理解不同特征提取方法的效率。总的来说，这项研究的结果可以应用于工厂和工业车间。因此，在未来的研究中可以探索获取工业图像并在真实环境中提供所提出方法的实际实现。

System.IO.File.AppendAllText()如何使用
System.IO.File.AppendAllText()是C#中用于向文件末尾追加内容的便捷方法publicstaticvoidAppendAllText(stringpath,stringcontents);publicstaticvoidAppendAllText(stringpath,stringcontents,Encodingencoding);2.核心功能追加内容：将文本写入文件末
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
视觉设计全栈解析：必知的8大核心方向与应用场景
在数字时代，视觉设计早已渗透到生活的方方面面——从手机APP界面到街头广告牌，从书籍的版式到产品的包装，这些统统离不开视觉设计的支撑！所以，了解视觉设计分类，不仅能帮助我们理清设计的边界与应用场景，更能让初学者找到学习的方向，让从业者精准定位创作目标哦。接下来，我们就来详细解析视觉设计分类中的8大常见类型，一起来享受这场视听盛宴吧~一、视觉识别图形设计在视觉设计分类中，视觉识别图形设计是构建品牌形
解决Nginx安全漏洞【CVE-2018-16844、CVE-2019-9511、CVE-2021-3618、CVE-2018-16843、CVE-2021-23017】等问题名字咋这么难起捏服务器配置 nginx 运维
前言最近网信办通报某服务器存在nginx[CVE-2018-16844、CVE-2019-9511、CVE-2021-3618、CVE-2018-16843、CVE-2021-23017、CVE-2019-9513]等漏洞，需要进行修复，查阅了下对应的资料发现这些漏洞是是Nginx的HTTP/2模块中的一个安全问题。此漏洞允许攻击者通过特定的HTTP/2请求构造，可能导致服务器崩溃或执行拒绝服务（
利用systemd启动部署在服务器上的web应用不是吧这都有重名遇到的问题服务器前端运维
0.背景系统环境：Ubuntu22.04web应用情况：前后端分类，前端采用react，后端采用fastapi1.具体配置1.1前端配置开发态运行（启动命令是npmrundev）,创建systemd服务文件sudonano/etc/systemd/system/frontend.service内容如下：[Unit]Description=ReactFrontendDevServerAfter=ne
牛顿迭代法求解平方根 Young_Gy
一个实例迭代简介牛顿迭代法牛顿迭代法简介简单推导泰勒公式推导延伸与应用一个实例//java实现的sqrt类和方法publicclasssqrt{publicstaticdoublesqrt(doublen){if(nerr*t)t=(n/t+t)/2;returnt;}publicstaticvoidmain(String[]args){sqrta=newsqrt();System.out.pri
（面经总结）一篇文章带你整理面试过程中常考的九大排序算法南淮北安冲刺大厂之面经总结面经排序算法二分插入冒泡快速
文章目录一、二分插入排序1.原理2.代码二、冒泡排序1.原理2.代码三、插入排序算法1.原理2.代码四、快速排序算法1.原理2.代码五、希尔排序1.原理2.代码六、归并排序1.原理2.代码七、桶排序八、基数排序九、堆排序1.原理2.代码十、总结1.算法分类2.性能分析一、二分插入排序首先必须是排好序的数组，然后通过二分查找，找到合适的位置，插入1.原理二分查找算法又叫作折半查找，要求待查找的序列有
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
医咖会免费STATA教程学习笔记——单因素方差分析 Unacandoit stata 单因素方差分析
单因素方差分析和单因素回归分析相同1.单因素方差分析需要满足的假设：（1）因变量为连续变量（2）至少有一个分类变量（大于等于2类）（3）观测值相互独立（4）没有异常值（5）服从正态分布（6）方差齐性2.准备工作（1）导入数据集：webusesystolic,clear（2）检验是否存在异常值：方法一：图形——箱线图——在变量中选择systolic——确定方法二：grahboxsystolic,ov
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
python --飞浆离线ocr使用/paddleocr
依赖#python==3.7.3paddleocr==2.7.0.2paddlepaddle==2.5.2loguru==0.7.3frompaddleocrimportPaddleOCRimportcv2importnumpyasnpif__name__=='__main__':OCR=PaddleOCR(use_doc_orientation_classify=False,#检测文档方向use
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
Logistic回归预测模型2：R语言实现模型的内部和外部验证
前面我们讲了logistic回归预测模型的建立，今天介绍的是模型的验证，可以在训练集和验证集中通过ROC曲线、校准曲线和决策曲线分别进行验证。1、原始数据原始数据分为训练集和验证集，其中训练集用于模型的构建和内部验证，验证集用于外部验证。两个数据集都包含5列，且列名相同。组别Group为因变量，1代表阳性结局，0代表阴性结局。自变量1和4为连续性变量，自变量2和3为二分类变量。2、安装所需要的R包
【JDBC痛点终结者】MyBatis如何优雅解决传统数据库操作的七大难题码农技术栈 MyBatis 数据库 mybatis tomcat java 开发语言后端性能优化
你是否曾在JDBC的ResultSet和PreparedStatement的海洋中迷失方向？是否被无数重复的模板代码折磨得精疲力尽？本文将带你揭秘MyBatis如何优雅解决JDBC的痛点，让你告别繁琐，拥抱高效！一、先看一个真实场景：JDBCvsMyBatis1.JDBC实现用户查询//JDBC查询用户publicUserfindUserById(intid)throwsSQLException{
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
【机器学习&深度学习】多分类评估策略一叶千舟深度学习【理论】深度学习【应用必备常识】大数据人工智能
目录前言一、多分类3大策略✅宏平均（MacroAverage）✅加权平均（WeightedAverage）✅微平均（MicroAverage）二、类比理解2.1宏平均（MacroAverage）2.1.1计算方式2.1.2适合场景2.1.3宏平均不适用的场景2.1.4宏平均一般用在哪些指标上？2.1.5怎么看macroavg指标？2.1.6宏平均值低说明了什么？2.1.7从宏平均指标中定位模型短板
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
大模型RLHF强化学习笔记（二）：强化学习基础梳理Part2 Gravity! 大模型笔记大模型 LLM 强化学习人工智能
【如果笔记对你有帮助，欢迎关注&点赞&收藏，收到正反馈会加快更新！谢谢支持！】一、强化学习基础1.4强化学习分类根据数据来源划分Online：智能体与环境实时交互，如Q-Learning、SARSA、Actor-CriticOffline：智能体使用预先收集的数据集进行学习根据策略更新划分On-Policy：学习和行为策略是相同的，数据是按照当前策略生成的，如SARSAOff-Policy：学习策
【前端工程化】前端组件模版构建那些事前端
在企业级后台系统中，组件是构建页面的基础单元。与C端不同，B端更注重功能完整性、交互一致性与复用效率。因此，我们需要围绕业务场景封装出可复用、易维护、结构清晰的组件模板。本文档主要围绕组件设计原则、分类建议和使用方式展开，适用于Vue或React技术栈下的开发场景。一、组件设计原则职责单一每个组件只负责一个功能或UI元素，不依赖外部状态；示例：按钮组件只处理点击行为，不包含API调用逻辑；高内聚低
大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
基于锁的获取与释放方式即计划于所得获取与释放方式进行分类——显式锁和隐式锁小黄工程师学习进阶版 Java java
隐式锁Java中的隐式锁（也称为内置锁或自动锁）是通过使用关键字实现的一种线程同步机制。当一个线程进入被synchronized修饰的方法或代码块时，它会自动获得对象级别的锁，退出该方法或代码块时则会自动释放这把锁。在Java中，隐式锁的实现机制主要包括以下两种类型：互斥锁（Mutex）虽然Java标准库并未直接暴露操作系统的互斥锁提供使用，但在Java虚拟机对synchronized关键字处理的
【Pytorch】8.torch.nn.conv2d Elephant_King Pytorch pytorch 人工智能 python
这个函数和我们之前提到的【Pytorch】6.torch.nn.functional.conv2d的使用的作用相似，都是完成CV领域的卷积操作，这里就不在过多赘述torch.nn.conv2d的使用打开pytorch的官方文档，我们可以看到torch.nn.conv2d包含了若干参数in_channels：代表输入的通道数out_channels：代表输出的通道数kernel_size：代表卷积核
定时器和守护线程
（八）定时器标准库中的定时器标准库中提供了一个Timer类。Timer类的核心方法为schedule，schedule包含两个参数：第⼀个参数指定即将要执行的任务代码，第⼆个参数指定多长时间之后执行(单位为毫秒)。Timertimer=newTimer();timer.schedule(newTimerTask(){@Overridepublicvoidrun(){System.out.print
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l