最烦起名字嗄

目标检测主流算法的分析与论述

摘要

机器学习和深度学习的不断发展为技术和科技的变革带来了无限可能，也为计算机视觉领域的开拓提供了更广阔的空间。目标检测作为计算机视觉领域重要的成员之一，在成功引入深度学习的知识和理念后，打破了令传统方案困惑多时的瓶颈，检测算法的精确度和性能都得到了极大的提高。
经过多年的发展，在R-CNN、YOLO、SSD等经典算法的基础上，目标检测算法演化出了数量众多的算法理论，本文通过对目前较为成熟的几种目标检测算法进行分析和论述，对不同算法的优点和不足做出讨论，将为不同的应用场景提出算法的择优方案。
关键词：目标检测；深度学习；R-CNN；YOLO；SSD

绪论

机器学习和深度学习的不断发展为技术和科技的变革带来了无限可能，也为计算机视觉领域的开拓提供了更广阔的空间。目标检测作为计算机视觉领域重要的成员之一，在成功引入深度学习的知识和理念后，打破了令传统方案困惑多时的瓶颈，检测算法的精确度和性能都得到了极大的提高。
目标检测(object detection)是一种基于目标几何和统计特征的图像分割技术，它将目标的分割和识别合二为一，在较为复杂的场景中，可以对多个目标进行实时处理。目标检测技术的发展为计算机视觉领域的很多后续视觉任务打下了基础，是计算机视觉领域研究中的一项非常具有挑战性的工作，也是计算机视觉领域中的一项极为重要的研究课题。近年来，针对目标检测算法的研究取得了很大的突破。目前比较成熟的算法大致可以分为两类，一类是基于Region Proposal的R-CNN系列算法（R-CNN，Fast R-CNN, Faster R-CNN等），这些算法需要在产生目标候选框的基础上对候选框做分类与回归；另一类算法是Yolo，SSD等，这类算法仅使用一个卷积神经网络，就可以直接预测出不同目标的类别与位置。比较以上两类算法可以发现，第一类方法准确度较高，但是速度相对较慢，第二类算法速度相对较快，但准确度较低。
本次研究课题主要针对目前较为成熟的几种目标检测算法进行分析和论述，基于这些算法的实现原理，比较它们的异同，为解决目标检测算法相关问题时的算法选取提供参考意见。

研究背景及理论基础

2.1国内外研究现状

自目标检测概念提出以来，针对这一问题，国内外学者做出了不懈的探索。从基于滑动窗口或特征点的传统目标检测算法到基于深度学习的目标检测算法，目标检测的技术逐步走向成熟。
目前，国际上有很多大公司都在做这一方面的研究，例如，谷歌、微软、苹果、亚马逊等，在人脸识别、自动驾驶、行人检测、物体检测、机器人等众多领域他们都取得了不错的成绩。将目标检测与实际生产相结合，在一定程度上提高了生产效率，随着算法的不断优化，收获的效益越发明显。
当然，国内的科研机构、各大企业在目标检测这一领域取得的成绩也是有目共睹的。近年来，火车站闸机与银行柜台的人脸检测逐渐普及，百度的无人驾驶技术突飞猛进，支付宝的刷脸支付火遍大江南北，京东物流的分拣流水线实现全自动化，目标检测技术的应用带来了生产技术的革新，也为日常生活带来了极大的便利。

2.2目标检测发展历程

在深度学习应用之前，也就是R-CNN算法问世之前，图像的特征是人工定义的具有鲁棒性的特征。随着计算水平的不算提高，以及算法的不断优化，目标识别的识别精度也在不断提升，但是提升速度是较为缓慢的，在引入深度学习后，目标识别的识别精度提升速度突飞猛进，实现了质的飞跃。图2 1展示了引入深度学习前后识别精度的增长情况。

图 2 1引入深度学习前后识别精度对比图

R-CNN作为深度学习用于目标检测的开山之作，基本奠定了two-stage方式在目标检测领域的应用。虽然R-CNN算法的问世极大地提高了目标检测的识别精度，但R-CNN算法自身也存在着许多问题，为了解决R-CNN中候选框子图必须将图像裁剪缩放到相同尺寸大小的问题，微软在2015年提出了Fast-RCNN。当然，Fast-RCNN也存在着不足之处，和R-CNN一样，它们都是通过选择性搜索来生成候选框，这使得算法耗时很长。为了解决Fast-RCNN速度慢的问题，Faster R-CNN诞生了。总的来说，R-CNN、Fast-RCNN、Faster R-CNN都是以two-stage方式作为基础的，但在信息量爆发式增长的时代里，我们对目标检测的实时性要求越来越高，在实时性要求较高的领域，以two-stage方式作为基础的目标检测算法运算速度已经不足以满足需求。于是，为了解决two-stage方式算法运算速度较慢的问题，yolo创造性地提出了one-stage的概念，而事实证明，基于one-stage方式的算法运算速度要比基于two-stage方式的算法运算速度快很多。yolo的诞生，是目标检测发展过程中，极具历史性的一刻。不过，虽然yolo算法的运算速度很快，但它的准确率和漏检率相较于Faster R-CNN而言却并不是很好，为了综合yolo和one-stage系列算法的优点，SSD算法登上了历史舞台。图2 2展示了目标检测算法的发展过程。

图2 2目标检测算法的发展过程

2.3目标检测理论基础

2.3.1 mAP衡量标准

mAP(mean average precision)是目标检测中衡量识别精度的指标。在多个类别物体检测中，每一个类别都可以根据recall和precision绘制一条曲线，precision描述查找一个目标的精准率，recall描述查找一个目标的漏检率。mAP是多个类别AP的平均值，AP是平均精确度，是每个类别根据对应的recall和precision绘制出的曲线下的面积。图2 3是Recall和precision的计算公式和mAP的计算公式。

图2 3 Recall和precision的计算公式和mAP的计算公式

2.3.2 IOU评价指标

IOU（Intersection over Union）是一种评价边界框正确性的度量标准，它可以描述这组图像中存在的对象的预测区域和正确区域之间的相似程度。较为直观的IOU计算如图2 4所示。

图2 4 IOU计算演示

2.3.3 卷积神经网络

CNN(Convolutional Neural Networks)是人工神经网络的一种，它是一类包含卷积计算且具有深度结构的前馈神经网络。一般而言，CNN由输入层、卷积层、池化层、全连接层和输出层构成。卷积神经网络的输入层可以处理多维数据，使用梯度下降算法进行学习。卷积层的功能是对输入数据进行特征提取，在卷积层进行特征提取后，输出的特征图会传递至池化层进行特征选择和信息过滤。卷积神经网络中输出层的上游通常是全连接层，因此其结构和工作原理与传统前馈神经网络中的输出层相同。使用CNN可以对图像进行分类，使用CNN进行图像分类的基本过程如图2-5所示。

图2 5使用CNN进行图像分类的基本过程

2.3.4 支持向量机

SVM(Support Vector Machine)由模式识别中的广义肖像算法发展而来，是一类按监督学习方式对数据进行二分类的广义线性分类器。SVM的理论基础由线性分类开始。图2 6描述了支持向量机线性分类的基本原理。

图2 6 支持向量机线性分类的基本原理

2.3.5 ROI

ROI(region of interest)，即感兴趣区域。机器视觉、图像处理中，从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出的需要处理的区域，称为感兴趣区域(ROI)。在图像处理领域，感兴趣区域(ROI)是从图像中选择的一个图像区域，这个区域是图像分析所关注的重点。
基于深度学习的目标检测算法分析

3.1 R-CNN算法分析和论述

3.1.1 R-CNN基本原理

R-CNN的全称是Region-CNN，是第一个成功将深度学习应用到目标检测上的算法。R-CNN遵循传统目标检测的思路，采用提取框对每个框提取特征，并在这一基础上创新性地应用了卷积神经网络。
R-CNN运算过程分为三部分：找出候选框；利用CNN提取候选框中图像的特征向量；使用SVM对CNN提取出的特征向量进行分类。具体的流程如图3 1所示。

图 3 1 R-CNN运算具体流程

寻找候选框的方式有很多种，主要包括等间距划分、使用边缘保持超像素划分和Selective Search等，R-CNN在找候选框时采用的方法是Selective Search，Selective Search的优势在于它可以满足目标多尺度的要求，而且会对过分割的区域进行合并，这样就可以尽可能地减少候选区域的数目,提高算法速度。图3 2 描述了Selective Search的具体算法。

图3 2 Selective Search的具体算法

3.1.2 R-CNN算法评价

R-CNN采用卷积神经网络提取候选框中图像的特征向量并使用支持向量机对提取到的特征进行分类，具有较高的目标检测精度，但由于训练过程使用多级流水线方式，涉及特征向量的提取和读写，并使用损失函数对网络进行微调，随后训练SVM分类器，最后拟合检测框回归，这就使得训练过程需要消耗大量的时间和空间，导致完成目标检测任务的速度变得很慢。
综合R-CNN算法的优点和缺点进行考虑，我们认为，在图像数据较为简单，且对实时性要求不高，但对检测精度要求较高时，可以使用R-CNN算法进行目标检测。R-CNN算法作为目标检测引入深度学习的开篇之作，它是经典的，也是基础的，从事目标检测相关工作的开发者需要熟悉R-CNN的原理和方法。拥有R-CNN算法的思想和理论作为铺垫，会为后续更为复杂的目标检测算法的学习打下坚实的基础。

3.2 Fast R-CNN算法分析和论述

3.2.1 Fast R-CNN基本原理

为了解决R-CNN训练速度慢、训练所需空间大的问题，R-CNN的原作者Ross Girshick对R-CNN做出了改进，提出了Fast R-CNN。在Fast R-CNN算法提出之前，针对如何既能固定全连接层的输入维度又不让候选区域产生畸变的问题， SPP-net算法给出了一套很好的解决方案。它通过在卷积层和全连接层之间引入空间金字塔池化层(Spatial Pyramid Pooling Layer, SPP Layer)的方法，使经过该层后特征的维度固定了下来。SPP-net网络结构如图3 3所示。Fast R-CNN算法吸收了SPP-net的特点，使得目标检测的速度大幅提升。

图3 3 SPP-net网络结构
Fast R-CNN网络结构如图3 4所示。首先，将图像和多个ROI输入到卷积网络中，然后将ROI合并到一个固定大小的特征图中，再通过全连接层映射到特征向量。Fast R-CNN网络中的每个ROI都具有两个输出向量：softmax概率分布和每个类边界框的回归偏移量。

图3 4 Fast R-CNN网络结构
Fast R-CNN的创新之处在于，它将最后一个卷积层的SSP Layer简化为RoI Pooling Layer，RoI Pooling Layer采用单一尺度进行池化，解决了SSP Layer权值无法更新的问题。SSP Layer与RoI Pooling Layer的对比如图3 5所示。

图3 5 SSP Layer与RoI Pooling Layer对比图

3.2.2 Fast R-CNN算法评价

对比Fast R-CNN和R-CNN可以发现，Fast R-CNN在R-CNN算法的基础上做出了极大的改善。R-CNN在用SVM分类之前，需要把通过CNN提取的特征存储在硬盘上。而在硬盘上进行大量的数据读写会使训练性能降低、训练速度变慢。而Fast-RCNN的训练数据在内存里直接进入Loss层，不再需要把大量的数据存储到硬盘，相较于R-CNN采用的硬盘读写方式，训练速度和性能得到了大幅提高。并且，在特征提取方面，R-CNN是将每个region proposal送入CNN中进行特征提取，导致region proposal大量重叠，特征提取冗余。Fast-RCNN则是将整张图像归一化后送入CNN进行特征提取，在最后一层feature map上将region proposal进行映射，避免了重复特征的提取，减少了运算能力的浪费。并且，R-CNN中独立的SVM和region proposal进行回归运算时需要大量的特征作为训练样本，增加了过多的额外存储，Fast R-CNN利用深度网络实现分类和回归，避免了过多的额外存储。不过，虽然Fast R-CNN相较于R-CNN算法而言，性能和运行速度都获得了提高，但由于它应用了SPP-net的理念，所以也不可避免地出现了在提取候选框时耗时很长的问题。
Fast R-CNN算法的精度比R-CNN要高，所以在对精度要求较高时，可以选取Fast R-CNN算法，但对实时性要求较高的目标检测问题，不建议使用Fast R-CNN算法，因为它的运算速度虽然比R-CNN要快很多，但在实时性的大数据运算过程中，它的运算速度依旧很慢。

3.3 Faster R-CNN算法分析和论述

3.3.1 Faster R-CNN基本原理

Faster R-CNN是Ross Girshick提出的一个很经典的检测结构，它将传统的Selective Search提取目标的方法替换成网络训练来实现，使得全流程的检测、分类速度大幅提升。Faster R-CNN可以简单地看做“区域生成网络RPNs + Fast R-CNN”的系统，用区域生成网络代替FastR-CNN中的Selective Search方法。Faster R-CNN的整体流程如图3-6所示。其具体流程大致可概括为：1.输入图像。2.通过区域生成网络RPN生成候选区域。3.提取特征。4.分类器分类。5.回归器回归并进行位置调整。

图 3-6 Faster R-CNN流程

图3-7是Faster R-CNN的基本结构，第一部分进行特征提取，输入图片和feature map间的那一串卷积+pooling，这部分和普通的CNN网络中特征提取结构没有区别，可以用VGG等各种常见的结构实现。第二部分是RPN部分，这部分是Faster R-CNN所特有的一部分，它所做的工作简化为两件事，第一件事就是把feature map分割成多个小区域，识别出哪些小区域是前景，哪些是背景，简称RPN Classification。第二件事就是获取前景区域的大致坐标，简称RPN bounding box regression。第三部分就是Proposal Layer部分，在获得RPN部分后，网络获得的大致位置，继续训练，获得更精确的位置。最后一部分ROI Pooling部分：利用前面获取到的精确位置，从feature map中抠出要用于分类的目标，并pooling成固定长度的数据。

图 3-7 Faster R-CNN基本结构

3.3.2 Faster R-CNN算法评价

从RCNN到Fast RCNN，再到Faster RCNN，一直都有效率上的提升，而对于Faster RCNN来讲，与RCNN和Fast RCNN最大的区别就是，目标检测所需要的四个步骤，即候选区域生成，特征提取，分类器分类，回归器回归，这四步全都交给深度神经网络来做，并且全部运行在 GPU上，这大大提高了操作的效率。
由于Fast RCNN存在成生候选区，耗时比较长的问题。Faster RCNN利用RPN（全卷积神经网络，其内部与普通卷积神经网络不同之处在于是将CNN中的全连接层变成卷积层）生成候选区，减少耗时。并且使用了RPN网络和Fast-rcnn网络的特征共享与训练，使用了ROI Pooling技术，使用了NMS技术。
综合前文所述，two-stage算法总结如图3-8所示。

图3 8 two-stage代表算法总结

3.4 YOLO算法分析和论述

3.4.1 YOLO基本原理

R-CNN等方法使用region proposal来生成整张图像中可能包含待检测物体的potential bounding boxes，然后用分类器来评估这些boxes，接着通过post-processing来改善bounding boxes，消除重复的检测目标，并基于整个场景中的其他物体重新对boxes进行打分。整个流程执行下来很慢，而且因为这些环节都是分开训练的，检测性能很难进行优化。
整个系统如图3-9所示：首先将输入图片resize到448x448，然后送入CNN网络，最后处理网络预测结果得到检测的目标。相比R-CNN算法，其是一个统一的框架，其速度更快，而且YOLO的训练过程也是end-to-end的。

图 3-9 YOLO检测系统

具体来说，YOLO的CNN网络将输入的图片分割成S×S网格，然后每个单元格负责去检测那些中心点落在该格子内的目标，如图3-10所示，可以看到狗这一个目标的中心落在左下角一个单元格内，那么该单元格负责预测这个狗。每个单元格会预测B个边界框（bounding box）以及边界框的置信度（confidence score）。所谓置信度其实包含两个方面，一是这个边界框含有目标的可能性大小，二是这个边界框的准确度。前者记为\mathbit{Pr}(\mathbit{object})，当该边界框是背景时（即不包含目标），含有目标的可能性是0，而当该边界框包含目标时，含有目标可能性为1。边界框的准确度可以用预测框与实际框（ground truth）的IOU（intersection over union，交并比）来表征。

图 3-10 网格划分

YOLO采用卷积网络来提取特征，然后使用全连接层来得到预测值。网络结构参考GooLeNet模型，包含24个卷积层和2个全连接层，如图3-11所示。对于卷积层，主要使用1x1卷积来做channle reduction，然后紧跟3x3卷积。对于卷积层和全连接层，采用Leaky ReLU激活函数：。但是最后一层却采用线性激活函数。除了上面这个结构，文章还提出了一个轻量级版本Fast YOLO，其仅使用9个卷积层，并且卷积层中使用更少的卷积核。

图3-11 YOLO网络结构

3.4.2 YOLO算法评价

对比YOLO算法在PASCAL VOC 2007数据集上的性能，如图3-12所示。这里YOLO与其它检测算法做了对比，包括DPM，R-CNN，Fast R-CNN以及Faster R-CNN。其对比结果如图所示。与实时性检测方法DPM对比，可以看到YOLO算法可以在较高的mAP上达到较快的检测速度，其中Fast YOLO算法比快速DPM还快，而且mAP是远高于DPM。但是相比Faster R-CNN，YOLO的mAP稍低，但是速度更快。所以。YOLO算法算是在速度与准确度上做了折中。
YOLO与Fast R-CNN的误差对比分析如图3-13所示，可以看到，YOLO的Correct的是低于Fast R-CNN。另外YOLO的Localization误差偏高，即定位不是很准确。但是YOLO的Background误差很低，说明其对背景的误判率较低。

图 3-12 YOLO在PASCAL VOC 2007上与其他算法的对比

图 3-13 YOLO与Fast R-CNN的误差对比分析
YOLO采用一个CNN网络来实现检测，是单管道策略，其训练与预测都是end-to-end，所以YOLO算法比较简洁且速度快。第二点由于YOLO是对整张图片做卷积，所以其在检测目标有更大的视野，它不容易对背景误判。最后全连接层也是对这个有贡献的，因为全连接起到了attention的作用YOLO的泛化能力强，在做迁移时，模型鲁棒性高。
对于YOLO的缺点，首先YOLO各个单元格仅仅预测两个边界框，而且属于一个类别。对于小物体，YOLO的表现会不如人意。这一方面可以借鉴Faster R-CNN，其采用了anchor boxes。YOLO对于在物体的宽高比方面泛化率低，就是无法定位不寻常比例的物体。当然YOLO的定位不准确也是很大的问题。

3.5 SSD算法分析和论述

3.5.1 SSD基本原理

SSD检测的框架如图，SSD在训练期间仅需要每个对象的输入图像和真实标签框。卷积处理时，在具有不同尺度的若干特征图中的每个位置处评估不同宽高比的小集合默认框。对于每个默认框，预测对所有对象类别的形状偏移和置信度。在训练时，首先对这些默认框匹配得到标签框。例如，两个默认框匹配到猫和狗，这些框为正，其余视为负。模型损失是位置损失和置信损失之间的加权和。

图3-14 ssd检测图像

SSD算法是一种直接预测目标类别和bounding box的多目标检测算法。该算法没有生成 proposal 的过程，这就极大提高了检测速度。针对不同大小的目标检测，SSD算法则利用不同卷积层的 feature map 进行综合也能达到同样的效果。SSD采用VGG16作为基础模型，然后在VGG16的基础上新增了卷积层来获得更多的特征图以用于检测。SSD的网络模型如图3-15所示。

图 3-15 ssd算法模型

将最后两个全连接层改成卷积层，并随后增加了4个卷积层来构造网络结构。对其中5种不同的卷积层的输出（feature map）分别用两个不同的3×3 的卷积核进行卷积，一个输出分类用的confidence，每个default box 生成21个类别confidence；一个输出回归用的 localization，每个 default box 生成4个坐标值（x, y, w, h）。此外，这5个feature map还经过 PriorBox 层生成 prior box（生成的是坐标）。上述5个feature map中每一层的default box的数量是给定的(8732个)。最后将前面三个计算结果分别合并然后传给loss层。从后面新增的卷积层中提取Conv7，Conv8_2，Conv9_2，Conv10_2，Conv11_2作为检测所用的特征图。

3.5.2 SSD算法评价

在原论文中，Wei Liu等人使用conv4_3，conv7（fc7），conv8_2，conv9_2，conv10_2和pool11来预测位置和置信度，用“xavier”方法初始化所有新添加的卷积层的参数。SSD300模型已经比Fast R-CNN更准确。当以更大的500×500输入图像训练SSD，结果更准确，甚至惊人的超过了Faster R-CNN 1.9% mAP。Fast和Faster R-CNN输入图像最小尺寸为600，两个SSD模型除了输入图像尺寸（300300和500500），其他设置与其相同。很明显，较大的输入尺寸得到更好的结果。

图 3-16 PASCAL VOC2007测试集检测结果

SSD提出一个one-stage的目标检测方法：在速度比同为one-stage方法YOLO v1快的同时精度能达到two-stage方法Faster-RCNN的水平。SSD的核心思想是用小尺寸卷积核对预设的bbox预测对应的classes score和coord offsets。SSD可以在不同尺寸的feature map上预测不同长宽比例的bbox提升检测精度。相比Yolo，SSD采用CNN来直接进行检测，而不是像Yolo那样在全连接层之后做检测。其实采用卷积直接做检测只是SSD相比Yolo的其中一个不同点，另外还有两个重要的改变，一是SSD提取了不同尺度的特征图来做检测，大尺度特征图（较靠前的特征图）可以用来检测小物体，而小尺度特征图（较靠后的特征图）用来检测大物体；二是SSD采用了不同尺度和长宽比的先验框（Prior boxes, Default boxes）。
通过前文对五种经典算法理论的分析和论述，总结五种基于深度学习的目标检测算法性能对比如图3-17所示。

图3 17 基于深度学习的目标检测算法性能对比

3.6总结

基于深度学习的目标检测算法由于无需进行人工的特征设计、良好的特征表达能力及优良的检测精度，目前已经超越传统检测方法，成为当前目标检测算法的主流。从Viola-Jones Detector、DPM等冷兵器时代的智慧到当今RCNN、YOLO等深度学习土壤孕育下的GPU暴力美学，整个目标检测的发展可谓是计算机视觉领域的一部浓缩史，而目标检测技术发展至今，在经典算法的基础上也演化出了更多的性能强大的算法，以yolo系列为例，通过多种先进方法的融合，yolo v3克服了yolo 系列不擅长检测小物体的缺点，成为了目前为止速度和精度最均衡的目标检测网络。

论文复现

4.1基于yolo v3的目标检测

4.1.1 选择yolo v3的理由

经过大量实验数据验证表明，使用yolo算法进行目标检测，能够获得较高的检测速度和检测准确率。该算法不仅对于实物有着很好的效果，对于其他目标，如艺术作品等同样具有很好的兼容性。yolo算法简单易实现，对于嵌入式开发较为友好，相比其他算法更符合工业界对目标检测算法实时性的要求。
yolo v3作为yolo系列算法集大成之作，表现相当惊人。以COCO mAP50作为评估指标，yolo v3与其他目标检测算法的对比如图4-1所示。

图4 1 YOLOv3与其他目标检测算法的mAP与运行时间对比

4.1.2 环境搭建与模型训练

系统环境：Windows10 + CUDA 10.1
软件环境：labelImg + darknet + visual studio 2019 + OpenCV 4.1.1

按照官网教程配置CUDA和CUDNN成功后，配置opencv4.1.1,然后下载darknet-master，解压后darknet.vcxproj文件使CUDA配置项版本与系统环境中的CUDA版本一致，然后使用visual studio打开darknet.sln文件，修改配置，编译运行后生成darknet.exe文件。在github上下载作者训练好的模型进行测试，测试结果如图4 5和图4-6所示。

使用yolo v3训练自己的数据集，数据集包括0到5六种手势图片，数据集（部分）如图4-7所示。数据集分成训练集和测试集两部分，使用labelImg对所有训练集图片进行画框标注，产生对应的xml文件，然后将这些xml文件转换为darknet能够识别使用的txt文件，并创建参数文件配置相关信息，开始训练。经过不断调参，最终得到了一个较好的模型。

图4 7 手势图片数据集

图4 8 平均损失
使用训练得到的模型对测试集数据进行测试。测试结果如图4 10至图4-15所示。

基于SSD的目标检测

4.2.1 选择SSD的理由

目前，SSD是主要的目标检测框架之一，应用广泛。相比Faster RCNN来说有明显的速度优势，相比早期的YOLO又有明显的mAP优势。SSD与其他算法的运行速度对比如图4-16所示。

图4 16 SSD算法速度与其他算法的对比

4.2.2 环境搭建与结果复现

系统环境：Windows10
软件环境：tensorflow 2.0.0 + pycharm 2018

在Windows10系统下搭建tensorflow框架，成功后从github下载模型，用pycharm对源码进行调试，加载ssd_300模型，加载后工程架构如图4-18所示。

调用已经训练好的ssd_300模型，对图片进行测试。测试结果如图4-19和图4-20所示。

你可能感兴趣的:(AI,神经网络,深度学习,图像处理,图像识别)

iOS OC使用正则表达式去除特殊符号并加粗文本，适用于接入AI大模型的流模式数据的文字处理 MrZWCui iOS ios xcode objective-c 正则表达式学习
1、编写逻辑使用分类(Category)的方法拓展NSString，本文使用NSString(Markdown)，NSString的分类来编写一个通用方法，使用正则表达式匹配字符串实现去除特殊字符，并自定义文字属性。在接入AI大模型后，返回的字符串会带有特殊字符用于做文字处理，下面代码简单进行了文字处理展示。2、代码实现1、NSString+Markdown.h#importNS_ASSUME_N
通义千问：阿里巴巴的AI大模型深度解析俊星学长人工智能
通义千问：阿里巴巴的AI大模型深度解析在人工智能（AI）技术日新月异的今天，大型语言模型作为其中的佼佼者，正逐步改变着我们的生活与工作方式。阿里巴巴推出的通义千问，作为这一领域的佼佼者，以其卓越的性能和广泛的应用场景，引起了业界的广泛关注。本文将从通义千问的简介、模型架构、技术特点与优势、应用场景以及未来发展等多个方面，对其进行全面解析。一、通义千问简介通义千问是由阿里云开发的一款大型语言模型，旨
聊聊langchain4j的AiServices llm
序本文主要研究一下langchain4j的AiServices示例原生版本publicinterfaceAssistant{Stringchat(StringuserMessage);}构建Assistantassistant=AiServices.create(Assistant.class,chatLanguageModel);Stringresp=assistant.chat(userMes
Visual Studio Code (VS Code) – C/C++ 入门
——基于VisualStudioCode官方文档的全面的、具体的入门级教程请移步至https://blog.csdn.net/m0_73287396/article/details/128635316
DeepSeek：中国大模型 “破壁者” 引发的四大产业地震赵同学爱学习人工智能 chatgpt DeepSeek 语言模型大模型开源
导语：当全球AI产业还在为GPT-4的1750亿参数惊叹时，中国团队DeepSeek以颠覆性创新撕开了大模型领域的“铁幕”。这款首个引发国际学术界集体关注的中文大模型，正从技术底层重构产业规则，其冲击波已蔓延至硬件、软件、商业模式的每个角落。一、算力霸权瓦解：低成本训推技术改写游戏规则1.1训练成本“悬崖式下降”DeepSeek通过混合专家架构（MoE）动态路由算法，在同等效果下将模型激活参数压缩
Java：AI 浪潮中的隐形支柱 —— 探秘 Java 在人工智能领域的独特地位琢磨先生David 人工智能
引言在人工智能技术席卷全球的今天，当人们谈论AI开发时，Python、R语言、C++等工具总是最先被提及。然而在这个充满创新的领域，有一个"老兵"正悄然发挥着不可替代的作用——自1995年诞生至今的Java语言，凭借其独特的工程化基因，正在构建起AI世界的底层基础设施。本文将揭示Java如何在大数据、机器学习、企业级AI系统等领域持续创造价值。一、Java的AI基因解码跨平台优势的现代意义"一次编
聊聊langchain4j的Tools(Function Calling) langchain4j
序本文主要研究一下langchain4j的Tools(FunctionCalling)示例tool@Slf4jpublicclassWeatherTools{@Tool("Returnstheweatherforecastfortomorrowforagivencity")StringgetWeather(@P("Thecityforwhichtheweatherforecastshouldber
谷歌Gemini 3大模型发布，AI领域再掀波澜！广拓科技人工智能
在人工智能的浩瀚宇宙中，每一次重大突破都如同一颗璀璨的新星，照亮我们对未来的想象。而近期，谷歌发布的Gemini3大模型，无疑是其中最为耀眼的存在，它在AI领域激起的波澜，迅速蔓延至全球科技圈，引发了广泛关注与热烈讨论。随着AI技术的迅猛发展，我们已经见证了众多令人惊叹的创新成果。从智能语音助手到图像识别技术，从自动驾驶汽车到医疗诊断辅助系统，AI正以前所未有的速度改变着我们的生活和工作方式。在这
详解TCP三次握手（建立连接）和四次握手（释放连接） dvlinker 网络编程与网络问题分享 C/C++实战专栏 tcp/ip 网络协议 TCP连接三次握手四次挥手
VC++常用功能开发汇总（专栏文章列表，欢迎订阅，持续更新...）https://blog.csdn.net/chenlycly/article/details/124272585<
Educoder题目：Java入门 - 变量与数据类型答案解析 bingeho Educoder题目解析 java r语言开发语言
变量与常量src/chapter2/step1/HelloWorld.javapackagechapter2.step1;publicclassHelloWorld{publicstaticvoidmain(String[
JavaScript性能优化指南：聚焦DOM操作优化桃木山人技术杂谈 javascript 性能优化开发语言
引言：性能优化的关键路径在Web应用开发中，JavaScript性能直接影响用户体验。虽然存在多种优化手段，但DOM操作优化往往能带来最显著的性能提升。本文将以DOM操作为核心展开深入分析，并简要概述其他优化方向。核心优化：DOM操作性能提升1.问题根源分析浏览器渲染引擎与JavaScript引擎独立运作，频繁的DOM操作会导致：重排（Reflow）：计算元素几何属性重绘（Repaint）：更新元
Transformer架构在生成式AI中的应用解析二进制独立开发非纯粹GenAI 人工智能 transformer 架构深度学习机器学习 tensorflow 迁移学习
文章目录1.Transformer架构概述1.1Transformer的核心思想1.2Transformer架构的优势2.Transformer在文本生成中的应用2.1GPT系列：基于Transformer的自回归文本生成2.2BERT系列：基于Transformer的双向编码器3.Transformer在图像生成中的应用3.1VisionTransformer（ViT）3.2DALL·E：基于T
1141. 【贪心算法】排队打水 (❁´◡`❁)Jimmy(❁´◡`❁) 粉丝才可以看的NC题解贪心算法算法
题目描述有n（nusingnamespacestd;typedefpairIpair;arrayArrayMan;intn;intmain(){scanf("%d",&n);for(inti=0;i
无需月费，完全本地运行！开源神器Local Deep Research解锁AI研究新姿势遇见小码 AI棱镜实验室人工智能开源 github
在AI技术日新月异的今天，动辄数百美元的订阅费和高性能硬件需求，让许多开发者和小团队对前沿研究工具望而却步。然而，近期一款名为LocalDeepResearch的开源项目横空出世，凭借完全免费、本地化运行、高度可定制的特性，迅速成为技术社区的热议焦点。它不仅打破了传统AI研究工具的高昂门槛，更让每个人都能轻松拥有堪比专业团队的研究能力！一、LocalDeepResearch是什么？LocalDee
**ResNet-SE + MFCC** 训练框架，包括 **数据加载、训练流程**，以及 **混淆矩阵** 可视化示例大霸王龙系统分析业务矩阵 python 线性代数人工智能机器学习深度学习
1.依赖库安装如果你还没安装相关库，请先执行：pipinstalltorchtorchaudiotorchvisionscikit-learnmatplotlibtqdm2.数据加载这里假设你有一个音频分类数据集，其文件结构如下：dataset/│──train/│├──class_0/││├──audio_0.wav││├──audio_1.wav│├──class_1/││├──audio_0
PO、DTO、VO等9大对象划分详解，让你的代码不再“一团糟” 码熔burning SpringBoot Java Java SpringBoot
目录一、PO(PersistentObject)二、DO(DomainObject)三、TO(TransferObject)四、DTO(DataTransferObject)五、VO(ViewObject)六、BO(BusinessObject)七、POJO(PlainOrdinaryJavaObject)八、DAO(DataAccessObject)九、Entity对象转换与使用场景总结何时使用
FastAPI安全防护指南：构建坚不可摧的参数处理体系 qcidyu fastapi 安全
扫描二维码关注或者微信搜一搜：编程智域前端至全栈交流与成长探索数千个预构建的AI应用，开启你的下一个伟大创意第一章：输入验证体系1.1类型安全革命frompydanticimportBaseModel,PaymentCardNumberfrompydantic.typesimportSecretStrclassUserRequest(BaseModel):username:str=Field(mi
LLM之Colossal-LLaMA-2：源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr 一个处女座的程序猿 CaseCode NLP/LLMs 精选(人工智能)-中级 Colossal LLaMA-2 自然语言处理
LLM之Colossal-LLaMA-2：源码解读(init_tokenizer.py文件)实现基于jsonl文件中读取新词列表(新中文词汇)→for循环去重实现词表的扩展(中文标记的新词汇)→保存新的分词模型、(init_model.py文件)实现过计算均值来扩展模型的嵌入层以适应新的词汇表，然后保存扩展后的模型、(prepare_pretrain_dataset.py文件)将原始数据集进行处理
LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插一个处女座的程序猿 NLP/LLMs 精选(人工智能)-中级 Colossal-AI LLaMA-2 大语言模型自然语言处理
LLMs之Colossal-LLaMA-2：源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件)→数据预处理(初始化分词器+数据处理器+数据加载器)→模型训练(初始化模型/优化器/学习率调度器/梯度检查点/Flash-Attention/设置数据类型/是否加载预训练模型/从上一次训练点继续训
小凯的疑惑(数论 ) vir02 算法数据结构 c++
#includeusingnamespacestd;typedeflonglongll;intmain(){//请在此输入您的代码lla,b;cin>>a>>b;llN=a*b-a-b;cout<<N;return0;}如果a和b互素，那么a*b-a-b是最大无法被表示的金额
聊聊langchain4j的ChatMemory langchain4j
序本文主要研究一下langchain4j的ChatMemoryChatMemorylangchain4j-core/src/main/java/dev/langchain4j/memory/ChatMemory.javapublicinterfaceChatMemory{/***TheIDofthe{@linkChatMemory}.*@returnTheIDofthe{@linkChatMemo
聊聊langchain4j的ChatMemory langchain4j
序本文主要研究一下langchain4j的ChatMemoryChatMemorylangchain4j-core/src/main/java/dev/langchain4j/memory/ChatMemory.javapublicinterfaceChatMemory{/***TheIDofthe{@linkChatMemory}.*@returnTheIDofthe{@linkChatMemo
聊聊langchain4j的RagAutoConfig langchain4j
序本文主要研究一下langchain4j-spring-boot-starter的RagAutoConfigLangChain4jAutoConfigdev/langchain4j/spring/LangChain4jAutoConfig.java@AutoConfiguration@Import({AiServicesAutoConfig.class,RagAutoConfig.class,Ai
聊聊langchain4j的RagAutoConfig langchain4j
序本文主要研究一下langchain4j-spring-boot-starter的RagAutoConfigLangChain4jAutoConfigdev/langchain4j/spring/LangChain4jAutoConfig.java@AutoConfiguration@Import({AiServicesAutoConfig.class,RagAutoConfig.class,Ai
聊聊langchain4j的AiServicesAutoConfig langchain4j
序本文主要研究一下langchain4j-spring-boot-starter的AiServicesAutoConfigLangChain4jAutoConfigdev/langchain4j/spring/LangChain4jAutoConfig.java@AutoConfiguration@Import({AiServicesAutoConfig.class,RagAutoConfig.c
深入理解cocotb的Timing Model (一) 数据库github
写在前面达坦科技即将开源的100GRDMARTL代码采用cocotb对其功能进行验证。因此，本文预先介绍一些cocotb验证框架相关的内容，希望以此抛砖引玉，引起大家对基于cocotb的敏捷验证的相关讨论交流。关于Cocotb的话题，会有一系列文章进行讨论，本篇是此系列的第一篇，欢迎大家关注达坦科技公众号，第一时间阅读最新文章。01、抛出问题在使用cocotb编写测试脚本时，大家肯定对类似awai
小狐狸AI数字人源码独立SAAS部署全开源+搭建环境教程 kaui52066 kaui52066精品源码人工智能 uni-app 前端小程序 php 小狐狸AI数字人数字人源码
一.系统介绍小狐狸AI数字人分身系统源码独立部署支持PC端、小程序端、H5端，一键克隆真人形象+声音核心功能亮点：1:1真人级克隆技术声音克隆：上传3分钟音频，AI深度学习声纹特征，复刻语气、情感、方言形象克隆：通过照片/视频建模，生成动态3D数字人，表情自然，动作流畅智能口型同步引擎AI算法精准匹配唇形与语音，实现口型同步0门槛SAAS化操作无需专业设备，网页端一键生成数字人视频海量模板库：电商
Dotnet洋葱架构实践福伴
实现数据层在DomainLayer目录里，建一个Models目录。在Models目录下，建两个类：BaseEntity.cspublicclassBaseEntity{publicintId{get;set;}publicDateTimeCreatedDate{get;set;}publicDateTimeModifiedDate{get;set;}publicboolIsActive{get;s
牛客练习赛128（下）筱姌牛客比赛算法 c++BFS DFS 图论动态规划
Cidoai的平均数对题目描述登录—专业IT笔试面试备考平台_牛客网运行代码#include#includeusingnamespacestd;intmain(){intn,k;cin>>n>>k;inttotalAns=0;intrSum=0;vectorex,weights;for(inti=0;i>a>>b;if(bf(rSum+1,0);for(inti=0;i=ex[i];--j){f[
用Python打造AI玩家：挑战2048，谁与争锋穿梭的编织者人工智能 python
文章目录一、创作背景二、效果图三、准备工作1.安装Chrome和ChromeDriver2.安装Python库四、代码说明‌1.init_driver函数‌2.play_2048函数‌五、完整代码六、改进版本七、主要模块八、核心算法分析1.棋盘状态获取2.位置权重系统3.连续性评估4.单调性评估5.移动模拟系统九、评估系统1.评估标准2.决策机制十、性能优化1.延迟控制2.错误处理十一、完整代码编
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen