rua1234567

目标检测方法综述

基于深度学习的目标检测方法综述

文章目录

基于深度学习的目标检测方法综述
- 一．前言
- 二．两阶段目标检测算法
- - 2.1 R-CNN
  - 2.2 Fast R-CNN
  - 2.3 Faster R-CNN
  - 2.4 Mask R-CNN
  - 2.5模型的对比
- 三．单阶段目标检测算法
- - 3.1 Yolov1
  - 3.2 Yolov2
  - 3.3Yolov3
  - 3.4 SSD
  - 3.5模型对比
- 四．总结和展望
- - 4.1 总结
  - 4.2 展望
- 参考文献

摘要
目标检测是检测图像中的物体的类别和具体位置的技术，随着卷积神经网络的不断发展，也带动了目标检测算法的进步，如今基于深度学习的算法已在目标检测领域成为主流。本文将目标检测算法分为两大类：单阶段和两阶段，具体介绍了每种算法的模型结构，算法性能和优缺点，最后进行了总结和展望。
关键词：深度学习，目标检测算法
Abstract:Object detection is a technology that detects the category and specific location of objects in an image. With the continuous development of convolutional neural networks, it has also led to the progress of target detection algorithms. Nowadays, algorithms based on deep learning have become mainstream in the field of object detection. This paper divides object detection algorithms into two categories: single-stage and two-stage. The model structure, algorithm performance, advantages and disadvantages of each algorithm are specifically introduced, and finally, a summary and outlook are given.
Keywords: deep learning, object detection algorithm

一．前言

在人工智能领域，一直有一个子领域凝聚着众多科学家和心血，其发展一直都是举世瞩目的，那就是计算机视觉领域。而现代的计算机视觉又可细分为四大类问题。分类，定位，检测和分割问题[11]。目标检测是一个检测问题，需要解决分类和定位两大类问题，也相当于是分类和回归问题。定位目标检测主要分为两类方法：单阶段和两阶段，本文将检测算法按照这两类进行具体阐述。

二．两阶段目标检测算法

两阶段目标检测算法需要通过特征提取，然后生成候选框，再使用候选框来进行预测，此类型的方法以R-CNN为代表。

2.1 R-CNN

随着CNN的提出，沉寂已久的目标检测领域终于有了新的方法指引，R-CNN就是这一产物，这是目标检测在深度学习领域的开山之作，由Girshick Ross等人提出。R-CNN(Region proposal with CNNs)第一次将CNN引入目标检测，通过实验研究者得出两个重要观点：可以使用CNN来对候选框来定位分割物体。当标签数据缺少时，使用辅助任务的监督预训练模型，经过特定任务的训练微调参数，可以获得巨大的性能提升。
R-CNN算法主要分为下面四步：

1)输入训练数据集。
2)首先需要先使用selective search方法得到2000个类别独立的候选框。
3)分别经过卷积神经网络计算特征，抽取一个固定长度的特征向量。
4)将特征图分别放入SVM和全连接层进行分类，回归，最终得到类别概率和具体位置信息[1]。
测试时也要使用selective search生成候选框，将候选框放入卷积神经网络，经过前传得到特征向量。再把这些特征向量放入每一个类所对应的SVM中计算概率。使用NMS非极大抑制算法，对于每一个类别的预测框进行处理，查找出预测概率最大的框，计算其他框与其IOU的值，如果大于阈值，则删除改框，最后会保留下每一个类别的少量框。这些框的预测概率都是类别的极大值。
R-CNN先裁剪候选框再计算特征，有很多重复的计算卷积特征。训练分为多个阶段，步骤繁琐：region proposal，CNN特征提取，SVM分类，边框回归。

2.2 Fast R-CNN

由于RCNN存在诸多缺点，比如训练需要经过多段流水线，时空消耗昂贵，在测试和实际检测时也很缓慢。为了加快训练和测试的速度，Girshick Ross又提出了Fast-RCNN，合理优化了检测过程的步骤，成功减少了训练时间并提升了检测准确率。
Fast R-CNN算法流程：

1）以整张图片为输入利用CNN得到图片的特征图
2）通过selective search 方法从原始图片提取区域候选框，并把这些候选框投影到最后的特征层。
3）把特征向量通过RoI Pooling得到定长的特征向量。
4）再把每一个向量放入全连接层得到两个子输出层，softmax分类器和边界框回归器，分别来预测物体类别和物体位置[2]。
Fast R-CNN结构如图1所示：

Fast R-CNN由于在边界框选取的过程中仍然使用selective search，训练一张图片，使用selective search获得候选框花费了2.3s，而特征提取花费了0.32s，花费大量时间，无法满足实时应用。
文章还对模型的训练进行改进，使用SVD来加快模型的训练速度，将两层全连接卷积神经网络参数矩阵进行压缩，可以大大减少参数量。在模型mAP方面，模型在VOC2012上的从62%到了66%。

2.3 Faster R-CNN

为了进一步提高目标检测网络的运行和检测速度，Shaoqing Ren, Kaiming He等人提出了Faster R-CNN，具有实时检测的性能。与前两者的不同，faster R-CNN没有使用selective search方法来搜索候选框，而是使用神经网络(RPN)来自动生成候选框。RPN是一个全卷积网络，能够同时预测每个物体的位置边界和分数。RPN是被训练为端到端的网络，产生高质量的候选框。Faster RCNN结构主要分为三个部分，具体结构如图2所示：
1.backbone，基础卷积层，用于提取图片的特征，例如VGG16，ResNet101，去掉最后的全连接层，输出采样后的特征图。
2.RPN：候选框生成网络，输入特征图，输出候选框。
3.RoI pooling和classifier：整合候选框和特征图，并输出长宽相同的特征向量，放入分类器，得到类别输出和位置输出[3]。

Fig2.faster RCNN Achitecture
图二.faster RCNN网络结构图
在RPN中，利用了滑动窗口的思想，使用3x3的卷积核充当滑动窗口来对特征图进行特征提取，每一个位置生成九个锚框，（3种缩放比*3种长宽比）。总共得到k个锚框，分别通过分类层和回归层得到2k个分数和4k个坐标位置。RPN的结构如图3所示

Fig3.Region Proposal Network
图三.候选框生成网络
Faster R-CNN在准确率方面也超过了以前的所有网络，在使用RPN，VGG和共享权重的条件下，比之前的SS(selective search)方法在相应的数据集下都高%3左右。Faster R-CNN利用CNN骨干网络只进行一次特征提取，就做到了RPN网络和检测头的权值共享，不仅简化了运算，还真正做到了端到端的训练。

2.4 Mask R-CNN

为了适配其他的计算机视觉任务，比如实例分割，Kaiming He，Georgia Gkioxari等人提出了Mask R-CNN。之前的Faster R-CNN在精度上还有不足，特别是在小图片上的精度。Mask R-CNN在Faster R-CNN的基础上添加了一个预测分割mask的头部结构，并将Rol Pooling换成了RolAlign。提高了检测的精度，同时也有利于实例分割。
为了得到固定大小的ROI坐标，Fast R-CNN使用Rol Pooling，但处理过程中常常会碰到坐标信息是一个浮点数，最后得到的坐标并不能对应到一个确切的整数像素点。而Rol Pooling在处理CNN传入的特征图时，采用简单的取整并由特征图再到ROI坐标时也简单的取整，最造成两次bounding box精度损失，这对于大小较小的图片的边界框会造成很大的偏差。
Rol Align在处理过程中没有简单地取整而是使用双线性插值算法，而是根据bounding box选取CNN传入的对应的特征图，并根据所需要的ROI坐标大小等分，对于每一个ROI部分选取几个采样点，并对每个采样点选取4个离其最近的像素点进行加权求和。并对每一个ROI部分中的点取最大值，最后得到w*h大小的ROI坐标[4]。

图5.Rol对齐
Fig5.Rol Align
RoI Align如图5所示，虚线表示特征图，外黑线表示边界框，而设定RoI区域大小为22，在每一个区域中选取一些点，并在每个点做双线性插值。得到22的RoI区域。
为了在有效检测目标的同时输出高质量的实例分割mask，Mask R-CNN在获得RoI区域后添加了预测mask的网络。Mask R-CNN设计了两个不同的网络模型，如图6所示。

图6.头部结构
Fig6.Head Architecture
左图是ResNet，右边是FPN，分别获得14x14x80和28x28x80的mask。Mask R-CNN在实例分割领域的表现高于当时最先进的网络。而使用RoIAlign会比使用RoIPool准确率高7%左右。但是由于使用了RoI Align并添加了新的mask分支，模型的参数量会进一步增加，模型会更加复杂。

2.5模型的对比

上述基于候选框的方法首先需要提取出目标可能存在的区域，然后提取特征进行预测和回归，相关的算法对比如表1所示。
随着卷积神经网络和区域提取方法的发展，两阶段目标检测算法的速度和准确率一直在提高，但还是无法进行实时的识别，另一种方法能完美的实现实时监测，那就是以yolo为代表的单阶段目标识别算法。
表1. 两阶段目标检测算法性能对比
Table1. Performance comparison of two-stage target detection algorithms
| 结构| 骨干网络 |损失函数 |计算速率| mAP/% |优点 |缺点

结构	骨干网络	损失函数	计算速率	VOC2007 mAP/%	优点	缺点
R-CNN	AlexNet	边界框回归L2 Loss分类SVM损失函数	0.03	58.5	首次使用CNN来提取图片特征用于目标检测[10] 有很多重复的计算卷积特征。	训练分为多个阶段，步骤繁琐
Fast R-CNN	VGG-16	SmoothL1 loss 分类损失softmax	0.5	70.0	对整张图片提取特征训练检测速度更快	仍然使用SS算法选取候选框，耗费大部分时间
Faster R-CNN	VGG-16	交叉熵，SmoothL1 loss	7.00	69.9	使用RPN自动生成候选框，实现了端到端训练	模型复杂，小目标效果不好
Mask R-CNN	ResNeXt-101	基于单像素sigmod二值交叉熵	11.00	78.2	使用RoI Align提高了检测精度，同时实现检测和分割	实例分割代价太高

三．单阶段目标检测算法

单阶段目标检测算法也需要先通过特征提取，然后直接使用特征来预测物体的类别和位置信息，不需要先生成候选框，因为已经有固定的锚框。此类型的方法以yolo为代表。

3.1 Yolov1

R-CNN系列的算法都不是实时的，检测的速度都是比较慢的，训练的流程也比较复杂，为了解决这些问题，Joseph Redmon等人模拟人眼看一眼就能知道物体类别和位置的特点，提出了YOLO(You Only Look Once)，这是一个单阶段的端到端的检测网络，能够实现实时检测，大大减少了训练和测试时间。
yolo模型将目标检测看作一个回归问题，并把每一个物体的边界框和相应的类别分开，一个简单的神经网络就可以直接在一个评估阶段预测出整个图片的物体边界框和类别概率。
在保证高精度的条件下，Yolo实时速度可以达到检测45fps。
Yolo在训练和测试时可以看到整张图片，所以这隐性地编码了上下文信息，这也使得Yolo在检测中比Fast R-CNN的背景检测错误率减少了一半，从13.6%降为4.75%。如图7所示。

Fig7.Error Analysis Fast R-CNN vs yolo
图7.Fast R-CNN与yolo错误率分析
Yolo做的一大贡献是将检测流程统一起来，整张图放入卷积神经网络获得特征图，将其分为SS个网格，每个网格负责预测B个边界框(x,y,w,h)和置信度©，如果一个物体的中心落入网格块，那这个网格块就要预测。预测的类别为C，最终获得的输出向量大小为SS*(B5+C)[5]。在yolo论文中，作者使用VOC2007数据集进行训练类别数C=20，设置S=7，B=2。所以最后的向量维度为77*(25+20)=1470维。
yolo在网络结构设计方面借鉴了GoogleNet，使用了大量11后接3*3卷积的组合，能够实现跨通道的信息整合和交互，能够大幅度的增加网络的非线性特征。

图8.yolo结构图
Fig8.Yolo Architecture
值得一提的是，由于论文中yolo对处理得到的特征图选取77=49个网格，并且每个网格也最多进行2个物体的检测，所以最多可有492=98个框，相当于候选框只有98个，与之前R-CNN的2000多个候选框差了20倍，所以yolo的检测速度非常快，但精度不太好，尤其是检测小物体的精度不够好，以及检测的召回率不高，这些都与yolo的框不够多，生成框的随机性太大，所以检测不到一些物体。yolo虽然精度方面没有提高，但其在简化目标检测训练流程和加快检测速度方面都有重大的突破。

3.2 Yolov2

针对yolov1暴露出的缺陷：大量的定位错误和较低的召回率，Joseph Redmon, Ali Farhadi提出了yolov2模型，采取了更好的表示方法，让网络更好的学习。Yolov2在VOC 2007数据集中达到了76.8的mAP和67fps。
为了模型正则化，作者引入了批量归一化层，提高了2%mAP。作者采用了高分辨率的分类器，yolov1时采用的输入大小为224224，但是检测网络采用的输入为448448，意味着检测网络训练的过程需要重新学习更大的输入尺寸。Yolov2将分类网络在448*448的输入下进行微调，然后进行检测网络的微调，提高了4%mAP[6]。
Yolov1包含有全连接层直接预测坐标，但是Faster R-CNN使用RPN对锚框预测偏移量和置信度，预测偏移而不是坐标会简化问题并且更易于网络学习。作者移除了全连接层，使用锚框来预测边界框，使用锚框会让精确度稍微下降，但用了它yolo能预测出大于1000个框，同时recall达到88%，mAP达到69.2%[5]。为了优化锚框的尺寸，作者在训练集的真实框中使用k-means聚类，得到了k个位置的锚框，能够自动的找到平均IoU更高的候选框。

3.3Yolov3

Yolov3是Joseph Redmon, Ali Farhadi提出的又一个yolo系列网络，它对之前地yolo网络又做了一系列的设计改变，在准确率方面有很大的提升，也仍然保持快速的特点。
由于同一个锚框可能会有多个目标存在，softmax并不适合多标签分类。Yolov3将损失函数从平方差损失函数改为n_class个二元交叉熵损失函数，能够更好的实现重叠多目标的检测[9]。
Yolo3具有多尺度预测的特点。yolov3使用三种不同尺度来预测锚框，对特征图采用上采样，并和原特征图进行拼接，作者又对组合的特征图进行放入卷积层处理，得到了类似的张量。使用多尺度的特征向量更有益于提高模型检测的精度[8]。

3.4 SSD

与yolov3同一时期，Wei Liu1, Dragomir Anguelov等人提出了SSD(Single Shot MultiBox Detector),这个方法将边界框的输出空间离散化为一组默认框，每个特征图位置具有不同的宽高比和大小比例。
除此之外，网络结合了不同分辨率的特征图能自然地检测到不同大小的物体。SSD是一个相对简单的网络，因为它完全消除了候选框生成，后续像素和特征重采样阶段，并将所有计算封装在一个单一的网络。这使得SSD易于训练并且可以直接嵌入需要检测组件的系统。
在网络模型方面，SSD在使用骨干网络提取到特征图后又在之后添加了不同深度的卷积特征层用于提取不同尺度下的特征图，使得模型能够预测不同尺度下的检测目标。SSD使用的先验框与Faster R-CNN中的锚框相似，但是SSD将先验框用在不同尺度下的特征图，能更有效地抽离出可能地输出边界框地大小形状[7]。SSD网络结构如图9所示。

图9.SSD网络结构图
Fig9.The SSD Architecture

3.5模型对比

单阶段目标检测算法没有生成候选框的步骤，所以训练和测试速度更快，但是检测的精度都是存在的问题。上述单阶段算法的具体对比如表2所示。
另外，SSD，yolov2，yolov3都提到了多尺度预测的概念，这是有所不同的。SSD对一个特征图用卷积层不断抽取新的特征，并将这些不同尺度的特征叠加在一起，这是一种尺度融合的方式。Yolov2是指输入的图像大小不同，yolov3是不同分辨率的特征图的融合。

表2.单阶段目标检测算法性能对比
Table2.Performance comparison of one-stage target detection algorithms

结构	骨干网络	损失函数	计算速率	VOC2012 mAP /%	优点	缺点
Yolov1	GoogLeNet	坐标，置信度，类别平方和损失之和[9]	45.0	63.4	划分为固定网格，大大减少了训练和测试时间。	检测小物体的精度不够好，以及检测的召回率不高
Yolov2	DarkNet-19	与yolov1相同	67	73.4	引入锚框，提高了检测精度和速度	池化层多，影响梯度计算
Yolov3	Darknet-53	n个二值交叉熵[9]	51.0		多尺度特征预测，准确率方面有很大的提升	模型复杂，中、大尺度物体检测效果差
SSD	VGG-16	交叉熵	19.3	78.5	融合多层卷积特征，提升中、大尺度物体检测精度	收敛困难、小物体检测精度提升有限

四．总结和展望

4.1 总结

这两大类方法最明显的不同就是是否使用预生成的候选框。这一流程有利有弊，它能提高模型检测各种尺度物体的精度，但也会大大降低模型检测速度，所以需要有所取舍，但随着目标检测技术的发展，单阶段检测算法也有很高的精度。
由于两阶段算法在速度方面的缺点，由此产生了单阶段算法，直接将目标检测看作回归问题，除此之外，研究人员还提出了多尺度特征融合和难样本挖掘等方法来进一步提高模型性能。
面对不同的场景，我们需要不同的检测算法，这些算法之间也有着千丝万缕的联系，比如原本用于图像分类的CNN也能用于目标检测，Faster R-CNN做进一步改进为Mask R-CNN就可以实现实例分割。算法之间的相互借鉴可以促进相互的发展，更好的验证算法的可行性和有效性。

4.2 展望

目标检测的精度，检测速度一直是受重视的指标，如今目标检测的发展方向还应该有检测流程简单，易于落地使用。在其他领域，目标检测也可以进一步发展。
1）小样本学习。由于目前的数据量非常庞大，而数据标注的成本有很高，所以研究人员需要研究如何仅使用少量样本标签，就能够学习到知识。这能够更好的提高模型的性能。
2）弱监督学习。与小样本学习类似，弱监督学习包括不确切的标签、不完整的标签和不正确的标签都是实际应用场景会碰到的问题。能解决这些问题将会是重大的突破。

参考文献

[1]Girshick, Ross, Jeff Donahue, Trevor Darrell, and Jitendra Malik. “Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation.” ArXiv:1311.2524 [Cs], October 22, 2014. http://arxiv.org/abs/1311.2524.
[2]Girshick, Ross. “Fast R-CNN.” ArXiv:1504.08083 [Cs], September 27, 2015. http://arxiv.org/abs/1504.08083.
[3]Ren, Shaoqing, Kaiming He, Ross Girshick, and Jian Sun. “Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks.” IEEE Transactions on Pattern Analysis and Machine Intelligence 39, no. 6 (June 1, 2017): 1137–49. https://doi.org/10.1109/TPAMI.2016.2577031.
[4]He, Kaiming, Georgia Gkioxari, Piotr Dollár, and Ross Girshick. “Mask R-CNN.” ArXiv:1703.06870 [Cs], January 24, 2018. http://arxiv.org/abs/1703.06870.
[5]Redmon, Joseph, Santosh Divvala, Ross Girshick, and Ali Farhadi. “You Only Look Once: Unified, Real-Time Object Detection.” ArXiv:1506.02640 [Cs], May 9, 2016. http://arxiv.org/abs/1506.02640.
[6]Redmon, Joseph, and Ali Farhadi. “YOLO9000: Better, Faster, Stronger.” ArXiv:1612.08242 [Cs], December 25, 2016. http://arxiv.org/abs/1612.08242.
[7]Liu, Wei, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, and Alexander C. Berg. “SSD: Single Shot MultiBox Detector.” ArXiv:1512.02325 [Cs] 9905 (2016): 21–37. https://doi.org/10.1007/978-3-319-46448-0_2.
[8]知乎专栏. “论文解读Yolo三部曲解读——Yolov3.” Accessed November 4, 2021. https://zhuanlan.zhihu.com/p/76802514.
[9]“[Intensive Reading]目标检测(Object Detection)扩展系列（三） Faster R-CNN，YOLO，SSD，YOLOv2，YOLOv3在损失函数上的区别_zhangxu-CSDN博客.” Accessed November 4, 2021. https://blog.csdn.net/chaipp0607/article/details/102094625.
[10]“RCNN,Fast RCNN,Faster RCNN比较归纳总结（一）rcnn和cnn区别.” Accessed November 4, 2021. https://blog.csdn.net/xiaoye5606/article/details/71191429.
[11]赵梓杉,秦玉英,李刚,衣明悦.基于深度学习的目标检测算法综述[J].汽车实用技术,2021,46(17):207-209.

人工智能驱动下的可再生能源气象预测：构建绿色能源时代的新大脑一ge科研小菜菜人工智能人工智能能源
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注一、背景：新能源快速发展下的预测焦虑为应对气候变化和实现碳中和目标，全球能源系统正在加速从“化石主导”向“可再生主导”过渡。风能、太阳能等清洁能源已成为未来能源结构的关键支柱。根据国际能源署（IEA）预测，到2050年，全球超70%的电力将来自可再生能源。然而，可再生能源具有显著的**“天气依赖性”和“波动不确定性”**，风速、光照、温度、湿度等
筑牢 AIGC 安全防线：警惕提示词注入攻击 CS创新实验室 AIGC AIGC 安全大模型提示词提示词注入
在AIGC（生成式人工智能）技术蓬勃发展的当下，其在各个领域的应用日益广泛。然而，随着AIGC技术的深入应用，安全问题也逐渐凸显，提示词注入攻击便是其中不容忽视的一大威胁。对于AIGC开发者而言，深入了解提示词注入攻击并做好防范工作，是保障AIGC系统安全稳定运行的关键。提示词注入攻击的基本知识提示词注入攻击是指攻击者通过精心设计和构造提示词，利用AIGC模型对输入文本的处理机制，干扰模型的正常运
AI人工智能助力联邦学习通信效率优化的解决方案 AI智能应用人工智能 ai
AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案元数据框架标题AI驱动的联邦学习通信效率优化：从理论到实践的全面解决方案关键词联邦学习（FederatedLearning）、通信优化（CommunicationEfficiency）、AI赋能（AI-Enabled）、参数压缩（ParameterCompression）、客户端选择（ClientSelection）、联邦蒸馏（Federa
通义WebSailor：开启网络智能体新时代云资源服务商人工智能 ai
引言：WebSailor的横空出世在人工智能技术迅猛发展的当下，新的模型和智能体不断涌现，一次次刷新着人们对AI能力的认知。2024年7月7日，阿里云的一则消息犹如一颗重磅炸弹投入AI领域的湖面，激起千层浪——通义正式开源网络智能体WebSailor。这一开源举措，瞬间吸引了全球AI开发者、研究者以及科技爱好者的目光，在业界引发了强烈震动。一时间，技术论坛、社交媒体上关于WebSailor的讨论铺
AI人工智能领域，Stable Diffusion掀起的技术风暴 AI大模型应用工坊人工智能 stable diffusion ai
AI人工智能领域，StableDiffusion掀起的技术风暴关键词：AI人工智能、StableDiffusion、技术风暴、图像生成、扩散模型摘要：本文深入探讨了AI人工智能领域中StableDiffusion所掀起的技术风暴。首先介绍了StableDiffusion的背景，包括其目的、预期读者和文档结构等。详细阐述了核心概念与联系，通过文本示意图和Mermaid流程图进行清晰展示。对核心算法原
AI人工智能浪潮中，GPT的技术优势凸显 AI学长带你学AI 人工智能 gpt ai
AI人工智能浪潮中，GPT的技术优势凸显关键词：人工智能、GPT、自然语言处理、深度学习、Transformer、大语言模型、技术优势摘要：本文深入探讨了在人工智能浪潮中GPT(GenerativePre-trainedTransformer)系列模型的技术优势。我们将从GPT的核心架构出发，分析其独特的技术特点，包括自注意力机制、预训练-微调范式、零样本学习能力等。通过与传统NLP方法的对比，揭
PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第1-11个视频笔记）胡说八道的Dr. Zhu 深度学习 pytorch 学习
本学习笔记源自于B站up主【我是土堆】的视频教程：PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】本博客是该视频教程中第1-11个视频的详细学习笔记，第12-22个视频、第23-33个视频的详细学习笔记链接如下：PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第12-22个视频笔记）PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第23-33个视频笔记）目录1、P
AI伦理与安全之-哥斯拉与缰绳：如何让“哥斯拉”听懂人类的“悄悄话”？众链网络 AI伦理与安全 AI 人工智能 AI工具 AI智能体
相关文章:AI伦理与安全AI伦理与安全之-镜子与偏见：我们教给它的，究竟是智慧还是偏见？AI伦理与安全之-哥斯拉与缰绳：如何让“哥斯拉”听懂人类的“悄悄话”？AI伦理与安全之-梦境与幻觉：它为何会一本正经地胡说八道？在上一篇中，我们谈到AI像一面“镜子”，会映照出我们数据中的偏见。但那只是AI伦理问题中的“序章”。一个更深邃、更终极的挑战，正横亘在人类与超人工智能（ASI）的未来之间。这个挑战，就
深度学习Pytorch(一) Bgemini 深度学习 pytorch 深度学习 python
深度学习Pytorch(一)前言：必须使用英伟达显卡才能使用cuda（显卡加速）！移除环境：condaremove-npytorch--all一、安装Pytorch下载Anaconda打开AnacondaPrompt创建一个Pytorch环境：condacreate-npytorchpython=3.9激活Pytorch环境：condaactivatepytorch查看当前包：piplist安装P
PyTorch深度学习优化实战：从理论到实践的现代化技能指南智算菩萨深度学习 pytorch 人工智能
引言：现代PyTorch开发的核心思维在深度学习技术日新月异的今天，掌握PyTorch不仅仅意味着能够搭建和训练神经网络，更重要的是理解如何高效地利用现代硬件资源、优化模型性能并构建可扩展的AI系统。随着PyTorch2.x系列的成熟，特别是最新2.7版本的发布，框架为开发者提供了前所未有的优化工具和性能潜力。本文将深入探讨现代PyTorch开发中的核心优化技能，从编译器优化到注意力机制革新，从内
俄罗斯方块AI深度解析：从算法原理到实现细节智算菩萨 Python小游戏项目实战人工智能算法
俄罗斯方块AI深度解析：从算法原理到实现细节前言俄罗斯方块，这个诞生于1984年的经典游戏，至今仍然是人工智能研究领域的热门课题。当简单的几何形状在网格中不断下落时，看似简单的规则背后却隐藏着复杂的策略决策问题。本文将深入剖析一个基于Python实现的俄罗斯方块AI系统，探讨其如何通过精巧的算法设计实现近乎完美的自动游戏表现。游戏状态的数字化抽象在构建任何游戏AI之前，我们首先需要将人类直观理解的
大语言模型的具身化——LLM-based Agents实战 apollowin123 人工智能语言模型深度学习
1.概述1.1Agent是什么长期以来，研究者们一直在追求与人类相当、乃至超越人类水平的通用人工智能（ArtificialGeneralIntelligence，AGI）。早在1950年代，AlanTuring就将「智能」的概念扩展到了人工实体，并提出了著名的图灵测试。这些人工智能实体通常被称为——代理（Agent）。「代理」这一概念起源于哲学，描述了一种拥有欲望、信念、意图以及采取行动能力的实体
AI原生应用：多模态交互技术的5大核心应用场景解析 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AI-native ai
#AI原生应用：多模态交互技术的5大核心应用场景解析>关键词：多模态交互、AI原生应用、人机交互、深度学习、应用场景>摘要：本文将深入解析多模态交互技术的核心原理，通过智能家居、医疗诊断、自动驾驶、教育创新和虚拟助手五大应用场景，揭示AI如何像人类感官协同工作般理解世界。文章包含技术原理图解、真实案例代码和未来趋势预测。##背景介绍###目的和范围解析多模态交互技术在AI原生应用中的落地实践，涵盖
PyTorch 2.7深度技术解析：新一代深度学习框架的革命性演进智算菩萨深度学习 pytorch 人工智能
引言：站在AI基础设施变革的历史节点在2025年这个充满变革的年份，PyTorch团队于4月23日正式发布了2.7.0版本，随后在6月4日推出了2.7.1补丁版本，标志着这个深度学习领域最具影响力的框架再次迎来了重大突破。这不仅仅是一次常规的版本更新，而是一次面向未来计算架构和AI应用场景的全面重构。从底层硬件支持到上层API设计，从编译器优化到注意力机制革新，PyTorch2.7展现出了前所未有
Boltz-2：革命性生物分子模型，加速药物发现的新引擎花生糖@ AIGC学习资料库 Boltz-2 生物模型 AI
在药物研发领域，预测蛋白质与其他分子间的结合强度（BindingAffinity）始终是核心挑战之一。传统方法如自由能微扰法（FEP）虽然精确，但计算成本极高，难以大规模应用。如今，Boltz-2的诞生打破了这一瓶颈——这是首个开源的深度学习模型，其结合强度预测准确度接近FEP方法，却将速度提升了1000倍，成为药物早期筛选的“加速器”。项目简介Boltz-2是由jwohlwend团队开发的生物分
人工智能在医疗领域的应用：技术革新与未来展望
人工智能（AI）技术正在重塑医疗行业的面貌。从辅助诊断到药物研发，从健康管理到手术机器人，AI的广泛应用不仅提升了医疗效率，还为精准医疗和个性化治疗提供了新可能。根据2025年多份研究报告及政策文件，全球AI医疗市场正以39.4%的年复合增长率高速扩张，预计到2025年，中国市场规模将达349亿元，全球规模则可能突破千亿美元18。本文将从应用场景、技术驱动、挑战与政策支持等维度，探讨AI在医疗领域
10.5 实战ChatGLM3私有数据微调之提示工程：批量生成数据稳定性秘籍少林码僧掌握先机！从 0 起步实战 AI 大模型微调打造核心竞争力机器学习深度学习人工智能语言模型
实战ChatGLM3私有数据微调之提示工程：批量生成数据稳定性秘籍在当今人工智能蓬勃发展的时代，大语言模型（LLMs）如ChatGLM3的出现，为自然语言处理领域带来了革命性的变化。企业和开发者们纷纷寻求利用这些强大的模型来构建定制化的应用，以满足特定业务需求。其中，使用私有数据对ChatGLM3进行微调，成为了实现差异化竞争和提供个性化服务的关键途径。然而，在微调过程中，确保批量生成数据的稳定性
大语言模型（LLM）课程学习（Curriculum Learning）、数据课程（data curriculum）指南：从原理到实践
在人工智能的浪潮之巅，我们总会惊叹于GPT-4、Llama3.1、Qwen2.5这些顶尖大语言模型（LLM）所展现出的惊人能力。它们似乎无所不知，能写诗、能编程、能进行复杂的逻辑推理。一个自然而然的问题是：它们是如何“学”会这一切的？大多数人会回答：“用海量数据喂出来的。”这个答案只说对了一半。如果你认为只要把互联网上能找到的所有数据（比如15万亿个token）随机打乱，然后“一锅烩”地喂给模型，
Halcon学习之select_shape（）算子参数介绍
一、算子介绍select_shape()是HALCON中用于基于形状特征筛选区域的关键算子，广泛应用于图像分割、目标检测和工业质检等领域。它允许用户根据指定的几何特征从输入区域集合中选择符合条件的区域。至于为什么单独介绍这个算子呢，因为他筛选特征的方式有太多种了，如果可以熟练的掌握这些特征，那在后面的例程学习以及实际应用中，可谓是得心应手了。二、算子参数select_shape(Regions:S
bounding box 回归
【目标检测】基础知识：IoU、NMS、Boundingboxregression-知乎(zhihu.com)
人工智能学习资源 Hemy08 人工智能学习
无机器学习基础：https://www.coursera.org/learn/machine-learning有机器学习基础：MachineYearning深度学习入门：https://www.coursera.org/learn/neural-networks-deep-learning
量子计算+AI芯片：光子计算如何重构神经网络硬件生态
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站量子计算+AI芯片：光子计算如何重构神经网络硬件生态——2025年超异构计算架构下的万亿参数模型训练革命产业拐点：英伟达BlackwellUltra发布光互连版GPU，IBM量子处理器突破512比特，光子计算商用成本降至$5/TOPS实测突破：Llama3-405B在光子-量子混合集群训练能耗下
为什么让AI洗碗比写诗难百倍？清华教授揭秘具身智能鸿沟 Loving_enjoy 计算机学科论文创新点机器学习人工智能 facebook 课程设计
>**人类小脑数亿年进化出的运动智慧，成了AI最难破解的密码**2025年3月，一位网友困惑地发问：“我想让人工智能替我洗碗做饭洗衣服，没想到现在的AI反而在画画、写歌、搞创作……”对此，全国政协委员、中国科学院自动化研究所研究员赵晓光一针见血地指出：**“大模型没有创新能力，想让AI干体力活还要靠具身智能的发展。”**这个看似矛盾的现象背后，隐藏着人工智能发展进程中一个惊人的认知盲区。清华大学心
TensorFlow图神经网络(GNN)入门指南 AI天才研究院 AI人工智能与大数据 tensorflow 神经网络人工智能 ai
TensorFlow图神经网络(GNN)入门指南关键词：TensorFlow、图神经网络、GNN、深度学习、图数据、节点嵌入、图卷积网络摘要：本文全面介绍如何使用TensorFlow实现图神经网络(GNN)。我们将从图数据的基本概念开始，深入探讨GNN的核心原理，包括图卷积网络(GCN)、图注意力网络(GAT)等流行架构，并通过TensorFlow代码示例展示如何构建和训练GNN模型。文章还将涵盖
AI LLM架构与原理 - 预训练模型深度解析陈乔布斯 AI 人工智能大模型人工智能架构机器学习深度学习大模型 Python AI
一、引言在人工智能领域，大型语言模型（LLM）的发展日新月异，预训练模型作为LLM的核心技术，为模型的强大性能奠定了基础。预训练模型通过在大规模无标注数据上进行学习，能够捕捉语言的通用模式和语义信息，从而在各种自然语言处理任务中展现出卓越的能力。本文将深入探讨AILLM架构与原理中预训练模型的方法论和技术，结合图解、代码解析和实际案例，为读者呈现一个全面且易懂的预训练模型图景。二、预训练模型的基本
深度学习微调中的优化器全景解析：从理论到实践北辰alk AI 深度学习人工智能
文章目录一、基础优化器：深度学习微调的基石1.1随机梯度下降（SGD）1.2AdaGrad（自适应梯度算法）二、自适应优化器：现代深度学习的标配2.1RMSProp2.2Adam（自适应矩估计）三、大模型微调专用优化器3.1LAMB（Layer-wiseAdaptiveMoments）3.2Sophia（二阶优化启发）四、优化器性能对比研究4.1在GLUE基准上的表现（BERT-base微调）4.
PyTorch 详细安装教程及核心API使用指南慕婉0307 pytorch pytorch 人工智能 python
一、PyTorch简介PyTorch是由FacebookAIResearch(FAIR)于2016年开发的开源深度学习框架，现已成为学术界和工业界最受欢迎的深度学习工具之一。其核心优势在于采用了动态计算图（DynamicComputationGraph，又称"define-by-run"机制），这使得开发者能够像编写普通Python代码一样构建神经网络，并在运行时动态调整计算图结构，大大提高了研究
2025主流AI大模型终极指南：横向对比+实战测评+官方注册教程 AI新视界 AI工具全指南：从入门到精通解锁高效生产力人工智能
《2025主流AI大模型终极指南：横向对比+实战测评+官方注册教程》在人工智能技术飞速发展的今天，大型语言模型(LLM)已成为推动数字化转型的核心引擎。作为CSDN资深AI技术专家，我将通过本文为您全面剖析2025年主流大模型的技术特点、应用场景和性能差异，并提供详细的官方注册和使用指南，帮助您快速掌握这些强大的AI工具。一、2025年主流大模型全景概览1.1大模型技术发展现状2024-2025年
AIGC视觉生成革命：文生图、图生图与视频生成垂直模型发展全景报告（2025） Liudef06小白 AIGC 人工智能 AI作画语言模型
一、引言：从实验工具到产业引擎的跃迁人工智能生成内容（AIGC）技术正经历从文本向多模态的范式转移。2023-2025年间，文生图、图生图与视频生成垂直模型逐步跨越技术奇点，从实验室玩具进化为工业化生产力工具。这一进程的核心驱动力在于架构创新、数据优化与场景深耕的三重突破：扩散模型与Transformer的融合催生了更高保真度的图像生成；十亿级多模态数据训练解决了复杂语义理解难题；而面向影视、电商
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分