麒麒哈尔

【论文阅读】【综述】3D Object Detection 3D目标检测综述

Multi-View 3D Object Detection Network for Autonomous Driving (CVPR2017)
RT3D: Real-Time 3-D Vehicle Detection in LiDAR Point Cloud for Autonomous Driving
Frustum PointNets for 3D Object Detection from RGB-D Data (CVPR2018)
Joint 3D Proposal Generation and Object Detection from View Aggregation (IROS2018)
PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud （CVPR2019）
VoteNet：Deep Hough Voting for 3D Object Detection in Point Clouds
Multi-Task Multi-Sensor Fusion for 3D Object Detection
GS3D: An Efficient 3D Object Detection Framework for Autonomous Driving
Stereo R-CNN based 3D Object Detection for Autonomous Driving
STD: Sparse-to-Dense 3D Object Detector for Point Cloud
Part-A^2 Net: 3D Part-Aware and Aggregation Neural Network for Object Detection from Point Cloud
Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection
BirdNet: a 3D Object Detection Framework from LiDAR Information（2018 ITSC）
StarNet: Targeted Computation for Object Detection in Point Clouds
PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection

One Stage

3D Fully Convolutional Network for Vehicle Detection in Point Cloud (IROS2017)
Complex-YOLO: An Euler-Region-Proposal for Real-time 3D Object Detection on Point Clouds（ECCV2018）
YOLO3D: End-to-end real-time 3D Oriented Object Bounding Box Detection from LiDAR Point Cloud（ECCV2018）
PIXOR: Real-time 3D Object Detection from Point Clouds (CVPR2018)
HDNET: Exploiting HD Maps for 3D Object Detection (CoRL2018)
Voxel-FPN: multi-scale voxel feature aggregation in 3D object detection from point clouds
VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection (CVPR2018) （未完）
LaserNet: An Effcient Probabilistic 3D Object Detector for Autonomous Driving Gregory (Arxiv2019)（未完）
3DSSD: Point-based 3D Single Stage Object Detector

另一种分类方式：Voxel or Image or Pointcloud？
Loss的进化史

未完待续。。。

3D Object Detection

2D Object Detection 的研究已经非常成熟了，代表作品有RPN系列的FasterRCNN和MaskRCNN，One Shot系列的YOLOv1-YOLOv3。这里推荐一个2D Object Detection发展过程和论文的github链接。

在2D Object Detection的基础上又提出了新的要求3D Object Detection。问题的具体描述检测环境中的三维物体，并给出物体的Bounding Box。相比于2D，3D的Bounding Box的表示除了多了一个维度的位置和尺寸，还多了三个角度。可以想象，一架飞机的Bounding Box的尺寸的是固定的，飞机的姿态除了位置之外，还有俯仰角、偏航角和翻滚角三个角度。

目前对于3D Object Detection有迫切需求的产业是自动驾驶产业，因为要想安全的自动驾驶，需要周围障碍物的三维位姿，在图片中的二维位姿不带深度信息，没有办法有效避免碰撞。所以3D Object Detection的数据集大多也是自动驾驶数据集，类别也主要是车辆和行人等，比较常用的有KITTI和kaist。由于自动驾驶针对车辆，所以障碍物的高度的检测对于安全行驶并没有十分重要，而障碍物都在陆地上，所以也不存在俯仰角和翻滚角两个角度。所以有些3D Object Detection方法将这三值忽略了。

接下来我将详细列几篇论文，以及我认为论文中比较关键的一些点。每篇论文具体的细节和解读还请读者自行搜索。3D Object Detection的方法很大程度上是借鉴了2D Object Detection的方法。

Sliding window

Vote3Deep: Fast Object Detection in 3D Point Clouds Using Efficien（IROS2017）

该方法使用三维滑动窗口的方法。首先将点云栅格化，然后使用固定大小的三维窗口，使用CNN判断该窗口的区域是否为车辆。由于栅格化的稀疏性质，该文章使用了稀疏卷积的操作，将卷积核做中心对称，将卷积操作变为投票操作，使得该投票操作只用在不为0的栅格点进行投票即可，减少了大量空卷积的操作。具体投票方式见下图。

具体投票为将中心对称过后的卷积核的中心与非零点对齐，然后相乘，即可得到改点的投票。将多点投票的重叠的区域相加，得到输出。

Two Stage

Multi-View 3D Object Detection Network for Autonomous Driving (CVPR2017)

MVNet使用点云和图像作为输入。点云的处理格式分为两种：第一种是构建俯视图（BV），构建方式是将点云栅格化，形成三维栅格，每一个栅格是该栅格内的雷达点最高的高度，每一层栅格作为一个channel，然后再加上反射率（intensity）和密度（density）的信息；第二种是构建前视图（FV），将雷达点云投影到柱坐标系内，也有文章叫做range view，然后栅格化，形成柱坐标系内的二维栅格，构建高度、反射率和密度的channel。
使用俯视图按照RPN的方式回归二维proposal，具有（x, y, w, l）信息，角度只分成0和90度两种，z和h的信息在这一步被设置为常量。然后将三维的proposal进行多个角度的ROI pooling，fusion过程可使用concatenation或summation。最后加上经典的分类头和回归头。

文章中强调使用俯视图的好处
“We use the bird’s eye view map as input. In 3D object detection, The bird’s eye view map has several advantages over the front view/image plane. First, objects preserve physical sizes when projected to the bird’s eye view, thus having small size variance, which is not the case in the front view/image plane. Second, objects in the bird’s eye view occupy different space, thus avoiding the occlusion problem. Third, in the road scene, since objects typically lie on the ground plane and have small variance in vertical location, the bird’s eye view location is more cru- cial to obtaining accurate 3D bounding boxes. Therefore, using explicit bird’s eye view map as input makes the 3D location prediction more feasible.”
本文提出的俯视图的构建过程非常有参考价值，是后续多篇文章所参考的依据。

RT3D: Real-Time 3-D Vehicle Detection in LiDAR Point Cloud for Autonomous Driving

用R-FCN检测车辆。
详细解读传送门

Frustum PointNets for 3D Object Detection from RGB-D Data (CVPR2018)

该方法使用图像和激光雷达检测障碍物。

处理流程
利用2D Object Detection方法在image上进行车辆检测；
使用2D proposals得到3D椎体proposals，并进行坐标变换，将坐标轴旋转至椎体中心线；
利用PointNet++进行3D Instance Segmentation，并进行坐标变换，将原点平移至instance的型心；
使用T-net进行坐标变换，估计物体的中心；
3D box 回归。

其中包含三次坐标变换如下图：

相比于Pointnet，T-net的训练是受监督的。
“However, different from the original STN that has no direct supervision on transformation, we explicitly supervise our translation network to predict center residuals from the mask coordinate origin to real object center.”
在回归3D box时，该文还提出同时使用Smooth_L1和Corner loss，以提升回归的准确性
"While our 3D bounding box parameterization is compact and complete, learning is not optimized for final 3D box accuracy – center, size and heading have separate loss terms. Imagine cases where center and size are accurately predicted but heading angle is off – the 3D IoU with ground truth box will then be dominated by the angle error. Ideally all three terms (center,size,heading) should be jointly optimized for best 3D box estimation (under IoU metric). To resolve this problem we propose a novel regularization loss, the corner loss:
"

Joint 3D Proposal Generation and Object Detection from View Aggregation (IROS2018)

利用Anchor grid作为感兴趣区域进行Crop和Resize到同一大小，然后将两者的特征进行element-wise sum，然后进行3D proposals的第一次回归。然后进行NMS，使用proposals对feature map再次进行Crop和Resize, 然后再次回归，修正proposals，通过NMS得到Object Bounding Boxes。
上图中左边的Fully Connected Layers回归车辆位置的尺寸，右边的Fully Connected Layers回归车辆的朝向角。

本文提出了一种新的3D box 的8个corner的编码方式
“To reduce redundancy and keep these physical constraints, we propose to encode the bounding box with four corners and two height values representing the top and bottom corner offsets from the ground plane, determined from the sensor height.”

PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud （CVPR2019）

该文章提出了使用PointNet++作为主干网络使用two-stage的方法进行目标检测的方法。该方法首先使用PointNet++得到point-wise的feature，并预测point-wise的分类和roi。然后扩大roi，使用上一步得到的feature再使用PointNet++优化3D Box。具体的网络结构可以参考我的另一篇PointRCNN网络可视化，代码详解

由于该方法第一次得到RoI的数量与三维点的数量相等，所以该方法理论上可以检测到所有的框。
文章中提到了Frustum PointNet的弊端
“F-PointNet [22] generates only 2D box proposals from 2D images, and estimate 3D boxes based on the 3D points cropped from the 2D regions. Its 2D-based proposal generation step might miss many difficult objects that could only be clearly observed from 3D space.”
解决了大量使用anchor的问题
“our method avoids using a large set of predefined 3D anchor boxes in the 3D space and significantly constrains the search space for 3D proposal generation.”
使用了Full-bin Loss，使得收敛速度和精度上升

VoteNet：Deep Hough Voting for 3D Object Detection in Point Clouds

详细解读传送门

Multi-Task Multi-Sensor Fusion for 3D Object Detection

详细解读传送门

GS3D: An Efficient 3D Object Detection Framework for Autonomous Driving

详细解读传送门

Stereo R-CNN based 3D Object Detection for Autonomous Driving

详细解读传送门

STD: Sparse-to-Dense 3D Object Detector for Point Cloud

[详细解读传送门(https://blog.csdn.net/wqwqqwqw1231/article/details/100565150)

Part-A^2 Net: 3D Part-Aware and Aggregation Neural Network for Object Detection from Point Cloud

[详细解读传送门(https://blog.csdn.net/wqwqqwqw1231/article/details/100541138)

Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection

本文更偏重于讲一些数据增广的方法和小技巧。
详细解读传送门

BirdNet: a 3D Object Detection Framework from LiDAR Information（2018 ITSC）

本文主要的贡献是解决跨线数激光雷达的训练和检测的鲁棒性问题。
详细解读传送门

StarNet: Targeted Computation for Object Detection in Point Clouds

本文提出了不使用神经网络生成proposal的方法，该方法的另外一个先进性在于inference过程和train过程的使用点云的数量可以不同，使得部署更方便。
详细解读传送门

PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection

目前KITTI榜首。
详细解读传送门

One Stage

3D Fully Convolutional Network for Vehicle Detection in Point Cloud (IROS2017)

该文章是3D Object Detection的早期之作，使用的方法就是3D卷积，pytorch中有对应的函数torch.nn.Conv3D。方法简单，与YOLOv1思路类似。进行三维卷积和池化，提取高维特征，然后反卷积得到分辨率适中的feature map然使用分类头和回归头预测Bounding Box。

相比后来的方法，该方法显得粗糙一些，但是本论文是将3D Object Detection从传统方法过度到深度学习的文章之一，还是有值得学习之处。

提出了使用Bounding Box的Corners作为回归变量，该回归方法在Frustum PointNets又被重新使用，并取得了效果的提升。
该文章介绍了比较多的点云栅格化过程中每个栅格的特征构建的方法，可以用来查找手工构建栅格特征的方法。

Complex-YOLO: An Euler-Region-Proposal for Real-time 3D Object Detection on Point Clouds（ECCV2018）

YOLO3D: End-to-end real-time 3D Oriented Object Bounding Box Detection from LiDAR Point Cloud（ECCV2018）

两篇文章作者来自同一个机构，姑且认为两篇文章有联系。这两篇文章用的方法也如出一辙，都是使用MVNet俯视图的构建方法，然后利用YOLO在俯视图上做Object Detection，只不过是回归变量多了一个维度和角度，就解决了3D Object Detection的问题。
方法没有什么创新之处，文章中提到了Frustum Pointnet的不足之处。
“This approach has two drawbacks: i). The models accuracy strongly depends on the camera image and its associated CNN. Hence, it is not possible to apply the approach to Lidar data only; ii). The overall pipeline has to run two deep learning approaches consecutive, which ends up in higher inference time with lower effciency.”
说出了Frustum Pointnet在构建proposal的时候依赖CNN这个问题。

PIXOR: Real-time 3D Object Detection from Point Clouds (CVPR2018)

PIXOR思路非常简单，容易理解。计算过程如上图：

类似于MVnet，将点云转为俯视图表示。
使用resnet进行特征提取，然后upsample至原图1/4的大小。
然后加入分类头和回归头。

整个网络框架如下图

我认为这个方法类似于YOLO的思想，One Shot将box分类和回归。Feature Map上采样至俯视图尺寸的1/4，相当于YOLO中的每个格子为4*4个像素。该方法回归的变量均是2维变量：俯视图中的中心点、长宽和方向角。

该论文的俯视图的编码是使用栅格的占据编码，不再使用大多数文章使用的高度。
“The value for each cell is encoded as occupancy”
论文论述了如何解决小目标的问题。小目标在原始图片张占据的像素点少，提取高层特征后，很容易在feature map只对应几个像素点。
“One direct solution is to use fewer pooling layers. However, this will decrease the size of the receptive field of each pixel in the final feature map, which limits the representa- tion capacity. Another solution is to use dilated convolu- tions. However, this would lead to checkerboard artifacts [25] in high-level feature maps. Our solution is simple, we use 16×downsampling factor, but make two modifications. First, we add more layers with small channel number in lower levels to extract more fine-detail information. Sec- ond, we adopt a top-down branch similar to FPN [21] that combines high-resolution feature maps with low-resolution ones so as to up-sample the final feature representation.”
一个实现细节，在regression头后没有再使用sigmoid函数

HDNET: Exploiting HD Maps for 3D Object Detection (CoRL2018)

该论文是PIXOR的延续之作，使用了PIXOR的网络框架，加入了高精地图的信息，使得检测更准。该论文首先假设高精地图是存在的，那么对于俯视图中，就有道路的的mask和路面的高度。该论文对PIXOR的改进之处体现在将点云转为俯视图过程中，将雷达点的高度z减去对应的高精地图中储存的该点的高度，做此变换之后然后栅格化地图，之后就与PIXOR相同。这样做的目的，论文中提到是减小道路坡度影响，因为PIXOR在进行车辆的Bounding Box的回归时没有考虑高度这个轴，所以这样做直观感觉确实可以提高精度。然后该论文提出了不存在高精度地图的情况，那么就先栅格化点云，然后用U-net在俯视图中做road segmentation和ground estimation（这一步就可以认为是在线地估计高精地图）。

该文章除了使用在使用高清地图的地方对PIXOR做了改进，还在输入和回归变量的地方进行了略微改进，论文中称为PIXOR++，可以从结果看出PIXOR++的效果要比PIXOR效果好不少，值得借鉴。
为了提高网络在高精地图不存在情况下的鲁棒性，该论文提出了对高清地图做dropout的方法。
“In practice, having a detector that works regardless of map availability is important. Towards this goal, we apply data dropout on the semantic prior, which randomly feeds an empty road mask to the network during training. Our experiments show that data dropout largely improves the model’s robustness to map availability.”

Voxel-FPN: multi-scale voxel feature aggregation in 3D object detection from point clouds

详细解读传送门

VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection (CVPR2018) （未完）

LaserNet: An Effcient Probabilistic 3D Object Detector for Autonomous Driving Gregory (Arxiv2019)（未完）

3DSSD: Point-based 3D Single Stage Object Detector

详细解读传送门

另一种分类方式：Voxel or Image or Pointcloud？

另一种分类方式，是从网络的输入和网络结构来分。对这种分类的详细的解释，可以参考我的另一篇博客三维激光雷达点云处理分类。

Voxel：输入为体素格式，典型为VoxelNet，网络使用3D卷积大量使用操作
Image：输入为图片格式，典型为MVNet，网络使用传统的CNN
Pointcloud：输入为点云格式，典型为PointNet，网络使用多层感知机，多层感知机的具体实现是2D卷积，但卷积核大小和步长多数为1

这种分类方式由于输入的不同，数据本身就有独自的优势和劣势：

Voxel：最大问题就是计算慢！体素是三维的，卷积模板也是三维的，那么计算起来就比二维的慢，而且卷积核移动的方向也是三维的，随着空间的大小的增大，体素的数量是以立方的数量增长；而且在自动驾驶场景，体素是稀疏的，存在大量体素中不包含雷达点，特征为0，做很多无用卷积。所以这种方式计算量大而且很多是无效计算。
Image：结果的好坏与输入的特征的有关，有效地将点云转为图像也是一个可以研究的点。
PointNet：可用的工具少，目前主流的也就是PointNet系列和Graph convolution系列。

Loss的进化史

使用深度学习除了网络结构，另外一个要关注的点是Loss的构建。接下来，就聊一聊Loss构建的发展史：

未完待续。。。

AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
Apache HBase基础（基本概述，物理架构，逻辑架构，数据管理，架构特点，HBase Shell） May--J--Oldhu HBase HBase shell hbase物理架构 hbase逻辑架构 hbase
NoSQL综述及ApacheHBase基础一.HBase1.HBase概述2.HBase发展历史3.HBase应用场景3.1增量数据-时间序列数据3.2信息交换-消息传递3.3内容服务-Web后端应用程序3.4HBase应用场景示例4.ApacheHBase生态圈5.HBase物理架构5.1HMaster5.2RegionServer5.3Region和Table6.HBase逻辑架构-Row7.
《中国特殊教育》专注知识产权服务13937636601 职称评审知网期刊核心期刊核心期刊职称评审
刊物名称《中国特殊教育》刊号国内CN11-3826/G4国际ISSN1007-3728投稿须知1．征稿范围及各类稿件的要求特殊教育与心理学研究各领域的实证研究、综述、教学改革研究等，具体研究领域包括全纳教育、特殊教育理论、听力障碍、视力障碍、智力障碍、学习障碍、自闭症、情绪与行为障碍、康复与治疗、超常儿童教育、特殊群体教育（留守儿童、流动儿童、孤儿、小团伙、网络成瘾儿童、工读学生）等1.1实证类稿
概率图模型（PGM）综述医学影像处理概率图模型概率图模型综述
RefLink:http://www.sigvc.org/bbs/thread-728-1-1.htmlGraphicalModel的基本类型基本的GraphicalModel可以大致分为两个类别：贝叶斯网络(BayesianNetwork)和马尔可夫随机场(MarkovRandomField)。它们的主要区别在于采用不同类型的图来表达变量之间的关系：贝叶斯网络采用有向无环图(DirectedAc
《互联网时代教师自主成长的模式研究》论文阅读与思考2 宁超群
2.第二部分教师自主成长的模式建构，实质上是对新网师底层逻辑的描述。你认为，新网师的培训模式与传统常见的培训模式有哪些区别？这些区别有什么意义或价值？读完第二部分后，你对新网师有哪些新的认识或理解？你认为新网师目前哪些方面做得好，哪些方面做得还不够？答：我认为新网师的培训模式与传统常见的培训模式有以下区别：（1）培训对象的参与动机不同。新网师学员的参与是自觉自愿、积极主动，而传统培训更多是被迫参与
Python：100行完成属于你的第一个贪吃蛇 ling1s python 开发语言
目录综述制作前的分析任务分析对象分析编程思路分析代码块引用定义变量函数函数一：change（x，y）函数二：inside_map()函数三：inside_snake()函数四：deffruit_appear()函数五：gameLoop()蛇吃东西的机制死亡判定画图相关主函数完整程序总结综述turtle库是Python的一个图形绘制库，它可以通过简单的命令来控制一个小海龟在窗口上绘制图形。这个库的设
pygame制作贪吃蛇 ling1s pygame python
目录综述制作前的分析面向对象和面向过程对象相关（地图，蛇，食物）地图和墙体的绘制蛇的绘制食物的绘制总结代码游戏的基础（gamebase.py）引用一些基础参数的设置颜色点类（方块元素）文本类游戏主体（snake.py）引用基础参数（其实可以加到gamebase里）一些函数食物生成画图方块圆形初始化函数游戏主体暂停功能死亡判断正常游戏操作按键监听相关吃东西相关移动和检测渲染和绘制完整代码gameba
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
arXiv综述论文“Graph Neural Networks: A Review of Methods and Applications” 硅谷秋水自动驾驶
arXiv于2019年7月10日上载的GNN综述论文“GraphNeuralNetworks:AReviewofMethodsandApplications“。摘要：许多学习任务需要处理图数据，该图数据包含元素之间的丰富关系信息。建模物理系统、学习分子指纹、预测蛋白质界面以及对疾病进行分类都需要一个模型从图输入学习。在其他如文本和图像之类非结构数据学习的领域中，对提取的结构推理，例如句子的依存关系
【定位系列论文阅读】-Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition（一）醉酒柴柴论文阅读学习笔记
这里写目录标题概述研究内容Abstract第一段（介绍本文算法大致结构与优点）1.Introduction介绍第一段（介绍视觉位置识别的重要性）第二段（VPR的两种常见方法，本文方法结合了两种方法）第三段（本文贡献）第四段（为证明本文方法优越性，进行的测试以及比较）2.RelatedWork相关工作第一段（介绍早期与深度学习的全局图像描述符）第二段（介绍局部关键点描述符）第三段（局部描述符可以进一
论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
写论文不再头秃！教你用ChatGPT一天搞定初稿！芙蓉姐姐陪你写论文 AI论文 chatgpt 数据库人工智能 AI写作论文笔记论文阅读 AIPaperGPT
论文写作，这大概是每个学生避不开的“必修噩梦”吧。尤其是，当你发现截止日期就像明天的天气预报一样迫在眉睫，而文档依然一片空白时，那种无力感，简直就是“说好的秃头，怎么突然就到了呢？”然而，如今我们有了学术界的“救星”——猜猜是什么？是的，你没猜错，就是ChatGPT！想象一下，你一边悠闲地喝着咖啡，一边对着电脑发号施令：“帮我写个引言，顺便再给我整理下文献综述，对了，别忘了结论！”而屏幕那头的Ch
【系统分析师】-安全体系宣晨光系统分析师软考真题标签安全软考系统分析
考点综述(1)综合知识:包括加密密钥和公开密钥算法:计算机病毒及防治技术计算机犯罪基本概念与防范措施、入侵检测与防范、系统访问控制技术;信息删除、修改、插入和丢失;伪造与重放攻击的防止;SHA、MD5;私有信息保护。(2)案例:根据具体案例，说明在网络与分布式环境下的分布式应用系统在安全性方面需要考虑的因素。(3)论文:包括入侵检测、VPN、安全协议(IPSec、SSL、PGP、HTTPSSSL)
P2P网络介绍 mazidao2008 网络学习 p2p 网络 internet 服务器存储通讯
Peer-To-Peer综述第1章Peer-To-Peer介绍罗杰文中科院计算技术研究所最近几年，Peer-to-Peer(对等计算，对等网络，简称P2P)迅速成为计算机界关注的热门话题之一，财富杂志更将P2P列为影响Internet未来的四项科技之一。“Peer”在英语里有“对等者”和“伙伴”的意义。因此，从字面上，P2P可以理解为对等互联网。国内的媒体一般将P2P翻译成“点对点”或者“端对端”
如何使用ChatGPT写学术论文？从论文综述写作全攻略避坑指南智写AI AI学术写作指南 chatgpt AI写作人工智能
大家好，感谢关注。我是七哥，一个在高校里不务正业，折腾学术科研AI实操的学术人。关于使用ChatGPT等AI学术科研的相关问题可以和作者七哥（yida985）交流，多多交流，相互成就，共同进步，为大家带来最酷最有效的智能AI学术科研写作攻略。经过数月爆肝，终于完成学术AI使用教程，估计也有个50万字的详细操作指南。跟着一步一步操作，借助ChatGPT做学术、干科研、写论文、课题申报都变得超简单。欢
周四 2020-01-09 08:00 - 24:30 多云 02h10m 么得感情的日更机器
南昌。二〇二〇年一月九日基本科研[1]:1.论文阅读论文--二小时十分2.论文实现实验--小时3.数学SINS推导回顾--O分4.科研参考书【】1)的《》看0/0页-5.科研文档1)组织工作[1]:例会--英语能力[2]:1.听力--十分2.单词--五分3.口语--五分4.英语文档1)编程能力[2]:1.编程语言C语言--O分2.数据结构与算法C语言数据结构--O分3.编程参考书1)陈正冲的《C语
sv标准研读第二章-标准引用 yunduor909 system verilog 前端
书接上回：sv标准研读第一章-综述第2章标准引用以下所引用的文件对于本标准的应用是必不可少的(即必须被使用，因此在文本中引用了每一个所引用的文件并解释了其与本标准的关系)。对于注明日期的参考文献，只适用所引用的版本。对于未注明日期的引用，引用文件的最新版本(包括任何修订或更正)适用。Anderson,R.,Biham,E.,andKnudsen,L.“Serpent:AProposalforthe
【论文阅读】Mamba:选择状态空间模型的线性时间序列建模（二） syugyou Mamba状态空间模型论文阅读
文章目录3.4一个简化的SSM结构3.5选择机制的性质3.5.1和门控机制的联系3.5.2选择机制的解释3.6额外的模型细节A讨论：选择机制C选择SSM的机制Mamba论文第一部分Mamba:选择状态空间模型的线性时间序列建模(一)3.4一个简化的SSM结构如同结构SSM，选择SSM是单独序列变换可以灵活地整合进神经网络。H3结构式最知名SSM结构地基础，其通常包括受线性注意力启发的和MLP交替地
采用FPGA进行SDI输入输出时钟同步设计炫视科技系统架构计算机视觉图像处理 fpga开发嵌入式硬件
模块综述目前SDI传输系统的视频传输都需要进行时钟恢复和去抖，导致每一级都耗费了较大的成本，而且不利于板卡的布局布线。因此该设计的优点在于每一级传输不需要si5324等芯片的费用，FPGA内部不同通道的数据也会同步到同一个主时钟上，节省了时钟资源。此外，该模块仍然遵循BT1120的数据协议。不足之处在于，在输出SDI端需要进行帧缓存，否则这种异步传输方式无法直接输出，需要重新生成标准SDI的BT1
看懂运营数据，学会如何利用微信公众号实现内容变现行政村进口量照相机
周去杭州为全国百家装修公司做了一次内容营销课培训，这是《装修情报》作为一家以内容生产为核心的专业装修媒体公司，第一次在业内系统地分享多年来的“内容营销”实操经验。微信公众号作为目前大多数品牌企业都在使用的自媒体，如何通过内容策划、撰写及运营，使之成为一个既能为企业做品牌传播，又能获客的一个渠道，是大多数企业在微信公众号运营上存在的一个普遍需求。雄大（以一篇“2017年上海装修公司选择指南综述”文章
最新计算机专业开题报告案例88：社区垃圾分类智能小程序的设计与实现平姐设计计算机毕业设计100套微信小程序项目实战 java项目实战小程序积分兑换商城获取定位在线答题云数据库百度AI接口研究方法
计算机毕业设计100套微信小程序项目实战java项目实战需要源码可以滴滴我项目演示地址目录一、研究目的与意义1.1目的1.2意义二、研究现状与文献综述2.1关于同类系统内容相关的研究2.2关于同类系统技术相关的研究三、研究的主要内容、预期目标与创新点3.1研究的主要内容3.2预期目标3.3创新点四、研究思路、研究方法与研究计划4.1研究思路4.2研究方法4.3研究计划一、研究目的与意义1.1目的近
如何避开毕业答辩里的坑论文学术交流地
在这里，你一定要记住三句话。一是“论文内容不会有人仔细看”（当然不是不看，这里是针对本科生而言）；二是“PPT制作要精良”；三是“只答不辩，疯狂道歉”。1、答辩老师不会仔细看论文内容“答辩老师不会仔细看论文内容”不是说答辩老师不会看论文内容，而是答辩老师只会看重点。对于不同层次的毕业论文，答辩老师的侧重点是不一样的：（1）本科毕业论文主要看规范；（2）硕士毕业论文主要看综述、参考文献和数据；（3）
模型剪枝综述发狂的小花人工智能 #模型部署深度学习人工智能模型部署模型剪枝性能优化
目录1深度神经网络的稀疏性：2剪枝算法分类：3具体的剪枝方法包括：4剪枝算法流程：5几种常见的剪枝算法：6结构化剪枝和非结构化剪枝各有其优缺点：7剪枝算法对模型精度的影响8影响剪枝算法对模型精度的因素模型压缩中的剪枝算法是一种应用广泛的模型压缩方法，其通过剔除模型中“不重要”的权重，来减少模型的参数量和计算量，同时尽量保证模型的精度不受影响。模型剪枝的核心是模型中的权重、激活、梯度等是稀疏的，减少
tomcat + spring mvc 原理（一）：tomcat原理综述和静态架构「已注销」 tomcat java spring linux docker
tomat+springmvc是目前比较流行java微服务体系架构，包括现在的springboot以及基于springboot的进一步应用化封装的springcloud框架，底层都是基于tomcat+springmvc的框架。因此学习tomcat+springmvc的基础原理，对于解决使用中出现的问题会有比较大的帮助。tomcat+springmvc的运作模式理解tomcat+springmvc的
C++11新特性综述 CC-xx C++
ScottMeyersTrainingCoursesAnOverviewoftheNewC++(C++11/14)SpecificationofthelatestversionofC++(“C++11”)wascompletedin2011,andmanycompilersnowofferawealthoffeaturesfromtherevisedlanguage.Andsuchfeatures
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记慘綠青年627 论文阅读笔记深度学习
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL，这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习（ML）：集中收集数据->隐私保护问题privacy-preservingML(PPML)采
MixMAE(MixMIM):用于分层视觉变压器有效预训练的混合和掩码自编码器论文阅读皮卡丘ZPC 扩散模型阅读论文阅读
论文:MixMAE(arxiv.org)代码:Sense-X/MixMIM:MixMIM:MixedandMaskedImageModelingforEfficientVisualRepresentationLearning(github.com)摘要:本文提出MixMAE(MixedandmaskAutoEncoder)，这是一种简单而有效的预训练方法，适用于各种层次视觉变压器。现有的分层视觉变
【论文阅读】LLM4CP: Adapting Large Language Models for Channel Prediction（2024） Bosenya12 科研学习论文阅读语言模型人工智能信道预测时间序列
摘要Channelprediction（信道预测）isaneffectiveapproach（有效方法）forreducingthefeedback（减少反馈）orestimationoverhead（估计开销）inmassivemulti-inputmulti-output（大规模多输入输出）(m-MIMO)systems.However,existingchannelpredictionmet
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

【论文阅读】【综述】3D Object Detection 3D目标检测综述

目录

3D Object Detection

相关博客：

Sliding window

Vote3Deep: Fast Object Detection in 3D Point Clouds Using Efficien（IROS2017）

Two Stage

Multi-View 3D Object Detection Network for Autonomous Driving (CVPR2017)

RT3D: Real-Time 3-D Vehicle Detection in LiDAR Point Cloud for Autonomous Driving

Frustum PointNets for 3D Object Detection from RGB-D Data (CVPR2018)

Joint 3D Proposal Generation and Object Detection from View Aggregation (IROS2018)

PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud （CVPR2019）

VoteNet：Deep Hough Voting for 3D Object Detection in Point Clouds

Multi-Task Multi-Sensor Fusion for 3D Object Detection

GS3D: An Efficient 3D Object Detection Framework for Autonomous Driving

Stereo R-CNN based 3D Object Detection for Autonomous Driving

STD: Sparse-to-Dense 3D Object Detector for Point Cloud

Part-A^2 Net: 3D Part-Aware and Aggregation Neural Network for Object Detection from Point Cloud

Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection

BirdNet: a 3D Object Detection Framework from LiDAR Information（2018 ITSC）

StarNet: Targeted Computation for Object Detection in Point Clouds

PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection

One Stage

3D Fully Convolutional Network for Vehicle Detection in Point Cloud (IROS2017)

Complex-YOLO: An Euler-Region-Proposal for Real-time 3D Object Detection on Point Clouds（ECCV2018）

YOLO3D: End-to-end real-time 3D Oriented Object Bounding Box Detection from LiDAR Point Cloud（ECCV2018）

PIXOR: Real-time 3D Object Detection from Point Clouds (CVPR2018)

HDNET: Exploiting HD Maps for 3D Object Detection (CoRL2018)

Voxel-FPN: multi-scale voxel feature aggregation in 3D object detection from point clouds

VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection (CVPR2018) （未完）

LaserNet: An Effcient Probabilistic 3D Object Detector for Autonomous Driving Gregory (Arxiv2019)（未完）

3DSSD: Point-based 3D Single Stage Object Detector

另一种分类方式：Voxel or Image or Pointcloud？

Loss的进化史

未完待续。。。

你可能感兴趣的:(#,综述,论文阅读)