视觉鸟

深度学习方法中 3D目标检测数据预处理综述

这一篇的内容主要要讲一点在深度学习的3D目标检测网络中，我们都采用了哪些数据预处理的方法，主要讲两个方面的知识，第一个是representation，第二个数据预处理内容是数据增广。
作为本篇博文的引言，我们先给一种博主制作的比较重要的3D检测方法图鉴，如下，就笔者的个人理解，今年的CVPR出现了很多的one-stage的方法，同时出现了很多融合的方法，这里的融合有信息融合，有representation融合，同时根据近两年的发展来看,voxel-based的方法占据了主导地位，这是得益于卷积结构优越性（point-based方法采用pointnet++结构，是MLP搭建的），但是今年的oral文章3D-SSD是一篇在point-based方法上很有建树的文章，所以在3D检测中了解主要的representation代表方法也是很重要的。

1 representation
做3D视觉的，尤其是基于点云做3D视觉任务的同学们都比较清楚的知道，点云因为其具有稀疏性和无规则性使得在二维上非常成熟的CNN结构不能直接的运用在点云中。我们先了解一下点云的这两个特性，如下图所示，下图中的(i)表示二维图像的排列方式，（ii），（ii），（iv）表示的是点云的数据，可以看出点云的排列稀疏性，对比（ii）和（iii）可以得知虽然点云数据的排列顺序假使是一样的，但是其对应的几何结构不同，而（iii）和（iv）则可以看出尽管几何结构表示同一个，但是排列顺序却是可以不一样的。

知道了上述的两个点云数据的两种特性，所以设计一种合适的点云表达形式是比寻找到一个高效的深度学习框架更加重要的内容，就3D检测方面而言，到CVPR20，至少有三种比较重要和值得探究的representation方式，分表示point representation，voxel representation和graph representation。

1.1 point representation
如题，就是采用最原始的点作为深度学习网络的输入，不采用任何的预处理工作，这类工作都是在pointnet++的基础上进行的。
这里首选插入一点采用point-based方法的基础backbone，如下所示，左图表示的是pointnet的特征提取结构，也就是point-based的基础模块，右图就是point-based方法的基础架构，由point-encoder层和point-decoder层组成，encoder层主要逐渐下采样采点特取语义信息，decoder过程是将encoder过程得到的特征信息传递给没有被采样到的点。使得全局的点都具有encoder的特征信息。最后再通过每个点作为anchor提出候选框。

最早的工作是CVPR18上的F-pointnet，该文章的作者也是pointnet/pointnet++的作者，具体做法如下可知，首先通过二维的检测框架得到二维目标检测结果，然后将二维检测结果通过视锥投影到三维，再采用三维破pointnet++延伸结构检测为三维目标框。算是三阶段的基于point输入的目标检测方法

随后的CVPR19的比较经典的Point_based方法是point-rcnn，该工作不仅仅采用point作为representation,同时和上诉的F-pointnet比较没有采用二维信息，仅仅采用点云作为网络输入。如下图所示，该工作是一个两阶段的检测方法，第一阶段根据语义分割信息对每一个点都提出一个候选框，随后再采用多特征融合进一步优化proposals。
除了CVPR会议，在IROS和ICRA机器人相关的会议上也有很多这方面的研究，其中有一篇在F-pointnet上做出更细致的优化的文章F-ConvNet也是很优秀的工作，有兴趣的同学可以去了解下；这里直接介绍今年CVPR20上的基于Point representation的文章 3D-SSD，如下图所示，平平无奇的一阶段encoder过程，也就是把pointnet++的decoder部分给去除掉（这样做的目的是减少网络前馈时间，在KITTI上达到35FPS），本文的最主要的贡献点在于将Pointnet++的采样方法由欧式空间度量改为特征空间度量和欧式空间度量相结合的方法，同样的也采用了anchor-free的设计方法，使得显存占用更少。

point representation方法小总结

就笔者个人对这方面的理解，该类方法的优点是作为最原始的点云数据，保留了最细致的几何结构信息，网络的输入信息损失几乎是所有representation方法中最小的。但是缺点也很明显，第一点，MLP的感知能力不如CNN，因此主流的effective的方法都是voxel-based的，第二点，pointnet++结构的采样是很耗时的，所以在实时性上也不及voxel-based的方法。所以今年的CVPR oral文章3D-SSD为了实时性，丢掉了FP层，同时设计了新的SA模块。
1. 2 voxel representation
1.2.1 Voxelization 步骤
在3D目标检测中，对整个场景的point2voxel的过程可以简单描述为如下：
    设置Voxelization参数（每个voxel可以存放点的个数(max_points_number)，voxel长宽高的大小(whl)）
    对依次每一个点，根据其对应的坐标（x,y,z）得到该点在voxel的索引。
    根据索引判断该voxel种是否已经存在max_points_number个点，如果存在，则将该点直接丢弃，如果不满足，则将该点加入到该voxel中。
    计算voxel特征
    采用voxelnet的图表示为如下：

1.2.2 Voxelization 参数
上文中的体素化过程涉及到两个重要的内容，一个是体素参数，另外一个是voxel特征根据该voxel中的特征如何求取。
Voxelization 对参数的要求比较高，就发展历史来说，VoxelNet(CVPR18)是第一篇采用voxel-representation作为点云输入的网络结构，该文章中max_points_number设置的为35，voxel大小设置为0.5；采用的voxel特征提取方式为增加一个pointnet对每个voxel中的35个点特征提取得到相应的voxel特征（如下图中的feature learning network所示的内容），但是该参数很明显是会丢失比较多的几何结构信息，但是以这样的参数划分在当时还受到VoxelNet网络后续的3D卷积的显存占用的影响（3D卷积很占显存，因此网络预处理的参数受到影响）。

18年的SECOND提出的3D稀疏卷积大大减少了3D卷积的内存占用，（我们知道，3D卷积本身会对空间中每一个voxel都进行卷积，但是3D稀疏卷积只保留了空间中非空的voxel，采用map映射的方式得到卷积后的voxel空间索引）；因此参数的设置自由了很多，就目前在KITTI和Nuscence上的sota的内容而言，我们一般采用的参数和特征提取方为：
max−points−number=5,(w,l)=(0.05,0.05),h=0.1
采用的voxel特征直接为mean特征，即对每一个voxel中的所有点的坐标求均值即可。
1.2.3 related paper
这里只介绍一些在voxel representation上做文章的研究内容，而不是采用voxel作为网络输入的研究工作，因此voxel-based的研究方法比较多，后续笔者会出一篇在这方面的研究综述，所以这里推荐的几篇文章都是在voxel-representation上的做出研究的工作。
voxel-based的先驱的两篇文章voxelnet和second的主要贡献分别是第一个提出采用voxel作为网络输入的方法和引入稀疏卷积替代3D卷积。这里补充一点voxel-based方法的backbone，目前几乎所有的voxel-based方法都采用如下的encoder的backone作为特征提取器。下图左图表示的是点的voxel表示，经过Voxelization 化后，经过逐步下采样的encoder过程降为二维 feature map，最后再根据二维的feature的每一个像素点作为anchor point提出候选框。

在voxel-representation上做文章的研究工作，如下图，这是一篇发表在sensors2020上的文章Voxel-FPN:multi-scale voxel feature aggregation in 3D object detection from point clouds，该研究工作的主要内容是通过不同scale的体素划分，最后将其整合成到RPN网络结构中的FPN网络中，需要注意的是，这里的scale的大小要和最初划分的scale对应起来。

同样采用该思想的还有今年的CVPR20的文章HVNet，如下图所示，也是对场景中点云采用multi-scale的体素划分，最后也会形成一个FPN的结构，但是不同的细节和实现之处还是有很多的，HVNet采用了多线程同时并行处理每一个scale的体素划分，同时对于voxel的特征提取和Voxel-FPN也是不一样的。

在voxel划分上做研究的工作还有
1.2.4 voxel representation方法小结
voxel-representation的方法的优点即是性能好又高效，不仅仅在精度上有着point-based的方法目前无法比拟的精度，在速度上也是很可观的，尤其是在稀疏卷积和3D流型卷积引入到3D目标检测后，发展更为迅速。但是缺点则是该类方法对参数比较敏感，预处理划分voxel的时候需要设置合适的参数，当然从信息论的方面理解，体素划分必然带来信息的丢失，尤其是局部细节信息的丢失，因此今年CVPR20上至少有三篇文章（SA-SSD，pointpainting，HVnet）在细节几何结构上做了一定的研究工作。
1.3 graph represention
这是一个比较新的representation，在3D检测中,今年CVPR20第一次出现了以graph作为representation的网络结构，如下图所示，graph representation的核心问题也在于构建一个graph网络，即下图中的图左所示的内容。这也是很多在语义分割中遇到的问题，在目前的建图中大多是采用的knn的方法构建图结构，后续再送入到图卷积进行特种提取，最后根据point rpn-head提出proposals。

就该类方法而言，目前的研究还不是很多，因为GCN非常耗时，可以理解为时pointnet++特征提取网络的升级版，不仅仅提取点之间的信息，同时根据‘点-边’信息提取到更加局部细节的信息，但是优点也可以理解到，3D shape实际上在增加边信息后，会更加容易感知（对比mesh结构可知），但是采用何种方式构建合适的graph都还是很需要研究的内容。
1.4 point-voxel fusion

既然我们知道point-based的方法具有保持了几何structure的能力，同时voxel-based的方法具有高效的感知能力，那么最新的研究就在考虑如何做这方面的fusion工作，PV-RCNN（CVPR20）采用的将voxel特征经过multi-scale的形式赋予到point上，最后再refine阶段将点的局部信息融合到pointnet中。SA-SSD采用voxel2point添加附加任务使得voxel backbone具有structure aware能力。实际上根据representation fusion的经验，应该还是大有可做的。
2 Augmentation
实际上3D目标检测的数据增广方式和二维目标检测的方式大多相同，我们总结为如下一些比较常见的数据增广方式，根据动态图很容易的看到的出来数据增广的方式，这里笔者着重介绍一下ground truth augmentor的方法，这应该是根据3D点云的稀疏空间特性所特有的数据增广方式。

ground truth augmentor
就KITTI object 3D的数据而言，每一帧的object数量从无到二十多个不等，ground truth augmentor的想法则是先从所有训练集中根据类别把ground truth建立成一个data base，然后在训练的时候将data base中的gt按照类别丢一定数量的gt到当前训练的帧中，这里笔者给出一般在KITTI上数据增广的数量如下。即表示一般会选择在场景中丢进去15个car，丢进10个Pedestrians和Cyclists。

SAMPLE_GROUPS: ['Car:15','Pedestrian:10', 'Cyclist:10']

因为该数据增广的工作在3D目标检测中比较重要，后续还延伸到一些涉及到该方面的研究工作，笔者做一点简单介绍.
这一篇文章（Class-balanced Grouping and Sampling for Point Cloud 3D Object Detection）的后续研究工作做成了一个detection zoo，在github上叫det3D，但是该文章的初始问题是想解决在nuscene数据中的数据不平衡问题，根据作者的采样得到如下图表，这里也就是目标检测的long tail问题，数据不平衡问题

这里作者采用的gt数据增广方式采样如下个数的gt来平衡数据集本身存在的long tail问题，并最终在nuscence上取得了榜一的成绩。
在这里插入图片描述
笔者再介绍一篇今年CVPR20上涉及到gt augmentation的工作(oral)(What You See is What You Get: Exploiting Visibility for 3D Object Detection),，如下图，在本文gt数据增广后，俯视图下由（a）变成了(b)，但是作者指出这里出现的问题在于有的增广的物体出现在墙后，这在Lidar扫描过程中是不符合规律的，因此作者采取的增广策略是把对应的墙体去掉，如(d)图所示的内容。这就比较符合lidar扫描的特性，即遇到object就会反弹。

3 笔者的思考

实际上数据预处理在深度学习中也是比较重要的内容，就representation来说，voxel的方法高效但存在信息丢失,point-basde的方法感知能力不及cnn但输入为最原始的结构，Graph构建了更容易感知的结构，但也要承担GCN网络过长的前馈时间；就augmentation来说，gt augmentation尽管在涨点上成了众人皆知的trick，但是要能很好的用起来该方法还是有一些值得研究的trick在里面，就比如上述提到的两篇文章。最后写一个flag，后续尽快写一个voxel-based方法研究的发展概述，主要也是笔者的理解。
推荐文献
[1] VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection
[2]Frustum PointNets for 3D Object Detection from RGB-D Data
[3]PointRCNN: 3D Object Proposal Generation and Detection from Point Cloud’
[4]3DSSD: Point-based 3D Single Stage Object Detector
[5]Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud

作者为CSDN博主「Little_sky_jty」

原文链接：https://blog.csdn.net/weixin_40805392/article/details/106169269?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

vue中如何关闭eslint
方案一:vue脚手架创建工程的时候，不要选择Linter/Formatter选项，（那如何选择启用，请参照方案二）方案二：如果已经选择了eslint，我们可以通过删包的方法来使他失效。在packge.json中，将devDependencies下的关于eslint的依赖包给删除掉。然后退出服务为，重新npmi，在重启服务即可。再次基础上，如果又想使用eslint了。就需要在重新将这几个包手动安装。
Android开发中的函数式编程应用：流与响应式编程
流与响应式编程1.函数式副作用的处理之前有说过函数式编程中尽量要编写纯函数，但是实际的程序中不可能如此理想的都是纯函数，异常、用户交互、时间、变量等等这些所谓的“副作用”是一定会也一定需要存在的，那程序应该如何编写？首先我们需要回到“纯函数”的定义上：对于相同的输入，总是产生相同的输出，可以用返回值替换函数执行。比如：varcount=0funincrease(a:Int):Int{returnc
vivo Pulsar 万亿级消息处理实践（3）-KoP指标异常修复
作者：vivo互联网大数据团队-ChenJianbo本文是《vivoPulsar万亿级消息处理实践》系列文章第3篇。Pulsar是Apache基金会的开源分布式流处理平台和消息中间件，它实现了Kafka的协议，可以让使用KafkaAPI的应用直接迁移至Pulsar，这使得Pulsar在Kafka生态系统中更加容易被接受和使用。KoP提供了从Kafka到Pulsar的无缝转换，用户可以使用Kafka
【前端工程化】前端工作中如何协同管理开发任务？前端
在企业级后台系统开发中，任务管理是保障团队协作效率、控制交付质量的核心环节。相比C端产品强调敏捷响应和快速迭代，B端更注重任务拆解的合理性、流程的可控性以及多人协作下的责任清晰。本文主要围绕需求拆解、任务分配、进度跟踪与闭环机制展开，适用于使用Git+PR流程+看板式工具的开发团队。一、任务管理目标职责明确每位成员清楚自己的任务范围与交付标准；避免多人重复处理同一功能模块；可视化进度使用看板或列表
量化价值投资中的深度学习技术：TensorFlow实战
量化价值投资中的深度学习技术：TensorFlow实战关键词：量化价值投资,深度学习,TensorFlow,股票预测,因子模型,LSTM神经网络,量化策略摘要：本文将带你走进"量化价值投资"与"深度学习"的交叉地带，用小学生都能听懂的语言解释复杂概念，再通过手把手的TensorFlow实战案例，教你如何用AI技术挖掘股票市场中的价值宝藏。我们会从传统价值投资的痛点出发，揭示深度学习如何像"超级分析
Rust BSS段原理与实践解析萧曵丶 Rust rust 开发语言后端内存模型
在Rust中，BSS段（BlockStartedbySymbol）是程序内存布局的关键部分，专门用于存储未初始化或零初始化的全局/静态变量。以下是从原理到实践的深入解析：一、BSS的核心特性零初始化BSS段中的所有变量在程序加载时自动初始化为0（或对应类型的零值：0、null、false等）。staticmutCOUNTER:usize=0;//实际存储在BSS段磁盘空间优化BSS段在可执行文件中
网络安全-反弹shell详解（攻击，检测与防御）程序员鱼 web安全网络安全单片机服务器 linux uni-app
反弹Shell：详解、攻击、检测与防御反弹Shell（ReverseShell）是一种网络安全领域中常见的攻击技术，通常用于远程控制受害者的计算机。本文旨在从网络安全的角度详细介绍反弹Shell的工作原理，实施方法以及如何检测和防御这类攻击。一、Shell的简介与原理1.1什么是Shell？Shell在计算机系统中指的是一个用户界面，用于访问操作系统的服务。在网络安全中，攻击者常利用Shell来控
MBSE 深度解析，基于模型的系统工程北城笑笑软件工程硬件工程
目录前言一、基础概述1.1中文全称与基本定义1.2MBSE的起源与背景1.2.1提出的背景与动因1.2.2MBSE的思想萌芽1.3MBSE与传统工程的区别二、发展历程2.1MBSE的演进阶段2.1.1探索期（2000年以前）2.1.1定义期（2000–2010年）2.1.1应用期（2010–2020年）2.1.1智能融合期（2020年至今）2.2主流建模语言与标准2.2主流建模语言与标准2.2.1
【人工智能】Spring AI Alibaba，一个面向 Java 开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。本本本添哥 A -AIGC 人工智能大模型人工智能 java spring
一、SpringAIAlibaba介绍SpringAIAlibaba是一个面向Java开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。该项目基于SpringAI构建，并且是阿里云通义系列模型及服务在JavaAI应用开发领域的最佳实践。SpringAIAlibaba的目标是为开发者提供一套高层次的AIAPI抽象以及与云原生基础设施的深度集成方案，从而帮助他们快速构建智能应用
模型融合与人机协同：构建人机共生的智能未来 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍在科技日新月异的今天，人工智能（AI）已经成为了我们生活中不可或缺的一部分。从智能手机，到自动驾驶汽车，再到医疗诊断，AI的应用已经渗透到了我们生活的方方面面。然而，尽管AI的发展已经取得了显著的成就，但是我们仍然面临着一个重大的挑战：如何让AI系统更好地理解和适应人类的需求，以实现人机共生的智能未来。为了解决这个问题，越来越多的研究者开始探索模型融合和人机协同的方法。2.核心概念与联
Linux文件权限管理 IT摆渡者网络服务器运维 linux
Linux文件权限管理：告别777，掌握核心操作在Linux系统中，文件权限是保障系统安全的基础。不少运维新手图省事，动辄给文件设置777权限，这其实隐藏着巨大安全风险。本文带你快速掌握Linux文件权限的核心知识与实用操作，摆脱对777的依赖。一、文件权限基础概念Linux通过"用户类别+权限类型"实现权限管控，核心要素包括：•三类用户：拥有者（user）、用户组（group）、其他用户（oth
穿越SaaS迷雾：从工具到智能体，国内垂直SaaS的“阵痛”与“新生”
——在增长与亏损的悖论中，一场由AI驱动的“大洗牌”正悄然上演引言：每个SaaS创始人的“冰与火之歌”每个投身国内SaaS（软件即服务）创业的创始人，心中或许都吟唱着一首“冰与火之歌”。“火”的一面，是资本的热捧、数字化转型的时代浪潮，以及那条陡峭诱人的ARR（年度经常性收入）增长曲线。根据相关调研报告，2023年中国企业级SaaS市场规模已达888亿元，其中垂直行业SaaS的占比正从35%攀升至
Hive 事务表(ACID)问题梳理
文章目录问题描述分析原因什么是事务表概念事务表和普通内部表的区别相关配置事务表的适用场景注意事项设计原理与实现文件管理格式参考博客问题描述工作中需要使用pyspark读取Hive中的数据，但是发现可以获取metastore，外部表的数据可以读取，内部表数据有些表报错信息是：AnalysisException:org.apache.hadoop.hive.ql.metadata.HiveExcept
使用FinancialDatasets工具包进行财务数据分析 Zbb159 数据分析数据挖掘
##技术背景介绍在现代金融分析中，获取准确且及时的财务数据是至关重要的。FinancialDatasets提供了一个强大的API，可以获取超过16,000个股票的财务数据，时间跨度超过30年。通过与OpenAI的集成，我们能够创建智能化的财务分析助手，为投资者提供深度的市场洞察。##核心原理解析FinancialDatasets工具包通过RESTAPI接口访问财务数据，为每个公开交易的公司提供详细
爬虫小结 Crescent_P python小项目 python 数据分析
python爬虫小组作业上周布置了python的小组作业,每一组要求爬取老师指定的信息,本组抽到的题目如下:从中国银行网址：http://www.boc.cn/sourcedb/whpj/获取主要外汇（美元、欧元、英镑、加拿大元、澳大利亚元、日元、韩元、新台币、澳门元和港币）的牌价信息，计算出它们的每天平均价。要求把今年5月份每天平均价格保存到Excel文件中，每种外汇的数据保存在一个工作表中，并
标题：2025传统制造业护网实战指南：从合规防御到智能免疫的体系化进阶上海云盾商务经理杨杨网络
引言2025年，随着《工业互联网企业网络安全》三项国家标准全面实施，护网行动已从“合规检查”升级为“能力对抗”。传统制造业在数字化转型浪潮中，面临设备老旧、人才短缺、供应链风险激增等挑战，41.5%的企业计划年内增加安全预算。本文将结合新规要求与行业最佳实践，深度解析传统制造业如何构建“技术-管理-运营”三位一体的护网防御体系。一、传统制造业的护网困境：三大核心矛盾1.设备老旧化vs安全新标准历史
【HCIA】TCP三次握手、4次断开详解戏精亿点点菜 tcp/ip 网络服务器
TCP（传输控制协议）是一种面向连接的、可靠的、基于字节流的传输层通信协议。在TCP/IP协议族中，TCP负责在两个网络实体之间建立、维护和终止连接。TCP连接的建立和终止分别通过三次握手和四次断开来完成。一、三次挥手TCP三次握手是建立TCP连接的过程，它确保了通信双方都准备好进行数据传输。过程如下：客户端->服务器:SYN,ISN=x服务器->客户端:SYN,ACK,ISN=y,ACK(x+1
FPGA 47 ，MIG 内存接口生成器深度解析（ FPGA 中的 MIG 技术）北城笑笑 fpga开发 fpga
目录前言一、基础理论1.1MIG介绍1.2结构框架1.2.1主要模块①用户接口层（UserInterfaceLayer）②控制逻辑层（ControLogicLayer）③校准逻辑（CalibrationLogic）④初始化与时序控制（Initialization&TimingControl）⑤物理层接口（PHY–PhysicalLayer）⑥IO引脚驱动（引脚分配与IO配置：Pinout&IOSt
Python 爬虫实战：实时采集外汇汇率数据的全方位指南 Python爬虫项目 python 爬虫开发语言信息可视化数据分析
引言在全球化的金融市场中，外汇汇率的实时数据对于投资者、企业和研究人员来说至关重要。通过自动化的方式获取这些数据，不仅可以提高效率，还能为决策提供及时的支持。本文将深入探讨如何使用Python爬虫技术，结合最新的工具和方法，实时采集外汇汇率数据。一、外汇汇率数据的获取途径1.1使用官方API接口许多金融机构和数据提供商提供了官方的API接口，供开发者获取外汇汇率数据。例如：AlphaVantage
ResNet：深度卷积神经网络的里程碑心想事“程” 小知识点 cnn 人工智能神经网络
一、引言在深度学习的发展历程中，深度卷积神经网络（CNN）不断演进，旨在提升对图像等数据的特征提取与分类能力。然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。2015年，由微软研究院提出的ResNet（ResidualNetworks，残差网络）横空出世，它以独特的残差学习思想，成功攻克了这些难题，在ImageNet竞赛中大放异彩，开创了深度神经网
C语言指针进阶完全指南：从多级指针到函数指针的深度探索给老吕螺丝 #C语言 c语言开发语言
掌握指针基础后，你将开启C语言真正的力量之门。本文通过实战代码示例和内存布局图解，带你系统攻克指针进阶技术。一、指针核心回顾与进阶重点核心概念：指针本质：存储内存地址的变量间接访问：通过地址操作数据指针大小：64位系统固定8字节（与类型无关）进阶重点：多级指针：处理复杂间接关系动态内存管理：精准控制内存生命周期函数指针：实现代码抽象与回调复杂结构：构建链表等动态数据结构二、多级指针：指针的指针内存
展锐平台(Android15)WLAN热点名称修改不生效问题分析
前言在展锐AndroidV项目开发中，需要修改softAp/P2P热点名称时，发现集成GMS后直接修改framework层代码无效。具体表现为：修改packages/modules/Wifi/WifiApConfigStore中的getDefaultApConfiguration方法编译烧录后修改不生效问题根源在于：Wi-Fi模块在AndroidS(12)及以上版本已纳入Mainline模块Mai
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
卷积神经网络架构的演进：从AlexNet到EfficientNet t0_54manong 大数据与人工智能 cnn 架构人工智能个人开发
在过去的8.5年里，深度学习取得了飞速的进步。回溯到2012年，AlexNet在ImageNet上的Top-1准确率仅为63.3%，而如今，借助EfficientNet架构和师生训练法，我们已经能达到超过90%的准确率。本文将聚焦于卷积神经网络（CNN）架构的演变，深入探究其背后的基本原理。一些关键术语在深入了解各种架构之前，我们需要明确几个关键术语。更宽的网络意味着卷积层中有更多的特征图（滤波器
Spring Security：认证与授权的实现原理及实践
SpringSecurity是Spring生态中强大的安全框架，用于为Java应用提供认证（Authentication）和授权（Authorization）功能。根据2024年StackOverflow开发者调查，SpringBoot是Java开发者中最流行的框架，约60%的Java开发者使用它构建微服务，而SpringSecurity是其首选安全解决方案。本文深入剖析SpringSecurit
MacOS系统安装Docker（非常详细）从零基础入门到精通，看完这一篇就够了_mac安装docker 2501_90249219 docker eureka 容器
选择默认配置就行，Docker会自动设置一些大多数开发人员必要的配置。这里我们跳过就好。运行Docker在应用程序中找到Docker程序图标，点击以启动Docker，启动之后我们会发现右上角工具栏中多了一个小鲸鱼的图片，这个就是Docker啦~真的好可爱~Docker桌面应用程序打开后，就是首页的学习中心界面。通过小鲸鱼中的AboutDockerDesktop可以查看Docker的版本可以看到版本
Python 领域 pytest 的测试用例的可维护性设计
Python领域pytest的测试用例的可维护性设计关键词：pytest、测试用例、可维护性、测试框架、自动化测试、测试设计模式、重构摘要：本文深入探讨了如何在Python测试框架pytest中设计可维护的测试用例。我们将从测试用例可维护性的核心原则出发，分析pytest的特性和最佳实践，介绍多种提高测试代码可维护性的设计模式和技巧。文章包含实际代码示例、项目实战案例以及可维护性评估指标，帮助开发
创建 TransactionStatus 悟能不能悟 log4j java 开发语言
在Spring框架中，TransactionStatus是一个接口，通常由事务管理器（如PlatformTransactionManager）在开启事务时自动创建，而不是由开发者直接实例化。如果你需要在代码中操作事务状态，应通过以下标准方式：正确获取TransactionStatus的步骤：注入事务管理器在SpringBean中注入PlatformTransactionManager（如DataS
Hera调度系统运行时架构源码分析 Code Monkey’s Lab 源码分析 Java 架构 hera 调度系统
目录一、Hera启动过程二、Master节点启动流程三、Worker节点启动流程四、心跳机制实现五、任务调度执行流程六、架构特点总结在笔者的职业生涯中，Hera调度系统是使用过的所有开源调度系统中最符合用户操作习惯、最贴近业务实际需求的一款产品——没有之一。若论产品成熟度与用户体验，或许只有部分大厂自研的调度平台才能与之比肩。与DolphinScheduler等主流开源调度系统相比，Hera的设计
web后端框架MyBatis 猿力觉醒 java 后端 mybatis
目录前言1.xml配置方式开发步骤2.注解方式开发步骤前言mybatis是一个优秀的基于java的持久层框架，它内部封装了jdbc，使开发者只需要关注sql语句本身，而不需要花费精力去处理加载驱动、创建连接、创建statement等繁杂的过程。mybatis通过xml或注解的方式将要执行的各种statement配置起来，并通过java对象和statement中sql的动态参数进行映射生成最终执行的
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

深度学习方法中 3D目标检测 数据预处理综述

你可能感兴趣的:(深度学习方法中 3D目标检测 数据预处理综述)

深度学习方法中 3D目标检测数据预处理综述

你可能感兴趣的:(深度学习方法中 3D目标检测数据预处理综述)