Little_sky_jty

论文阅读-PointRCNN+python3.5实现

Brief

发表在CVPR2019，还挺新的一篇文章，前面看了一些，大部分都是在候选区域如何得到上做文章，就比如第一个voxelnet直接暴力的把所有的anchor 都弄一下，不够优美，不过这一篇最大的贡献在VFE结构，但是说下去也就是个pointnet,都是线性全连接层嘛。其二是F-pointNet。这是一篇18年CVPR的文章，就比较有想法的结合了2D去先找个视锥出来，再通过这个区域实例分割得到最后的物体，再把它框起来完事儿。不过这个阶段性有点强，严重依赖二维的detection效果。
因为这一篇在github的3D detection上取得了不少的stars，所以把它作为了我在该方向上的第三篇文章。先在知乎上看了个大概，感觉主要的贡献是抛弃的anchor这个玩意，一开始在2维上引入anchor_free时，以为会晚两年，没想到还挺快的，这一篇就不用anchor，而是采用一种对前景点的方式。**从一组前景点（这组前景点，相当于anchor了）出发，为每个前景点找到它所属于的目标框。**这和我后面要读的凯明大神19年ECCV上的voteNet貌似都是丢弃了anchor，而采用基于一种方式去代替候选框。

Q

固定输入

Abstruct

处理的是原始点云数据。
两阶段；阶段一：bottom-up 3Dproposal generation。阶段二：refining proposals in the canonical coordinates。

stage-1的子网络通过将点云分为前景和背景的方式，采用自下而上的形式直接生成少量优质的3D候选框。
stage-2子网络将每一个proposal的池化的点转化为canonical坐标以达到学习到更好的局部空间特征，其与在stage-1中学到的每个点的全局语义信息相结合以用于bbox的精确优化和置信度预测。

sota KITTI

Introduction

目前的sota的方法采用的结合了成熟的2D检测或者3D voxel的方法

Pointnet和F-pointnNet并且指出该方法对2D detector的依赖性太强了。
3D training data和2D training data最大的不同在于：用于3D对象检测的训练数据直接提供用于3D对象分割的语义掩模,在二维中这个bbox只能是一个语义分割的弱监督信息（毕竟bbox里面有很多不是interest，所以后面很多anchor_free的方法都在这方便组改进）

two stage 方法

stage-1

和sbstruct中所说的一样：

By utilizing 3D bounding boxes to generate ground-truth segmentation mask, the first stage segments foreground points and generates a small number of bounding box proposals from the segmented points simultaneously. Such a strategy avoids using the large number of 3D anchor boxes in the whole 3D space as previous methods [43, 14, 4] do and saves much computation.

这里比较好奇的是：如何使用3D bbox去生成gt和怎样分割前景和背景（后文填坑）。

stage-2

refinement。操作步骤：

（1）对stage-1中学习到的represent进行pool。
（2）优化。不是直接学习bbox的坐标差值，而是先把3D坐标转化到正交坐标系，再结合stage-1中所学习到的pooled坐标和分割mask来做坐标进行优化。

一种新的loss:the full bin-based 3D box regression loss

Related Work

3D object detection from 2D images

主要是从2D图像中得到一个3D的object和CAD模型这种，用到先验知识：3D几何形式。这种没有深度信息的检测得到的bbox是很粗糙的。难顶。

3D object detection from point clouds

birds view+ 2D CNN 。信息损失
voxel+3D CNN。信息损失+资源耗费大；一个新词语：data quantization
F-pointnet。对2D依赖大
我们的stage-1。efficient and quantization free

Learning point cloud representations

我们的工作是把poinet进一步引入到detection中来。

3. PointRCNN for Point Cloud 3D Detection

overall structure如下：

3.1 Bottom-up 3D proposal generation via point cloud segmentation

讲了一下2D中的one-stage和two-stage。但是把2D移植到3D由于空间的和点云的稀疏性是很难做到的。后面说了一下AVOD在3D中放置了80~100K个的anchor，再对每一个anchor的多视角特征进行池化得到生成的proposals。F-pointnet呢就是有的在3D中才能看到的数据，在2维度是很难看到的。

作者的stage-1：

（1）stage-1子网络是基于全场景分割的。利用先验知识：3D物体在点云中是自然分割，没有互相overlap的（这一观点不太赞同，为哈没有overlap）
（2）所谓前景就是那些在有annotations的bbox内的点。
（3）采用bottom-up的方式生成3D proposals：对点云提取point-wise features用于分割原始的数据，同时对分割为前景的点生成3D BOX。这样的Box就避免了很多个，比3D abchor-based的方法有更高的reall rate。

主要步骤如下分：

Learning point cloud representations
Foreground point segmentation
Bin-based 3D bounding box generation

下面一个一个阅读：

Learning point cloud representations

我们的backbone采用的是pointnet++集合multi-scale。得到的被编码的point-wise features.

Foreground point segmentation

这里的分割和box 生成是同时做的，都是在前面的features的基础上做的。

（1）对于分割来说，gt-maks 是由3D gt bbox产生的。对于室外场景来说,前景点比背景点少多了（这也正是文章杜宇anchor的优化吧）。所以对于不平衡的优化采用的是 focal loss,如下：
$\begin{array}{l}{\mathcal{L}_{\text {focal }}\left(p_{t}\right)=-\alpha_{t}\left(1-p_{t}\right)^{\gamma} \log \left(p_{t}\right)} \\ {\text { where } p_{t}=\left\{\begin{array}{ll}{p} & {\text { for forground point }} \\ {1-p} & {\text { otherwise }}\end{array}\right.}\end{array}$
在训练中，选取的值 $\alpha_t=0.25,\gamma=2$ ;

Bin-based 3D bounding box generation

训练时，只用回归前景点的box。不回归背景点。
同样采用的是7维特征回归的方式。我们提出一种bin-based regression losses。
预测中心位置，如下

（1）首先，我终于明白了相机和liadar的z轴是车向前的方向，y轴是指向地面的。
（2）将前景点周围的区域沿着x轴和z轴划分成一块一块的Bin区域。每个轴规定了最大search范围为 $s$ ，这个是对整体的大坐标系来说的。
（3）对每一个1D（这是个什么意思？？）的search range都是以长度 $\delta$ 来划分的，也就是每一个小坐标系坐标轴的单位长度。
（4）对X和Z轴的定位损失包含了链各个方面的loss，bin classification和residual regression。这两个采用的是交叉熵损失.对于y轴的定位，由于范围很小，所以采用的是smooth L1 loss。因此location target可以定位为：
$\begin{aligned} \operatorname{bin}_{x}^{(p)} &=\left\lfloor\frac{x^{p}-x^{(p)}+\mathcal{S}}{\delta}\right\rfloor, \operatorname{bin}_{z}^{(p)}=\left\lfloor\frac{z^{p}-z^{(p)}+\mathcal{S}}{\delta}\right\rfloor \\ \operatorname{res}_{u}^{(p)} &=\frac{1}{\mathcal{C}}\left(u^{p}-u^{(p)}+\mathcal{S}-\left(\operatorname{bin}_{u}^{(p)} \cdot \delta+\frac{\delta}{2}\right)\right) \\ \operatorname{res}_{y}^{(p)} &=y^{p}-y^{(p)} \end{aligned}$
代表含义： $bin_{x}^{(p)}$ 表示gt_bin在x轴上的位置。 $x^p$ 表示gt中心点坐标， $x^{(p)}$ 表示感兴趣区域的前景点，也就是每个小坐标系的中心点。 $res_x^{(p)}$ 表示的在一个bin之类的残差值。是为了进一步精细的定位所用到的残差损失。 $C$ 是 bin length大小， $\delta$ 表示的是单位长度。和C一个意思，只是一个用来表示确切的大小，一个用来表示单位长度的含义。
作者把x-z空间分成了很多个bin。

同样的是，对于 $\theta$ 的回归也是采用Bin的思想，把 $2 * p i$ 分成若干个bin。对于 $(h, w, l)$ 则是直接回归残差值。
在推理阶段：首先选择预测出的具有最高自信度的bin center，然后把回归得到的残差加进去。
overall 3D损失：

我有个疑惑， $\theta$ 是怎么存在cls损失的，不应该只有reg损失才对吗。
要知道上诉的每一个前景点都是一个兴趣点，所以出来的box也是很多的，因此作者后续会采取NMS方法对候选框缩减；是在Birds view上进行的。最后大致保留300个候选框进入第二阶段的预测。
这一段看的有点迷，回顾一下bottom-up生成候选框主要有两个步骤，其一是特征提取，采用的是pointnet+；后面两个工作一个是分割，直接采用focal-loss对每个点进行二分类就行了（是前景还是背景）。另一个工作是Box的生成，这一步不是在分割之后做的，而是在之前的特征提取之后，我们知道特征提取最后出来的张量为 $[b s, n, 128]$ ；假如每一个点也都是会被预测一个bbox（这不是voxel的方式还蠢？？）;所以作者是结合分割的mask来做，也就是只对前景点做bbox生成。

3.2 Point cloud region pooling

为了进一步从regi proposals中得到优化后的结果，我们对3D点进行池化和根据proposals对由stage-1得到的点特征进行池化。
所以呢，这一部分就是把得到的3D bbox 给扩大一点如下：
$\mathbf{b}_{i}^{e}=\left(x_{i}, y_{i}, z_{i}, h_{i}+\eta, w_{i}+\eta, l_{i}+\eta, \theta_{i}\right)$
然后对所有点做一个测试，看看他有没有在这个扩大后的bbox当中，如果有的话，那么这个点的特征也会被加入到后续的refine当中。

3.3. Canonical 3D bounding box refinement

3.3.1 Canonical transformation.

也就是上面这个图，每一个新的坐标系都是和框框的位置和朝向平行啥的，作者说这样可以得到更好的学习结果。

3.3.2Feature learning for box proposal refinement

这里这个优化后的网络使用的输入特征有：

transformed local spatial points (features) $\widetilde{p}$
global semantic features $f^{(p)}$
confidence 信息

坐标正交化后会出现的问题是，丢失了深度信息，这里要把丢失的信息补回来:
$d^{(p)}=\sqrt{\left(x^{(p)}\right)^{2}+\left(y^{(p)}\right)^{2}+\left(z^{(p)}\right)^{2}}$

网络特征组合：

（1）首先呢，我们的网络先把local features $\widetilde{p}$ 额外的补充信息 $r^{p},m^{p},d^{p}]$ 先组合起来，再给通过几层FC得到特征.
（2）再把得到的全局特征和 $f^{(p)}$ 整合一下。也就是局部特征和全局特征的整合。

3.3.3 Losses for box proposal refinement

我们只对和gt IOU大于0.55的做优化。

疑惑：前面生成的时候也用了gt。和这里的有什么区别？

gt bbox和proposals都需要先转化为正交坐标系中来。也就是如下转化：
$\begin{aligned} \tilde{\mathbf{b}}_{i} &=\left(0,0,0, h_{i}, w_{i}, l_{i}, 0\right) \\ \tilde{\mathbf{b}}_{i}^{\mathrm{gt}} &=\left(x_{i}^{\mathrm{gt}}-x_{i}, y_{i}^{\mathrm{gt}}-y_{i}, z_{i}^{\mathrm{gt}}-z_{i}, h_{i}^{\mathrm{gt}}, w_{i}^{\mathrm{gt}}, l_{i}^{\mathrm{gt}}, \theta_{i}^{\mathrm{gt}}-\theta_{i}\right) \end{aligned}$
training target:

定义的方式和前面stage-1中是一样的；对于长宽高的优化也是直接优化。
优化朝向，目标：
$\theta^{gt}_i-\theta_i$
这个误差的范围在 $[-\pi/4,\pi/4]$ 之间，这是因为3D IOU大于0.55所自带的属性。因此我们把 $\pi/2$ 以 $w$ 分成很多个bin；因此bin-based taeget就成了如下：

因此，在优化阶段，所有的Loss之和就是：

具有同样的疑惑，朝向为什么会有cls损失。

实验部分

细节实现

网络结构

输入：采样到16384个点，不足的话就重复使得也是16384个点（固定输入）
backbone采用的是 pointnet++， set-abstraction layer采用MSG，每一个size为4096,1024,256,64四层的size。
box proposal refinement sub-network。我们对每一个pooled的proposals采样512个点。

The training scheme（CAR）

阶段一所有的gt box的内点都会被当做是前景点，其余的都是背景点。扩大0.2的size， $S = 3 m, δ = 0.5 m, n = 12$
训练阶段二网络，augment

代码实现

源码pytorch 版本的代码，就比较容易读了。对我这种新手就比较容易理解。
首先我们还是先看源码的README文件；主要是为了方便，把它的md格式直接放在网页上显示出来。主要代码分为几步：

环境安装
数据准备
预处理
training
个人代码解读

1环境安装

这一步我就不说了，文章要求的是Py3.6。我是3.5不过我觉得问题不大，如果出了bug就继续修改就好了。
每次使用pip的时候带上清华源就很快了，秒秒钟的事情就装好了。

2 数据准备

这里使用的依然是KITTI数据集。并且按照下面的形式组织文件夹：

PointRCNN
├── data
│   ├── KITTI
│   │   ├── ImageSets
│   │   ├── object
│   │   │   ├──training
│   │   │      ├──calib & velodyne & label_2 & image_2 & (optional: planes)
│   │   │   ├──testing
│   │   │      ├──calib & velodyne & image_2
├── lib
├── pointnet2_lib
├── tools

因为我的data被放在了另外一个地方和源码是分开的，因此我们需要在后续运行代码时改一下文件路径就可以了。

3 预处理

本文以"car”做实验，数据预处理主要是根据gt增广数据：

cd tools
python generate_gt_database.py --class_name 'Car' --split train

这个文件具体的操作和含义如下：
正如文件名，也就是把含有gt的点云输入文件和对应的labels建立起gt_boxs，最后统一装入一个叫self.gt_database中。所以这样dataset也就多了一个只有含有gt的属性。

4 training

由于代码要求是python3.6及其以上的版本，我是Python3.5所以需要改正一些地方；目前只有两处内容，也就是出现：

fastai_optimazion129行的：
  return f'OptimWrapper over {repr(self.opt}.\nTrue weight decay: {self.true_wd}'
  改为：
  return 'OptimWrapper over {}.\nTrue weight decay: {}'.format(repr(self.opt), self.true_wd)
87行的：
f'List len mismatch ({len(p)} vs {n})'
改为：
 'List len mismatch ({} vs {})'.format(len(p),n)

这样就可以训练我们的RPN的阶段了，我们输入：

python train_rcnn.py --cfg_file cfgs/default.yaml --batch_size 16 --train_mode rpn --epochs 200

效果如下：

这里我想讲一下自己的一下理解和疑惑，参看博客

1RPN阶段的具体数据流动过程。

（1）数据输入大小为 $[B, N, 3]$ ,进入Pointnet++得到对应的point-wise features为 $[B, N, 128]$ ，这里的 $B = 16, N = 16384$
（2）得到的feature会经过两个后续结构，一个做分割，一个做回归，其实都是简单的全连接层。
--------对于分割网路就是对每一个点计算一个二分类score，也就是前景和背景，再经过一个sigmod函数归一化到0~1;随后使用一个阈值得到对应的mask，这里的损失采用的是focal loss。这个比较好理解。
--------对于回归。在训练的时候，根据代码作者是采用的利用gt计算的对应的损失而不是说是前景点，整个过程如下：第一步，输出是一个 $[16, 16384, 76]$ 维度的tensor，其中bin loss和 res loss各占12个通道，这里为什么是12？（作者是根据X轴和Z轴上的搜索范围来的，12=6/0.5；所以是12）；其二为什么是16384个而不是作者的前景点的个数呢？，作者这里代码中是先生成这么多个，但实际不会用到这些，而是会进行一个test，检测生成候选框的点是否在gt内部，如果是就算作是有效的候选框，计算它的回归损失，损失的计算的时候会把每一个兴趣点先移动到中心，然后再和其gt求差值。第三个问题，这个loss的中心怎么确定是哪个gt box的？作者在计算loss之前采用检测所有的点是否在gt中，只有在gt中的点才能算作有效的，而对应的gt-box也就是这个gt-box。

转 C# .NET4.0 混合模式程序集异常 weixin_30516243
1.引用Microsoft.DirectX.dll和Microsoft.DirectX.Directsound.dll这2个文件。2.项目属性里边，把目标平台改成X86。3.App.Config修改下：123456在.NET4.0下使用Dirext3D托管库，出现“混合模式程序集是针对“v1.1.4322”版的运行时生成的，在没有配置其他信息的情况下，无法在4.0运行时中加载该程序集。”异常信息，
【论文复现】——基于SIFT特征点结合ICP的点云配准方法点云侠点云配准专题开发语言计算机视觉算法 3d c++
目录一、论文概述二、代码实现三、结果展示1、初始位置2、配准结果四、实验心得一、论文概述在点云配准过程中，针对迭代最近点(ICP)算法对点云初始位置依赖性强且迭代速度慢的问题，提出一种基于尺度不变特征变换(SIFT)特征点结合ICP的点云配准方法。首先利用SIFT算法提取待配准点云和目标点云的特征点;接着计算出特征点的快速点特征直方图(FPFH)特征;然后依据该特征使用采样一致性初始配准(SA
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
Bash 脚本基础 HXQ_晴天 linux bash chrome 开发语言
一、Bash脚本基础什么是Bash脚本：Bash脚本是一种文本文件，其中包含了一系列的命令，这些命令可以被Bashshell执行。它用于自动化重复性的任务，提高工作效率。Bash脚本的基本结构：以#!/bin/bash开头，表示使用Bash解释器来执行脚本。接下来是具体的命令和操作。二、编写和运行第一个Bash脚本创建脚本文件：使用命令nanohello.sh创建名为hello.sh的文件。编写脚
HTML+CSS案例展示(CSS3D效果旋转相册) hacalili html css 前端 css3
参考来源：黑马程序员pink老师前端入门教程，零基础必看的h5(html5)+css3+移动端前端视频教程_哔哩哔哩_bilibili效果展示：总结：transform：translate(x,y)rotate(180deg)scale()...顺序对最后的效果有影响，需要根据需求安排位移和其他属性的顺序；实现暂停动画效果：animation-play-state:paused;经常和鼠标经过等其
python processpoolexecutor_Python多进程解决方案multiprocessing ProcessPoolExecutor weixin_39599046 python
大多数编程语言都会有多线程和多进程的概念，至于线程和进程的概念，大家可以百度一下。作为一门胶水语言，Python毫不意外，也可以利用多线程和多进程处理并发问题，但是多线程由于GIL的存在，起作用范围大打折扣，仅限于在IO等场景可以发挥点作用。所以，今天要跟大家分享的是Python多进程方案，更好地利用系统多核，从而提升性能。基础方案一：利用Process新建一个子进程，在子进程执行任务。我们写一个
html5 相册翻转效果,HTML5 css3：3D旋转木马效果相册岑依惜 html5 相册翻转效果
这篇博客的目的是因为上篇HTML5CSS3专题诱人的实例CSS3打造百度贴吧的3D翻牌效果中有个关于CSS3D效果的比较重要的知识点没讲到，就是perspective和tranlateY效果图：嘿嘿，我把大学毕业时的一些照片，做成旋转木马，绕着我大文理旋转，不忘母校的培育之恩~1、perspectiveperspective属性包括两个属性：none和具有单位的长度值。其中perspective属
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
HTML5+CSS实现图片3D旋转效果，附音乐宁醉小白 html5 前端 html
利用程序呈现图片，可以俘获一众女生的心，增加音乐可以实现图片变化的同时也带上了想要得到效果，如此一程序实乃众人之喜。先看看程序呈现的效果，还是特别吸引人的。先在网上爬取想要呈现的美女照片，存放在文件夹img-one，与程序路径一致。图片像素需进行调整，同一面图片可以使用同一个图片，保持图片像素一致的同时也增加了立体感。第二张02.jpg和2.jpg可以倒着放，这样在程序实现的时候，可以和其他方向的
conda篇----在已有conda环境的基础上升级python包心惠天意 conda python jvm
conda篇----在已有conda环境的基础上升级python包原先的python版本第一步：condaupdate--all(py11)[xxx@aivrs01xxx]$condaupdate--allCollectingpackagemetadata(current_repodata.json):doneSolvingenvironment:done==>WARNING:Anewervers
集成学习（随机森林） herry57 数学建模大数据随机森林集成学习
目录一、集成学习概念二、Bagging集成原理三、随机森林四、例子（商品分类）一、集成学习概念集成学习通过建⽴⼏个模型来解决单⼀预测问题。它的⼯作原理是⽣成多个分类器/模型，各⾃独⽴地学习和作出预测。这些预测最后结合成组合预测，因此优于任何⼀个单分类的做出预测。只要单分类器的表现不太差，集成学习的结果总是要好于单分类器的二、Bagging集成原理分类圆形和长方形三、随机森林在机器学习中，随机森林是
HTML实现酷炫3D相册算法与编程之美编程之美 css html js css3 javascript
欢迎点击「算法与编程之美」↑关注我们！本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。欢迎加入团队圈子！与作者面对面！直接点击！目录1、创建文件目录2、调背景色3、制作3D相册4、将图片散开，围成一圈。5、绘制透明底盘6、最终效果1、创建文件目录在Hbuilder在新建一个目录，创建css和js文件。图12、调背景色在style块里面给整个页面渲染成黑色调。*{padd
【Html+CSS】3D旋转相册小木荣 web前端 css html 3d
3D旋转木马相册&3D盒子相册因为代码大部分相同，就放一起了注释一下就是另一个相册3D旋转木马相册body{background-color:#000;/*视距，使子元素获得视距效果*/perspective:900px;}section{margin:20vhauto;position:relative;width:200px;height:200px;/*开启3D空间*/transform-s
解码软件需求的三个维度：从满足基础到创造惊喜技术管理修行项目管理信息系统项目管理师需求分析质量功能部署需求管理常规需求期望需求意外需求用户体验
在软件开发的世界里，用户需求就像一张复杂的地图，指引着产品前进的方向。但并非所有需求都能带来同样的价值——有些是产品生存的“氧气”，有些是吸引用户的“磁石”，还有一些则是让人眼前一亮的“魔法”。如何区分它们？质量功能展开（QFD）提出的常规需求、期望需求、意外需求分类法，为团队提供了一把解开需求迷局的钥匙。1.常规需求：没有它，产品活不下去想象一下，你下载了一款外卖App，却发现无法下单支付；或者
Xilinx系ZYNQ学习笔记（二）ZYNQ入门及点亮LED灯贾saisai FPGA学习学习笔记 fpga开发
系列文章目录文章目录系列文章目录前言简单介绍简称xc7z020型号FPGAZYNQ实操通用IO点亮LED灯硬件逻辑基础前言简单入门一下ZYNQ是何种架构，如何编程，至于深入了解应该要分开深入学习Linux和FPGA简单介绍其基本架构都是在同一个硅片上集成FPGA和CPU，并通过高速、高带宽的互联架构连接起来。ARM的顺序控制、丰富外设，开源驱动、FPGA的并行运算、高速接口、灵活定制、数字之王的特
Python知识分享第十四天闵少搞AI python 开发语言
“”"1.面向对象相关概述概述面向对象是一种编程思想强调的是以对象为基础完成的各种操作它是基于面向过程的扩展Python中是同时支持面向对象和面向过程这两种编程思想的思想特点更符合人们的思考习惯把复杂的问题简单化把人们(程序员)从执行者变成了指挥者2.面向对象三大特征介绍封装继承多态封装概述封装就是隐藏对象的属性和实现细节仅对外提供公共的访问方式举例:插板电脑手机好处提高代码的安全性弊端代码量增加
QGIS结合天地图API实现批量经纬度转地址的完整指南网优随笔 QGIS 开源软件
一、技术背景与工具选择地理编码（Geocoding）是将地址转换为地理坐标的过程，反向地理编码（ReverseGeocoding）则是将经纬度坐标转换为结构化地址。QGIS作为开源GIS平台，通过插件扩展可实现批量地理编码操作。天地图作为我国权威地理信息服务平台，其API提供高精度的地理编码服务。本文将以QGIS3.22+版本为基础，结合天地图Web服务API，实现5000条级数据的批量反向地理编
AutoImageProcessor代码分析 fydw_715 Transformers 人工智能
以下是对AutoImageProcessor类的整理，按照类属性、类方法、静态方法、实例属性和实例方法分类，并对每个方法的功能进行了描述。类属性无显式定义的类属性。全局方法IMAGE_PROCESSOR_MAPPING_NAMES1.遍历IMAGE_PROCESSOR_MAPPING_NAMES字典formodel_type,image_processorsinIMAGE_PROCESSOR_MA
【机器学习】机器学习四大分类藓类少女机器学习机器学习分类人工智能
机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。学习目标是找到一个映射(f(X)\approxY)。适用于分类和回归问题。主要算法：分类（Classification）：逻辑回归（LogisticRegression）支持向量机（SVM）朴素贝叶斯（NaïveBa
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
蓝桥杯备赛Day12 动态规划1基础爱coding的橙子蓝桥杯蓝桥杯动态规划 c++算法
动态规划动态规划基础动态规划将复杂问题分解成很多重叠的子问题，再通过子问题的解得到整个问题的解分析步骤:确定状态:dp[i][j]=val,“到第i个为止，xx为j的方案数/最小代价/最大价值”状态转移方程:确定最终状态要求:(1)最优子结构(2)无后效性:已经求解的子问题，不会再受到后续决策的影响。(3)子问题重叠，将子问题的解存储下来两种思路:(1)按题目线性DP数字三角形学习:(1)将整个大
Python 常用函数全解析，轻松提升编码效率 jiajia651304 python 开发语言 windows
Python常用函数全解析，轻松提升编码效率Python常用函数全解析，轻松提升编码效率1.基础内置函数1.1`print()`与`input()`1.2`len()`、`type()`与`isinstance()`2.数学与数值处理函数2.1`abs()`、`round()`与`pow()`2.2`divmod()`与`max()/min()`3.序列与迭代相关函数3.1`range()`与`e
linux 逻辑卷LVM IT小饕餮 linux基础 linux 运维服务器
LVM（LogicalVolumeManager）逻辑卷管理是一种在Linux系统中用于管理磁盘空间的技术，它提供了一种灵活、高效的方式来管理硬盘分区和卷。以下是关于LVM逻辑管理的详细介绍：LVM的基本概念物理卷（PhysicalVolume，PV）物理卷是LVM的基本组成部分，可以是一块磁盘、也可以是一个分区。物理卷是LVM存储的基础，用于提供实际的存储空间。卷组（VolumeGroup，VG
向量数据库技术系列三-Chroma介绍恰恰虎 chromadb 数据库向量
一、前言Chroma是一个开源的AI原生向量数据库，旨在帮助开发者更加便捷地构建大模型应用，将知识、事实和技能等文档整合进大型语言模型（LLM）中。它提供了简单易用的API，支持存储嵌入及其元数据、嵌入文档和查询、搜索嵌入等功能。主要有以下特点:轻量级：Chroma是一个基于向量检索库实现的轻量级向量数据库，不需要复杂的配置和大规模基础设施支持，非常适合小型或中型项目。易用性：提供简单的API，易
《Solidity智能合约开发：从零到一实战指南》大纲白马区块Crypto100 智能合约
为什么要学Solidity智能合约？在过去几年，区块链从一种“投机工具”进化为一种全新的技术基础设施。无论是NFT、DeFi、GameFi还是DAO，它们的核心都是——智能合约。✨什么是智能合约？智能合约是运行在区块链上的“自动执行程序”，不用依赖中介或第三方，信任直接写进代码里。而Solidity是智能合约开发的“通用语言”。为什么要做这个专栏？做区块链项目的人越来越多，但真正从零系统学习Sol
【第21节】windows sdk编程：网络编程基础攻城狮7号 Windows编程(C++)windows windows编程 windows sdk c++网络编程
目录引言：网络编程基础一、socket介绍(套接字)1.1BerkeleySocket套接字1.2WinSocket套接字1.3WSAtartup函数1.4socket函数1.5字节序转换1.6绑定套接字1.7监听1.8连接1.9接收数据1.10发送数据1.11关闭套接字二、UDP连接流程2.1接收数据2.2发送数据三、阻塞与非阻塞模式四、示例代码4.1TCP协议代码4.2UDP协议代码引言：网络
索骥馆－编程语言之《网络编程实用教程（第2版）》扫描版[PDF] cinnarnia 面壁区 windows编程程序设计 TCPIP 网络
内容介绍：本书主要介绍基于tcp/ip协议栈的套接字网络编程技术。全书分为10章，第1章介绍网络编程基础，第2章介绍套接字网络编程接口，第3章介绍windows环境的网络编程，第4章介绍mfc编程，第5章介绍mfcwinsock类的编程，第6章介绍wininet编程，第7章介绍winsock的多线程编程，第8章介绍winsock的输入/输出模型，第9章介绍http及高级编程，第10章介绍电子邮件协
Milvus学习整理 louisliao_1981 milvus 学习
Milvus学习整理一、度量类型(metric_type)二、向量字段和适用场景介绍三、索引字段介绍（一）、概述总结（二）、详细说明四、简单代码示例（一）、建立集合和索引示例（二）、搜索示例（三）、参考文档五、数据搜索(一)、基础搜索参数说明(二)、范围搜索1.概述总结2.详细说明(三)、全文搜索(BM25)1.概述2.使用全文搜索步骤(四)、其他搜索一、度量类型(metric_type)相似度量
Windows下重叠I/O模型智驾 Windows开发 windows开发重叠IO模型
目录一.Windows下重叠I/O模型二．重叠模型的优点三．重叠模型的基本原理五、实现重叠模型的步骤六.客户端情况的注意事项七．已知问题原文链接：https://blog.csdn.net/zhongguoren666/article/details/1827928在此感谢原作者。一.Windows下重叠I/O模型重叠模型的优点重叠模型的基本原理关于重叠模型的基础知识重叠模型的实现步骤多客户端情况
如何用3个月零基础入门网络安全？_网络安全零基础怎么学习白帽黑客啊一学习 web安全安全 python 网安入门
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言写这篇教程的初衷是很多朋友都想了解如何入门/转行网络安全，实现自己的“黑客梦”。文章的宗旨是：1.指出一些自学的误区2.提供客观可行的学习表3.推荐我认为适合小白学习的资源.大佬绕道哈！基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包一、自学网络安全学习的误区和陷阱1.不要试图先成为一名程序员（以编程为基础的学习）
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

论文阅读-PointRCNN+python3.5实现

Brief

Q

Abstruct

Introduction

two stage 方法

stage-1

stage-2

Related Work

3D object detection from 2D images

3D object detection from point clouds

Learning point cloud representations

3. PointRCNN for Point Cloud 3D Detection

3.1 Bottom-up 3D proposal generation via point cloud segmentation

Learning point cloud representations

Foreground point segmentation

Bin-based 3D bounding box generation

3.2 Point cloud region pooling

3.3. Canonical 3D bounding box refinement

3.3.1 Canonical transformation.

3.3.2Feature learning for box proposal refinement

3.3.3 Losses for box proposal refinement

实验部分

细节实现

网络结构

The training scheme（CAR）

代码实现

1环境安装

2 数据准备

3 预处理

4 training

1RPN阶段的具体数据流动过程。

你可能感兴趣的:(CV-Detection,3D语义分割,深度学习-点云基础网路-分类)