Dujing2019

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

Abstract
（一） Introduction
（二） Related Work
（三） Our Method

3.1. Architecture Overview
3.2. Backbone Network
3.3. Clustering Algorithm
3.4. ScoreNet
3.5. Network Training and Inference

（四）Experiments

4.1. Experimental Setting
4.2. Evaluation on ScanNet
4.3. Evaluation on S3DIS

（五） Conclusion

论文：https://arxiv.org/abs/2004.01658
源码：https://github.com/Jia-Research-Lab/PointGroup

Abstract

介绍了PointGroup，这是一种新的端到端自下而上的体系结构，着重关注于通过探索对象之间的空隙空间更好地对点进行分组。
设计了一个两分支网络来提取点特征并预测语义标签和偏移量，以将每个点移向其各自的实例质心。
后接一个聚类，以利用原始点和偏移位移点坐标集的优势。
制定ScoreNet来评估候选实例，然后使用非最大抑制（NMS）来删除重复项。
在两个数据集ScanNet v2和S3DIS上进行了实验，获得最高的性能，分别为63.6％和64.0％。

（一） Introduction

目前存在的困难：

实例分割不仅需要预测语义标签，而且还需要预测场景中每个对象的实例ID。
卷积神经网络提高了二维实例分割的性能。但是，在无序和无结构的3D点云的情况下，不能将2D方法直接扩展到3D点，并使3D点仍然非常具有挑战性。

应用：

在自动驾驶，机器人导航等在室外和室内环境中的有潜在应用。

改进： 通过探索3D对象之间的空隙空间以及语义信息来更好地分割，从而解决了具有挑战性的3D点云实例分割任务。

流程：

利用语义分割骨架来提取描述性特征并预测每个点的语义标签。
采用偏移分支来学习相对偏移，以将每个点移至其各自的ground-truth实心质心。通过这种方式，可以将同一对象实例的点移向同一质心并将其收集得更近，从而可以更好地将点分组为对象并分离同一类别的附近对象。
借助预测的语义标签和偏移量，采用一种简单而有效的算法将点分组为聚类。
对于每个点，以其坐标为参考，将其与相同标签的附近点分组，然后逐步扩展该组。
在两个单独的通道中考虑了两个坐标集–原始点位置和那些偏移了预测偏移的位置。此过程为 “Dual-Set Point Grouping.”。两种结果互为补充，以实现更好的性能。
设计了ScoreNet来评估和选择候选组。
最后采用非最大抑制来消除重复的预测。

贡献：

提出了一个名为PointGroup的自底向上3D实例分割框架，以处理具有挑战性的3D实例分割任务。
提出一种基于双坐标集（即原始和移动集）的点聚类方法。与新的ScoreNet一起，可以更好地分割对象实例。
所提出的方法在各种具有挑战性的数据集上均达到了最新水平，证明了其有效性和普遍性。

（二） Related Work

看论文吧~~

（三） Our Method

3.1. Architecture Overview

为了获得3D对象的实例级分割标签，考虑两个问题：

首先是分开将3D空间中的内容分成单个对象。
第二个是确定每个对象的语义标签。

与2D图像不同，在3D场景中不存在视图遮挡问题，散布在3D中的对象通常被空白空间自然分隔。因此，利用3D对象的这些特征，根据语义信息将3D内容分组为对象实例。

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation_第1张图片

图释：

网络体系结构，该体系结构包含三个主要组件，即（a）骨干网，（b）聚类部分和（c）ScoreNet ；
骨干网的输入（a）是一个 $N$ 点的点集 $P$ 。每个点都有一个颜色 $f_{i}=\left ( r_{i},g_{i},b_{i}\right )$ 和3D坐标 $p_{i}=\left ( x_{i},y_{i},z_{i}\right )$ ，其中 $i\in \left \{1,...,N\right \}$ 。
主干网络提取每个点的特征 $F_i$ ， $F=\left \{F_i\right \}\in R^{N\times K}$ ，K是通道数。
将F馈入两个分支，一个分支用于语义分割，另一个分支用于预测每点偏移向量，使用两个分支生成偏移向量 $O=\left \{o_{i}\right \}$ 和语义标签 $S=\left \{s_{i}\right \}$ ， $o_{i}=(\triangle x_{i}，\triangle y_{i}，\triangle z_{i})$ 。
获取语义标签后，根据对象之间的空白空间将点分组为实例簇。将彼此接近的点归为同一聚类（如果它们具有相同的语义标签）。(直接基于点坐标集 $\left \{p_i\right \}$ 进行聚类可能无法分离在3D空间中彼此靠近的相同类别的对象并对其进行错误分组，例如，两张并排悬挂的图片墙)。
将学习到的偏移 $o_{i}$ 去位移点 $i$ 朝向其各自的实例质心，并获得位移坐标 $q_i = p_i +o_i∈R^3$ 。
对于与 $p_i$ 不同的属于同一对象实例的点，偏移的坐标 $q_i$ 围绕同一质心。因此，通过基于移动的坐标集 $\left \{q_i\right \}$ 进行聚类，即使它们具有相同的语义标签，也可以更好地分离附近的对象。
但是，对于靠近对象边界的点，预测的偏移可能不准确。聚类算法使用“dual”点坐标集，即原始坐标 $P$ 和移动坐标 $Q$ 。在 $P$ 上进行聚类可能会将附近的同一类别的对象误分组，而在 $Q$ 上进行聚类则不会出现此问题，但可能无法处理大对象的边界点。
将聚类结果 $C$ 表示为 $C^{p}=\left \{C_{1}^{P},...,C_{M_{p}}^{p}\right \}$ 和 $C^{q}=\left \{C_{1}^{q},...,C_{M_{q}}^{q}\right \}$ 的并集，分别是基于 $P$ 和 $Q$ 发现的聚类。 $M_p$ , $M_q$ 分别表示 $C_p$ 和 $C_q$ 中的簇数， $M = M_p+M_q$ 表示总数。
构建ScoreNet（c）处理点聚类 $C = C p \cup C q$ ，并为每个聚类生成一个聚类得分 $S_c$ 。
将NMS应用于具有分数的提案，以生成最终实例预测。
将实例预测表示为 $G=\left \{G_{1},...,G_{M_{pred}}\right \}\subseteq C$ ，实例 ground-truth 表示为 $I=\left \{I_{1},...,I_{M_{gt}}\right \}$ ， $G_i$ 和 $I_i$ 是 $P$ 的子集， $M_{pred}$ 和 $I_{i}$ 代表 $G$ 和 $I$ 中实例数量， $N_i^I$ 和 $N_i^G$ 代表 $I_i$ 和 $G_i$ 中点数。

3.2. Backbone Network

首先对这些输入点进行体素化，并构建具有子流形稀疏卷积（SSC）和稀疏卷积（SC）的U-Net。然后，从体素中恢复点以获取逐点特征。 U-Net可以很好地提取上下文和几何信息，该U-Net为以后的处理提供了可区分的逐点特征 $F$ 。可以使用任何点特征提取网络作为骨干网（图2(a)）。

Semantic Segmentation Branch.

将 $M L P$ 应用于 $F$ ，以针对 $N$ 个类上的 $N$ 个点生成语义评分 $SC=\left \{sc_{1},...,sc_{N}\right \}\in R^{N\times N_{class}}$ ;
通过交叉熵损失 $L_{sem}$ 来对结果进行正则化;
预测的语义标签 $s_i$ 对于点 $i$ 是得分最高的类别，即 $s_i= argmax(sc_i)$ 。

Offset Prediction Branch.

偏移分支对 $F$ 进行编码，以生成 $N$ 个点的 $N$ 个偏移矢量 $O=\left \{o_{1},...,o_{N}\right \}\in R^{N\times 3}$ 。对于属于同一实例的点，我将它们的学习偏移量通过 $L_1$ 回归损失约束为:
$L_{o\_reg}=\frac{1}{\sum_{i}^{ }m_{i}}\sum_{i}^{}\left \| o_{i}-(\hat{c}_{i}-p_{i})\right \|\cdot m_{i}--------(1)$

注释：

$m=\left \{m_{1},...m_{N}\right \}$ 是二进制掩码。如果点 $i$ 在实例上，则 $m_i = 1$ ；否则， $m_i = 0$ 。
$\hat{c}_{i}$ 是点 $i$ 所属实例的质心

$\hat{c}_i=\frac{1}{N_{g(i)}^{I}}\sum_{j\in _{Ig(i)}}^{}P_{j}--------(2)$
注释：

$g (i)$ 将点 $i$ 映射为其对应的真实实例的索引，即包含点i的实例。
$N_{g(i)}^{I}$ 是实例 $I_{g(i)}$ 中的点数。

注意：

上述机制看起来类似于VoteNet 中的投票产生策略。但是，不是根据几个子采样种子点的投票对边界框进行回归，而是预测每个点的偏移矢量来收集公共实例质心周围的实例点，以便更好地将相关点聚类到同一实例中。

发现：

从点到其实例质心的距离通常具有较小的值（0到1m）。

图释：

3b给出了ScanNet数据集中此类距离分布的统计分析。

发现：

考虑到不同类别的不同对象大小，网络很难回归精确的偏移量，尤其是对于大型对象的边界点，因为这些点距离实例质心相对较远。

解决方案：

制定方向损失来约束预测偏移向量的方向。将损耗定义为减去余弦相似度的一种方法，即：
$L_{o\_dir}=-\frac{1}{\sum_{i}^{}m_{i}}\sum_{i}^{}\frac{o_{i}}{\left \| o_{i}\right \|_{2}}\cdot \frac{\hat{c}_{i}-p_{i}}{\left \| \hat{c}_{i}-p_{i}\right \|_{2}}\cdot m_{i}-------(3)$
损失与偏移矢量范数无关，并确保了点朝其实例质心移动。

3.3. Clustering Algorithm

给定预测的语义标签和偏移量矢量，通过聚类算法将输入点分组为实例。算法1：

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation_第3张图片

表释：

对于点 $i$ ，将半径r的球内的点以 $x_i$ （点i的坐标）为中心，并将具有与点i相同的语义标签的点归为同一簇。
r用作聚类中的空间约束，因此不会对距离大于r的两个类别内对象进行分组。
使用广度优先搜索将同一实例的点分组为一个群集。
对于场景中的点，可以在聚类之前并行找到r球体内的相邻点以提高速度。

3.4. ScoreNet

输入： 一组候选聚类 $C=\left \{C_{1},...,C_{M}\right \}$

$M$ 表示候选聚类的总数
$C_i$ 代表第i个聚类
$N_i$ 代表 $C_i$ 中的点数。

目标： 预测每个聚类的得分，以便可以在NMS中精确保留更好的聚类。

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation_第4张图片

图释：

对于每个聚类，从 $F∈R^{N×K}$ （由主干网络提取的特征）中收集点特征，对于聚类 $C_i$ 形成 $F_{C_{i}}=\left \{F_{h(C_{i},1)},...,F_{h(C_{i},N_1)}\right \}$ 。
$h$ 映射 $C_i$ 中的点索引到 $P$ 中对应的点索引。
用 $P_{C_{i}}=\left \{p_{h(C_{i},1)},...,p_{h(C_{i},N_1)}\right \}$ 表示 $C_i$ 中点的坐标。
采用 $F_{C_i}$ 和 $P_{C_i}$ 作为初始特征和坐标，并像在骨干网开始时一样对聚类进行体素化。
每个体素的特征均与该体素中点的初始特征进行平均池化。
将它们输入带有SSC和SC的小型U-Net中，以进一步编码功能。
最大池化，对于每个聚类产生单个聚类特征向量 $f_{C_i}∈R^{1×Kc}$ 。
最终聚类得分 $S_c = \left \{s_1^c，...，s_M^c\right \}∈R^M$ 表示为：
$S_c=Sigmoid(MLP(F_C))-------(4)$ 其中 $F_{c}=\left \{f_{C_{1}},...,f_{C_M}\right \}\in R^{M\times K_{c}}$

为了保证分数中聚类的质量，使用软标签代替二进制0/1标签来监督预测聚类得分，

$\hat{s_i}^{c}=\left\{\begin{matrix} 0 & iou_{i}< \theta _{l}\\ 1 & iou_{i}> \theta _{h}\\ \frac{1}{\theta _{h}-\theta _{l}}\cdot (iou_i-\theta _{l}) & otherwise\end{matrix}\right.--------(5)$

$\theta _{l}$ 和 $\theta _{h}$ 分别设置为0.25和0.75，
$iou_i$ 是簇 $C_i$ 和真实实例之间最大的联合交集（IoU）:
$iou_i=max\left ( \left \{IoU(C_i,I_j)|I_j\in I\right \}\right )-------(6)$

使用二元交叉熵损失作为得分损失:

$L_{c\_{score}}=-\frac{1}{M}\sum_{i=1}^{M}(\hat{s_i}^{c}log(s_{i}^{c})+(1-s_{i}^{c})log(1-s_{i}^{c}))------(7)$

3.5. Network Training and Inference

Training.

总损失为:

$L=L_{sem}+L_{o\_dir}+L_{o\_reg}+L_{o\_score}---------(8)$

Inference.

使用预测分数 $S_c$ 对聚类 $C$ 进行NMS，以获得最终实例预测 $G \subseteq C$ 。
将IoU阈值设置为0.3。
由于基于语义信息进行聚类，因此聚类的语义标签是聚类所指的类别。

（四）Experiments

4.1. Experimental Setting

Datasets

ScanNet v2
S3DIS

Evaluation Metrics

平均精度（mAP）
$AP_{25}$ 和 $AP_{50}$ 分别表示将IoU阈值设置为25％和50％时的AP分数
AP将IoU阈值设置为50％至95％（步长为5％）对得分进行平均。

Implementation Details

体素大小设置为0.02m。
在聚类部分，将聚类半径设置为0.03m，最小聚类点数 $N_θ$ 为50。
基本学习率为0.001的Adam。
由于GPU内存的限制，对于数据集中的每个场景，将最大点数设置为250k。
如果场景中的点数超过25万，将随机裁剪部分场景，并根据裁剪区域中的点数逐渐调整裁剪大小.
在测试过程中，无需裁剪，将整个场景馈入网络。
S3DIS中的场景具有较高的点密度。有些场景甚至具有数百万个点。因此，对于每个S3DIS场景，在每次裁剪之前随机地采样1/4点。

4.2. Evaluation on ScanNet

4.2.1 Benchmark Results

表释：

PointGroup达到了63.6％的最高 $AP_{50}$ 得分，超过了以前的所有方法。
与以前的最佳解决方案相比，后者获得54.9％的 $AP_{50}$ 分数，论文结果是高出8.7％（绝对），15.8％（相对）。
对于每个类别的详细结果，PointGroup在18个类别中的13个类别中排名第一。

4.2.2 Ablation Studies

任务： 对ScanNet验证集进行消融研究，以分析PointGroup中的设计和参数选择。

Clustering based on Different Coordinate Sets

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation_第6张图片

表释：

显示了仅使用原始坐标 $P$ ，仅使用移动坐标 $Q$ 以及 $P$ 和 $Q$ 进行的比较。
仅靠 $P$ 聚集点可能会将具有相同语义标签的两个近距离对象误分组为同一实例。因此，对于两个对象可能非常接近的类别（例如椅子和图片），仅在P上的聚类效果不佳。
Q上的聚类部分地通过在实例质心周围收集实例点并扩大聚类之间的空间来解决该问题。但是，由于偏移量预测的不精确性，特别是对于大对象（例如，窗帘和柜台）的边界点，仅靠Q进行聚类并不能完美地执行。

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation_第7张图片

图释：

图4显示了使用不同坐标集的簇训练的模型的定性结果-（i）仅P，（ii）仅Q，以及（iii）P和Q。
（i）中的问题是错误地将图片分组在墙上。
（ii）的情况成功地将图片分成了单独的实例。然而，它在物体边界区域周围遭受误差。
（iii）的情况同时具有（i）和（ii）的优势。获得最佳性能。

Ablation on the Clustering Radius $r$

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation_第8张图片

表释：

在聚类算法中使用不同的 $r$ 值。
较小的 $r$ 对点密度敏感。扫描对象在不同部分可能具有不一致的点密度。具有这样的 $r$ 的聚类可能无法在低密度部分中增长。
相反，较大的 $r$ 增加了将两个附近相同类别的对象归为一个的风险。
最终将 $r$ 设置为0.03（米）。

Ablation for the ScoreNet

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation_第9张图片

表释：

消融ScoreNet，用于评估每个候选聚类的质量。
直接使用ScoreNet的输出评分对实例进行排名，以计算AP。
另一种方法是直接将实例内相关实例类别的平均语义概率用作置信度。这样，AP / AP50 / AP25的结果为30.2 / 51.9 / 68.9（％），比ScoreNet的结果为34.8 / 56.9 / 71.3（％）差。这表明ScoreNet通过为NMS提供准确的分数对于改善实例分割结果至关重要且必不可少。

4.2.3 Runtime Analysis

表释：

运行时间取决于点数和场景复杂性。
从ScanNet v2验证集中随机采样了四个场景，并在Titan Xp GPU上对其进行了100次测试，以获得每个场景的平均运行时间。
Q上（移位）的时间通常比P上（原始）聚类的时间更长，因为移位的点可能具有更多的邻居。

4.3. Evaluation on S3DIS

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation_第11张图片

表释：

使用0.2的得分阈值来删除一些低置信度聚类。
对于第5区的结果，PointGroup在 $AP_{50}$ 上获得57.8％，在 $mPrec_{50}$ (平均精度)上获得61.9％，在 $mRec_{50}$ (平均召回率)上获得62.1％。 $mPrec_{50}$ 和 $mRec_{50}$ 分别比ASIS 高6.6和19.7点。
对于6倍交叉验证的结果，关于 $AP_{50}$ ，PointGroup比SGPN 高9.6点，这是一个很大的差距。 $mPrec_{50}$ 和 $mRec_{50}$ 得分比第二好的解决方案高4和21.6点。

可视化图：

（五） Conclusion

提出用于3D实例分割的PointGroup，侧重通过探索对象实例之间的空间和点语义标签来更好地对点进行分组。
考虑到两个类别内对象可能彼此非常接近的情况，设计了一个两分支网络以分别学习点语义标签和点偏移向量，以将每个点移向其各自的实例质心。
基于原始点坐标和偏移位移的点坐标对点进行聚类。结合了两个坐标集的互补优势，以优化点分组精度。
引入了ScoreNet来学习评估生成的候选聚类，然后引入NMS以避免重复，再输出最终的预测实例。
PointGroup取得了最好的精度。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

CVPR 2020——PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

Abstract

（一） Introduction

（二） Related Work

（三） Our Method

3.1. Architecture Overview

3.2. Backbone Network

3.3. Clustering Algorithm

3.4. ScoreNet

3.5. Network Training and Inference

（四）Experiments

4.1. Experimental Setting

4.2. Evaluation on ScanNet

4.3. Evaluation on S3DIS

（五） Conclusion

你可能感兴趣的:(三维点云,计算机视觉,人工智能,深度学习,神经网络)