Little_sky_jty

论文阅读--Fully-Convolutional Point Networks for large-Scale Point Clouds

自我感悟

这一篇文章着重的贡献体现在几个方面，第一，该网络可以处理large-scale的无规则输入，并且在内部转化为有规则的结构进行处理。其二，提出了一种新的任务，即在未知环境中，通过语言描述来表达所处的环境。结构上我觉得和poinnet++比较相似，都是采用pointnet作为局部特征提取器，采用分层结构，不过这里重点有一个multi-scale的点在这里。第三：Hybrid (point-to-voxel) network architecture capable of processing arbitrarily large point clouds in a single pass。
这里是 paper,ECCV18年的文章
这里是 code

Abstruct

此工作在于对于高效的处理大规模的3D数据提出了一个通用的，全卷积的结构。我们工作的一个stricking的特点在于对于例如点云这种无规则的输入，也能在内部将它们转化为有序结构，再通过3D卷积进行处理。和传统的采用有组织或者无组织的方法相比，从输入到输出，我们的方法的优点是在充分利用卷积运算的自然结构的同时，对输入数据进行高效存储，避免了网络中空间信息的冗余计算和存储。这个网络消除了对原始传感器数据的预处理或者后处理的需要。优势一：再加上该网络的性质，使得端到端方法可意处理大场景下的点云，甚至一次处理高达200K的整个房间的点云。优势二：我们的网络可以直接输出一个规则的输出或者是对输入点云的映射，使其能够成为很多3D任务的通用点云descriptor。我们通过在语义体素分割，语义细粒分割和3D scene captioning的标准数据集上做的评估。证明我们的网络在low-level features和复杂合成关系上的学习有效性。

1 Introduction

在3D视觉，虚拟现实，场景理解和机器人及自动驾驶领域，处理由3D扫描仪或者深度相机获得的3D数据对很对应用是一个很基础的问题。对3D场景的可信赖语义信息的提出是十分有用的，例如，可以在我们周围场景添加虚拟的3D内容或者描述给给视力受损的人。Analogously，在机器人领域，处理来自深度相机的3D数据是要求机器人处理复杂的任务，避免碰撞，这需要在现实环境中进行智能交互。
最新的一些研究已经开始设计高效的处理3d数据，例如点云数据，体素和mesh结构的网络了.为了能被引入例如基于体素的场景语义分割任务、3D特征匹配和3D分割任务。这些模型的一个主要目标是在处理真实世界数据时对典型问题的鲁棒性，例如，噪声、洞、遮挡和部分扫描，以及视点变化和3D转换（旋转和平移）。另一个和场景分析相关的任务是处理大量的描述真实世界场景特性的类，这些类传统上具有很大的类内方差。
为了可以设计出一个通用的3D架构，可以运用于大和小的输入任务，不仅仅要考虑到对3D输入的多尺度特征提取，更要考虑到一次性处理大输入的能力。 就此，FCN最近由于它对参数的激烈的减少和对输入面积的灵活性，导致了其的快速发展。然而，从最低层次开始学习这些分层统计分布需要大量的数据。为了做到这些，一些方法在综合的数据集上进行训练，但是应用在真实世界上时存在很大的差距。缩小该差距的很大一步由 ScanNet 来完成，这是一个大规模室内扫描数据集。那些在这些挑战任务上具有最优秀表现的方法很快由于3D数据附加维度导致的GPU内存不足而受到限制。尽管前面提到的FCN具有降低参数为作用，但是它要求数据的输入是有序的。为了避免把输入无序的点云转化为有序的作为输入，PointNet可以直接处理无序的点云数据。但是由于Pointnet仅仅是学习的全局的局部特征，该作者后续引入的多层次点网络，称作Pointnet++,来应对这个问题。尽管pointnet++在一些任务上表现不错，但是由于其完全基于点的特性，pointnet++不能很好的利用3D卷积所提供的menory和performance benefits。

我们提出一个处理3D数据的全卷积，通用的网络结构（PFCN）：我们的网络是混合的，输入为3D数据无规则的表达式，内部处理是通过3D卷积把他们按照一种规律的方式去处理。这和那些要求内部数据和输入数据均是规则或者不规则的方法有很大的不同。我们混合方法的优势就在于结合了二者的优势，我们的网络运行在menory efficient input representations上，可以很好的适应场景或则对象的大小，并且通过全卷积网络将其转化为有组织的内部数据。我们的方法的一个优点在于可以通过处理一次点云时扩展到大容量。他也能够在小区域上被训练，例如 $2.4 * 204 * 2.4 米$ ，然后在推理过程中应用于较大的点云。一个通过我们网路训练的三个不同规模大小的可视化的输出如图:，

尽管该方法最初用于处理大规模真实场景下的场景理解，但是被语义体素标签化和3D场景captioning tasks demonstrated，该方法也在语义分割上进行的评估以证明它作为一个feature descripture在处理一大类空间规模时的的通用性。
我们的主要贡献在于：

一个无规则输入/有规则内部表示的网络
第一个采用全卷积直接处理原始数据的网络结构，经过在ScanNet上的测试，我们的网络最大容量可一次达 $80m^2$
将我们的方法应用于一个新的我们称之为“3D captioning”的任务，这解决了从室内3D重建中提出有意义的文本描述。我们将会证明我们的方法是如何通过嵌入上下文信息，通过无序输入到有序输出来来处理这个任务的，为了这个任务，我们也公布了一个数据集。

2 Related Work

深度学习已经对3D视觉产生了很深的实质的影响，这些3D的方法可以被分为：

有规则输入的体素方法
基于point的无规则输入，一些方法不直接处理3D数据，而是处理2d或则2.5D的数据，例如muti-view CNNS。由于输入的信息中颜色信息大于形状信息导致了鲁棒性差。在不同的光照下的影响会很大。我们的方法是完全采取的形状特征，不会存在这个问题。

2.1 voxel-based networks

众多的基于体素的方法在一系列任务中证实了其的有效性[论文引用],这些方法采用卷积机构来处理数据，这需要数据的数据是规则的，正好他们的数据是在预先定义好的密集网格中存储，每一个单元格的信息都是被标上一个语义信息的，规则的3D信息的优势在于查找领域信息时的时间负责度为O(1),这种表达式经常显示的models empty space使得空间为密集型空间。由于3D数据的稀疏特性导致了这不是很高效，进一步的，体素对数据展示了准确的像素信息。为了将稀疏的3D数据转化为密集表达的体素需要预处理：要么使用简单的占用网格或则是对它进行编码，例如，在 truncated signed-distance filed（TSDF）中，这意味中模型并不能看见数据本身而是对它进行下采样编码。
**Voxnet**是使用该方法的先驱，类似的，Wu等人学习deep 体素表达式来学习shape和对应的shape是被及补全，另外一个比较有意思的网络是3D-Unet，它处理相对较高的分辨率，然后输出这个体素的中心点。由于目前内存的限制，大规模的数据体素需要更低的采样密度上进行labeling，这意味着像素的损失。可选择的，如果使用较小的context去inform每一个体素的预测值，也可以实现更高的密度。例如Scannet根据体素的领域的occupancy 特性对每大约5cm的体素列进行语义体素标定。SSCNet对共同的语义信息达到了一个更大的空间范围为 $2.26m^2$ ，然鹅，一样的，这些的输出都是经过了降维的。
为了解决这个限制，OctNet采用了Octtree，以其在octants中有效的划分3维空间而出名。kd-trees。

2.2 point-based networks

pointnet是该无序三维数据输入的先驱。该方法展示了直接处理点云的优势，在连续区域中学习了更多准确的分布，因此避免了需要对输入进行分辨率采样。pointnet在很多分类，场景分割等任务中都取得了最好的结果，但是却只能在同一纬度上进行处理。并且，他们宣称了该网络对点密度的变化和outlier的鲁棒性。然而，由于Pointnet不能提取局部特征，Pointnet++使用pointnet作为其局部特征提取器提出了多层结构用于语义分割。在语义分割任务中，point contexts是最先被提取出来的，接着通过3NN插值的方传播到潜在区域。对这种大尺度的场景分割任务，pointnet++储存整个网络中的context of points和冗余处理是相关的，这导致pointnet++一次性处理大面积输入存在阻碍。代替的是哦，在语义信息的场景分割任务中，它处理由8192个点表示的 $1.5*1.5*3m^3$ 的区域。
我们的工作是第一个这种混合体素和point的工作，因此定位在二者之间。同样的（as such），就是可以处理使用3D卷积编码的多尺度强特征和直接处理原始点。

3 Fully-Convolutional Point Network

我们的网络处理无规则输入并且采用pointnet作为底层特征描述符，和pointnet++不同的是，我们使用的是均匀采样。这一步在每一个局部领域都捕捉到了局部精确的local geometry 这怎么处理不均匀分布问题？以及将无序的输入进一步转化为有序的表示等待进一步处理。这一步的转变是根据3D卷积接着进一步的处理是进行多尺度组合，我们的网络提取的空间有三种大小分别是： $S_1,S_2,S_3$ 。在每个scale下采用的skip connections的大小分别是 $1 * 1 * 1 和 3 * 3 * 3$ ，可以使得网络捕获的特征比例总数翻倍Skip connections with 1×1×1 and 3×3×3 convolutions at each scale inexpensively double the total number of feature scales the network captures,这里的动词的double，表示翻倍,在最高的提取层，这些特征还根据他们到每一个体素的距离加权平均汇总特征。At the highest abstraction scale, the features are additionally average pooled together weighted by their distance to each voxel.，一旦每一个scale的特征提取完后，同一个size的特征就汇集在一起接着进一步的通过3D反卷积进行上采样以致于达到理想的输出采样密度。下图给了一个我们方法的overview，根据场景的不同，可以分别应用额外的卷积、潜在的最近邻居插值或全连接层来生成有序的端到端映射或单值输出。在下面的部分中，我们将更详细地描述网络的不同架构。

3.1 Architecture

FCPN包含了四个主要的模块：

一系列的提取层
不同尺度的特征学习器
加权平均池化层
一个合并阶段，其中响应按层次结构重新合并在一起

Abstraction layers

三个abstraction层被使用来做到空间上和概念上的划分，第一层提取到例如边角这种基础的geometric特征，第二层是对复杂的结构响应，最高层在其他机构的上下文中。The first level captures basic geometric features like edges and corners, the second level responds to complex structure and the highest level to structure in context of other structures
第一层采用一个简化的pointnet，用于高效的提取局部区域的geometric 特征，它包含有 $r a d i u s s e a r c h 和 g r o u p i n g ， 1 * 1 * 1$ 的卷积,紧接着是最大池化层，采用pointnet在均匀的3D网格中产生代表最底层物理特征的3D特征volume。这个feature volume接着喂给下一个的abstraction layer。更高层次的abstraction 层采用内核和步长都是2的3D卷积进行实现。**它们被设计成以非重叠的方式抽象空间，前面的抽象层的8个特征（八分圆）由后续层中的单个单元表示，就像OctTree一样，**这种非重叠的空间分区方式很大程度上减少了在每个abstraction level上对空间的占用。

Feature Learners

根据三种不同scale的特征提取层，我们现在应用 $1 * 1 * 1 和 3 * 3 * 3$ 的卷积再更多尺度上来提取有意义的特征，如下图所示。对每一个的abstraction 层次，跳跃连接在level的固有的空间尺寸上进行特征传播，同样 $3 * i t$ 的网络将会在后续的网络中被合并。这允许对更大尺度的识别，该网络可以成为更好的recognise 结构，以及客服在abstraction layer的严格非重叠分区。

Weighted Average Pooling

加权平均池化层经济有效的cost-efectively汇集了long-range的上下文信息。对最高层次的abstraction的每一个cell来说，在这个区域中其他所有cells的响应都通过他们到周围1米的球体的欧式距离加权。For every cell in the highest abstraction level, the responses of all other cells in the space are averaged together weighted by their euclidean distance to a 1m sphere around the cell.因此，离球面最近的带你具有最大的权重值。这强调了远程上下文信息，而不是那些直接相邻已经被 $3 * 3 * 3$ 的跳跃连接所捕获的单元格的信息。通过允许邻接语义信息影响预测提升了网络的判别能力。这里很不懂？？？？,如何解释例如，例如，通过考虑附近是否有书桌，或者更确切地说，是否有水池，来区分椅子和厕所。该层的无参数特性不仅非常划算，而且提供了更有用的信号。平均空间池化高效的移除了附近结构的精确配置，但是保留了他们的语义ID。这是十分理想的特性，因为临近物体的语义ID可以帮助区分边界情况，而不是他们所处的配置。继续拿椅子和厕所来讲，知道附近有一个水池比知道水池在厕所中的朝向是左边更有意义，我们也避免固定的挑战：更大的空间上下文 $> 1 m$ 鼓励模型学习空间的所有配置，这导致了不通用性。最终，平均加权池化层展示了在推理阶段将网络扩展到更大space所需要的flexibility。这一个层好懵逼

merging

在mergeing阶段，对abstraction层所对应的跳跃连接第一希被整合，接着通过3D反卷积进行 $2 *$ 的上采样。这允许每个abstraction level的特征进一步互相融合。 $1 * 1 * 1$ 的卷积在反卷积层之间展现了很好的性能。

3.2 Output Respresentation

网络的结果变种可以适用于不同的场景：为了产生规则的输出，该网络加入了一个额外的反卷积层来得到想要的点密度，潜在的最近邻插值被应用在有语义信息覆盖的区域，对于end-to-end的过程，对每个输入点云的点而言。全卷积层用于总结整个输入是恰当的。例如scene captioning.

3.3 Uniform vs. furthest Point Sampling

由于最远点采样对数据空间分布没有预先的假设，所以最远点采样在描述occupied space的特性时，是十分高效的。然而，为了描述整个空间（occupied 和 unoccupied），只能是采用均匀采样的。

问：为啥要采样unoccupied space？ 因为整个房间都是输入。

3.4 Full-Volume Prediction

Fully-convolutional Point Network 给作为输入的整个空间容积打上label。这是通过在执行 $3 * 3 * 3$ 的卷积之前，将特征图上采样达到原始密度以及对称填充体积来实现的。由于occupancy characteristocs 表达在volume的边界有可能延伸出去，因此对于在input volume之外的区域最有可能被label为离它最近的cell。

3.5 Scalability

该网络是可以变化的，在训练时输入为比较小的采样，但是在测试时可以扩展到输入的好几倍大小。该网络成功一次测试了 $80m^2$ 大小，且包含了200k个点。甚至在更加稀疏的情形下，该网络还能测量更多的空间。这进一步延伸了该网络的通用性，比如自动驾驶。

4 3D Captioning

我们引入了一个新的称作为3D Captioning的任务。对空间产生有意义的文本描述。我们设想一下该任务作为辅助科技是有意义的，对于那些要导航或者在不熟悉环境中的视力受损的人来说。为了测试该网络的专业性，我们基于ScanNet做了一个人工标记的caption数据集。我们选取最能描述ScanNet的空间多样性的前25个句子。他们被设计回答3中问题，“我所处的地方的功能价值是啥？”，“我应该怎么走？”，“我应该如何和该空间互动？”。一个场景的100帧都会有0或者更多可适用的captions。接下来，该数据集被验证用于去除异常值。为了实现这个，一个Scene caption annotion tool 被设计出来用于给近一半的Scannet数据进行标记。

5 Evalution

在small-scal的3D分割和large-scale的3D分割上进行了测试，在Scacnnet上测试了语义分割，这是一个包含有1513个RGB-D的室内扫描且含有对应的表面重建和语义分割。这允许我们和基于体素的分割网络和pointnet++网络的分割进行对比，我们达到了具有竞争力的表现，但是由于我们的网络可以处理各种大小的输入，因此在5.2中我们在一个model-based的分割上标准数据集上，展示了我们网络扩展到其他数据任务和较小scale的能力。为了进一步展示我们网络在更高场景理解任务上的有用性，我们训练我们的网路来预测没见过的场景的captions，结果在5.3.

5.1 semantic voxel labeling

这个体素Label任务是训练一个网络来预测被占用空间的语义信息，一共有20类。我们提供了语义体素标签网络的变体以及实验设置。We present a variant of the network for Semantic Voxel Labeling along with the experimental setup.

Data Preparation

按照ScanNet中的相同步骤生成训练样本,根据已公布的ScanNet train/set split，我们从1201个场景中提取至少占2％的占用率和70％的有效注释。训练样本为2.4m3，均匀点间距为5cm3。这产生了一个75k volume的培训集。在训练期间，样本被重新采样到一个固定的基数16k点。增强是动态执行的:沿上下轴随机旋转增强，抖动增强在+/- 2cm范围内，point dropout在0-80%之间。输入中只有点的X、Y、Z坐标.ground truth是由20个对象类和一个表示unoccupied的类组成。对312个场景测试集中的每个场景进行预测2.4m3的场景裁剪处理.每个语义类都由其在数据集中每点频率的逆对数加权.

Network

语义体素标记网络的空间尺度S1、S2、S3分别为15cm、30cm、60cm。因此，该网络在15cm、30cm、45cm、60cm、90cm、180cm尺度下提取特征why?，并在60cm空间尺度下汇聚特征.每个抽象、特征学习和上采样层都有3个1×1×1层。一个额外的反褶积层达到最终的输出密度为5cm3。在这层之前应用Dropout(50%)。我们还在最后一层使用了最后的3×3×3卷积来加强相邻预测的空间连续性，避免了单点分类错误。使用ADAM优化器训练网络，学习速率为0.01，每个时期衰减一半，持续5个时期。

Results

表1给出了基于体素的20个类的语义分割的定量结果。该方法的加权精度为82.6%，非加权精度为54.2%;相比之下，ScanNet只有73%的标签(加权)或50.8%(未加权)的体素正确。三个PointNet++变体(MSG+DP)的最佳性能报告为84.5%(加权)或60.2%
(无关紧要的)。我们的方法在很大程度上优于ScanNet，尤其是在课桌、厕所、椅子和书架上。请注意，我们的方法具有能够处理所有场景的优势，从小浴室到整个公寓，与将滑动量的预测与多数投票相结合的PointNet ++相比。图5显示了一些具有相应基础事实注释的定性结果。

5.2 Part Segmentation

我们还在一个较小规模的点云处理任务上评估了我们的方法–基于模型的语义部分分割。为了评估这一点，Yi等人[19]提供了一个基于ShapeNet的基准分割数据集。它由16种类型的对象组成的50个部分类别组成。例如，汽车类别具有零件类别：引擎盖，车顶，车轮和车身。（见表2）。

Data Preparation

对于这个任务，我们直接对提供的数据进行培训，而不进行任何预处理。在训练过程中，首先对输入云进行重新标定，使其最大程度地拟合在单位球(2m直径)内，然后像前一项任务一样，增加点缺失和抖动，随机移动(+/- 5cm)并缩放(+/- 10%)。

Network

网络的输入空间范围为2.8m，使每个点都具有完整有效的上下文。空间尺度S1 S2 S3为10cm，20厘米,40厘米。三个1×1×1层紧跟在每个sbstraction，feature learning 和upsampleing后。在上采样特征恢复到原始采样分辨率后，在潜在空间中进行三近邻插值。然后，像我们比较的方法一样，将一个独热编码的对象类连接到每个点的特征向量上，然后是三个最后的1×1×1层，它们之间有50%的dropout。

Results

该方法在16个对象类别中有12个类别的性能优于基准数据集上的最新技术。图6给出了可视化示例。

5.3 Captioning

为了演示空间有序输出的有用性，我们基于FCPN网络评估3D字幕任务的基线方法。为了训练字幕模型，我们采用语义体素标记网络并用三个全连接层替换最终的上采样层和随后的卷积层。我们冻结语义体素标签网络的权重，并仅在此任务上训练完全连接的层。再一次，字幕由其在训练集中的频率的倒数对数加权。我们考虑网络产生的前3个最自信的字幕。示例在图7中示出。与标准的基于图像的字幕不同，所提供的结果暗示3D字幕输出与所提出的网络一起如何有效地总结关于特定视点的相关场景几何形状以辅助导航和交互任务。补充材料中提供了其他结果。

人民日报报道，华为云赋能智能制造助力图扑软件构造数字孪生场景智慧园区华为人工智能物联网
2021年12月22日，《人民日报》头版头条刊登了《华为云赋能智能制造，助力图扑软件构造数字孪生场景》一文，聚焦数据可视化建设发展。报道指出，数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神;高效便捷管控的背后，是云端平台各大企业的互助共赢;高质精准2D、3D数据可视图的背后，是专注于数据可视化Web组态开发的厦门图扑软件科技有限公司。并对厦门图扑软件科技有限公司进
Stability AI 发布 Stable Virtual Camera：从 2D 图像生成 3D 视频三花AI 三花AI 人工智能 3d 音视频
StabilityAI发布StableVirtualCamera：从2D图像生成3D视频StableVirtualCamera[4]是由StabilityAI最新发布的一款能够从一张或多张2D图像（最多支持32张）生成具有真实深度和透视感的3D视频的技术。用户可以自由定义相机轨迹，或者选择预设的动态相机路径，例如360°旋转、螺旋、变焦（DollyZoom）等，效果极其丝滑。不过，当输入图像包含人
stability ai推出的 AI模型2D图像转3D视频微丽宝 AI工具人工智能 3d 音视频
StableVirtualCamera是StabilityAl推出的A|模型，能将2D图像转换为具有真实深度和透视感的3D视频。用户可以通过指定相机轨迹和多种动态路径(如螺旋、推拉变焦、平移等)来生成视频。模型支持从1到32张输入图像生成不同宽高比(如1:1、9:16、16:9)的视频，最长可达1000帧。无需复杂的重建或优化，可生成高质量的3D视频，同时保持3D一致性和时间平滑性。StableV
unity3D获取游戏物体的四种方式 qq_35430208 unity3d 游戏 uinity3d 图形渲染 3d渲染游戏引擎 unity3D获取游戏物体
一、第一种：二、第二种：voidStart(){print(transform.Find("GameObject(1)/GameObject"));print(transform.Find("GameObject(2)"));}三、第三种：比较耗性能，不推荐使用voidStart(){GameObjectmainCameraGo=GameObject.Find("MainCamera");//查找
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROL 寻丶幽风论文阅读笔记论文阅读笔记 3d 人工智能自动驾驶
MagicDrive论文MagicDrive通过对3D数据和文本数据的多模态条件融合和隐式视角转换，实现了高质量、多视角一致的3D场景生成。几何条件编码Cross-attention：针对顺序数据，适合处理文本标记和边界框等可变长度输入。Additiveencoderbranch：对于地图等网络状规则数据，能够有效保留空间结构。对于文本按照模版构建：“Adrivingsceneat{locatio
转 C# .NET4.0 混合模式程序集异常 weixin_30516243
1.引用Microsoft.DirectX.dll和Microsoft.DirectX.Directsound.dll这2个文件。2.项目属性里边，把目标平台改成X86。3.App.Config修改下：123456在.NET4.0下使用Dirext3D托管库，出现“混合模式程序集是针对“v1.1.4322”版的运行时生成的，在没有配置其他信息的情况下，无法在4.0运行时中加载该程序集。”异常信息，
HTML+CSS案例展示(CSS3D效果旋转相册) hacalili html css 前端 css3
参考来源：黑马程序员pink老师前端入门教程，零基础必看的h5(html5)+css3+移动端前端视频教程_哔哩哔哩_bilibili效果展示：总结：transform：translate(x,y)rotate(180deg)scale()...顺序对最后的效果有影响，需要根据需求安排位移和其他属性的顺序；实现暂停动画效果：animation-play-state:paused;经常和鼠标经过等其
html5 相册翻转效果,HTML5 css3：3D旋转木马效果相册岑依惜 html5 相册翻转效果
这篇博客的目的是因为上篇HTML5CSS3专题诱人的实例CSS3打造百度贴吧的3D翻牌效果中有个关于CSS3D效果的比较重要的知识点没讲到，就是perspective和tranlateY效果图：嘿嘿，我把大学毕业时的一些照片，做成旋转木马，绕着我大文理旋转，不忘母校的培育之恩~1、perspectiveperspective属性包括两个属性：none和具有单位的长度值。其中perspective属
HTML5+CSS实现图片3D旋转效果，附音乐宁醉小白 html5 前端 html
利用程序呈现图片，可以俘获一众女生的心，增加音乐可以实现图片变化的同时也带上了想要得到效果，如此一程序实乃众人之喜。先看看程序呈现的效果，还是特别吸引人的。先在网上爬取想要呈现的美女照片，存放在文件夹img-one，与程序路径一致。图片像素需进行调整，同一面图片可以使用同一个图片，保持图片像素一致的同时也增加了立体感。第二张02.jpg和2.jpg可以倒着放，这样在程序实现的时候，可以和其他方向的
HTML实现酷炫3D相册算法与编程之美编程之美 css html js css3 javascript
欢迎点击「算法与编程之美」↑关注我们！本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。欢迎加入团队圈子！与作者面对面！直接点击！目录1、创建文件目录2、调背景色3、制作3D相册4、将图片散开，围成一圈。5、绘制透明底盘6、最终效果1、创建文件目录在Hbuilder在新建一个目录，创建css和js文件。图12、调背景色在style块里面给整个页面渲染成黑色调。*{padd
【Html+CSS】3D旋转相册小木荣 web前端 css html 3d
3D旋转木马相册&3D盒子相册因为代码大部分相同，就放一起了注释一下就是另一个相册3D旋转木马相册body{background-color:#000;/*视距，使子元素获得视距效果*/perspective:900px;}section{margin:20vhauto;position:relative;width:200px;height:200px;/*开启3D空间*/transform-s
关于pytorch3d的安装诚威_lol_中大努力中人工智能 pytorch 人工智能 python
更新1：2025_2_04今天发现，原来的pytorch3d不见了，在我的aaa1环境中。重新安装，我发现最好用的还是去github下载最新的pytorch3d的zip，unzip之后，进去pipinstall-e.然后安装成功！1、参考文章1：windows安装PyTorch3D详细指南-哔哩哔哩(bilibili.com)这篇文章巨好2、参考文章2：pytorch3d/INSTALL.mdat
Echarts map3D 禁止鼠标滚轮缩放程序媛小白白 javascript 前端 vue echarts
Echartstype为map3D在使用时发现会存在鼠标滚轮缩放的情况zoomSensitivity属性本质上是是否开启map3D的缩放和平移所以也可以禁止鼠标滚轮缩放的情况zoomSensitivity:false,//是否开启缩放和平移/鼠标滑动缩放禁止禁用这个属性就可以实现map3D禁止鼠标滚轮缩放的需求了
echarts map3D区域颜色单独设置浪漫不敌风月 echarts echarts 前端 3d
效果图：实现：用的是map3D，之前试了下geo3d因为版本问题不好控制（地图上字体颜色都没法设置）只需要在series的data中加上你要标色的区域名称和颜色即可。此效果实现的是无图例着色。series:[{type:"map3D",//系列类型name:"map3D",//系列名称map:"yuhang",//地图类型。data:[{name:"鸬鸟镇",itemStyle:{color:"#
【地图 Map3d】——2 花花 Show Python pyecharts—从0到精通信息可视化数据分析 python
解锁数据可视化的魔法钥匙——pyecharts实战指南在这个数据为王的时代，每一次点击、每一次交易、每一份报告背后都隐藏着无尽的故事与洞察。但你是否曾苦恼于如何将这些冰冷的数据转化为直观、吸引人的视觉盛宴？欢迎来到《pyecharts图形绘制大师班》在这里，你将不再受限于单调的表格和图表，而是学会如何运用pyecharts这一强大的Python数据可视化库，将复杂的数据转化为令人惊叹的交互式图形。
Roblox 开源 AI 3D 生成模型，游戏开发迎来智能化变革 Yvette-W IT职业圈人工智能 3d 游戏
如果说过去的3D游戏开发需要建模师一笔一划地雕刻细节，如今AI的加入正在彻底改变这一模式。Roblox最新发布的3D生成AI模型——Cube，允许开发者用简单的文本指令，快速生成3D物体。更重要的是，Roblox还开放了Cube的开源版本，这意味着不仅Roblox开发者，任何游戏开发团队甚至个人创作者，都可以利用这项技术来提升创作效率。这一突破不仅能让游戏开发变得更快、更简单，也让AI在3D生成领
WHAM 人体3d重建部署笔记 AI算法网奇深度学习宝典 3d 笔记
目录依赖项：mmpose的依赖项：demo脚本WHAM:ReconstructingWorld-groundedHumanswithAccurate3DMotion2024依赖项：pipinstallmmposemmpose的依赖项：mmcv>=2.0.0,=3.0.0,=0.4.0,<1.0.0demo脚本Youcantrywithoneexamplarvideo:pythondemo.py--
C++和标准库速成(十一)——简单雇员系统梦醒沉醉 C++20 c++
目录1.雇员记录系统2.Employee类2.1Employee模块接口文件2.1.1实现细节2.1.2完整代码2.2Employ模块实现文件2.2.1实现细节2.2.2完整代码2.3Employee测试文件3.Database类3.1Database模块接口文件3.1.1实现细节3.1.2完整代码3.2Database模块实现文件3.2.1实现细节3.2.2完整代码3.3Database测试文件
CAD二次开发踩过的坑我的sun&shine CAD二次开发 c++
CAD二次开发踩过的坑CAD二次开发踩过的坑一、3D图形编译不过二、智能指针三、多文档操作规范流程四、CAD系统变量（参数）大全五、细节注意CAD图纸在软件中出现许多连接线线怎么关闭C++try无法展开无调试信息：重新生成变量已被优化掉,因而不可用两个列表中选中第一个再选第二个时第一个的选中见了预览时无法找到k3DDrawing无法缩放：静态框的通知打开intersectWith无法求交点对话框老
重塑家用机器人大脑！云鲸旗舰机型逍遥002搭载旭日5正式开售量子位
2025年3月20日，全球家庭清洁机器人明星品牌云鲸智能携最新一代旗舰机型——云鲸逍遥002，亮相中国家电及消费电子博览会（AWE）。该产品以”AI智能深度清洁“为核心，基于地瓜机器人全新一代旭日5智能计算芯片，推出首创的双目AI视觉感知自适应系统，以10TOPs的端侧算力与180万点/秒的3D稠密深度点云生成能力，为家庭场景带来毫米级障碍测距精度与语义级环境理解，是家庭清洁机器人智能化演进的又一
WebGL开发：BabylonJS从入门到精通（下卷）莲华君前端权威教程合集 WebGL系统化学习 webgl
全书卷目：WebGL开发：BabylonJS从入门到精通（上卷）WebGL开发：BabylonJS从入门到精通（下卷）目录第一部分：基础篇——构建3D世界的基石第一章：BabylonJS概述与环境搭建什么是BabylonJS：WebGL宇宙的创世引擎BabylonJS的历史与优势：开源利剑的进化史安装与配置开发环境：3D工匠的工坊搭建术使用BabylonJSPlayground与本地开发环境浏览器
StyleGaussian: Instant 3D Style Transfer with Gaussian Splatting 于初见月 paper 计算机视觉
AbstractWeintroduceStyleGaussian,anovel3Dstyletransfertechniquethatallowsinstanttransferofanyimage’sstyletoa3Dsceneat10FPS.Leveraging3DGS,StyleGaussianachievesstyletransferwithoutcompromisingitsreal-t
不搞花里胡哨！CMU最新开源：极简风格的LiDAR全景分割+跟踪！ 3Ｄ视觉工坊 3D视觉从入门到精通 3D视觉
来源：3D视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf、代码链接添加微信：dddvisiona，备注：三维点云，拉你入群。文末附行业细分群1.笔者个人体会激光雷达全景分割（LPS）一般遵循自下而上的以分割为中心的范式，利用聚类获得对象实例来建立语义分割网络。但是最近CMU&Meta等大佬们重新思考了这种方法，并提出了一个简单而有效的检测中心网络，用于LPS和跟踪。这项工作也
【JavaScript】11-JS高阶技巧 beibeibeiooo JavaScript【已完结】javascript 前端 ecmascript es6
本文介绍JS中的一些高阶技巧。目录1.深浅拷贝1.1浅拷贝1.2深拷贝1.2.1通过递归实现1.2.2lodash/cloneDeep1.2.3JSON.stringify()2.异常处理2.1throw抛异常2.2try/catch捕获异常2.3debugger3.处理this3.1this指向3.1.1普通函数this3.1.2箭头函数的this3.2改变this3.2.1call方法改变3.
【ES6】03-Set + Map beibeibeiooo ES6【已完结】es6 前端 javascript ecmascript
本文介绍两种集合setmap的操作和方法。目录1.Set1.1set基本使用1.2add1.3delete1.4has1.5size1.6set转换为数组1.7拓展运算符1.8for...of1.9forEach1.10set给数组去重2.Map2.1创建map集合2.2set添加元素2.3delete删除元素2.4has2.5size2.6map转换为数组2.7拓展运算符...2.8for...
cesium 文字避让花归去 cesium javascript 前端 vue.js
token记得换成您自己的！！！申请cesium的token官网【Cesium:ThePlatformfor3DGeospatial】>import*asCesiumfrom'cesium';import{onMounted,reactive,ref,computed,nextTick}from'vue';//地图实例letviewer:any;constshowText=()=>{viewer.
探究Three.js中模型移动与旋转的交互逻辑 Front_Yue 3D技术实践指南 javascript three.js 3d
前言Three.js作为一个功能强大的JavaScript3D库，极大地简化了在网页上创建和展示3D图形的过程。它在游戏开发、产品展示、虚拟现实等众多领域都被广泛应用。通过Three.js，开发者能够轻松创建出复杂的三维场景和交互性强的3D应用，为用户带来沉浸式的体验。一、模型移动的交互逻辑实现（一）键盘控制模型移动利用键盘事件来控制模型在三维空间中的位置移动，是一种常见且便捷的交互方式。以下为具
使用Three.js渲染器创建炫酷3D场景 Front_Yue 3D技术实践指南 javascript three.js 3d
引言在当今数字化的时代，3D图形技术正以其独特的魅力在各个领域掀起波澜。从影视制作到游戏开发，从虚拟现实到网页交互，3D场景以其强烈的视觉冲击力和沉浸式的体验，成为了吸引用户、传达信息的重要手段。而Three.js，作为一款功能强大且广受欢迎的JavaScript3D库，为我们提供了便捷、高效的途径来创建令人炫目的3D场景。本文将深入探讨使用Three.js渲染器创建炫酷3D场景的方方面面，带领读
AI预测体彩排3新模型百十个定位预测+胆码预测+杀和尾+杀和值2025年3月21日第25弹 GIS小天体彩排3 人工智能机器学习彩票算法
前面由于工作原因停更了很长时间，停更期间很多彩友一直私信我何时恢复发布每日预测，目前手头上的项目已经基本收尾，接下来恢复发布。当然，也有很多朋友一直咨询3D超级助手开发的进度，在这里统一回复下。由于本人既精通编程+大数据分析，也热衷于彩票研究，所以很多彩友通过一些渠道找到了我。目前，加我的已有不少彩友，分成了3类人群：第一类：平时不懂数据分析，买彩全靠瞎猜乱蒙，这些朋友希望借助我的技术和方法来给他
借Kinect 扫描软件 reconstructMe skanect ksan3d learn deep learning 三维重建
[基础技术]3D扫描教程http://bbs.kechuang.org/read/59979楼主#更多发布于：2013-08-2314:48入门级的3D扫描ReconstructMe硬件kinectXBox360不兼容kinectforwindows或者XtionProLive（XtionProLive开发版包装,有Microphone和RGBsensor）有电动转盘更好，win732位或者64位
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

论文阅读--Fully-Convolutional Point Networks for large-Scale Point Clouds

自我感悟

Abstruct

1 Introduction

2 Related Work

2.1 voxel-based networks

2.2 point-based networks

3 Fully-Convolutional Point Network

3.1 Architecture

Abstraction layers

Feature Learners

Weighted Average Pooling

merging

3.2 Output Respresentation

3.3 Uniform vs. furthest Point Sampling

3.4 Full-Volume Prediction

3.5 Scalability

4 3D Captioning

5 Evalution

5.1 semantic voxel labeling

Data Preparation

Network

Results

5.2 Part Segmentation

Data Preparation

Network

Results

5.3 Captioning

你可能感兴趣的:(3D语义分割)