Zuolyme

Deep Continuous Fusion for Multi-Sensor 3D Object Detection

文章目录

Abstract
Introduction
Relative Works
Multi-Sensor 3D Object Detection

3.1 Continuous Fusion Layer
3.2 Multi-Sensor Object Detection Network

Abstract

本文提出了一种新型的3D物体探测器，它可以利用激光雷达和摄像机，能进行非常精确的定位。为此，本文设计了一个端到端的可学习架构，利用连续卷积将图像和激光雷达特征映射融合到不同分辨率级别。本文提出的连续融合层既能编码离散状态的图像特征，又可以编码连续的几何信息。这使本文能够设计一种基于多个传感器的新型、可靠和高效的端到端可学习 3D 物体检测器。本文对 KITTI 以及大规模 3D 对象检测基准的实验评估表明，与最先进的技术相比，本文的方法有显著改善。

Introduction

最近的一些基于激光点云的方法对于远距离的目标和遮挡物体的3D检测效果较差。

基于图像的3D目标检测，由于缺少深度信息，导致精度较差。

基于点云和图像的方法基本的思路是：首先在相机视图中，生成region，然后使用激光雷达进行最终的目标定位。但是这些方法不能够对图像和点云进行联合推理。因此，3D检测的性能收到了2D图像检测的约束。其他的一些方法在相机视图和激光雷达的鸟瞰图中进行2D卷积操作，并在中间卷积层，通过特征串联的方式进行特征的融合，但这种方法由于在粗糙的水平上进行，因此分辨率会显著降低。

本文提出的方法能够根据鸟瞰图的特性进行推理，使得通过学习实现特征在鸟瞰图下进行融合。并设计了一个全新的端到端的网络，利用连续的卷积将点云和图像的特征进行不同分辨率的融合。网络的连续融合层能够编码两种模式下位置之间的密集精确几何关系。这使本文能够设计一种基于多个传感器的新型、可靠和高效的 3D 物体探测器。实验数据表明，本文的网络性能优异。

Relative Works

本节主要回顾了3D目标检测的几种常见方法。

Multi-Sensor 3D Object Detection

鸟视图（BEV）保留了3D传感器如Lidar的原生结构，因此在BEV中进行3D目标检测，十分有效。
在点云和图像之间做融合是十分重要的。原因在于，图像表示的世界投影到了相机平面，激光雷达则保存的是世界的局部3D结构。一种融合方式是将点云投影到相机平面上，并增加一个额外的通道，用于保存深度信息，并且利用传统的2D目标检测体系。这在图像中进行推理已经证明了十分有效。但从2D输出的结果推广到3D目标检测仍需进一步的工作。
不同的是，本文采取的是相反的思路。本文利用卷积神经网络提取图像的特征，然后将图像特征投影到BEV中去，并将其与基于激光雷达的卷积层进行融合。此种融合是十分必要的，原因在于图像的特征采集是在离散的位置间。因此需要使用“插值方法”创建稠密的BEV特征映射。为了执行这个操作，本文利用连续卷积操作从BEV中的每个点所对应的最近的图像特征中提取信息。本文的整体架构主要有两个处理流，一个是提取图像特征的流，另一个是从LIDAR BEV中提取特征。本文设计了连续融合层，以连接两个层的多个中间层，以实现在多个尺度上进行多传感器融合。所设计的架构实现了在BEV空间中实现最终的结果输出，即在自动驾驶中所需要的结果。可参考下图。

网络架构图：有两个处理流：相机图像流和激光雷达点云流。连续融合层将图像的特征图融合到BEV的特征中去。

3.1 Continuous Fusion Layer

Deep Parametric Continuous Convolution: 深度参数连续卷积 [36] 是一个可学习的运算符，可对非网格结构数据进行操作。此运算符背后的动机是将标准网格结构卷积扩展到非网格结构数据，同时保持高容量和低复杂性。关键思想是利用多层感知器作为参数化内核函数进行连续卷积。此参数内核函数跨越完整的连续域。此外，对有限数量的相邻点的加权求和用于近似计算禁止的连续卷积。每个相邻邻居的权重根据其相对于目标点的相对几何偏移量不同。更具体地说，参数连续卷积执行以下操作：
$\LARGE \mathbf{h}_{i}=\sum_{j} \operatorname{MLP}\left(\mathbf{x}_{i}-\mathbf{x}_{j}\right) \cdot \mathbf{f}_{j}$
其中索引j位于点i的邻域上， $\mathbf{f}_{j}$ 是输入的特征， $\mathbf{x}_{j}$ 是该点所关联的连续坐标。MLP用于计算每个相邻点的卷积权重。参数连续卷积的优点是，它利用标准卷积的概念从相邻观测值中捕获局部信息，而不可能会导致几何信息损失的栅格化阶段。在本文中，本文认为连续卷积非常适合本文的任务，这是因为相机视图和BEV都通过3D点集连接起来，以无损的方式进行建模它们之间的几何关系是融合信息的关键。
Continuous Fusion Layer:

本文提出的连续融合层利用连续卷积来解决两个问题：观测中的稀疏性和相机视图中图像空间离散特征的处理。给定输入相机图像特征图和一组激光雷达点，连续融合层的目标是创建一个稠密的BEV特征图，其中每个离散像素包含从相机图像中生成的特征。然后此稠密的特征图可以与从LIDAR中提取的BEV特征图轻松地融合。图像BEV融合的一个难点是，并非所有BEV空间上的离散像素都可以在相机中观察到。为了克服这一点，对于密集地图中的每个目标像素，本文使用欧氏距离在 2D BEV 平面上找到其最近的 K个 LIDAR 点。然后，本文利用 MLP 将来自这些 K 近邻点的信息融合在目标像素处"插值"未观察到的特征。对于每个源激光雷达点，本文的 MLP 的输入包含两个部分：首先，本文将源 LIDAR 点投影到图像平面上来提取相应的图像特征。其次，对源激光雷达点与密集BEV特征图上目标像素之间的3D相邻偏移进行编码，以便对每个激光雷达点相对于目标位置的贡献的依赖性进行建模。总体而言，这为本文提供了每个目标像素的 $\times\left(D_{i}+3\right)-\mathrm{d}$ 输入到 MLP，其中 $D_i$ 是输入特征维度。对于每个目标像素，MLP 通过对其所有相邻像素的 MLP 输出求和来输出 Do-维输出特征。这就是说：

$\mathbf{h}_{i}=\sum_{j} \operatorname{MLP}\left(\text { concat }\left[\mathbf{f}_{j}, \mathbf{x}_{j}-\mathbf{x}_{i}\right]\right)$

其中 $\mathbf{f}_{j}$ 是点 j 的输入图像特征， $\mathbf{X}_{j}-\mathbf{X}_{i}$ 是从邻点 j 到目标 i 的 3D 偏移， $(\cdot)$ 是多个矢量的串联。在实践中，本文使用 3 层感知器，其中每个层都有 Di 隐藏特征。然后，通过元素求和与前一层的 BEV 特征结合 MLP 的输出特征，以融合多传感器信息。总体计算图如图2所示。

图2，连续卷积层：给定BEV图像上的目标像素，本文首先提取K个最近的激光雷达点。然后，将3D点投影到相机平面上，这有助于检索相应的图像特征。最后将图像特征+连续集合偏移反馈到MLP中，生成目标像素的特征。
Comparison against Standard Continuous Convolution:

与标准参数连续卷积 [36] 相比，本文的连续融合层利用 MLP 直接输出目标特征，而不是将权重输出到特征的总和.这为本文提供了更强大的能力和更大的灵活性来聚合来自多个邻居的信息。另一个优点是内存效率。由于 MLP 直接输出特征而不是权重，因此本文的方法不需要在 GPU 内存中显式存储额外的加权矩阵。

3.2 Multi-Sensor Object Detection Network

本文的多传感器检测网络有两个流：图像特征网络和 BEV 网络。本文使用四个连续融合层将多个比例的图像特征融合到 BEV 网络中，从较低级别到更高级别。图 1 描述了整体体系结构。在本节中，本文将更详细地讨论每个单独的组件。

骨干网络：由于其效率，本文选择轻量级ResNet18作为图像网络的主干。在本文的应用领域，实时估算对于安全性至关重要。BEV 网络经过自定义，具有一组卷积层（第一组）和四组剩余块。每组卷积数分别为 2、4、8、12 和 12。除第一组外，所有组均以步长 2 卷积开始，所有其他卷积都有步长 1。每个组的特征维度分别为 32、64、128、192 和 256。

融合层 ：四个连续融合层用于将多比例图像特征融合到 BEV 网络的四个残层中。每个连续融合图层的输入是从所有四个图像残差组的输出组合的图像特征图。本文使用与特征金字塔网络（FPN） [21] 相同的组合方法。BEV 空间中的输出特征与相应的 BEV 层具有相同的形状，并通过元素求和组合到 BEV 中。本文的最终 BEV 功能输出还以与 FPN [21] 类似的方式组合了最后三个剩余组的输出，以便利用多尺度信息。

检测头 : 本文使用简单的检测标头来提高实时效率。在最终的 BEV 层上计算 1 × 1 卷积层以生成检测输出。在每个输出位置，本文使用两个具有固定大小和两个方向的锚点，分别为 0 和 $\pi / 2$ 弧度。每个锚点的输出包括每像素类置信度及其关联框的中心位置、大小和方向。接下来是非最大抑制（NMS）图层，用于生成基于输出映射的最终对象框。
训练 :本文使用的是一个多任务损失函数用于训练。

$L=L_{c l s}+\alpha L_{r e g}$

$I_{C l S}$ 被定义类别置信度和标签之间的二值交叉熵损失函数

$L_{c l s}=\frac{1}{N}\left(l_{c} \log \left(p_{c}\right)+\left(1-l_{c}\right) \log \left(1-p_{c}\right)\right)$

其中 $p_c$ 代表预测的分类分数， $l_c$ 代表二值标签。N是所有样本的数目。

$L_{reg}$ 是七个项目的和。

$L_{r e g}=\frac{1}{N_{p o s}} \sum_{k \in(x, y, z, w, h, d, t)} D\left(p_{k}, l_{k}\right)$

D is a smoothed L1-norm defined as:

$D\left(p_{k}, l_{k}\right)=\left\{\begin{array}{ll}0.5\left(p_{k}-l_{k}\right)^{2} & \text { if }\left|p_{k}-l_{k}\right|<1 \\ \left|p_{k}-l_{k}\right|-0.5 & \text { otherwise }\end{array}\right.$

with $p_{k}$ and $l_{k}$ the predicted and ground truth offsets respectively. For $\in$ $x, y, z), p_{k}$ is encoded as:
$p_{k}=\left(k-a_{k}\right) / a_{k}$
where $a_{k}$ is the coordinate of the anchor. For $\in(w, h, d), p_{k}$ is encoded as:
$p_{k}=\log \left(k / a_{k}\right)$
with $p_{k}$ and $l_{k}$ the predicted and ground truth offsets respectively. For $\in$ $x, y, z), p_{k}$ is encoded as:
$p_{k}=\left(k-a_{k}\right) / a_{k}$
where $a_{k}$ is the coordinate of the anchor. For $\in(w, h, d), p_{k}$ is encoded as:
$p_{k}=\log \left(k / a_{k}\right)$
where $a_{k}$ is the size of anchor. The orientation offset is simply defined as the difference between predicted and labeled orientations:
$p_{t}=k-a_{k}$
当仅需要 BEV 检测时，z 和 d 项将从回归损失中删除。正样本和负样本根据与真实中心的距离确定。特别是，本文首先随机选择5%的负锚点，然后根据分类分数，只使用其中的top-k进行训练。本文使用 ImageNet 预训练的权重初始化图像网络，并使用 Xavier 初始化初始化初始化 BEV 网络和连续融合层 [14]。整个网络通过反向传播进行端到端训练。请注意，对图像流没有直接的监督;相反，误差沿 BEV 特征空间的连续融合层进行传播。

由于 KITTI 的培训数据有限，本文采用多种数据扩充技术来缓解过度拟合。对于训练期间的每个帧，本文对所有 3 个轴应用随机缩放（0.9~1.1）、平移（-5 ~5 米用于 xy 轴，-1 ~ 1 表示 z 轴）和旋转（沿 z 轴 -5 ~5 度），并在 3D 激光雷达点云上应用随机缩放（0.9~ 1.1）和平移（-50~50像素）。本文将从 LIDAR 的变换矩阵相应地修改为摄像机，以确保其对应性。在测试期间，本文不会应用数据扩充。

directx12 3d游戏开发了解函数名和类名规律，提高开发效率云缘若仙 directx12 3d 算法
类常用：形式为XM+“✳✳✳✳✳✳”XMVECTOR：XM+VECTOR向量类XMMATRIX:XMMATRIX矩阵类前加F：FXMVECTORF+XM+VECTOR前3个XMVECTOR参数前加C：CXMVECTORC+XM+VECTOR其余的XMVECTOR参数其他类定义在：DirectXMath库结构函数常用：形式为XM+“✳✳✳✳✳✳”+“✳✳✳✳✳✳”+“✳✳✳✳✳✳”XMVectorA
Model Import Settings UniMark unity editor manual unity
前言在可视化3D世界中，模型是3D世界的核心，你可以没有贴图，可以没有特效，甚至可以没有用户交互界面，但必须得有模型来描述世界的基本样貌。在3D世界中，由点线面构成了模型的轮廓；由UV和纹理，共同描述模型的样貌；由骨骼和蒙皮信息描述模型的运动姿态；再由骨骼的运动轨迹描述模型在某个时间段内的肢体动作。MODELPAGEMODEL功能描述ScaleFactor调整导入模型的全局缩放比例。如果模型的比例
全面解析：HTML页面的加载全过程(六）--浏览器渲染之分层 - Layer huazi99于老师 html 前端
分层原因在生成布局树之后，渲染进程会将一些复杂的3D动画、滚动条、高z-index的元素生成图层，并生成图层树交给GPU加速渲染。页面设计复杂，并且交互效果多。如不分层，用户的一个简单交互将导致整个页面的重新渲染，效率低下。分层好处‌通过分层，浏览器可以将复杂的页面元素分离成不同的图层，每个图层可以独立地进行渲染和更新，从而减少重排和重绘的次数。例如，当用户滚动页面时，只有可视区域的内容会被重新绘
CVPR‘24开源 | ADA-Track：端到端3D多目标跟踪最新SOTA！计算机视觉工坊 3D视觉从入门到精通 3d 目标跟踪人工智能
编辑：计算机视觉工坊添加小助理：dddvision，备注：方向+学校/公司+昵称，拉你入群。文末附行业细分群扫描下方二维码，加入3D视觉知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门视频课程（星球成员免费学习）、最新顶会论文、3DGS系列、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！
所有指标全面领先！图像-点云配准最新SOTA！CoFiI2P详细介绍！ 3Ｄ视觉工坊 3D视觉从入门到精通 SLAM 自动驾驶 3D视觉
作者：大森林|来源：3D视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf。添加微信：dddvisiona，备注：3D点云，拉你入群。文末附行业细分群。1.笔者总结本文介绍了CoFiI2P，这是一种新颖的图像到点云（I2P）配准网络。传统的I2P配准方法通常在点到像素级别估计对应关系，但忽略了全局关系，这往往导致陷入局部最优解。为了解决这个问题，CoFiI2P采用分层的方式提取对
unity3d tilemap hewei+ unity3d
2019的unity3d需要进入packageManager添加tilemap。不然找不到tilepalette瓦片碰撞器compositecollider2d是将多个碰撞器融合提高性能的。自动添加的刚体改成static，勾选tilemapcollider2d的usedBycomposite不添加碰撞器的瓦片设置为none;图片有间隙。改为能被图片像素除断的值，也不能太小
ModelNet40-C 项目使用教程薛烈珑Una
ModelNet40-C项目使用教程ModelNet40-CRepofor"BenchmarkingRobustnessof3DPointCloudRecognitionagainstCommonCorruptions"https://arxiv.org/abs/2201.12296项目地址:https://gitcode.com/gh_mirrors/mo/ModelNet40-C1.项目介绍M
设计项目实例26-基于物联网的智能开关电源（BUCK电路、电压电流监测、阿里云、DHT11、继电器）凡人电子工作室物联网阿里云嵌入式硬件 stm32
设计项目实例26-基于物联网的智能开关电源（BUCK电路、电压电流监测、阿里云、DHT11、继电器）前提说明需知项目设计要求项目提供资料main.c代码测试视频项目3D图前提说明电子开发合作请私信联系，商业/非商业项目均可洽谈，价格友好，负责可靠。目前已开发项目三百余单，不限时售后，直到项目完结。需知对此项目有需求请私信联系我，备注对应项目名称号（非免费，伸手党勿扰，价格公道，售后负责）所有项目均
Python学习——numpy ToToBe python 学习 numpy
参考资料：numpy官网一、基础NumPy的主要对象是同构多维数组。它是一个元素表（通常是数字），所有类型都相同，由非负整数元组索引。在NumPy维度中称为axes.例如，3D空间中的点的坐标[1,2,1]具有一个轴。该轴有3个元素，所以我们说它的长度为3.在下图所示的例子中，数组有2个轴。第一轴的长度为2，第二轴的长度为3。[[1.,0.,0.],[0.,1.,2.]]NumPy的数组类被叫做n
【云原生网关】Higress 从部署到使用详解小码农叔叔网关与限流术 linux与容器实战 docker搭建Higress Higress搭建 docker部署Higress Higress使用详解 Higress使用 docker搭建higress
目录二、网关概述2.1什么是云原生网关2.2常见的云原生网关2.2.1Nginx2.2.2ApiSix2.2.3Kong2.2.4ApacheShenyu2.2.5Higress2.2.6Envoy三、higress介绍3.1什么是higress3.2Higress定位3.3Higress内核选择四、Higress搭建过程4.1higress常用部署模式4.2环境准备4.3docker部署higr
【Python练手】logging日志修改，显示成毫秒级时间戳 -＞ 1628822017676 青禾tester Python基础学习-入门
一、初始配置和日志显示1、配置format=%(asctime)s.%(msecs)03d%(name)s%(relativeCreated)d%(levelname)s%(module)s%(funcName)s%(message)sdatefmt=%Y/%m/%d%H:%M:%S2、打印日志2021/08/1220:56:59.708root13280INFOloginclick_mine_t
对称加密和非对称加密算法分类，国密算法分类。铁锤2号各种小问题小技巧
对称加密算法对称加密算法加密和解密使用的是同一个密钥。常用的对称加密算法包括：DES、3DES、AES、RC4、RC5、RC6。非对称加密算法指加密和解密使用不同密钥的加密算法，也称为公私钥加密。假设两个用户要加密交换数据，双方交换公钥，使用时一方用对方的公钥加密，另一方即可用自己的私钥解密。常见的非对称加密算法：RSA、DSA（数字签名用）、ECC（移动设备用）、Diffie-Hellman散列
软件开发中的密码学（国密算法）自己的九又四分之三站台 #软件架构师的“不归之路“密码学算法
1.软件行业中的加解密在软件行业中，加解密技术广泛应用于数据保护、通信安全、身份验证等多个领域。加密（Encryption）是将明文数据转换为密文的过程，而解密（Decryption）则是将密文恢复为明文的过程。以下是加解密在软件行业中一些常见的应用和技术：1.1.对称加密与非对称加密对称加密：加密和解密使用相同的密钥。常见算法包括AES（高级加密标准）、DES（数据加密标准）、3DES（Trip
mayavi实例鄧寜 matlab python 开发语言
Mayavi是一个用于三维可视化的Python库。它可以用于绘制三维图形、曲面、等值线和点云数据。它使用VTK后端进行绘图，并提供了一个类似于MATLAB的界面，使用户能够轻松地创建复杂的三维图形。示例：frommayaviimportmlab#生成等值线数据x,y,z=mlab.test_plot3d()#使用mlab.contour3d绘制等值线mlab.contour3d(x,y,z)#显示
pythonmayavi三维建模可视化_Mayavi-更方便的可视化 ftggggc
#Mayavi-更方便的可视化虽然VTK3D可视化软件包功能强大，Python的TVTK包装方便简洁，但是要用这些工具快速编写实用的三维可视化程序仍然需要花费不少的精力。因此基于VTK开发了许多可视化软件，例如：ParaView、VTKDesigner2、Mayavi2等等。Mayavi2完全用Python编写，因此它不但是一个方便实用的可视化软件，而且可以方便地用Python编写扩展，嵌入到用户
手机查看IGES,STP,STEP格式3D模型免费APP推荐-CAD Assistant 达芬奇科普 3d 经验分享软件测试 android 开源
达芬奇上期和大家分享了一款手机查看iges/stp/step格式3d模型手机APP-Glovius，是一个收费软件，一个账号只能免费试用15天，有网友反馈CADAssistant免费好用，达芬奇尝试下载安装试用过后发现，确实免费实用，且无需注册，无任何小广告，良心软件。非常有必要推荐给大家。今天达芬奇就再次向大家介绍下CADAssistant。CADAssistant官网网址：CADAssista
UE4的导航系统：基于Tile的导航你一身傲骨怎能输 UE4虚幻引擎 ue4
前言UE4的导航使用的是RecastDetour组件，这是一个开源组件，主要支持3D场景的导航网格导出和寻路，或者有一个更流行的名字叫做NavMesh。不管是Unity还是UE都使用了这一套组件。Github上有更为详细的源码、Demo和说明：https://github.com/recastnavigation/recastnavigation这一篇会阐述UE4是如何划分Tile，并基于Tile
cocos开发代码案例 chengxuyuan66666 cocos2d
Cocos是一个流行的开源游戏引擎，支持2D和3D游戏开发。以下是一些使用Cocos开发的代码案例，涵盖了不同方面的游戏开发功能：案例一：刮刮乐效果实现实现原理：借助Mask遮罩组件和Graphics自定义图形组件。资源准备：准备一张目标图片（如美女图）。准备一张盖在目标图片上面的遮罩图。核心代码：typescript复制代码import{_decorator,Component,Graphics
Android-动画墨漓 Android技术点 Andorra 属性动画补间动画帧动画动画插值器
本文较长。。。时间充足可以看，没时间的可以先收藏^_^Android系统提供了很多丰富的API可以让我们去去实现UI的2D、3D动画，最主要的划分可以分为如下几类：ViewAnimation：视图动画，在古老的Android版本系统中就已经提供了，只能被用来设置View的动画。DrawableAnimation：也叫Frame动画、帧动画。其实可以划分到视图动画的类别，专门用来一个一个的显示Dra
纯HTML&CSS实现3D旋转地球前端Hardy CSS html css 3d javascript 前端
效果演示这段HTML和CSS代码创建了一个带有动画效果的星空背景，其中包含闪烁的星星和一个旋转的地球图案。HTMLsection-banner:这是最外层的容器，用于包含所有的星星和地球图案。star-1~star-7:这些是单个星星的容器，每个星星都有自己的位置和动画。curved-corner-star">:这是构成星星形状的容器，包含四个角的元素。curved-corner-bottomri
python 的sm2 生成密钥的方法，gmssl里没有提供密钥生成 CissSimkey python 算法机器学习
"""Author:tangleiDateTime:2024-11#importrandom#random不安全所以替换为secrets中的算法#选择素域，设置椭圆曲线参数"""importsecretsclassSM2_Key():default_ecc_table={'n':'FFFFFFFEFFFFFFFFFFFFFFFFFFFFFFFF7203DF6B21C6052B53BBF40939D
网上FLAC3D学习笔记 lqlong19922008 FLAC数值模拟 primitive plot interface filter ini table
建议：初学者将FLAC/FLAC3D版所有帖子都浏览一遍；学有所得后，再浏览一遍，会发现又有新的收获。第一部分（相关链接）1.FLAC3D知识基本介绍SimWehttp://www.simwe.com/forum/viewthread.php?tid=209662http://www.simwe.com/forum/viewthread.php?tid=573644http://www.simwe
深度转点云点云着色 AI算法网奇 3d渲染 3D视觉 opencv python 人工智能
目录depthanything生成深度图，转点云着色点云转深度图depthanything生成深度图，转点云着色importnumpyasnpimportcv2importopen3daso3ddefdepth_to_point_cloud(depth_image,rgb_image,camera_intrinsics,camera_extrinsics=np.eye(4),scale=1.0):
DirectX12GameEngine：用C打造的强大游戏引擎伏崴帅
DirectX12GameEngine：用C#打造的强大游戏引擎DirectX12GameEngineDirectX12.NETgameengine项目地址:https://gitcode.com/gh_mirrors/di/DirectX12GameEngine项目介绍DirectX12GameEngine是一款完全使用C#编写的游戏引擎，利用Direct3D12API进行图形渲染。该引擎支持U
Windows平台下使用DirectX实现的飞行射击游戏详解不胖的羊
本文还有配套的精品资源，点击获取简介：本文深入解析了一款在Windows平台上利用DirectX技术实现的飞行射击游戏“打飞机大战”。文章涵盖了Windows编程基础、DirectX技术的应用，以及游戏开发中使用的各种技术细节，如实时3D渲染、事件驱动编程、动画和物理模拟、声音处理以及性能优化等。通过这个项目，展示了Windows编程结合DirectX创造游戏的无限可能。1.Windows编程基础
ogre 学习笔记 - Day 1 頖╃縌 ①oO% #ogre 学习笔记游戏引擎
ogre学习笔记-Day1OGRE:Object-OrientedGraphicsRenderingEngine从名称可以得出，OGRE是一个渲染引擎下载地址https://www.ogre3d.org/最新版ogre-13.1.0编译工具cmake-gui,vs2019,vscodeConfigureconfigure时发现ogre会自动从github下载/编译依赖项，github速度有可能很慢
深入EPnP算法 JesseChen79 SLAM 计算机视觉 EPnP Computer Vision PnP 位姿估计
[原创]深入EPnP算法本文是JesseChen的原创文章。PnP问题是研究如何从3D-2D匹配对中求解摄像头位姿，EPnP算法是一种非迭代的PnP算法。本文作者用baidu搜索了“EPnP算法”时，能找到的中文介绍不多，而且这些网文并没有深入研究这个算法，找出这个算法的精妙点。因此贴出这篇文章，希望能给大家带来我对EPnP算法的理解。有问题的同学，可以联系[email protected]讨论。文
使用Python调用OpenCV中的solvePnP函数 WzisTypescript python opencv 开发语言 OpenCV
OpenCV是一个广泛使用的计算机视觉库，它提供了许多用于处理图像和视频的功能。其中一个重要的功能是解决透视投影问题，也就是通过已知的3D点和对应的2D图像点来计算相机的位姿。在OpenCV中，solvePnP函数就是用于解决这个问题的。solvePnP函数使用了一种称为Perspective-n-Point（PnP）问题的算法，它可以估计相机的旋转和平移向量，从而确定相机在3D空间中的位置。这对
【AI论文】FilmAgent: 一个用于虚拟3D空间中端到端电影制作自动化的多智能体框架东临碣石82 自动化运维
摘要：虚拟电影制作涉及复杂的决策过程，包括剧本编写、虚拟摄影以及演员的精确定位和动作设计。受近期基于语言智能体社会的自动化决策领域进展的启发，本文提出了FilmAgent，这是一个新颖的、基于大型语言模型（LLM）的多智能体协作框架，旨在实现我们构建的3D虚拟空间中的端到端电影制作自动化。FilmAgent模拟了各种剧组成员角色，包括导演、编剧、演员和摄影师，并涵盖了电影制作工作流程的关键阶段：（
RTX 4090D和A10和T4显卡差别、价格对比张3蜂软件安装部署开源神经网络人工智能深度学习机器学习
RTX4090D、NVIDIAA10和NVIDIAT4三款显卡在设计用途、性能、功耗、价格等方面都有显著差异，以下是它们的主要区别：1.设计用途：RTX4090D:面向高端消费者市场，主要用于游戏、内容创作和3D渲染，适合需要高图形性能的用户，如游戏玩家和内容创作者。NVIDIAA10:专为数据中心和企业应用设计，优化了AI推理、深度学习、虚拟桌面基础设施(VDI)以及多实例GPU（多用户共享显卡
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin