R.X. NLOS

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition

论文原文：

Wenzheng Chen, FangyinWei, Kiriakos N. Kutulakos, Szymon Rusinkiewicz, and Felix Heide. 2020. Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition. ACM Trans. Graph. 39, 6, Article 230 (December 2020), 18 pages. https://doi.org/10.1145/3414685.3417825

基于嵌入特征学习的非视距成像与识别

Abstract 摘要

Introduction 引言

Transient Imaging

Impulsing NLOS sensing and Imaging

dulated and Coherent NLOS Imaging

NLOS Tracking and Classification

Learning Multiview Image Synthesis

3. Observation Model

3.1 Detector Model

3.2 transient rasterizaion 瞬态光栅化

4. Learned NLOS Scene Representations

4.1 Spatial-Temporal Feature Extraction

4.2 Latent Feature Propagation

4.3 Feature Abstraction

5. End-to-end NLOS Networks

5.1 2D Rendering 二维渲染

View Transformer

Visibility Network

Image Renedering Network

Depth Rendering Network

5.2 RGB-D Reconstruction

5.3 Classification 分类

5.4 检测

6. Analysis and Synethetic Validation 合成数据上的结果

7. 真实实验数据上的测试结果

总结

Abstract 摘要

研究对象：使用激光脉冲的主动非视距成像场景；

已有研究存在的问题：三次反射光衰减幅度大、信噪比低，有必要学习场景先验，故应使用监督学习方法；然而，当前没有合适的数据集，而且已有的网络结构重建效果不好；

本文的贡献：

提出的网络仍旧基于物理模型，学习了适用于重建和识别任务的场景特征表示；
提出的网络可以使用仿真数据(仿真数据使用一个可微的瞬时渲染器合成)进行训练，并在和训练数据不同的真实场景上进行测试；(如图1所示，第一行是仿真数据，第二行左侧是仿真数据的groundtruth，第二行右侧是在真实数据上的测试结果)
提出的方法能够端到端地完成不同地非视距成像任务，如图像重建，分类和物体识别；

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第1张图片

图1 所提出的网络的合成训练数据，和在真实场景上的测试结果

Introduction 引言

注：由于这篇文章的所述方法均针对使用激光脉冲的主动非视距成像设置(而不是passive等)，所以本笔记中所有的非视距是激光脉冲主动非视距成像设置下的非视距。

第一段介绍非视距成像的含义和意义；

第二段说非视距成像存在两个限制：角度模糊和三次反射衰减导致low-signal。目前主流方法使用了transient imaging的高时间分辨方法，缓解了角度模糊的问题。因此，low-signal问题就是当前非视距重建算法面临的主要限制。

第三段继续分析low-signal的解决：先表示要解决low-signal问题就要考虑场景先验，然而现有的大多数方法是传统方法，没有考虑场景先验；考虑场景先验的一些深度学习方法也囿于没有大规模数据集和合适的网络结构而无法取得好的结果/泛化能力差。

后面几段说文章的工作和贡献：

构建了一个基于深度学习的模型，该模型先将合成的transient images映射到一个特征空间中，之后再将特征空间中的特征图重建为隐藏场景/ 进行识别。
训练数据集：由ShapeNet渲染得到；
测试数据集：经过了在真实数据上的测试，效果良好(如图1)。说明尽管训练用的是合成数据，但泛化能力良好。

所提方法的不足：

该方法需要大量的数据集才能取得更好的效果。但即便是合成数据集，训练集的大小也受制于shapeNet，因此没办法应用到足够多的场景中。

Transient Imaging

介绍瞬态成像。之后分别介绍瞬态成像的两种获取方式：基于脉冲和基于干涉法

Impulsing NLOS sensing and Imaging

基于脉冲的非视距成像，特别和2020 CVPR中的Deep NLOS Reconstruction进行了对比，并表示Deep NLOS Reconstruction基于已有的encoder-decoder网络，泛化能力太差，没法用于真实数据。这篇文章则通过学习特征嵌入来弥补了domain gap.

dulated and Coherent NLOS Imaging

介绍基于干涉法的NLOS成像

NLOS Tracking and Classification

介绍非视距探测/分类任务

Learning Multiview Image Synthesis

多角度3D重建：输入为多个角度的照片，输出为三维形状；

本文：输入为多个transient images，输出为三维形状。

本文通过引入一个逆向模型来克服了过拟合，拥有良好的泛化能力。

3. Observation Model

首先说明主动非视距成像的3次漫反射的含义，并给出了基本示意图：

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第2张图片

图2 激光脉冲非视距成像示意图

下面推导成像模型：当relay wall的形状和位置已知时，直接反射可以无视，因此，成像模型为：

该模型和LCT等文章中的成像模型一致，其中γ表示相互的visibility，式中的v表示[0,1]的可见性，对于部分遮挡v为连续变量：

f为双向反射分布函数BRDF：

其中，fd为漫反射香；fs为镜面反射项；fr为逆向反射项。对于普通的墙，fd占主导.

注意：上述成像模型中唯一的假设是三次反射光在隐藏场景内部只进行了1次散射。

下面是detector model和transient rasterizaion

3.1 Detector Model

首先说明了这里的detector model是指三次漫反射光经过三次漫反射后，又经过SPAD探测器时的噪声模型。

该模型参考了文章

Q. Hernandez et al. (2017) “A Computational Model of a Single-Photon Avalanche Diode Sensor for Transient Imaging,” arXiv

模型如下：

$\begin{aligned} \tilde{\tau}\left(x^{\prime}, y^{\prime}, \tilde{t}\right) & \sim \operatorname{Poisson}\left(N \mu(\tau \otimes g+s)\left(x^{\prime}, y^{\prime}, t^{\dagger}\right)+N d\right) \quad \text { with } \\ t^{\dagger} & \sim \text { Jitter }\left(\tilde{t}, \mid \sigma_{\text {jitter }}\right) \end{aligned}$

在具体实现的过程中，忽略了串扰和寄生脉冲。(crosstalk and afterpulsing)

3.2 transient rasterizaion 瞬态光栅化

除了噪声模型外，还需要一个瞬态图片的渲染模型。

渲染模型如下

上述噪声模型和渲染模型生成数据的结果如图3下所示(图3上为真实数据)

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第5张图片

图3 合成的真实训练数据

文章所采用的光栅化瞬时图像渲染原理如图4所示，其中(a)示出了反射由三个部分组成，分别是镜面、漫和逆向反射；(b)和(c)表示不同的投影方向会在中继面得到不同的投影

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第6张图片

图4 渲染模型的原理

光栅化的结果如图5所示：

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第7张图片

图5 瞬态光栅化

表1则示出了论文提出的渲染方法在时间上相对于其他方法的优势：

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第8张图片

表1 论文提出的渲染方法与其他渲染方法耗时比较

4. Learned NLOS Scene Representations

提出的网络结构如图6所示，它的核心是提取体素特征。

这里还用了一个完全倒装句(lies at): At the core of the algorithm lies a learned volumetric feature representation of the 3D object.

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第9张图片

图6 网络结构

(因为使用了深度学习，)这里的特征并仅仅是对体素-反照率信息的编码，而是同时对形状、遮挡、法线、语义等很多信息的编码。

获取这个特征嵌入的过程分为两步：

step1: 使用卷积网络提取transient images中得时空特征；这样做的动机是transient image是稀疏的：

(transient images) are sparse with large areas of low entropy. Instead of propagating all intensity values to a hidden volume, e.g., as in backprojection methods [Velten et al. 2012], we reason only on features that are critical for reconstruction, e.g., spherical wavefront shapes of scene objects instead of measurement noise or ambient background.

从而使提取的特征smaller;

step2: 解码(feature propagation). 即将提取到的特征propagate至目标特征空间(也就是隐藏场景的空间形状特征空间)，这一过程可以使用基于深度学习的方法，也可以使用传统方法，如反向投影。

上述两步可以formulated为：

4.1 Spatial-Temporal Feature Extraction

描述了上面step1所需要使用的网络结构；

4.2 Latent Feature Propagation

这一步完成的是将采集数据得时空信息映射到隐藏场景空间domian. 因此，在整个网络中是重要得一步。

这一步最重要的是提取全局特征，而这也是目前善于提取局部特征的神经网络相关研究所不擅长的。

本文的解决方案是将深度学习与传统算法相结合。但根据论文，所谓相结合的意思好像只是说可以从传统方法的角度(如BP，LCT等)来理解本步骤所完成的从采集数据得时空信息到隐藏场景空间的映射。

4.3 Feature Abstraction

最后还进行了一个特征提取步骤，以得到最终的embedding features.

5. End-to-end NLOS Networks

如图6所示，这篇文章根据功能不同共设计了如下端到端网络：

二维图像重建；
RGB-D结果重建；
识别与估计；

而使用到的网络模块主要有4个：

a view transformer: 基于相机位置在空间上转换3D特征图；
a visibility network: 在体素嵌入的基础上预测visibility；
a differentiable render: 在隐藏图片2D特征的基础上渲染得到高质量的RGB图片；
a depth estimator: 在给定3D表示喝对应的visibility map的基础上估计深度。

5.1 2D Rendering 二维渲染

View Transformer

输入：前一节得到的3D特征Cs: (c,d,w,h),其中c为每一个位置的特征向量长度；d,w,h分别为深度宽度高度；

操作：

$C_{s}^{\prime}=\mathcal{S}\left(C_{s} \cdot R^{T}\right)$

其中，R为旋转矩阵；S为用于计算最终离散空间中取值的算子。

Visibility Network

输入：前一节得到的3D特征Cs: (c,d,w,h),

输出：Cs的一个平面表示p: (c,h,w)

$p_{i, j, k}=\sum_{u=1}^{d} C_{s_{i, u, j, k}}^{\prime} v_{u, j, k}$

Image Renedering Network

输入：p

输出：高质量RGB图I

$I=\mathcal{F}_{\text {render}}(p)$

Depth Rendering Network

输入：可见性map--v ；和特征图--p

输出:深度图Z

5.2 RGB-D Reconstruction

训练过程：

输入的瞬时图片经过特征提取、映射和进一步提取，得到嵌入特征图(第四节)；

之后，由View Transformer得到典型视角；再使用visibility network得到visibility map;

最后，得到渲染二维图片和RGB-D的重建结果；

上述过程中的总损失函数为：

$L=\alpha L_{R G B}+\beta L_{d e p t h}=\alpha \sum_{i=1}^{h \cdot w}\left(I_{i}^{p r}-I_{i}^{g t}\right)^{2}+\beta \sum_{i=1}^{h \cdot w}\left(Z_{i}^{p r}-Z_{i}^{g t}\right)^{2}$

除此之外，文章还添加了多视角监督。即训练过程中使用了不同的非标准视角，进行监督学习：

$L=\alpha \sum_{j=1}^{m} L_{R G B_{j}}+\beta \sum_{j=1}^{m} L_{d e p t h_{j}}$

其中，m表示不同视角的个数。

5.3 Classification 分类

直接将第四节得到的embedding feature输入一个分类网络，得到分类结果。损失函数为softmax，如下：

$L=\sum_{i=1}^{r}-\log \left(\frac{\exp \left(p_{i}^{g t}\right)}{\sum_{i=1}^{r} \exp \left(p_{j}^{p r}\right)}\right)$

5.4 检测

边界框为(xmin, xmax,ymin,ymax, zmin)

检测损失函数为：

$\begin{array}{l} L=\sum_{u \in\left\{x_{\min }, x_{\max }\right.}\left(u^{g t}-u^{p r}\right)^{2} \\ \left.y_{\min }, y_{\max }, z_{\min }\right\} \end{array}$

6. Analysis and Synethetic Validation 合成数据上的结果

合成数据集由ShapeNet得到；

数据集包括两个部分：摩托车数据集和汽车数据集。

其中汽车有2244个样本；摩托车有6925个样本；

并通过旋转和平移进行了数据增强；

除此之外，也合成了多分类的数据集，包括ShapeNet中的13个类别，每个类别包括了446-500个transient images. 训练：验证：测试=8：1：1

对成像模型、噪声模型和渲染模型均设定了参数，从而进行仿真。

在合成数据上结果如下：

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第12张图片

合成数据集上的多类别的定量统计重建结果

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第13张图片

合成数据上多类别的二维图像重建结果

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第14张图片

合成数据上仅仅在摩托车上训练，在其他类别上测试的二维成像结果(说明泛化能力)

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第15张图片

合成数据上深度估计结果

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第16张图片

使用不同的方法完成特征propagation步骤(第四节的第二步)得到的结果对比

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第17张图片

合成数上消融实验结果对比

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第18张图片

合成数据上识别结果对比

7. 真实实验数据上的测试结果

下面是真实数据上的测试结果，这决定了该项研究是否真的有意义

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第19张图片

真实数据上的测试结果

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition_第20张图片

真实数据上的运行时间结果

可见，本文的结果要好于2020 CVPR上Deep NLOS Reconstruction的结果。

总结

相对于其他的深度学习主动非视距成像研究，此研究将网络中的重要一步与传统方法相结合，取得了很好的效果。

======================================================================================================

本文为阅读笔记，阅读的论文是：

本阅读笔记原载于我的博客

如有错误，请联系 [email protected]

======================================================================================================

ESP8266调试及使用金增辉电子开发嵌入式硬件
ESP8266调试及使用一、准备工作：1.产品外形及型号2.使用的串口调试工具3.使用的串口调试软件4.ESP8266和调试工具的接线5.插入工具到计算机的USB口6.设备管理器配置串口7.打开串口调试软件开始测试二、使用手机的串口调试助手完成TCPClient通信一、准备工作：1.产品外形及型号##使用的串口调试工具2.使用的串口调试工具3.使用的串口调试软件4.ESP8266和调试工具的接线注
深度学习 vs 传统机器学习：哪个更适合你的项目？ AI大模型应用之禅深度学习机器学习人工智能 ai
深度学习vs传统机器学习：哪个更适合你的项目？关键词：深度学习、传统机器学习、特征工程、数据量、计算资源、项目选择、算法对比摘要：本文将用"炒菜"和"拼图"等生活案例，从核心原理、适用场景、资源需求等维度对比深度学习与传统机器学习。通过具体代码示例和真实项目场景分析，帮助开发者和企业决策者快速判断：你的项目该选深度学习还是传统机器学习？背景介绍目的和范围随着AI技术普及，"该用深度学习还是传统机器
LLM大语言模型学习笔记（1） Arixs666 大语言模型语言模型笔记人工智能
1.概念大语言模型（LLM，LargeLanguageModel），也称大型语言模型，是一种旨在理解和生成人类语言的人工智能模型。LLM通常指包含数百亿（或更多）参数的语言模型，它们在海量的文本数据上进行训练，从而获得对语言深层次的理解。2.能力2.1涌现能力区分大语言模型（LLM）与以前的预训练语言模型（PLM）最显著的特征之一是它们的涌现能力。涌现能力是一种令人惊讶的能力，它在小型模型中不明显
Java ArrayList 扩容机制笑衬人心。 JAVA学习笔记 java 开发语言笔记后端
一、ArrayList简介ArrayList是Java集合框架中基于数组实现的可变长度列表，其核心特性是：支持随机访问（通过索引）支持动态扩容插入/删除效率较低（非尾部操作）二、底层数据结构//JDK11+transientObject[]elementData;//实际存储元素的数组三、容量与初始状态默认构造函数publicArrayList(){this.elementData=DEFAULT
Vue-pdf预览pdf文件流：让Vue项目中的PDF预览变得简单
Vue-pdf预览pdf文件流：让Vue项目中的PDF预览变得简单【下载地址】Vue-pdf预览pdf文件流Vue-pdf预览PDF文件流是一个专为Vue项目设计的开源解决方案，旨在帮助开发者轻松实现在线预览PDF文件的功能。通过集成vue-pdf插件，该项目简化了在Vue应用中嵌入和展示PDF文件的过程，支持流式传输，提升用户体验。开发者只需按照简单的步骤将插件引入项目，并根据需求配置文件路径或
计算整数二进制中1的个数 VictorWuuu 算法算法后端
Golang实现：计算整数二进制中1的个数（包含负数补码）问题分析这道题目要求我们计算一个整数的二进制表示中1的个数，对于负数需要考虑其补码形式。例如：输入：5（二进制：101）→输出：2输入：-3（二进制补码：1111...1101）→输出：31（32位系统下）解题思路我们可以利用位运算中的与运算（&）来检查整数的每一位是否为1。具体步骤如下：初始化计数器为0通过循环检查整数的每一位：将整数与1
Milvus向量数据库入门指南 longfei.li milvus 数据库人工智能
一、Milvus简介Milvus是一个开源的向量数据库，专为AI应用和向量相似度搜索而设计，以加速非结构化数据的检索。自2019年创建以来，Milvus专注于存储、索引和管理由深度神经网络和其他机器学习模型生成的海量嵌入向量。其能够处理万亿级别的向量索引任务。Milvus的核心优势在于其高效的索引机制，它支持多种索引类型，包括FLAT、IVF_FLAT、IVF_SQ8、IVF_PQ和HNSW等。这
OGRGeometry和geos::Geometry之间的相互转换蒙山蒙水 C++算法 geos ogr gdal OGRGeometry Geometry
OGRGeometry属于OGR库，OGR库通常是和GDAL一起封装供用户使用的。GDAL&OGR库支持了大多数地理数据格式的读写，通常用户使用OGR库可以完成大部分矢量相关的任务。但是OGR并没有对特征之间的空间关系计算提供原生支持。尤其是空间矢量之间的拓扑关系计算，其内部是采用的第三方库geos。所以有时候我们干脆直接使用geos进行矢量运算。这时候就有可能遇到OGRGeometry和geos
go 语言大小写SpecialCase转换小可爱amour golang 前端 javascript
背景：不同语言或者组件的大小写转换规则有小许不同，导致在不同地方计算字符串大小写的md5不一样。需要依据特定语言或者组件对齐大小写转换。解决方案：根据不同平台，使用不同的大小写转换。本文以小写为例。官方支持：funcToLowerSpecial(cunicode.SpecialCase,sstring)stringfuncToUpperSpecial(cunicode.SpecialCase,ss
常见机器学习算法与应用场景计算机软件程序设计知识科普机器学习算法人工智能
当然可以。下面是对常见机器学习算法的全面详细阐述，包括每种算法的基本原理、特点以及典型应用场景。1.监督学习（SupervisedLearning）1.1线性回归（LinearRegression）原理：通过拟合一条直线来表示输入和输出之间的关系，适用于预测连续值输出。特点：简单易懂，计算速度快，但只能捕捉线性关系。应用场景：房价预测股票价格预测销售额预测1.2逻辑回归（LogisticRegre
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
指数计算机在线使用,ffmi(在线ffmi指数计算器) 带虾条酱指数计算机在线使用
我们可用FatFreeMassIndex(FFMI)无脂肪重量指数来做为一个衡量肌瘦肉量的基准。不像BMI会把脂肪算到重量里，FFMI在测量进展和潜力上是更有实用性的。FFMI的.彭于晏的体型用FatFreeMassIndex(FFMI)无脂肪重量指数来看应该是处于20左右，而26是不依赖药物所能达到的极限了，所以算是很不错的了。专业健美运动员都是用.首先讲一点，当年的施瓦辛格也是使用固醇类药物的
b树与b+树的区别 Senkorl MySQL b树数据结构 mysql
B树和B+树都是平衡树的一种，广泛应用于数据库和文件系统中。它们的主要区别在于结构和性能优化上。以下是B树和B+树的主要区别：1.结构差异B树：节点存储键和值：B树的每个节点不仅存储键，还存储与键关联的数据（值）。叶子节点和内部节点都可以存储数据。多层次的值存储：数据可能存储在内节点或叶子节点，因此查找时可能会终止于非叶节点。B+树：节点只存储键，值存储在叶子节点：B+树的内部节点只存储键，数据（
spring 面试题爆爆凯 spring 数据库 java
一、Spring基础概念什么是Spring框架？Spring是一个开源的Java应用程序框架，它提供了一种轻量级的、非侵入式的方式来构建企业级应用。Spring的核心功能包括依赖注入（DependencyInjection，DI）、面向切面编程（Aspect-OrientedProgramming，AOP）、事务管理、数据访问等，旨在简化企业级Java开发，提高开发效率和代码的可维护性。Sprin
中国计算机学会（CCF）推荐学术会议-C（网络与信息安全）：TrustCom 2025 爱思德学术网络安全信息与通信
TrustCom2025TheIEEETrustCom-2025(24thIEEEInternationalConferenceonTrust,SecurityandPrivacyinComputingandCommunications)isaforumforpresentingleadingworksontrustedcomputing,communications,networkingandm
C#索引和范围：简化集合访问的现代特性详解阿蒙Armon C#工作中的应用 c#开发语言
C#索引和范围：简化集合访问的现代特性详解在C#8.0中引入的索引（Index）和范围（Range）特性，为集合元素的访问提供了更简洁、直观的语法。无论是数组、列表还是字符串，这些特性都能大幅简化获取元素或子序列的代码，使开发者能够更专注于业务逻辑而非边界计算。本文将全面解析索引和范围的工作原理、使用方法及实战技巧，帮助你彻底掌握这一现代C#特性。一、索引：超越传统下标的访问方式传统上，C#通过从
Django REST framework - 版本控制 djangopython
版本控制是一种礼貌地淘汰已部署客户端的方式。—RoyFielding。API版本控制允许你在不同客户端之间改变行为。RESTframework提供了多种不同的版本控制方案。版本控制由传入的客户端请求确定，可以基于请求URL或基于请求头。对于版本控制，有多种有效的实现方式。对于非版本化系统，如果是在设计长期系统且有多个不受控的客户端时，也可能适用。在RESTframework中实现版本控制当启用了A
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？努力毕业的小土博^_^ 机器学习基础算法优质笔记2 深度学习学习笔记迁移学习人工智能机器学习
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？文章目录【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？✅一、使用正则化进行模型压缩（ModelCompression）目标：方法：L1正则化促使权重稀疏化代码示例：后续压缩步骤
数字孪生：未来城市管理的革命性技术大有数据可视化信息可视化
一、数字孪生技术概述数字孪生技术是一种通过创建虚拟模型与物理实体之间实时交互的技术。它借助物联网、大数据、云计算、人工智能等前沿技术，实现对物理实体的精准映射与动态仿真。数字孪生的核心在于构建一个与物理世界相对应的虚拟模型，该模型能够实时反映物理实体的状态，并通过数据分析与模拟优化其性能。在城市管理领域，数字孪生技术为城市管理者提供了一种全新的视角和工具。城市是一个复杂的巨系统，涉及基础设施、交通
中国计算机学会（CCF）推荐学术会议-C（计算机体系结构/并行与分布计算/存储系统）：ATS 2025 爱思德学术可用性测试压力测试功能测试
ATS2025The34thAsianTestSymposium(ATS)andthe9thInternationalTestConferenceinAsia(ITC-Asia)willbeheldinconjunctionwithSEMICONJapan2025inTokyo,Japan.Thisjointeventprovidesavaluableplatformforacademicrese
B树和B+树的区别嗨，正在熬夜的你面试部分 b树数据结构 b+树
B树，如图B+树，如图B树和B+树的区别1.B树的叶子节点和非叶子节点都存放数据（树更高），而B+树只有叶子节点存放数据，非叶子节点可以存储更多的键值（树更矮）。这种结构使得B+树在查询的的时候效率更稳定2.B+树的叶子节点之间形成了双向链表，使得范围查询性能更好
达梦dsc与mpp集群机制比较 wyllove97 数据库 dba
达梦数据库现有2套分布式产品，即DMdsc共享存储集群以及DMmpp非共享存储集群DMdsc共享存储集群：该产品功能类似于oraclerac，具有高可用性和高伸缩性的特征，可提供横向扩展，实现超单一服务器的功能。其提升了错误恢复能力，并且随着系统增长而逐步扩展。一旦系统发生失败，该集群对用户保证最高可用性，保障关键业务数据不被丢失。拓扑图如下图所示：在配置DMdsc时，需配置两套网络，一套用于提供
Python从0到100完整学习指南（必看导航）是Dream呀 Python python 人工智能爬虫 web 神经网络算法深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和工作就业的先行者！【优惠信息】•新专栏订阅前1000名享9.9元优惠•订阅量破10
达梦数据库归档日志详解运维小乔数据库 oracle
一、归档日志文件概述：1）达梦数据库可以运行在归档状态或者非归档状态下。2）归档模式下运行：联机日志文件中的内容将被保存至硬盘，形成归档日志文件；3）非归档模式运行：则不会形成归档日志。4）采用归档模式会对系统的性能造成些许的影响，但是数据库运行在归档模式下，数据会更加安全。5）当出现故障的时候，数据丢失的可能性会更小，因为一旦出现介质故障（如：磁盘损坏）时，可以利用归档日志，将数据库恢复到发生故
windows 服务器重启原因排查运维小乔服务器运维
客户web网址经常突然无法访问，等上了服务器查看web应用日志的时候，日志内容是断层的，发现java进程是被杀死了。在任务管理器里面查看系统运行时间的是六七分钟打算查询系统日志，在“此电脑”右击点击“管理”>计算机管理(本地）>事件查看器>windows日志>系统中查找对应时间段的日志如下图，原因大概是“客户体验改善计划的用户注销通知”导致的，百度查了有两种方法，先把两种方法记录一下，免得忘记！方
【机器学习&深度学习】模型微调的基本概念与流程一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、什么是模型微调（Fine-tuning）？二、预训练vs微调：什么关系？三、微调的基本流程（以BERT为例）1️⃣准备数据2️⃣加载预训练模型和分词器3️⃣数据编码与加载4️⃣定义优化器5️⃣开始训练6️⃣评估与保存模型四、是否要冻结BERT层？五、完整训练示例代码5.1环境依赖5.2执行代码总结：微调的优势前言在自然语言处理（NLP）快速发展的今天，预训练模型如BERT成为了众多任务
MySQL索引 - 索引失效孤寒者 Python全栈系列教程 mysql 数据库索引索引失效
目录：每篇前言：索引失效深入解析一、模糊匹配导致索引失效场景：`LIKE'%xx'`或`LIKE'%xx%'`二、函数操作导致索引失效场景：索引字段参与函数运算三、表达式计算导致索引失效场景：索引字段参与表达式计算四、隐式类型转换导致索引失效场景：字段类型与查询值类型不一致（如字符串与数字）五、联合索引未遵循最左前缀原则场景：未按照联合索引定义的列顺序查询六、WHERE子句中的OR导致索引失效场景
C语言经典题目2 一支闲人 C语言 c语言基础知识适用新手小白
1.字符串长度计算一个字符串的长度并输出本体主要运用了strlen库函数的应用#include#includeintmain(){charste[100];intlen;printf("Enterastring");scanf("%s",str);len=strlen(str);printf("Lengthof'%s'=%d",str,len);return0;}2.字符串反转将一个字符串反转并输
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

论文阅读 激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition

Abstract 摘要

Introduction 引言

Related Work

Transient Imaging

Impulsing NLOS sensing and Imaging

dulated and Coherent NLOS Imaging

NLOS Tracking and Classification

Learning Multiview Image Synthesis

3. Observation Model

3.1 Detector Model

3.2 transient rasterizaion 瞬态光栅化

4. Learned NLOS Scene Representations

4.1 Spatial-Temporal Feature Extraction

4.2 Latent Feature Propagation

4.3 Feature Abstraction

5. End-to-end NLOS Networks

5.1 2D Rendering 二维渲染

View Transformer

Visibility Network

Image Renedering Network

Depth Rendering Network

5.2 RGB-D Reconstruction

5.3 Classification 分类

5.4 检测

6. Analysis and Synethetic Validation 合成数据上的结果

7. 真实实验数据上的测试结果

总结

你可能感兴趣的:(#,非视距成像,#,计算成像,#,论文阅读,非视距成像,深度学习,ToF,激光脉冲,特征嵌入)

论文阅读激光脉冲主动非视距成像+深度学习 || Learned Feature Embeddings for Non-Line-of-Sight Imaging and Recognition