X_Student737

双目立体匹配_StereoNet网络

端到端立体匹配网络：通常以左右视图作为输入，经卷积模块提取特征后，按相关性操作(Correlation)或拼接操作(Concat)构建代价体，最后根据代价体的维度进行不同的卷积操作，回归出视差图。

根据代价体维度的不同，可分为基于 3D 代价体和基于 4D 代价体的两种方法， 2D 编码器-解码器和 3D 卷积正则化模块是分别用来处理 3D 和 4D 代价体的两种结构。2D 编码器-解码器由一系列堆叠的 2D CNN 组成，并带有跳跃连接。而 3D 正则化模块是在构建代价体时将提取的左右图特征沿视差维度拼接以得到一个 4D 的代价体，而后使用 3D CNN 处理 4D 代价体，充分利用了视差维度的信息。

文章目录

双目立体匹配_StereoNet网络
前言
1、GCNet网络架构
2、StereoNet网络架构
3、双目立体匹配数据集
4、实验过程
- 实验1：只在Sceneflow数据集上训练
- 实验2：只在KITTI2012数据集上训练
- 实验3：先在Sceneflow数据集上pretrain，再在KITTI2012数据集上finetune
- 实验4：先在Sceneflow数据集上pretrain，再在KITTI2012+2015数据集上finetune
五、细节与想法
六、源代码

前言

传统立体匹配算法通常选取立体校正后的左视图作为参考图像，通过在目标图像上进行行搜索寻找同名点并计算视差，将每个像素的视差进行保存，得到单通道的视差图。距离相机越近的空间点，在视差图中灰度值越大。传统立体匹配算法将双目立体匹配问题转化寻找最小化能量函数的图D问题，此处的D可以时深度图或视差图，因此在深度学习领域立体匹配又被成为视差估计、深度估计。

随着神经网络、深度学习技术的不断发展，学者认识到双目立体匹配问题接近于传统的密集回归问题（如语义分割、光流估计等），受U-Net模型的启发，Mayer等人基于光流估计网络FlowNet提出DispNet，成为第一个非常经典的端到端视差估计网络。与U-Net网络结构类似，DispNet先在收缩路径进行特征提取与空间压缩，然后在扩张路径进行尺度恢复与视差预测，并通过长距离跳跃连接实现多层次特征融合，保留更多的网络层信息。

与受传统神经网络模型启发的架构不同，基于4D代价体的端到端立体匹配网络架构是专门为立体匹配任务而设计，这一架构下的网络不再对特征进行降维操作，从而使代价体能保留更多的图像几何和上下文信息。StereoNet网络是在GC-Net网络的基础上改进而来。

1、GCNet网络架构

GC-Net是由Kendall等人提出的一种新型深度视差学习网络架构，作者创造性地引入了4D代价体，并在正则化模块中首次利用3D卷积来融合4D代价体的上下文信息，开创了专门用于立体匹配的3D网络结构。

GC-Net包含四个步骤：1、利用权值共享的2D卷积层分别提取左右图像的高维特征，并在此阶段进行下采样将原始分辨率减半以减少内存需求；2、将左特征图和对应通道的右特征图沿视差维度逐像素错位串联得到4D代价体；3、利用由多尺度的3D卷积和反卷积组成的编码、解码模块对代价体进行正则化操作，得到大小为1的代价体张量；4、对代价体应用可微的SoftArgMax操作回归得到视差图。GC-Net创造性的使用3D卷积构建3D代价体，通过downsampling构造多尺度的3D卷积，并不像传统方法一样使用特征的差值或者距离来计算代价体，而是使用3D卷积，从而学到更多的语义信息，优化了最终的视差图质量。

尽管上述基于4D代价体的端到端网络展示了出色的匹配效果，但由于3D卷积结构本身的计算复杂度，导致网络在存储资源和计算时间上成本高昂，以GC-Net为例，处理分辨率为1216、352尺寸的图像对大约需要10.4G的GPU内存。为了解决此问题，压缩代价体、构建更低分辨率的代价体或减少3D卷积层个数等多种思路被提出。Khamis等人采取设计低分辨率代价体的思路，提出了实时轻量立体匹配网络StereoNet，算法直接在得到低分辨率的视差图后通过2D卷积网络进行上采样和视差优化，以此降低网络的复杂性。

2、StereoNet网络架构

StereoNet使用Siamese网络从左右图像中提取特征，在非常低分辨率的cost volume中计算视差估计，然后分层进行上采样并重新引入高频细节，利用颜色输入作为指导生成高质量的边缘结果。在整体思路上，StereoNet网络将cost volume设计的比较小，但是仍然可以包含了较多的特征信息，只会有较少的精度损失，这样网络可以先得到一个粗糙的视差图，之后再设计了一种层次化的、边缘敏感的精修网络，实际上是利用卷积网络估计残差，利用残差和粗糙的视差图分层优化，最终可以得到更加细致、保留边缘的视差图。

StereoNet网络大致可分为四个部分。第一部分是特征提取模块，网络采用了一个简单的结构，先利用大小为5、步长为2的卷积进行降采样，然后利用一系列大小为3、步长为1的卷积进行特征提取，重复3到4次。第二部分是匹配代价计算模块，为提高运算效率，网络直接通过错位相减，从而构建匹配代价体。第三部分是代价聚合模块，网络利用一系列3D卷积进行滤波，对代价体进行正则化。第四部分是视差计算和优化模块，网络利用当前尺度的图像对当前尺度的视差图进行导向滤波，即首先利用双线性插值上采样视差图，提高一倍其分辨率，然后将当前尺度的影像和插值得到的视差图一起放到一系列的空洞卷积里优化，得到当前尺度的结果。

3、双目立体匹配数据集

SceneFlow数据集是目前规模最大的双目立体视觉公开数据集，所有场景都是利用3D模型人工合成的虚拟数据，包括三个子数据集：FlyingThings3D、Monkaa和Driving。FlyingThings3D中主要包括静态背景中沿3D轨迹随机飞行的日常物体。Monkaa是基于动画短片创建，其中包含了非刚性和柔和的关节运动，以及视觉上极具挑战性的皮毛问题。Driving模拟的是驾驶场景下的动态街景，与KITTI数据集相似。SceneFlow数据集中共包含35454对立体图像对作为训练集，4370对立体图像对作为测试集，图片大小均为960、540，训练集和测试集均提供了稠密而精细（100%）的真实视差值。该数据集是专门为训练和测试基于深度学习的立体匹配算法设计的。

KITTI Stereo数据集是使用经过校准的双目相机与车载激光雷达在真实室外场景中采集的一个小型数据集，可以测试算法针对室外真实场景的匹配精度与实时性，广泛应用于视差估计、目标检测、语义分割等领域。由于室外场景中包含大量车辆、行人、路标以及周围的房屋和树木等，极具挑战性和多样性。

KITTI Stereo数据集中包含KITTI 2012和KITTI2015两个子数据集。KITTI2012数据集中包含194对具有稀疏真实视差图的立体图像作为训练集，195对没有真实视差图的立体图像作为测试集，图片大小为1240、375，且同时给出了灰度和彩色图像。KITTI2015数据集扩充了车辆玻璃高光反射时的判断以及车辆在运动时拍摄的情况，训练集和测试集都包含200对立体图像，图片大小均为1242、375。其中训练集的真实视差图中只提供了不到50%的稀疏真实视差，测试集没有提供真实视差图。

4、实验过程

实验1：只在Sceneflow数据集上训练

Sceneflow数据集比较大，差不多200G，必须得借助服务器训练。此外FlyingThings3D、Monkaa和Driving不同文件夹的标签分布差异较大，训练起来会比较困难，甚至会出现loss跳跃现象。我在8张RTX3090上联合训练了5天，跑了差不多500个epoch，权重才逐渐收敛。前200个epoch学习率设为1e-4，后面调整至1e-5，采用的是 optim.Adam优化器，batchsize选择4、16、32、64或128都行。

由于Sceneflow数据集标签是稠密视差图，训练起来的效果会好很多。加载Sceneflow数据集预训练得到的模型权重，选取Sceneflow测试集中的双目图像进行测试，计算得到平均视差精度为92.69%，即视差偏差在3像素以内(包括3像素)的像素占所有有效像素的比例。预测视差效果如下图所示，左图代表StereoNet网络预测视差图，右图代表真实视差图。

通常情况下，Sceneflow数据集训练出来的网络权重，可以作为其他数据集的预训练加载权重。

实验2：只在KITTI2012数据集上训练

KITTI2012数据集只有200对双目图像，我划分180对为训练集，20对为测试集。此外KITTI Stereo数据集的视差图为稀疏视差图，只在视差大于0的像素位置提供真值，计算损失时采用L1_smooth回归损失，但仅对y_true大于0的像素部分进行处理，其余像素位置的损失值忽略。如果不加载Sceneflow数据集的预训练权重，其实也能训练出效果。

我在KITTI2012数据集上训练了2000个epoch，前200个epoch学习率为1e-3，后面调整至1e-4，优化器设置为Adam，batch_size设置为4，训练会逐渐收敛，并且可以获得一个还能接受视差预测效果。

计算测试集20对双目图像的计算耗时和视差精度，视差精度表示为视差偏差在3像素以内(包括3像素)的像素占所有有效像素的比例，20对双目图像的平均视差精度为81.85%。

实验3：先在Sceneflow数据集上pretrain，再在KITTI2012数据集上finetune

采用和实验2一样的处理步骤，不过不是从零开始训练，而是加载Sceneflow数据集上的预训练权重，训练效果果然能够提升。此外我尝试了不同学习率下的训练效果，发现在前200轮学习率1e-3，第200轮到第2000轮学习率1e-4，第2000轮后学习率1e-5此时收敛精度最好。而如果采用1e-4+1e-5的设置，训练效果略有欠缺。

加载KITTI Stereo数据集Finetune得到的模型权重，选取测试集中的20对双目图像进行测试，计算得到平均视差精度为86.14%，即视差偏差在3像素以内(包括3像素)的像素占所有有效像素的比例。

实验4：先在Sceneflow数据集上pretrain，再在KITTI2012+2015数据集上finetune

我利用实验3预测出的视差图进行三维重建，重建效果还是不太满意，想进一步提高KITTI数据集的双目重建精度。考虑到KITTI2012数据量还是太少了，于是尝试在实验3的基础上，进一步融合KITTI2012+KITTI2015数据集一起训练。

前200轮学习率1e-3，第200轮到第2000轮学习率1e-4，第2000轮后学习率1e-5，采用Adam优化器，batch_size取4。

加载KITTI Stereo数据集Finetune得到的模型权重，选取测试集中的20对双目图像进行测试，计算得到平均视差精度为90.09%。

利用训练出来的视差图进行三维重建，输入为左目和右目RGB图像：

StereoNet预测得到左目视差图为：

三维重建效果如下：

五、细节与想法

1、Sceneflow数据集的视差标签，直接读取即可，不需做额外处理；KITTI Stereo数据集的视差标签，数值需要额外除以256。
2、StereoNet训练时使用数据增强，不是直接对图像做resize缩放，这样会导致图像形变，源码采用在原图中先随机选定256、512区域，再裁减，这时不光增加了样本多样性，而且也不会导致图像形变，视差数值也不用等比例缩放了。
3、StereoNet是真的学习到了视差匹配，而不是强行拟合数据。网络训练时输入图像对使用的是256、512尺寸，但测试时直接输入的是368、1232，照样能准确输出视差值。
4、StereoNet推理速度比较快，368、1232图像尺寸，单张RTX2070推理时间0.05s，而且模型保存权重很小，大概占5M的空间。
5、不同pytorch版本保存的权重是有差异的，1.6.0版本后的模型无法加载1.6.0版本前保存的权重。

六、源代码

如果需要源代码，或者想直接使用数据集，可以去我的主页寻找项目链接，以上代码和实验结果都由本人亲自实验得到：
https://blog.csdn.net/Twilight737

人工智能OpenCV计算机视觉技术 yzx991013 OpenCV基础全集 opencv 计算机视觉人工智能
5.3cand可调节边缘检测完整代码：importcv2importnumpyasnp#载入图像，并处理可能的读取错误img_original=cv2.imread('./image/lena.jpg')ifimg_originalisNone:print("无法读取图像文件")raiseSystemExit#创建可调整大小的窗口cv2.namedWindow('Canny',cv2.WINDOW
深入解读ChatGPT的工作原理及底层逻辑 NAR_鱼丸 ChatGPT 程序人生
ChatGPT的工作原理和底层逻辑可以从多个方面进行解读，主要包括其基本原理、核心技术、训练过程以及应用能力。工作原理涉及了深度学习模型、自然语言处理技术和文本生成算法等多个方面。通过预训练和微调，模型能够理解语言的语法和语义，并能够根据上下文生成符合语境的文本回复。基本原理ChatGPT是一种基于自然语言处理（NLP）和深度学习技术的聊天机器人。其基本原理是使用大量文本数据来训练深度神经网络模型
c#中的socket中的time_wait状态处理方法 www_sjz c#socket c#服务器 tcp 网络测试
端口的状态说明：TCP协议规定，对于已经建立的连接，网络双方要进行四次握手才能成功断开连接，如果缺少了其中某个步骤，将会使连接处于假死状态，连接本身占用的资源不会被释放。网络服务器程序要同时管理大量连接，所以很有必要保证无用连接完全断开，否则大量僵死的连接会浪费许多服务器资源。在众多TCP状态中，最值得注意的状态有两个：CLOSE_WAIT和TIME_WAIT。1、LISTENING状态FTP服务
软考信安04~网络安全体系与网络安全模型 jnprlxc 软考~信息安全工程师 web安全网络安全
1、网络安全体系概述1.1、网络安全体系概念网络安全体系是网络安全保障系统的最高层概念抽象，是由各种网络安全单元按照一定的规则组成的，共同实现网络安全的目标。网络安全体系包括法律法规政策文件、安全策略、组织管理、技术措施、标准规范、安全建设与运营、人员队伍、教育培训、产业生态、安全投入等多种要素。1.2、网络安全体系特征(1)整体性。网络安全体系从全局、长远的角度实现安全保障，网络安全单元按照一定
04~防火墙概念及登录 jnprlxc 网络运维安全学习方法改行学it 职场和发展
一、防火墙概念1、概念来源防火墙的概念来源于现实生活中的防火门，在大型的商超、银行等公共场所中，我们经常看到防火门，其作用就是如果发生了火灾，通过锁住这个门用来隔离火情，防止火势蔓延，进而保护门内财产的安全。防火墙也是如此，它是对网络的访问行为进行控制的设备，通常部署在网络边界（如局域网和互联网、局域网中各功能子网、数据中心边界等），保护一个网络（通常我们所说的局域网）不受另一个网络（如互联网）的
Node.js - HTTP 蒜蓉大猩猩 Node.js http 网络协议网络 javascript php 后端 node.js
1.HTTP请求HTTP（HypertextTransferProtocol，超文本传输协议）是客户端和服务器之间通信的基础协议。HTTP请求是由客户端（通常是浏览器、手机应用或其他网络工具）发送给服务器的消息，用来请求资源或执行操作。简单来讲就是向服务器发送请求，服务器返回响应给用户端HTTP请求由三个主要部分组成：1.1请求行包含请求方法、目标资源路径、协议版本。GET/index.htmlH
Pytorch详解-模型模块(RNN,CNN,FNN,LSTM,GRU,TCN,Transformer) qq742234984 rnn pytorch cnn
Pytorch详解-模型模块Module¶meterModule初认识forward函数ParameterPytorch中的权重、参数和超参数Module容器-ContainersSequentialModuleListModuleDictParameterList&ParameterDict常用网络层LSTM输入和输出GRUConvolutionalLayers卷积层的基本概念常见的卷积
【使用webrtc-streamer解析rtsp视频流】 m0_74824592 vip1024p webrtc
webrtc-streamerWebRTC(WebReal-TimeCommunications)是一项实时通讯技术，它允许网络应用或者站点，在不借助中间媒介的情况下，建立浏览器之间点对点（Peer-to-Peer）的连接，实现视频流和（或）音频流或者其他任意数据的传输。WebRTC包含的这些标准使用户在无需安装任何插件或者第三方的软件的情况下，创建点对点（Peer-to-Peer）的数据分享和电
厉害了，LSTM+Transformer王炸创新，精准度又高了！马拉AI LSTM transformer
【LSTM+Transformer】作为一种混合深度学习模型，近年来在学术界和工业界都受到了极大的关注。它巧妙地融合了长短期记忆网络（LSTM）在处理时序数据方面的专长和Transformer在捕捉长距离依赖关系上的优势，从而在文本生成、机器翻译、时间序列预测等多个领域取得了突破性的进展。这种创新的结合不仅提升了模型的预测精度，还优化了性能和训练效率，使其在序列分析任务中展现出卓越的能力。例如，最
linux-配置yum源 HoRain云小助手运维 Linux linux 运维
一、配置本地yum源首先将centos自带的网络yum源删掉（自带的默认从centos官网下载软件，服务器在国外，非常不稳定） [root@cloud~]#rm-rf/etc/yum.repos.d/*创建挂载点并挂载镜像[root@cloud~]#mkdir/opt/centos[root@cloud~]#mount/dev/cdrom/opt/centos/mount:/dev/sr0写保护，
在Linux系统下配置IP地址的方法 HoRain云小助手 php 服务器 apache linux ubuntu centos
在Linux系统下配置IP地址可以使用以下几种方法：1.使用ifconfig命令：打开终端，并以root权限登录。输入ifconfig命令查看当前网络接口的配置信息。使用ifconfignetmask命令来配置IP地址和子网掩码，其中表示网络接口名称（如eth0、wlan0等），表示要配置的IP地址，表示子网掩码。输入ifconfig命令确认IP地址的配置结果。2.使用ip命令：打开终端，并以ro
构建高效GPU算力平台：挑战、策略与未来展望 Mr' 郑 gpu算力
引言随着深度学习、高性能计算和大数据分析等领域的快速发展，GPU（图形处理器）因其强大的并行计算能力和浮点运算速度而成为首选的计算平台。然而，随着模型规模的增长和技术的进步，构建高效稳定的GPU算力平台面临着新的挑战。本文旨在探讨这些挑战、应对策略以及对未来发展的展望。当前挑战算力分配与资源优化在多用户共享GPU集群的环境下，合理分配计算资源并确保每个任务能够高效运行是一项挑战。这不仅涉及到硬件资
详解深度学习中的Dropout nk妹妹深度学习深度学习人工智能
Dropout是一种在神经网络训练中常用的正则化技术，其操作是在每次训练迭代中随机“丢弃”一部分神经元（即将其输出置为零）。以下是对这一操作的详细解释：一、基本思想Dropout的基本思想是减少神经元之间的复杂共适应关系，迫使网络在训练过程中不依赖于特定的神经元子集。这有助于增加模型的泛化能力，防止过拟合。二、具体实现随机选择：在每次训练迭代中，以一定的概率p（通常设定为0.2到0.5之间）随机选
IP协议 ip网络面试问题
IP（InternetProtocol）协议是互联网通信中最重要的协议之一，它是在TCP/IP协议族中的网络层协议。IP协议为数据在网络中的传输提供了统一的标准，使得不同的计算机和网络设备能够相互通信。IP协议负责将数据包从源主机发送到目的主机，并且确保数据包在传输过程中不会丢失或损坏扫码关注公众号，查看更多优质文章IP协议是一种无连接协议，它不对数据包进行任何形式的确认或控制。它仅仅负责将数据包
计算机网络破译密码的题目,密码习题及部分参考答案.doc 耿礼勇计算机网络破译密码的题目
一、密码学概述部分：1、什么是密码体制的五元组。五元组(M,C,K,E,D)构成密码体制模型，M代表明文空间；C代表密文空间；K代表密钥空间；E代表加密算法；D代表解密算法2、简述口令和密码的区别。密码：按特定法则编成，用以对通信双方的信息进行明、密变换的符号。换而言之，密码是隐蔽了真实内容的符号序列。就是把用公开的、标准的信息编码表示的信息通过一种变换手段，将其变为除通信双方以外其他人所不能读懂
Java 常见的面试题（反射） java全套学习资料 java 开发语言
一、什么是反射？JAVA反射机制是在运行状态中，对于任意一个类，都能够知道这个类的所有属性和方法，对于任意一个对象，都能够调用它的任意一个方法和属性，这种动态获取的信息以及动态调用对象的方法的功能称为java语言的反射机制。二、什么是java序列化？什么情况下需要序列化？**序列化：**将Java对象转换成字节流的过程。**反序列化：**将字节流转换成Java对象的过程。当Java对象需要在网络上
计算机网络（48）P2P应用 IT 青年一研为定计算机网络
前言计算机网络中的P2P（PeertoPeer，点对点）应用是一种去中心化的网络通信模式，它允许设备（或节点）直接连接并共享资源，而无需传统的客户端-服务器模型。一、P2P技术原理去中心化架构：P2P网络不依赖单一的中心服务器，而是由所有参与者共同维护网络和资源。每个节点都可以充当客户端和服务器，可以直接与其他节点通信。资源共享：P2P网络允许参与者共享文件、带宽、计算资源等。这意味着用户可以从其
网络安全，文明上网（2）加强网络安全意识 IT 青年中国好网民阅读
前言在当今这个数据驱动的时代，对网络安全保持高度警觉已经成为每个人的基本要求。网络安全意识：信息时代的必备防御网络已经成为我们生活中不可或缺的一部分，信息技术的快速进步使得我们对网络的依赖性日益增强。然而，网络安全问题也随之日益严重，包括个人信息的泄露、网络诈骗以及黑客攻击等。因此，增强网络安全意识对于保护个人隐私、财产安全乃至国家安全都显得尤为重要。网络安全意识的重要作用网络安全意识是个人在网络
VXLAN 基础教程：VXLAN 协议原理介绍 lingshengxiyou 网络 linux 运维 c++开发语言
VXLAN（VirtualeXtensibleLocalAreaNetwork，虚拟可扩展局域网），是一种虚拟化隧道通信技术。它是一种Overlay（覆盖网络）技术，通过三层的网络来搭建虚拟的二层网络。简单来讲，VXLAN是在底层物理网络（underlay）之上使用隧道技术，借助UDP层构建的Overlay的逻辑网络，使逻辑网络与物理网络解耦，实现灵活的组网需求。它对原有的网络架构几乎没有影响，不
【机器学习实战中阶】音乐流派分类-自动化分类不同音乐风格精通代码大仙数据挖掘深度学习 python 机器学习分类自动化人工智能数据挖掘深度学习
音乐流派分类–自动化分类不同音乐风格在本教程中，我们将开发一个深度学习项目，用于自动化地从音频文件中分类不同的音乐流派。我们将使用音频文件的频率域和时间域低级特征来分类这些音频文件。对于这个项目，我们需要一个具有相似大小和相似频率范围的音频曲目数据集。GTZAN流派分类数据集是音乐流派分类项目中最推荐的数据集，并且它是为了这个任务而收集的。音乐流派分类器模型音乐流派分类关于数据集：GTZAN流派收
Nginx+FFmpeg实现海康威视摄像头的rtsp流转hls流并在本地WEB页面以及服务器WEB页面实现直播效果 Zim_cie 海康威视摄像头 hls rtsp nginx ffmpeg html
由于自己的海康威视网络摄像机不支持websocket，无法使用官方网页提供的WEB3.2开发包，只能使用低版本3.0版本的web开发包，但是这个版本的开发包只支持44以下版本的Chrome浏览器（当前普遍版本90+），ie9-ie11（？？?很少人用ie了，更何况不适配开发需求），其余Firefox也应该是低版本的。转而想到通过提取视频流的方法进行二次开发。》》具体如何查看通过海康威视技术人员提示
OSPF（1）：基础知识与数据包、状态机、工作过程小度爱学习网络安全从小白到大神网络
引言上一篇我们学习了RIP：RIP基础知识与配置，可是通过学习，我们发现RIP似乎只能运用在中小型网络中，那么中大型网络应该怎么做呢？这一篇博客我们就来学习OSPFOSPF---开放式最短路径优先协议动态路由优势评价维度：选路佳，收敛快，占用资源少RIP与OSPF比较1.OSPF本身是链路状态型协议，所以计算出的路径不会存在环路，并且使用带宽作为选路依据，所以，OSPF在选路的角度上优于RIP；2
深度强化学习(DRL)原理与代码实战案例讲解 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1人工智能的演进：从符号主义到连接主义人工智能(AI)的发展经历了漫长的历程，从早期的符号主义到如今的连接主义，标志着人工智能从基于规则的推理演变到基于数据的学习。符号主义AI试图通过逻辑和符号系统来模拟人类的思维过程，而连接主义AI则侧重于构建类似于人脑神经网络的结构，通过大量数据进行训练，从而实现智能。1.2强化学习：智能体与环境的互动强化学习(ReinforcementLea
神经网络常见操作（卷积）输入输出被放养的研究生计算机视觉神经网络深度学习机器学习
卷积dim=d的tensor可以进行torch.nn.Convnd(in_channels,out_channels),其中n=d-1,d-2对于torch.nn.Convnd(in_channels,out_channels)，改变的是tensor的倒数n+1维的大小全连接使用torch.nn.Linear(in_features,out_features,bias)实现Y=XWT+b,其中X的
AI歌手会成为主流吗？网络安全我来了 IT技术人工智能
AI歌手会成为主流吗？在如今这个科技迅猛发展的时代，AI歌手渐渐走入我们的视野。或许你会想，AI真的能够唱歌，它的歌声能与真实歌手相媲美吗？让我们一起探索这个引人入胜的主题，看看AI歌手的发展现状、优缺点，以及它在音乐行业的未来前景。1.AI歌手的发展现状1.1技术背景我们处于一个机器学习和深度学习技术飞速发展的时代，AI歌手的诞生并非偶然。通过收集和分析大量的音乐数据，AI能够学习并模仿特定歌手
基于 Linux 的 Ngina-server 通信架构 C++ 实现 Alkaid3529 C++新经典 C++面试核心与项目设计 linux 架构服务器 c++tcp/ip
文章目录本章内容概述一、项目概述1.项目描述2.项目技术二、项目详解1.项目框架2.项目流程三、项目拓展1.简要介绍一下你的项目？2.项目程序结构？3.线程之间如何同步？4.如何处理客户端发送的数据包？5.Socket编程服务端和客户端的基本流程？6.IO多路复用相关？7.如何做压测的？8.保护内存资源？9.为保护服务器不受攻击做出了哪些处理？10.CPU占比过高如何分析？四、网络编程1.IO多路
数据增强方法及其工具 cxr828 大数据
数据增强（DataAugmentation）是指在训练深度学习模型时，通过对现有数据进行一系列变换，从而生成新的样本。数据增强有助于增加数据的多样性，减少过拟合，提升模型的泛化能力，尤其是在数据量有限的情况下。数据增强可以应用于图像、文本、音频等多种类型的数据。以下是一些常见的、简单易行的图像数据增强方法及其具体实现步骤，这些方法也可以广泛应用于目标检测、图像分类、图像分割等任务。一、图像数据增强
【Redis】为什么Redis单线程还这么快？通过什么机制进行优化的？来一杯龙舌兰数据库 #Redis redis 数据库缓存多路复用内存优化 redis快
文章目录纯内存操作高效的数据结构非阻塞I/O与多路复用技术（网络I/O优化）非CPU密集型任务单线程的优势单线程的劣势redis6.0引入多线程后台线程的优化总结更多相关内容可查看Redis的瓶颈在于内存和网络带宽纯内存操作Redis是一个内存数据库，它的数据都存储在内存中，这意味着我们读写数据都是在内存中完成，这个速度是非常快的可能有很多人只知道存内存更快，但是不知道原因内存：中每个存储单元都有
Kafka面试夺命连环30问（一）知否&知否 kafka 面试分布式
1、kafka消息发送的流程？Producer创建并配置。发送消息，消息被序列化，并通过配置的分区规则决定发送的分区。Producer发送请求，通过网络将消息发送到相应的Broker。Broker存储消息，将消息写入分区日志。Producer等待ACK确认，根据acks配置等待响应。成功或失败，根据结果执行回调，消息成功则继续发送，失败则重试。2、Kafka的设计架构你知道吗？Kafka的设计架构
网络安全拟态防御技术网安墨雨 web安全安全网络
一.拟态防御拟态现象（MimicPhenomenon,MP）是指一种生物如果能够在色彩、纹理和形状等特征上模拟另一种生物或环境，从而使一方或双方受益的生态适应现象。按防御行为分类可将其列入基于内生机理的主动防御范畴，又可称之为拟态伪装（MimicGuise,MG）。如果这种伪装不仅限于色彩、纹理和形状上，而且在行为和形态上也能模拟另一种生物或环境的拟态伪装，我们称之为“拟态防御”（MimicDef
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

双目立体匹配_StereoNet网络

双目立体匹配_StereoNet网络

文章目录

前言

1、GCNet网络架构

2、StereoNet网络架构

3、双目立体匹配数据集

4、实验过程

实验1：只在Sceneflow数据集上训练

实验2：只在KITTI2012数据集上训练

实验3：先在Sceneflow数据集上pretrain，再在KITTI2012数据集上finetune

实验4：先在Sceneflow数据集上pretrain，再在KITTI2012+2015数据集上finetune

五、细节与想法

六、源代码

你可能感兴趣的:(计算机视觉图像处理,网络,深度学习,计算机视觉)