m_buddy

深度估计 ManyDepth 笔记

参考代码：manydepth
论文名称：The Temporal Opportunist: Self-Supervised Multi-Frame Monocular Depth

1. 概述

导读：这篇文章借鉴了多视图深度估计中的cost-volume方法（参考：cost-volume概念），并将其引入到单目的自监督深度估计网络中。这里将原来的双目图像换成了一对前后帧图像，从而去构建cost-volume克服之前的单目深度估计中的scale ambiguity问题。此外，为了克服单目情况下cost-volume的训练问题，文章提出了一系列的策略进行解决，如运动目标的滤除，从而极大提升了单目深度估计的性能。

笼统上看文章的方法是单目视觉与立体视觉的组合，其具有：

1）自监督的深度估计网络，在预测的时候可以输入一帧图像也可以输入多帧图像，自然多帧图像带来的效果更好；
2）对于图像中运动的目标和静止的场景往往会对深度估计网络带来影响，对此文章通过引入有效的损失函数与训练策略去解决了这个问题；
3）对于单目深度估计中scale ambiguity的问题，文章借鉴立体视觉中的cost-volume，利用单目的视频序列构建cost-volume；

文章的方法在单帧图像输入和多帧图像输入情况下进行深度估计的效果见下图所示：

文章将深度估计中的一些方法在使用时需要的条件进行了分析，这些方法的要求为：

1）需要多帧图像作为输入；
2）相机不能静止；
3）深度估计训练时需要知道相机的位姿，甚至是测试时；
4）图像中没有移动的目标；

然后，将文章提出的方法与这些方法在使用限制上进行对比，见下表所示：

2. 方法设计

2.1 网络结构

文章的网络结构见下图所示：

从上图可以看到算法主要由：相机位姿估计网络，cost-volume构建，深度估计网络组成。

相机位姿估计网络：
这里使用相邻的两帧图像去估计相机的位姿 $T_{t\rightarrow t+n},n\in\{-1,1\}$ （文章中并没有使用未来帧，因而 $n = - 1$ ），则位姿被描述为：
$T_{t\rightarrow t+n}=\theta_{pose}(I_t,I_{t+n})$

cost-volume构建：
cost-volume在文章算法中描述的是在不同深度下相邻帧像素上的差异，不过文章中并不是在图像的维度进行，而是在特征（stride=4）的维度上。按照最小深度和最大深度值： $d_{min},d_{max}$ （文章中对于这两个超参数的设置是通过自适应的方式进行的，这个在后面的cost-volume部分进行说明）在 $I_t$ 光轴的垂直方向上划分多个平面 $\mathcal{P}$ ，之后在源图像的特征上使用计算得到的相机位姿信息和相机内参矩阵对特征进行变换得到 $F_{t+n\rightarrow t,d},d\in\mathcal{P}$ 。之后cost-volume就是在变换后的源图像特征与目标图像特征上做绝对值差得到的。之后再与目标图像的特征组合起来经过解码器得到深度估计图。

深度估计网络:
这里深度估计的时候是使用了多帧的信息，因而深度估计部分被描述为：
$D_t=\theta_{depth}(I_t,I_{t-1},\dots,I_{t-N})$
也就是文章使用过往帧的数据作为输入去预测深度，代码中将其设置为 $N = 1$ 。之后在图像的维度上进行了重构误差监督，重构的过程描述为：
$I_{t+n\rightarrow t}=I_{t+n}\langle proj(D_t,T_{t\rightarrow t+n},K)\rangle$
重构误差的计算与monodepth2的计算过程类似，描述为：
$L_p=\min_n pe(I_t,I_{t+n\rightarrow t})$
这里使用的重构损失为SSIM与L1范数的组合，也与monodepth2类似。

2.2 cost-volume机制

Adaptive cost-volume：
cost-volume的引入可以解决之前单目深度估计中scale ambiguity的问题，但是却因为实际的 $d_{min},d_{max}$ 是未知的，对此文章引入了自适应的cost-volume机制。将 $d_{min},d_{max}$ 通过在输入的数据中进行学习的方式得到，也就是网络通过训练的过程中自适应找到这两个参数（在batch预测的深度图 $D_t$ 上进行统计，并在之后进行动量更新），之后在写checkpoint的时候一并写入，测试的时候取出使用。

cost-volume中过拟合问题的处理：
一般意义上讲cost-volume机制的引入会使得结果更好，但是实际上还是会存在之前自监督方法的“孔洞”问题（这些区域存在目标的移动），见图c的b图。经过分析cost-volume中的信息只是在某些场合下是可信的，而在诸如目标移动/低纹理区域上是不置信的。而这些区域在图像的维度上进行重构的时候其重构的误差是很小的，因而这部分的cost-volume信息被过度信赖，需要一个mask将其排除，类似monodepth2中的auto-mask机制。这里由auto-mask产生的掩膜记为 $M_A$ 。

在计算cost-volume的过程中，那些为0的区域就是需要被排除出去的区域，这里将其记为 $M_c$ 。具体的cost-volume的计算过程描述为：

# manydepth/networks/resnet_encoder.py#157
def match_features(self, current_feats, lookup_feats, relative_poses, K, invK):
    """Compute a cost volume based on L1 difference between current_feats and lookup_feats.

    We backwards warp the lookup_feats into the current frame using the estimated relative
    pose, known intrinsics and using hypothesised depths self.warp_depths (which are either
    linear in depth or linear in inverse depth).

    If relative_pose == 0 then this indicates that the lookup frame is missing (i.e. we are
    at the start of a sequence), and so we skip it"""

    batch_cost_volume = []  # store all cost volumes of the batch
    cost_volume_masks = []  # store locations of '0's in cost volume for confidence

    for batch_idx in range(len(current_feats)):

        volume_shape = (self.num_depth_bins, self.matching_height, self.matching_width)
        cost_volume = torch.zeros(volume_shape, dtype=torch.float, device=current_feats.device)
        counts = torch.zeros(volume_shape, dtype=torch.float, device=current_feats.device)

        # select an item from batch of ref feats
        _lookup_feats = lookup_feats[batch_idx:batch_idx + 1]
        _lookup_poses = relative_poses[batch_idx:batch_idx + 1]

        _K = K[batch_idx:batch_idx + 1]
        _invK = invK[batch_idx:batch_idx + 1]
        world_points = self.backprojector(self.warp_depths, _invK)  # 将不同深度的平面从图像坐标映射到带有深度的相机坐标

        # loop through ref images adding to the current cost volume
        for lookup_idx in range(_lookup_feats.shape[1]):
            lookup_feat = _lookup_feats[:, lookup_idx]  # 1 x C x H x W
            lookup_pose = _lookup_poses[:, lookup_idx]

            # ignore missing images
            if lookup_pose.sum() == 0:
                continue

            lookup_feat = lookup_feat.repeat([self.num_depth_bins, 1, 1, 1])  # source图像特征处理，为了维度匹配
            pix_locs = self.projector(world_points, _K, lookup_pose)  # 相机坐标系经过变换到图像坐标（特征图维度）
            warped = F.grid_sample(lookup_feat, pix_locs, padding_mode='zeros', mode='bilinear',
                                   align_corners=True)  # 进行采样

            # mask values landing outside the image (and near the border)
            # we want to ignore edge pixels of the lookup images and the current image
            # because of zero padding in ResNet
            # Masking of ref image border
            x_vals = (pix_locs[..., 0].detach() / 2 + 0.5) * (
                self.matching_width - 1)  # convert from (-1, 1) to pixel values
            y_vals = (pix_locs[..., 1].detach() / 2 + 0.5) * (self.matching_height - 1)

            edge_mask = (x_vals >= 2.0) * (x_vals <= self.matching_width - 2) * \
                        (y_vals >= 2.0) * (y_vals <= self.matching_height - 2)
            edge_mask = edge_mask.float()

            # masking of current image
            current_mask = torch.zeros_like(edge_mask)
            current_mask[:, 2:-2, 2:-2] = 1.0
            edge_mask = edge_mask * current_mask  # 去除掉边界

            diffs = torch.abs(warped - current_feats[batch_idx:batch_idx + 1]).mean(
                1) * edge_mask  # 计算source特征经过不同深度平面映射之后与target特征的差距，cost-volume的关键

            # integrate into cost volume
            cost_volume = cost_volume + diffs
            counts = counts + (diffs > 0).float()
        # average over lookup images
        cost_volume = cost_volume / (counts + 1e-7)

        # if some missing values for a pixel location (i.e. some depths landed outside) then
        # set to max of existing values
        missing_val_mask = (cost_volume == 0).float()  # 未被匹配到的区域，"孔洞"区域
        if self.set_missing_to_max:
            cost_volume = cost_volume * (1 - missing_val_mask) + \
                cost_volume.max(0)[0].unsqueeze(0) * missing_val_mask
        batch_cost_volume.append(cost_volume)
        cost_volume_masks.append(missing_val_mask)

    batch_cost_volume = torch.stack(batch_cost_volume, 0)
    cost_volume_masks = torch.stack(cost_volume_masks, 0)  # 无效掩膜

    return batch_cost_volume, cost_volume_masks

最终 $M_c$ 的确定：

# manydepth/networks/resnet_encoder.py#259
def compute_confidence_mask(self, cost_volume, num_bins_threshold=None):
    """ Returns a 'confidence' mask based on how many times a depth bin was observed"""

    if num_bins_threshold is None:
        num_bins_threshold = self.num_depth_bins
    confidence_mask = ((cost_volume > 0).sum(1) == num_bins_threshold).float()  # 非“孔洞”区域

    return confidence_mask  # 掩膜M_1

在文章中对此的约束是使用一致性约束，使用一个monocular depth网络去生成深度图：
$\hat{D}_t=\theta_{consistency}(I_t)$
之后使用L1损失函数使得 $D_t$ 与 $\hat{D}_t$ 保持相似：
$L_{consistency}=\sum M|D_t-\hat{D}_t|$
其中， $M=1-M_A\odot M_c\odot M_m \odot M_a$ 。是一个二值掩膜用于去排除不置信的区域，取值为1的时候是不置信的，0的时候反之。

PS：那么为什需要这个 $\theta_{consistency}$ 呢？
文章给出的解释是这部分主要是为了避免cost-volume带来的过拟合问题。因为单张图像深度模型并没有包涵cost-volume，因而输出的深度图是没有存在cost-volume带来的问题，因而可以当作teacher去引导最后带cost-volume的深度估计。

匹配掩膜 $M_m$ 的确定：
在 $M_m$ 确定过程中使用了monocular depth网络的输出 $\hat{D}_t$ ，在像素为置信的情况下 $\hat{D}_t$ 应该与argmin之后的cost-volume输出（ $D_{cv}$ ）近似，因而可以将掩膜 $M_m$ 的确定过程描述为：
$M_m=max(\frac{D_{cv}-\hat{D}_t}{\hat{D}_t},\frac{\hat{D}_t-D_{cv}}{D_{cv}})\gt1$
其中对于 $M_m$ 的计算过程可以描述为：

# manydepth/trainer.py#527
def compute_matching_mask(self, outputs):
   """Generate a mask of where we cannot trust the cost volume, based on the difference
   between the cost volume and the teacher, monocular network"""

   mono_output = outputs[('mono_depth', 0, 0)]
   matching_depth = 1 / outputs['lowest_cost'].unsqueeze(1).to(self.device)

   # mask where they differ by a large amount
   mask = ((matching_depth - mono_output) / mono_output) < 1.0
   mask *= ((mono_output - matching_depth) / matching_depth) < 1.0
   return mask[:, 0]

静态相机与初始帧处理（掩膜 $M_a$ ）：

1）初始帧处理：由于在首帧情况下没有前一帧的输入，因而无法有效构建cost-volume，因而这里通过训练过程中按照概率 $p = 0.25$ 将cost-volume置为0，从而得以适应首帧的情况；
2）静态相机的处理：静态相机情况下前后帧是一致的，因而在训练的过程中按照概率 $q = 0.25$ 将前一帧赋值为当前帧，从而模拟静态相机的情况。

由于这里经过数据的特殊处理，使得一些数据失效因而得到一个新的mask用以表明数据的有效性，记为 $M_a$ 。

2.3 损失函数

文章的损失构成为：
$L=(1-M)L_p+L_{consistency}+L_{smooth}$
其中， $M=M_A\odot M_c\odot M_m \odot M_a$ 。

3. 实验结果

文章的方法与其它一些方法在KITTI数据集上的性能比较：

Mininet树形拓扑解析漫谈网络网络技术进阶通途网络 mininet sdn nfv
在Mininet中，tree,depth,fanout用于定义树形拓扑的参数，其中：depth：树的深度（层数），包括根节点所在的层。fanout：每层节点的分叉数（每个节点连接的子节点数量）。对于tree,4,3，即深度为4，分叉数为3，其节点生成规则如下：一、拓扑参数定义depth=4：交换机的层级数（根为第1层，共4层交换机）。fanout=3：每台交换机（非最后一层）连接3台子交换机或主机
单目3d重建DUSt3R 笔记 AI算法网奇 3D视觉人工智能
目录DUSt3R三维重建报错RecursionError:maximumrecursiondepthexceededincomparison报错numpy.core.multiarrayfailedtoimport报错Numpyisnotavailable解决升级版mast3r速度变慢修改了参数设置脚本：测试效果操作技巧DUSt3R三维重建git地址：GitHub-naver/dust3r:DUS
Linux如何查询文件及文件夹大小大数据侠客操作系统相关 linux
查看当前目录下各文件、文件夹的大小，这个比较实用du-h-max-depth=1*查询当前目录总大小du-sh3.最大文件夹倒叙和正序du-s*|sort-rn从小到大按字节排序du-sh*sort-n从小到大按字节和M排序4.最大文件夹倒排前10和后10du-sh*|sort-rn|head前面10个du-sh*|sort-rn|tail后面10个
python读取海康RGBD感知相机并解析图像数据我认为可以！ python 开发语言相机
python读取海康RGBD感知相机情景：相机：MV-EB435i海康提供的C++SDK比较完善，但是python的比较粗糙，给的demo只能得到他自己定义的数据帧需求：基于海康提供的pythonSDK，进一步开发读取RGB和Depth图，并转换成后续任务需要的numpy数组形式相机分析：可以使用HiViewer先调试相机，确认相机读取RGBD没问题：下载地址这些参数可以跟着相机的指南挑一挑，调到
Ubuntu常用命令及使用示例解析 zeeq_ Ubuntu linux ubuntu
pwd-Printcurrentworkingdirectory，打印当前终端所在的目录。ls-Listdirectoryconte，列出当前工作目录下的所有文件/文件夹的名称。du-h--max-depth=1-查看当前目录下所有文件及文件夹所占用空间的大小。–max-depth参数用于指定深入目录的层数，为0时表示当前层。cd-changedirectory，切换当前的工作目录，eg：cd~，
redis内部数据结构(5)-quicklist Tinner丶链表数据结构算法 java redis
Redis对外暴露的list数据类型，它底层实现所依赖的内部数据结构就是`quicklist`。我们在讨论中还会涉及到两个Redis配置(在redis.conf中的ADVANCEDCONFIG部分)：12list-max-ziplist-size-2list-compress-depth0注：本文讨论的quicklist实现基于Redis源码的3.2分支。quicklist概述Redis对外暴露的
Redis内部数据结构quicklist详解码农单克 redis redis
在本文中，我们介绍一个Redis内部数据结构——quicklist。Redis对外暴露的list数据类型，它底层实现所依赖的内部数据结构就是quicklist。我们在讨论中还会涉及到两个Redis配置（在redis.conf中的ADVANCEDCONFIG部分）：list-max-ziplist-size-2list-compress-depth0我们在讨论中会详细解释这两个配置的含义。注：本文讨
TPAMI 2025 | Glissando-Net: 基于单视图的类别级姿态估计与3D重建小白学视觉论文解读 IEEE TPAMI 3d 深度学习论文解读顶刊论文 IEEE TPAMI
论文信息Glissando-Net:DeepSinglevIewCategoryLevelPoseeStimationANd3DReconstructionGlissando-Net:基于单视图的类别级姿态估计与3D重建作者：BoSun;HaoKang;LiGuan;HaoxiangLi;PhilipposMordohai;GangHua论文创新点联合估计3D形状和6D姿态：Glissando-N
Unity中WolrdSpace下的UI展示在上层程序员也有头发 Unity开发 unity ui 游戏引擎
一、问题描述Unity中Canvas使用WorldSpace布局的UI，想让它不被3d物体遮挡，始终显示在上层。二、解决方案使用shader解决在UI的材质中禁用深度测试（ZTest），强制UI始终渲染在最上层。Shader"Custom/UI_NoDepthTest"{Properties{...}SubShader{Tags{"Queue"="Transparent+1000"//设置高优先级
111.二叉树的最小深度程序员正在诞生中 python 二叉树算法蓝桥杯深度搜索
#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:defminDepth(self,root:Optional[TreeNode])->int:ifr
【力扣hot100】刷题笔记Day13 小涛44 力扣hot100刷题笔记 leetcode 笔记算法职场和发展数据结构 python
前言元宵节快乐~周六在图书馆快乐刷题！继续二叉树543.二叉树的直径-力扣（LeetCode）递归后序classSolution:defdiameterOfBinaryTree(self,root:Optional[TreeNode])->int:self.res=0#记录最长路径#递归求最大深度defdepth(node):ifnotnode:return0l=depth(node.left)#
XGBClassifiler函数介绍浊酒南街 #算法机器学习 XGB
目录前言函数介绍示例前言XGBClassifier是XGBoost库中用于分类任务的类。XGBoost是一种高效且灵活的梯度提升决策树（GBDT）实现，它在多种机器学习竞赛中表现出色，尤其擅长处理表格数据。函数介绍XGBClassifiler(max_depth=3,learning_rate=0.1,n_estimators=100,objective='binary:logistic',boo
【深度学习】Adam（Adaptive Moment Estimation）优化算法辰尘_星启机器学习--深度学习深度学习算法人工智能 Adam pytorch python
概述Adam算法结合了动量法（Momentum）和RMSProp的思想，能够自适应调整每个参数的学习率。通过动态调整每个参数的学习率，在非平稳目标（如深度神经网络的损失函数）中表现优异目录基本原理和公式笼统说明：为什么Adam算法可以帮助模型找到更好的参数基本概念动量（Momentum）：跟踪梯度的指数衰减平均（一阶矩），加速收敛并减少震荡。自适应学习率：跟踪梯度平方的指数衰减平均（二阶矩），调整
Compressed Channel Estimation for Intelligent Reflecting Surface-Assisted Millimeter Wave Systems No_one-_-2022 移动天线优化算法学习
文章目录II.SYSTEMMODELANDPROBLEMFORMULATIONIII.CHANNELMODELIV.PROPOSEDMETHOD摘要：在这封信中，我们考虑了智能反射面(IRS)辅助毫米波(mmWave)系统的信道估计，其中部署了IRS来辅助从基站(BS)到用户的数据传输。本文表明，为了实现联合主动式和被动式波束形成，需要获取大尺寸级联信道矩阵的知识。为了减少训练开销，利用了毫米波信
Zustand selector 发生 infinate loops的原因以及解决夫琅禾费米线 javascript react.js ecmascript
Zustandselector发生infinateloops做zustandtutorialproject的时候，使用选择器方法引入store，出现Maximumupdatedepthexceeded,也就是组件一直重新渲染，改成直接使用store就没有不会出现这个问题。如下：//const[xIsNext,setXIsNext]=useGameStore((state)=>[//state.xI
数据结构之二叉树（C#版）爱码星人数据结构二叉树数据结构
数据结构之二叉树（C#版）什么是二叉树人话版猿话版代码实现树结构树节点二叉树的遍历方法深度优先---DepthFirstSearch（DFS）先序遍历中序遍历后序遍历深度优先遍历总结广度优先---BreadthFirstSearch（BFS）总结什么是二叉树数据结构里面的“二叉树”这种结构，听起来很高大上，但实际上，他也的确是高大上，那么什么是二叉树呢？下面我再次用灵魂给你画一下，什么是二叉树。人
【Linux】之【Bug】VMware 虚拟机开机一直卡在黑屏左上角下划线闪烁界面 Htht111 Linux bug linux bug 运维
解决参考：解决Ubuntu20.04开机黑屏光标闪烁进不去系统Centos根目录100%解决思路当前界面ctrl+alt+f3-f6暂时进入终端界面df-h查看发现根目录磁盘空间已满执行命令查看当前目录占用内存明细sudodu-h-x--max-depth=1清理无用的大内存文件或者安装了ncdu也能使用该命令查看内存使用明细删除了几个无用的大内存文件后，关机再开机就能正常进入用户登录界面进行使用
docker-compose部署开源堡垒机Orion-Visor——筑梦之路筑梦之路 linux系统运维 docker 容器运维
gitclone--depth=1https://github.com/dromara/orion-visorcdorion-visordockercomposepull#配置,此处我保持默认cp.env.example.env#启动进行数据库初始化dockercomposeup-d#访问http://[ip]:8081进行登陆Adminer#依次导入这些初始化sqlorion-visor/sql
（图像梯度处理、图像边缘化检测、图像轮廓查找和绘制、透视变换、举例轮廓的外接边界框） GWY_uu 计算机视觉人工智能图像处理
梯度处理的Sobel算子函数功能：Sobel算子是一种用于边缘检测的梯度计算方法，它通过计算图像在水平方向和垂直方向上的梯度来增强边缘信息。参数：src：输入图像。ddepth：输出图像的深度，通常选择为CV_16S以避免溢出。dx和dy：分别指定是否对x轴或y轴求导数，0表示不求导，1表示求一阶导数。ksize（可选）：使用的Sobel核大小，默认为3。返回值：经过Sobel算子处理后的图像，通
LeetCode 111. 二叉树的最小深度 java题解奔跑的废柴 LeetCode leetcode java 算法
https://leetcode.cn/problems/minimum-depth-of-binary-tree/description/注意，跟二叉树的最大深度求解完全不同。//当一个左子树为空，右不为空，这时并不是最低点//因为叶子结点需要左右孩子都为空，当前节点有右孩子，不符合叶子结点。//同理，当一个右子树为空，左不为空，这时并不是最低点。//节点左右都不为空，节点左右都为空intres
神经网络中的Adam 化作星辰神经网络人工智能深度学习
Adam（AdaptiveMomentEstimation）是一种广泛使用的优化算法，结合了RMSprop和动量（Momentum）的优点。它通过计算梯度的一阶矩估计（mean）和二阶矩估计（uncenteredvariance），为每个参数提供自适应学习率。Adam由DiederikP.Kingma和JimmyBa在2014年的论文《Adam:AMethodforStochasticOptimi
【解读】核密度图 dearr__ python 开发语言
def：what核密度估计（KernelDensityEstimation，简称KDE）是一种用来估计随机变量概率密度函数的非参数方法实现：（库函数）howimportseabornassnsimportmatplotlib.pyplotasplt#使用Seaborn绘制KDE图sns.kdeplot(data,shade=True)#添加标签和标题plt.xlabel('Data')plt.yl
24-3-25拓扑+二分图+tarjan Agnes_A20 c++算法开发语言
确定比赛名次问题（图的拓扑排序+单调队列）原文链接：https://blog.csdn.net/Mitchell_Donovan/article/details/116654722问题描述：有N个比赛队伍(1#include#include#includeusingnamespacestd;voidtopsort(intnumvextex,vector>&matrix,vector&depth){
无人机实战系列（二）本地摄像头 + Depth-Anything V2 nenchoumi3119 无人机实战无人机
这篇文章介绍了如何在本地运行Depth-AnythingV2，因为我使用的无人机是Tello，其本身仅提供了一个单目视觉相机，在众多单目视觉转Depth的方案中我选择了Depth-AnythingV2，这个库的强大在于其基于深度学习模型将单目视觉以较低的代价转换成RGBD图像，可以用来无人机避障与SLAM。Step1.拉取Depth-AnythingV2源码与模型下载官方仓库提供了两种方式调用De
mesh threejs 属性_threejs 材质一璇 mesh threejs 属性
一、材质种类：MeshBasicMaterial：为几何体赋予一种简单的颜色，或者显示几何体的线框MeshDepthMaterial：根据网格到相机的距离，该材质决定如何给网格染色MeshNormalMaterial：根据物体表面的法向量计算颜色MeshFaceMaterial：这是一种容器，可以在该容器中为物体的各个表面上设置不同的颜色MeshLambertMaterial：考虑光照的影响，可以
OpenCV每日函数图像过滤模块 (3) boxFilter函数坐望云起深度学习从入门到精通 OpenCV从入门到精通 opencv 计算机视觉人工智能
一、概述使用箱形滤镜模糊图像，该函数使用内核平滑图像：其中非归一化箱形滤波器可用于计算每个像素邻域上的各种积分特征，例如图像导数的协方差矩阵（用于密集光流算法等）。如果您需要计算可变大小窗口上的像素和，请使用积分图。二、boxFilter函数1、函数原型cv::boxFilter(InputArraysrc,OutputArraydst,intddepth,Sizeksize,Pointancho
python制图之小提琴图 pianmian1 python 信息可视化开发语言
提琴图（ViolinPlot）是一种结合了箱线图（BoxPlot）和核密度估计（KernelDensityEstimation,KDE）的可视化工具，用于展示数据的分布情况和概率密度。它在数据可视化中具有独特的作用.本节我们学习如何使用python绘制提琴图#导入所需的库importmatplotlib.pyplotasplt#用于绘图importnumpyasnp#用于数值计算importpan
麦萌《至尊红颜归来》技术架构拆解：从复仇算法到分布式攻防的终极博弈短剧萌架构重构
系统设计核心逻辑剧情主线可抽象为高鲁棒性安全系统的构建与攻防对抗：加密协议与身份隐匿：叶念君隐藏身份映射为零知识证明（ZKP）协议，通过环签名（RingSignature）技术实现“青木令主”权限的匿名验证。分布式任务调度：勇闯修罗九塔对应多层防御链（Defense-in-Depth）架构，每层塔可视为独立微服务，通过Kafka实现异步攻击流量编排。对抗性训练框架：修罗门诱捕圈套可建模为GAN（生
线程通信基础汇总（C语言实现）做自己'S Catanin 前端数据库算法
一、为什么需要线程通信？当多个线程需要共享资源或协调任务时，需要通过通信机制保证：数据访问的安全性执行顺序的合理性资源分配的高效性二、常用通信方式1.互斥锁（Mutex）原理：通过加锁机制保护临界区#includepthread_mutex_tmutex=PTHREAD_MUTEX_INITIALIZER;intshared_data=0;void*thread_func(void*arg){pt
joint_info smpl AI算法网奇 python基础计算机视觉人工智能
生成代码：出处：https://github.com/DART-Lab-LLUI/Metrabs_PoseEstimationdefget_joint_info():joint_names_smpl=('pelv,lhip,rhip,bell,lkne,rkne,spin,lank,rank,thor,ltoe,rtoe,neck,lcla,rcla,head,lsho,''rsho,lelb,r
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。