Detect-and-Track论文：3D Mask R-CNN Caffe2源代码解析——4. 网络头解析

在第三部分，我们对3D Mask R-CNN的RPN和FPN进行了详解，在特征图经过RoIAlign过程之后，我们得到了Resize后的特征图。下一步就是将这些维度相同的特征图送入“网络头/Net Head”部分进行最终处理。这篇文章我们就一起探究以下这两个网络头：Cls_Head和Key_Head。

参考内容链接如下：

Detect-and-Track论文：【网页链接】

Detect-and-Track源代码：【网页链接】

Fast R-CNN论文：【网页链接】

一、框架详解

二、Fast R-CNN回顾

三、Net_Head代码详解

1. Fast R-CNN网络头

1) add_roi_frcn_head_func()

2)add_fast_rcnn_outputs()

2. Mask分支

3.关键点支路

1) add_roi_keypoint_head_func()

2) add_heatmap_outputs()

四、一些感想

一、框架详解

上图中HighLight出来的部分就是网络头。网络头由一对姊妹支流构成：Fast R-CNN Head（又简称Cls_Head）和Key Point_Head，两路支路功能如下：

Fast R-CNN Head：之所以这样起名是因为这个结构初创于Fast R-CNN，其中cls用于确定目标类别，reg是对RoI进行Bounding Box回归。其中的cls使用softmax损失值，reg使用L1损失值。

Key Point Head：这个分支用于生成人体关键点。所采用的方法是：先使用8层卷积将RoI变小，之后使用两层DeConv层得到Heatmap。这一层使用的是空间softmax损失值。

二、Fast R-CNN回顾

论文网址已经贴在上边了，具体的内容用一张核心的图就可以表示出来：

好了，这个部分我们主要还是了解一下Fast R-CNN的作者：Ross Girshick。免得以后人家再出了大文章我们不认识。首先来看一下Fast R-CNN的题目：

够霸气吧……一个人独立完成了RCNN向Fast R-CNN的进化。Ross Girshick的个人主页在这里：http://www.rossgirshick.info/ ，2012年芝加哥大学博士毕业，先后在Microsoft Research和FAIR工作，后来又去U.C. Berkeley做博士后。在这里膜拜一下大佬，希望大佬保佑我早日毕业！

三、Net_Head代码详解

model_builder()一直都是Key Point R-CNN构建的核心函数，上节分析到了RPN和FPN，现在继续。我们到了这一段。三个星星将三段程序完美地隔开：第一段程序是添加Fast R-CNN头；第二段程序是生成Mask；第三段程序是生成关键点。我们依次分开来看。

1. Fast R-CNN网络头

# ★  Add the Fast R-CNN branch（生成cls和reg）
		blob_frcn, dim_frcn, spatial_scale_frcn = add_roi_frcn_head_func(model, blob_conv, dim_conv, spatial_scale_conv)
# ResNet3D.add_ResNet18_roi_conv5_head
		add_fast_rcnn_outputs(model, blob_frcn, dim_frcn, is_head_3d=head_3d)

首先由add_roi_frcn_head_func()添加网络头，生成的参数都在最后添加了frcn。之后用add_fast_rcnn_outputs()直接生成了cls和reg结果。我们分开来看：

1) add_roi_frcn_head_func()

实质是ResNet3D.add_ResNet18_roi_conv5_head，定位到此函数：

def add_ResNet18_roi_conv5_head(*args, **kwargs):
	""" Usable with R18/34 models. """
	kwargs['dim_out'] = 512		# 修改输出维度为512
	kwargs['block_counts'] = 2	# 含有2个bottleneck block
	return add_ResNet_roi_conv5_head(*args, **kwargs)

核心程序是add_ResNet_roi_conv5_head()函数，再定位到此函数。可以发现，首先对输入的张量使用RoIFeatureTransform()进行了RoIAlign变换，应该是变换成为7*7的小特征图。之后通过了两个bottleneck blocks，最后通过维度扩展得到了3*4的张量。

def add_ResNet_roi_conv5_head(model, blob_in, dim_in, spatial_scale, block_counts=3, dim_out=2048):
	"""Adds an RoI feature transformation (e.g., RoI pooling) followed by a res5/conv5 head applied to each RoI."""
	# TODO(rbg): This contains Fast R-CNN specific config options making it non-
	# reusable; make this more generic with model-specific wrappers
	
	# 进行RoI特征变换
	model.RoIFeatureTransform(
		blob_in, 'pool5',
		blob_rois='rois',
		method=cfg.FAST_RCNN.ROI_XFORM_METHOD,	# RoIAlign	
		resolution=cfg.FAST_RCNN.ROI_XFORM_RESOLUTION,	# 分辨率：7
		sampling_ratio=cfg.FAST_RCNN.ROI_XFORM_SAMPLING_RATIO,	# 采样率：2
		spatial_scale=spatial_scale)
		
	dim_bottleneck = cfg.RESNETS.NUM_GROUPS * cfg.RESNETS.WIDTH_PER_GROUP	# 1*64
	stride_init = int(cfg.FAST_RCNN.ROI_XFORM_RESOLUTION / 7)	# 步长
	
	# 添加2个bottleneck blocks
	s, dim_in = add_stage(4, model, 'res5', 'pool5', block_counts, dim_in, dim_out, dim_bottleneck * 8, 1, stride_init)
	
	# Reduce mean across all dimensions (h,w,t)
	model.ReduceBackMean(s, 'res5_pool_w')
	model.ReduceBackMean('res5_pool_w', 'res5_pool')
	
	# Do not pool on time as well, as I use a 3D head on top, so leave it as a
	# 3D blob so I can do 3D conv on it.
	# s = model.ReduceBackMean('res5_pool', 'res5_pool')
	s = model.ExpandDims('res5_pool', 'res5_pool', dims=[3, 4])	# 扩展为3*4的，与3帧图像有关
	return s, dim_out, spatial_scale

2)add_fast_rcnn_outputs()

作用是生成分类结果和回归结果。cls_score由一次卷积直接得出；final_shape由一次卷积和多次Resize得出。如果不是3D模式，则使用全连接层。

def add_fast_rcnn_outputs(model, blob_in, dim, is_head_3d):

	# 将3D张量卷积为2D
	if is_head_3d:	
		# As per the changes to ResNet head, the output will be a 3D blob
		# so that I can run 3D convolutions on it. But be careful to output a 2D
		# blob from here
		cls_score = model.ConvNd(	# 进行卷积
			blob_in, 'cls_score_1', dim, model.num_classes,
			[1, 1, 1], pads=2 * [0, 0, 0], strides=[1, 1, 1],
			weight_init=('GaussianFill', {'std': 0.01}),
			bias_init=('ConstantFill', {'value': 0.}))
		# Does not support inplace operations! WOW
		model.ReduceBackMean(model.ReduceBackMean(model.ReduceBackMean(
			cls_score, 'cls_score_2'), 'cls_score_3'), 'cls_score')
			
	# 如果不是3D模式，就用全连接层
	else:
		# Original code
		model.FC(
			blob_in, 'cls_score', dim, model.num_classes,
			weight_init=('GaussianFill', {'std': 0.01}),
			bias_init=('ConstantFill', {'value': 0.}))
	
	# 只有测试的时候才用softmax	
	if not model.train:  # == if test
		# Only add softmax when testing; during training the softmax is combined
		# with the label cross entropy loss for numerical stability
		model.Softmax('cls_score', 'cls_prob', engine='CUDNN')	
		
	if is_head_3d:
		model.ConvNd(
			blob_in, 'bbox_pred_1', dim,
			4 * model.num_classes, [1, 1, 1],	# 4倍个种类
			pads=2 * [0, 0, 0], strides=[1, 1, 1],
			weight_init=('GaussianFill', {'std': 0.01}),
			bias_init=('ConstantFill', {'value': 0.}))
		# 接下来是一系列的张量操作，不停地调整维度
		# Convert into the format bbox losses expect (Same as RPN)
		
		# Convert the Bx(4C)xTxHxW -> BxCx4xTxHxW
		model.ExpandDims('bbox_pred_1', 'bbox_pred_2', dims=[2])		# 扩展一个维度
		model.Reshape(['bbox_pred_2'], ['bbox_pred_3', model.net.NextName()],	# 自动填充这个维度
					  shape=(0, -1, 4, 0, 0, 0))
					  
		# Convert the BxCx4xTxHxW -> BxCxTx4xHxW
		model.Transpose('bbox_pred_3', 'bbox_pred_4',	# 重新调整维度次序
						axes=(0, 1, 3, 2, 4, 5))
						
		# Convert the BxCxTx4xHxW -> Bx(C*T*4)xHxW
		batch_size = model.GetShapeDimIdx(blob_in, 0)
		ht = model.GetShapeDimIdx(blob_in, 3)
		wd = model.GetShapeDimIdx(blob_in, 4)
		final_shape = model.GetNewShape(batch_size, -1, ht, wd)
		model.Reshape(['bbox_pred_4', final_shape],
					  ['bbox_pred_5', model.net.NextName()])
					
		# Does not support inplace operations! WOW
		model.ReduceBackMean(model.ReduceBackMean('bbox_pred_5', 'bbox_pred_6'), 'bbox_pred')
	else:
		model.FC(
			blob_in, 'bbox_pred', dim, model.num_classes * 4,
			weight_init=('GaussianFill', {'std': 0.001}),
			bias_init=('ConstantFill', {'value': 0.}))

2. Mask分支

这个框架没有使用到Mask，仅仅只是预测关键点。

# ★  Add the mask branch（生成Mask），但是在KeyPoint R-CNN中没有使用到Mask
		if cfg.MODEL.MASK_ON:
			if is_inference:
				bbox_net = copy.deepcopy(model.net.Proto())

			# Add the mask branch
			blob_mrcn, dim_mrcn, _ = add_roi_mask_head_func(model, blob_conv, dim_conv, spatial_scale_conv)
			blob_mask = add_mask_rcnn_outputs(model, blob_mrcn, dim_mrcn)

			if is_inference:
				# Extract the mask prediction net, store it as its own network,
				# then restore the primary net to the bbox-only network
				model.mask_net, blob_mask = get_suffix_net(
					'mask_net', bbox_net.op, model.net, [blob_mask])
				model.net._net = bbox_net

3.关键点支路

此支路用于生成HeatMap关键点。

# ★  Add the keypoint branch（关键点支路）
		if cfg.MODEL.KEYPOINTS_ON:
			if is_inference:	# 测试模式
				bbox_net = copy.deepcopy(model.net.Proto())
				
			# RoIAlign操作和8层3D卷积
			blob_krcnn, dim_krcnn, _ = add_roi_keypoint_head_func(	# keypoint_rcnn_heads.add_roi_pose_head_v1convX_3d
				model, blob_conv, dim_conv, spatial_scale_conv)
			
			# 生成热图	
			blob_keypoint = add_heatmap_outputs(
				model, blob_krcnn, dim_krcnn, time_dim=out_time_dim, is_head_3d=head_3d)

			if is_inference:
				model.keypoint_net, keypoint_blob_out = get_suffix_net(
					'keypoint_net', bbox_net.op, model.net, [blob_keypoint])
				model.net._net = bbox_net

1) add_roi_keypoint_head_func()

此函数通过add_roi_pose_head_v1convX()函数进行链接，内容是完成8层Conv的添加。

def add_roi_pose_head_v1convX(model, blob_in, dim_in, spatial_scale, nd=False):
	# 先经过RoIAlign，再通过8层3D卷积
    hidden_dim = cfg.KRCNN.CONV_HEAD_DIM		# 512
    kernel_size = cfg.KRCNN.CONV_HEAD_KERNEL
    pad_size = kernel_size // 2
	
    current = model.RoIFeatureTransform(
        blob_in, '_[pose]_roi_feat',
        blob_rois='keypoint_rois',
        method=cfg.KRCNN.ROI_XFORM_METHOD,	# RoIAlign
        resolution=cfg.KRCNN.ROI_XFORM_RESOLUTION,	# 14
        sampling_ratio=cfg.KRCNN.ROI_XFORM_SAMPLING_RATIO,	# 2
        spatial_scale=spatial_scale)

    for i in range(cfg.KRCNN.NUM_STACKED_CONVS):	# 8
        if nd:	# 执行N维卷积
            current = model.ConvNd(
                current, 'conv_fcn' + str(i + 1), dim_in, hidden_dim,
                [cfg.VIDEO.TIME_KERNEL_DIM.HEAD_KPS, kernel_size, kernel_size],
                pads=2 * [cfg.VIDEO.TIME_KERNEL_DIM.HEAD_KPS // 2, pad_size, pad_size],
                strides=[1, 1, 1],
                weight_init=(cfg.KRCNN.CONV_INIT, {'std': 0.01}),
                bias_init=('ConstantFill', {'value': 0.}))
        else:
            current = model.Conv(
                current, 'conv_fcn' + str(i + 1), dim_in, hidden_dim,
                kernel_size, stride=1, pad=pad_size,
                weight_init=(cfg.KRCNN.CONV_INIT, {'std': 0.01}),
                bias_init=('ConstantFill', {'value': 0.}))
        current = model.Relu(current, current)
        dim_in = hidden_dim

    return current, hidden_dim, spatial_scale

2) add_heatmap_outputs()

按照配置文件添加解卷积层，生成heatmap。这个程序实在是太长了我就不放了。。。

四、一些感想

都说caffe代码比较“乱”，个人感觉的确是有一点，因为找函数要不停地跳。其实现在看代码只到了比较宏观的程度，还没有具体到代码的细节，如每个张量的维度、每个操作的函数。还是有很长的路要走啊。

今天公司里新到了DGX工作站，价格是50万，操作界面都是命令行，看来要彻底抛弃Ubuntu界面了。加油，早日跑起D&T来！

回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Linux下使用U盘 WittXie Linux linux 运维服务器
第一步：插入U盘，如果能够识别出U盘，则会打印出一些信息；第二步：查看U盘系统分配给U盘的设备名；输入如下命令进行查看：fdisk-l/dev/sda如果打印出如下信息：Disk/dev/sda:4233MB,4233101312bytes165heads,34sectors/track,1473cylindersUnits=cylindersof5610*512=2872320bytesDevi
【安装环境】配置MMTracking环境 xuanyu22 安装环境机器学习神经网络深度学习 python
版本v0.14.0安装torchnumpy的版本不能太高，否则后面安装时会发生冲突。先安装numpy，因为pytorch的安装会自动配置高版本numpy。condainstallnumpy=1.21.5mmtracking支持的torch版本有限，需要找到合适的condainstallpytorch==1.11.0torchvision==0.12.0cudatoolkit=10.2-cpytor
three.js AnimationClip 和 AnimationMixer 灵魂清零 three web3 前端 javascript vue.js
AnimationClip动画剪辑（AnimationClip）是一个可重用的关键帧轨道集，它代表动画。构造器AnimationClip(name:String,duration:Number,tracks:Array)name-此剪辑的名称duration-持续时间(单位秒).如果传入负数,持续时间将会从传入的数组中计算得到。tracks-一个由关键帧轨道（KeyframeTracks）组成的数
git 恢复误删的远程分支 Hanfank
需求实际工作上，肯定会有不小心的时候，比如我吧，删除了本地dev分支，intellijidea提示是否将trackedbranch也删掉，结果一不小心将远程分支也删除了，接下来就是我的救赎之旅。查看reflog，找到最后一次commitidgitreflog--date=isoreflog是referencelog的意思，也就是引用log，记录HEAD在各个分支上的移动轨迹。选项--date=is
美国专利申请常用加快审查程序察尔斯格伦
美国专利商标局（USPTO）针对专利申请人的不同需求开展了多种方式的加快审查。今天我们来聊一聊更为常用的专利申请高速公路（PatentProsecutionHighway,PPH）和优先审查（PrioritizedExamination,TrackOne）程序。一、专利申请高速公路（PPH）专利申请高速公路是适用于不同国家的知识产权局之间的加速审查通道，其根据是美国参与的双边和多边协议。根据专利申
【Vue3源码实现】Ref isRef unRef proxyRefs实现 ZhaiMou vue.js javascript 前端数据结构前端框架开发语言
前言在上篇文章中我们了解了响应式原理，并在最后实现了reactive。上文链接Vue3响应式原理实现与track和trigger依赖收集和触发依赖在我们的日常业务中，我们有可能需要将一个基础数据类型的值也转换成响应式的，而reactive只能代理对象，我们需要对基础数据类型的值也进行读写操作的拦截，但Proxy无法实现对基础数据类型值读写操作的拦截。所以Vue设计了Ref,以及相关api本篇文章实
ExoPlayer架构详解与源码分析（17）——TrackSelector 山雨楼 ExoPlayer 架构 android 音视频 ExoPlayer Media3 源码
系列文章目录ExoPlayer架构详解与源码分析（1）——前言ExoPlayer架构详解与源码分析（2）——PlayerExoPlayer架构详解与源码分析（3）——TimelineExoPlayer架构详解与源码分析（4）——整体架构ExoPlayer架构详解与源码分析（5）——MediaSourceExoPlayer架构详解与源码分析（6）——MediaPeriodExoPlayer架构详解与
如何通过阅读外刊积累英文写作句型？（8）原创：魏剑峰英文悦读 5天前长袜子皮卡丘
WhentheLightComesDirkReichardt-Kokowääh2(OriginalSoundtrack)[DeluxeEdition]这是“读外刊，学英文句型”栏目的第八期，关于该栏目第一期的说明可以见如何通过阅读外刊积累英文写作句型？1.形容某人很有名如何形容某人很有名？最常见的说法是somebodyisfamous/well-known/renown，有没有其他说法呢？可以看看
html ios 滚动条隐藏,CSS溢出滚动和隐藏滚动条（iOS）社长从来不假装 html ios 滚动条隐藏
6个答案:答案0:(得分：5)我只是玩了这个codepen(https://codepen.io/devstreak/pen/dMYgeO)，看来如果你为下面的所有三个属性设置background-color到transparent，滚动(在这个例子中)同时删除box-shadows)，根本看不到滚动条：#style-1::-webkit-scrollbar-track{//-webkit-box
SRT3D: A Sparse Region-Based 3D Object Tracking Approach for the Real World Terry Cao 漕河泾 3d 人工智能计算机视觉目标跟踪
基于区域的方法在基于模型的单目3D跟踪无纹理物体的复杂场景中变得越来越流行。然而，尽管它们能够实现最先进的结果，大多数方法的计算开销很大，需要大量资源来实时运行。在下文中，我们基于之前的工作，开发了SRT3D，这是一种稀疏的基于区域的3D物体跟踪方法，旨在弥合效率上的差距。我们的方法在所谓的对应线（这些线模型化了物体轮廓位置的概率）上稀疏地考虑图像信息。由此，我们改进了当前的技术，并引入了考虑定义
linux查看git log目录,git得一些常用命令！廖宝华 linux查看git log目录
.Git基本操作查看状态：1.gitstatus：查看工作区、暂存区的状态1.1.Onbranchmaster#默认在master(主干)分支上1.2Nocommitsyet#当前没有任何的提交1.3nothingtocommit(create/copyfilesanduse"gitadd"totrack)没有什么需要提交的(创建/复制文件，使用“gitadd”命令可追踪，也就是用git去管理文件
开源项目 Kubernetes 源码探索与部署指南邹滢朦
开源项目Kubernetes源码探索与部署指南kubernetesThisistherepothattracksallpatchestotheOpenShiftdistributionofKubernetesonbranchescorrespondingtoOpenShiftreleases.Seehttps://github.com/openshift/kubernetes/blob/maste
【干货】你可能不知道的 20个 Linux 网络工具迷途不归路
转载自公众号：DevOps技术栈原文链接：http://linoxide.com/monitoring-2/network-monitoring-tools-linux/如果要在你的系统上监控网络，那么使用命令行工具是非常实用的，并且对于Linux用户来说，有着许许多多现成的工具可以使用，如：nethogs,ntopng,nload,iftop,iptraf,bmon,slurm,tcptrack
Android音频路由策略 zhuyong006 Android-Audio
Android音频路由策略1.分析音频的默认路由在之前的文章音频输出设备是如何决定的中，我们知道AudioTrack的创建过程会调用到getOutputForAttrstatus_tAudioPolicyManager::getOutputForAttr(constaudio_attributes_t*attr,audio_io_handle_t*output,audio_session_tses
Gmtracker安装中存在的问题程序小旭目标跟踪
Gmtracker安装中存在的问题GMtracker安装问题该如何解决？使用用服务器，在云服务器中使用conda环境python=3.6的版本环境.pipinstall-rrequirements.txt在网上查找资料：opencv安装失败卡在这里是因为没有使用高版本的python环境切换环境继续进行安装python=3.7换高于3.6版本的安装存在问题报错网上解决方法：pipinstalllxm
动画框架：Animation lengbingteng OGRE_API
在说API之前先了解一下动画的原理：以一个人行走为例，要想使人能够行走，必须在这个人模型上设置一些特真点，然后让这些点在每一帧按照一定的规则进行动，从而改变整个模型的状态。在ogre里面，Keyframe类描述的是一个特征点（一个结点、一根骨头、一个顶点）的某一个关键帧的状态（位置、缩放、朝向等）和对应的时间点。一个可驱动点的所有keyframe组合成一个track，每个可驱动点都有一个他的tra
python 3D体感游戏雨轩智能 Unity3D教程游戏 python 开发语言
python和Unity制作的3D体感游戏初步，python获取手势关键点控制Uinty场景中游戏物体，实现3D场景游戏，python代码如下fromcvzone.HandTrackingModuleimportHandDetectorimportcv2importsocketcap=cv2.VideoCapture(0)cap.set(3,1280)cap.set(4,720)success,i
【深度学习实战】行人检测追踪与双向流量计数系统【python源码+Pyqt5界面+数据集+训练代码】YOLOv8、ByteTrack、目标追踪、双向计数、行人检测追踪、过线计数阿_旭 AI应用软件开发实战深度学习实战深度学习 python 行人检测行人追踪过线计数
《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~感谢小伙伴们点赞、关注！《------往期经典推荐------》一、AI应用软件开发实战专栏【链接】项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体
[译] Plaid 应用迁移到 AndroidX 的实践经历 weixin_34029680 移动开发 java runtime
原文地址：Cross-stitchingPlaidandAndroidX原文作者：TiemSong译文出自：掘金翻译计划本文永久链接：github.com/xitu/gold-m…译者：Mirosalva校对者：PhxNirvana一份AndroidX的迁移指南由VirginiaPoltrack提供图片。Plaid是一款呈现MaterialDesign风格和丰富交互界面的有趣应用。最近这款应用通过
linux查看具体进程占用的网络流量寰宇001 Ubuntu
监控网络宽带（网速）的18个命令下面是按功能划分的命令名称。监控总体带宽使用――nload、bmon、slurm、bwm-ng、cbm、speedometer和netload监控总体带宽使用（批量式输出）――vnstat、ifstat、dstat和collectl每个套接字连接的带宽使用――iftop、iptraf、tcptrack、pktstat、netwatch和trafshow每个进程的带宽
LeetCode46 全排列红毛乌龟算法刷题数据结构算法 leetcode c++回溯法
前言题目：46.全排列文档：代码随想录——全排列编程语言：C++解题状态：成功解答！思路排列问题综合了之前的回溯问题，但没有新的东西，按部就班回溯就好。代码classSolution{private:vector>res;vectorpath;voidbacktracking(vector&nums,vector&used){if(path.size()==nums.size()){res.pus
深度学习思考夜雪朝歌
神经网络如果能了解每一层输出的意义，就可以避免end－to－end的黑箱理论，对理论话深度学习很有意义，一个思路是经验值，将每一层在特定任务下都有输出，对结果作经验总结，比方说浅层输出低层次的几何轮廓特征，高层输出语意特征，我曾经在objecttracking用过这样的方法,在大数据集测试，每一层都输出结果，并且和handcraftfeature做比较，发现浅层的效果不如handcraftfeat
探索未知的利器：Detect It Easy（DIE）——文件类型检测大师颜旖玫Michael
探索未知的利器：DetectItEasy（DIE）——文件类型检测大师Detect-It-EasyProgramfordeterminingtypesoffilesforWindows,LinuxandMacOS.项目地址:https://gitcode.com/gh_mirrors/de/Detect-It-Easy在信息安全领域，了解文件的真实性质是至关重要的。DetectItEasy（简称D
Detect It Easy 使用教程伍盛普Silas
DetectItEasy使用教程Detect-It-EasyProgramfordeterminingtypesoffilesforWindows,LinuxandMacOS.项目地址:https://gitcode.com/gh_mirrors/de/Detect-It-Easy项目介绍DetectItEasy（简称DIE）是一个用于确定文件类型的程序。它是一个跨平台的应用程序，除了Window
论文翻译：arxiv-2024 Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large CSPhD-winston-杨帆 LLMs-数据污染论文翻译语言模型人工智能深度学习
DataContaminationQuiz:ATooltoDetectandEstimateContaminationinLargeLanguageModelshttps://arxiv.org/abs/2311.06233数据污染测验：一种检测和估计大型语言模型中污染的工具文章目录数据污染测验：一种检测和估计大型语言模型中污染的工具摘要1引言摘要我们提出了数据污染测验（DataContamina
二刷代码随想录训练营Day 25|491.递增子序列、46.全排列、47.全排列 II、332.重新安排行程、51.n皇后、37.解数独好名字可以让你的朋友更容易记住你498 算法 leetcode c++数据结构
1.递增子序列代码随想录视频讲解：回溯算法精讲，树层去重与树枝去重|LeetCode：491.递增子序列_哔哩哔哩_bilibili代码：classSolution{private:vectorpath;vector>result;voidbacktracking(vector&nums,intstartIndex){if(path.size()>1){result.push_back(path)
代码随想录算法训练营Day22 | 491.递增子序列，46.全排列，47.全排列 II ，332. 重新安排行程，51. N皇后，37. 解数独，总结 Yummy Penguin 算法
第七章回溯算法part04491.递增子序列本题和大家刚做过的90.子集II非常像，但又很不一样，很容易掉坑里。代码随想录视频讲解：回溯算法精讲，树层去重与树枝去重|LeetCode：491.递增子序列_哔哩哔哩_bilibili#491classSolution:deffindSubsequences(self,nums):result=[]path=[]self.backtracking(nu
MediaStream 的媒体流对象 (stream) 和流媒体轨道 (track) 详解 Wu Youlu 前端
navigator.mediaDevices.getUserMedia和MediaStream是实时音视频处理的重要API。通过这些API，可以从摄像头、麦克风或其他设备捕获音视频流，应用于视频通话、录制等场景。本文将介绍navigator.mediaDevices.getUserMedia的参数配置、MediaStream的传参、属性和方法，配合详细的代码示例，特别是如何动态添加和移除音视频轨道
Example of an Automated SBOM Generation Using Syft Chia-Te Kuan 分析工具 c++SBOM STQC
CONTENTWhyIneedaSBOMWhatisSBOMHowtobuildSBOM?IdentifyComponents:GatherMetadata:AutomateDependencyTracking:DocumentRelationshipsUpdateRegularlyValidateandVerifyGeneratetheSBOMIntegrateintoDevelopmentWo
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

Detect-and-Track论文：3D Mask R-CNN Caffe2源代码解析——4. 网络头解析

一、框架详解

二、Fast R-CNN回顾

三、Net_Head代码详解

1. Fast R-CNN网络头

1) add_roi_frcn_head_func()

2)add_fast_rcnn_outputs()

2. Mask分支

3.关键点支路

1) add_roi_keypoint_head_func()

2) add_heatmap_outputs()

四、一些感想

你可能感兴趣的:(Detect,And,Track)