Airs_Gao

人体部位检测：BodyHands

Whose Hands are These? Hand Detection and Hand-Body Association in the Wild解读

摘要
1. 简介
2. Related Work
- 2.1 Hand Analysis
3. Problem Definition and Proposed Method（问题定义和建议方法）
- 3.1 Problem Definition
- 3.2 Architecture Overview
- 3.3 Hand-Body Association Network
- - Overlap Estimation Module
  - Positional Density Module
- 3.4 Training Objective
- 3.4 Hungarian Hand-Body Assignment
4. BodyHands Dataset
- 4.1 Dataset Source
- 4.2 Annotation and Quality Control
- 4.3 Statistics
5. Experiments
- 5.1 Hand-Body Association Experiments
- - 5.1.1 Evaluation Metrics
  - 5.1.2 Competing Methods and Comparison Results
  - 5.1.3 Ablation Studies
  - 5.1.4 Qualitative Results

论文地址：https://openaccess.thecvf.com/content/CVPR2022/papers/Narasimhaswamy_Whose_Hands_Are_These_Hand_Detection_and_Hand-Body_Association_in_CVPR_2022_paper.pdf
论文代码：https://github.com/cvlab-stonybrook/BodyHands
论文出处：CVPR2022

摘要

我们研究了一个新的人手检测问题，并为每只被检测的人手找到相应的人的位置。
该任务对许多下游任务(如hand tracking和hand contact estimation)很有帮助。
难点：在不受约束的条件下，将手与人联系起来是一种挑战，因为多个人可以出现在不同的重叠和遮挡的场景中。
我们提出了一种全新的端到端可训练卷积网络，可以同时检测相应的人的手和身体的位置。
我们的方法首先检测一组手和身体，并使用一个新的Hand-Body关联网络来预测它们之间的关联分数。
我们使用这些关联分数来找到body位置 for 每个检测到的hand。
我们还引入了一个新的具有挑战性的数据集BodyHands，其中包含无约束的手图像和相应的身体位置注释。
最后，我们在两个关键应用中演示了手-身体关联的好处: 手跟踪和手接触估计。
实验表明，通过对手-体关联的推理，手部跟踪和手部接触估计方法得到了明显的改进。

1. 简介

Hand analysis 是计算机视觉和应用在人类理解、动作、手势和手语识别中的一项重要问题。
人手的视觉分析对于VR和AR应用也至关重要。
虽然计算机视觉界已经研究了手的检测、手的姿势估计、手的跟踪和手的接触估计等问题，但在研究手与身体的关联方面还没有显著的努力。
在这项工作中，我们研究了在图像中检测手的问题，并为每只被检测到的手找到相应的人的位置。
在不受约束的条件下，检测手并将其与合适的身体联系起来是一项挑战。如图1所示，一个图像可能包含多个人，手和身体之间有大量的重叠和遮挡。
一种方法是分别检测手和人，并使用基于它们的大小、距离或重叠区域的启发式方法来建立手和身体之间的对应关系。 然而，由于手和身体的极端连接，导致手和相应的人体之间的相对位置和大小有巨大的差异，这种方法不能很好地执行。
另一种方法是使用人体姿态检测器来找到人体的骨架，并在图像中找到每一个被检测到的姿势的手。 然而，姿态检测本身是不可靠的。在人群聚集或互动的场景中，一个人的手和胳膊可能会与另一个人的骨架纠缠在一起。此外，姿态检测器可能无法检测图像中每个人的姿态，特别是那些部分被遮挡或部分在相机视野之外的人。因此，我们不能仅仅依靠姿态检测来将手与人联系起来。
这项工作提出了一种新的卷积体系结构，可以联合检测手和身体并将它们关联起来。
具体地说，我们在MaskRCNN(一个最先进的对象检测器)的基础上进行构建，并通过添加一个新的HandBody Association Network模块对其进行扩展。
我们首先使用一个Region Proposal Network （RPN）生成候选人的手和身体proposal boxes。然后利用bounding box regression和mask generation heads得到手和身体的边界盒和分割图。检测到的手和身体然后被传递到Hand-Body Association Network 来获取它们之间的关联。
Hand-Body Association Network有两个新颖的模块。
（1）第一个模块是Overlap Estimation Module，它使用手和身体的视觉特征来估计它们是否可以重叠。直觉上，如果手和身体没有重叠，它们就不可能属于同一个人。然而，反过来就不成立了，手和身体可以重叠，即使它们属于不同的人。例如，在提出的BodyHands数据集中，超过33%的人的手与他人重叠。
（2）第二个模块是Positional Density Module ，它使用手的特征来估计每只被检测到的手的可能身体位置的密度。直观地说，手的外观和位置为估计其身体位置提供了一些线索。然而，由于手和身体之间的相对比例的巨大变化和人与人之间的相互咬合，直接从手定位身体可能是困难的。因此，我们首先估计可能位置上的密度，并使用这些密度值使用匈牙利（Hungarian）算法找到所有手-体对的兼容匹配。
我们还提供了一个大规模的无约束图像数据集，其中包含手部位置和相应身体位置的注释。该数据集有大约20K个带边界框注释的图像，用于57K多个手实例和63K多个身体实例。
最后，我们在两个关键的下游任务中演示了手-身体关联的好处：hand tracking and hand physical contact estimation.

2. Related Work

2.1 Hand Analysis

计算机视觉对hand进行了广泛的研究，有手检测方法（hand detection），手姿势估计方法（hand pose estimation），手跟踪（hand tracking），手接触估计（hand contact estimation）。
然而，以往的研究没有考虑hand-body association的问题。
尽管有一些带有手部位置注释的数据集，如Hand-CNN，ContactHands但它们没有对应身体位置的注释。
另一种选择是使用人体姿势数据集，其中包含人体关节位置。然而，这样的数据集没有手部的边界框注释。
Egohands提出了一个包含48个两个人之间第一人称互动视频的数据集。但是，它们只提供手部位置的注释，而不提供身体位置的注释。
COCO-WholeBody dataset 通过在COCO数据集上标记手的关键点开发。
与这些数据集相比，提出的BodyHands数据集有大量拥挤的图像，在人之间有显著的重叠和遮挡，34%的BodyHands用户的手与不同的人重叠，而COCOWholeBody用户的这一比例为19%。

3. Problem Definition and Proposed Method（问题定义和建议方法）

3.1 Problem Definition

给定一个图像I∈^RH×W×3，我们的目标是:
（1）检测边界盒位置 H = {h_i∈R⁴: 1 ≤ i ≤ m} 和 B = {b_j∈R⁴: 1 ≤ j ≤ n}。
这里，m和n表示图像I中的手和身体的数量。
每个边界框由其左、上、右、下位置的4维向量表示。
(2) 对于每只被检测的手 h∈H，我们需要关联一个物体 b∈B，满足以下两个约束条件: a) 每只手h∈H恰好与一个身体b∈B相关联; b) 每个体b∈B在H中最多可与两个hand相关联。
注意，我们把人的任何可见区域都看作是身体。
因此，当检测器未检测到任何人时，即B =∅，我们将手边界框作为其对应的人边界框。

3.2 Architecture Overview

我们在图2中说明了所提议的体系结构。
给定一个输入图像，我们使用ResNet获取主干特征，使用Region Proposal Network获取对应于两个对象类的建议: 手和身体。
然后，我们使用RoIAlign操作提取与这些建议对应的特征，并执行bounding box回归和mask生成。
对于每只检测到的手 h∈H ，我们使用新的HandBody Association Network来估计条件似然 P(b|h)，在所有被检测物体 b∈B上。
条件P(b|h)表示身体b与手h相关联的概率。
我们使用P(b|h)作为手和身体之间的二部图（bipartite graph）的权重，并提出手-身体关联问题，以寻找满足第3.1节中问题定义所描述的约束条件的最大权重分配。
最后我们使用匈牙利算法 （Hungarian Matching）得到了该匹配问题的解。
我们实现了Hand-Body Association Network作为MaskRCNN的一个新分支，并与MaskRCNN的其他组件端到端一起训练这个模块。

3.3 Hand-Body Association Network

Hand-Body Association Network的输入是被检测到的手H和身体B的集合。
对于每个检测到的手实例 h∈H，输出条件似然 P(b|h) 在所有物体 b∈B上。
当身体b属于手h时，概率P(b|h)是高的，否则它是低的。
我们证明，在一些独立的假设下，项P(b|h)可以分解为两个项的乘积： h和b之间重叠（overlap）的和b上的位置密度 （positional density）:
要明白这一点，我们首先注意到属于同一个人的手和身体之间的重要关系。由于手是人体的一部分，属于同一个人的手边界框和身体边界框必须有正重叠。换句话说，如果手和身体没有重叠，它们就不可能属于同一个人。然而，反过来就不成立了，手和身体可以重叠，即使它们属于不同的人。
形式上，如果我们让 I_h,b是一个指示随机变量，表示是否h和b有重叠，我们有
我们可以用I_h,b∈{0,1}的总概率和条件定律来表示
结合式(2)和式(3)，得到
独立假设P(I_h,b = 1|h) = P(I_h,b =1)将式(4)化简为式(1)。
我们学习概率P(I_h,b = 1)使用Overlap Estimation Module和P(b | h, I_h,b = 1)使用 Positional Density Module。

Overlap Estimation Module

该模块以手部边界框h和身体边界框b对应的视觉特征为输入，估计它们重叠的概率。
具体来说，我们使用神经网络 f_overlap来建模 P(I_h,b = 1):= foverlap(h, b)。
我们执行 f_overlap 为MaskRCNN一个附加的分支，使用卷积和全连接层。
该网络模块计算量小，我们在训练过程中使用以下binary cross-entropy loss与MaskRCNN一起学习它们的参数:

在上面，Yh,b(gt)表示groundtruth，如果h和b重叠，Yh,b(gt)等于1，否则等于0。
注意，我们使用手和身体的外观特征来预测f_overlap(h, b)，而不是直接计算边界框h和b之间的重叠。这是因为重叠是两个区域之间相互的几何信息。利用手和身体的外观特征学习手和身体之间的相互几何信息，使学习丰富的判别表示对手和身体的关联有用。我们在实验中证明了这一点。

Positional Density Module

我们使用这个模块来建模Eq.(1)中的项P(b | h, I_h,b = 1)。
具体地说，给定任意手h，对于任意可能的身体位置b和I_h,b = 1，我们使用以下分布来建模该概率
在上式中，µh/body∈R4是相对于手h的平均身体位置，bh是相对于手h的body box 坐标b的编码，σ是一个可调的超参数。
更具体地说，受FasterRCNN中的边界盒回归公式的启发，我们使用

(hx, hy)表示h的中心坐标(x, y)， hw和hh表示h的宽和高。
同理，(bx, by)表示b中心的(x, y)坐标，bw和bh表示b的宽度和高度。
我们利用手h的外观特征和边界框位置来预测公式(6)中的u_h/body.
直观地说，手的外观特征和位置为估计其身体位置提供了一些线索。
然而，直接从手的特征定位身体可能是困难的，因为手和身体之间的相对比例的巨大变化和人与人之间的相互遮挡。
因此，我们首先在可能的位置上估计一个密度，并使用这些密度值使用匈牙利算法找到所有手-身体对的兼容匹配。
如果身体b远离估计的平均身体位置µ_h/body，则P(b|h, I_h,b = 1)较小，因此根据Eq. (1)， P(b|h)也较小。
我们可以有效地实现网络f_density作为MaskRCNN的一个附加分支使用卷积和全连接层。
我们将f_density与MaskRCNN端到端训练在一起，通过最小化smooth-L1 loss between预测的µ_h/body和与手h相关的groundtruth body b^h (gt):

3.4 Training Objective

通过优化以下多任务丢失，我们将提出的手-身体关联网络与MaskRCNN端到端一起训练:

在这里，Lcls, Lbox, Lmask表示分类，边界盒回归，以及检测的分割掩码损失。
手部关联损失，定义为

标度因子λ1和λ2是可调超参数，表示重叠估计和位置密度估计之间的相对重要性。

3.4 Hungarian Hand-Body Assignment

给定一组被检测的手H = {hi: 1≤i≤m}，身体B = {bj: 1≤j≤n}，以及从手-身体关联网络中估计的条件分布P(b | h)，我们需要一种分配策略来匹配手和身体的约束条件，这些约束条件在3.1节中描述。
我们遵循bipartite matching strategy和使用P(b|h)为bipartite graph中手h与身体b之间的权重。
我们使用匈牙利算法（Hungarian Algorithm）在被检测的手H和身体B之间获得了一个最大的加权分配。
注意，匈牙利算法只匹配一只手和一个身体，但它也产生了一个不希望的结果:每个身体最多只能匹配一只手。然而，我们需要身体和双手的灵活性。
我们为此提供了一个简单的解决方案，即复制B，以确保每个主体在运行匈牙利算法。这确保了一个身体可以有两个与之相关联的手。

4. BodyHands Dataset

本节描述BodyHands，为开发和评估手-身体关联方法而收集的新数据集。
BodyHands是一个大规模的数据集，包含无约束的图像，带有手部和身体位置和对应关系的注释。

4.1 Dataset Source

我们从ContactHands数据集的图像开始构建BodyHands数据集. ContactHands是一个大型数据集，包含无约束的图像，用手多边形位置及其接触状态注释。
它的图像来自流行的数据集，比如MS COCO， PASCAL VOC， Oxford-Hand，TV-Hand和COCO-Hand。

4.2 Annotation and Quality Control

我们雇佣了几个注释工人来注释我们的数据集。
在ContactHands数据集中每个人的手部注释实例中，我们要求注释器在人周围画一个矩形边框，并输入手部和身体的识别号。
属于同一个人的手和身体具有相同的识别号码，因此充当手和身体之间的联系。
我们要求注释人员画出人的边界框，以包括人的所有可见部分。
我们还指示注释者确保每个主体最多有两只手与之关联，而且每只手恰好与一个主体关联。因此，我们数据集中的每个手部实例都有一个与之相关的身体。
当手是人的唯一可见区域时，我们使用手边界框作为人的边界框。
我们批量收集注释，并亲自手工验证注释结果。

4.3 Statistics

BodyHands数据集有20,490张图片，其中手部有57,898个带注释的多边形，人体有63,095个轴平行矩形边界框。
19,810人有一只手有注释，19,044人有两只手有注释，24,241人没有注释手(因为他们的手要么遮挡要么太小)。
我们使用相同的训练和测试分割ContactHands数据集向后兼容。图3显示了一些代表性的图像。

5. Experiments

5.1 Hand-Body Association Experiments

5.1.1 Evaluation Metrics

我们使用标准VOC平均精度(AP)度量来测量手部检测性能。
为了衡量手-身体关联的表现，我们考虑了两个指标：
（1）Conditional Accuracy for body association
我们将其定义为在正确检测到的手实例中正确关联的体的百分比。
这里我们定义，如果关联体框和对应的GT体框之间的交集/并(IoU)大于0.5，则该体与手相正确关联。
我们称之为条件精度，因为我们只考虑与正确检测到的手实例相对应的关联体。
需要注意的是，如果检测到的手部边界框与GT边界框之间的 IoU大于0.5，则手部检测是正确的。
(2) Joint AP for hand detection and body association
在这个度量中，如果检测到一只手被认为是true positive，如果：（a）被检测手的边界盒与GT边界盒之间的交并(IoU)大于0.5；（b）被检测手实例关联的身体边界框与GT身体边界框之间的IoU大于0.5。

5.1.2 Competing Methods and Comparison Results

我们在表1中总结了结果。该方法的性能明显优于其他方法。

我们将在下面的比较中描述这些方法。

2D Human Pose
我们运行不同的2D姿态估计方法，如OpenPose、Keypoint Communities和DOPE来获取手部关键点和身体关节。
利用这些关键点和节点，我们得到了手部边界框和相应的身体边界框。
我们使用一个不那么严格的评估协议，因为检测到的手的关键点可能非常嘈杂:我们认为一个手是真正的，如果它的边界框有正IoU和一个GT边界框。
这些方法不能很好地执行，因为在无约束条件下获得准确的手和身体姿势是具有挑战性的。
MaskRCNN + X
我们使用ResNet101主干来训练MaskRCNN来检测手和身体。
然后我们使用匈牙利匹配算法来匹配手和身体，使用几个成本函数（cost functions）：
（1）Feature Distance：首先提取MaskRCNN的手和身体的bbounding回归1024维特征向量，然后使用这些特征向量之间的L2距离。
（2）Feature Similarity：首先提取MaskRCNN的手和身体的bbounding回归1024维特征向量，然后使用这些特征向量的内积。
（3）Location Distance：使用被检测到的手和身体边界框之间的L2距离。
（4）IoU：使用检测到的手和身体边界框之间的IoU。

5.1.3 Ablation Studies

我们进行了消融研究，以研究所提出的方法的不同成分的影响。
具体来说，我们使用BodyHands训练集训练三个不同的模型：
（1）the proposed method without the Overlap Estimation Module
（2）the proposed method without the Positional Density Module
（3）the proposed method using overlap computed from hand and bounding boxes instead of Overlap Estimation Module
这些方法在BodyHands测试集上的Joint AP分别为59.03%，50.29%、60.34%。
这些结果表明，Overlap Estimation Module和Positional Density Module都有助于手-体关联。

5.1.4 Qualitative Results

图4显示了我们方法的一些定性结果和失败案例。失败的情况主要是由于错误的手检测和错误的身体关联，特别是在拥挤的图像。

Python机器学习实战：使用Flask构建机器学习API AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：使用Flask构建机器学习API作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域，模型训练和部署一直是重要的挑战。传统的机器学习项目往往采用独立的脚本或复杂的流程，难以实现模型的自动化、可视化和复现。为了解决这一问题，将机器学习模型封装成可访问的API变得越来越流行。Fla
Django框架的全面指南：从入门到高级步入烟尘 Python超入门指南全册 django sqlite 数据库
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
Sijia_y的个人经历以及计算机行业发展 Sijia_y python
如今互联网发展的速度甚是快，以至于技术都在更新迭代。稍有不注意可能就会被淘汰甚至是替代。作为一名中专生，我的成绩也是很差。因为高中考不上的缘故，来到了江苏上学。计算机行业我了解的并不是很多，当时只是听说工资高，铁饭碗。我是一个很懒的人，也是很贪玩。并没有学习很高的兴趣。我接触编程语言，完全是因为我的朋友。因为他是自学C语言的，后面他参加比赛得奖了。我就觉得非常厉害。我就开始学习Python，学会一
第 146 题「LRU缓存机制」（手撸LRU算法）冰火同学力扣缓存数据结构算法
首选用比较通俗的语言来讲一讲LRU算法，那手机内存来举例子，就是当内存超出了手机设置的内存后，就要删除了内存，那删除那部分内存呢，LRU算法就是提供一个策略来选择那些需要缓存需要被删除掉，就是谁隔得最远就删除掉谁。LRU算法的描述怎么描述呢，其实上述描述的就是LRU算法要实现的逻辑只不多是人能理解的活，那么如何从写代码的角度来说一下实现LRU算法的逻辑呢，这个时候就要通过基础的数据结构结合来讲LR
为什么Python使用者远远大于perl perlpython
不认为两者的语法差异是造成如此局面的主要原因.perl的语法虽然比较特立独行,但也不是很难.总结如下原因:library(或者叫package)的使用如果是本语言原生的library,那没有问题.如果是需要调用外部函数/过程的package的话,那么就会有巨大的差异.python是预编译然后从pypi上下载python(pip)将package下载到本地然后解压后将package内容安装到不同的指
AI 问答系统实战：用 Python + Flask + LLM 打造你的智能对话机器人！ Leaton Lee 人工智能 python flask
开篇互动：你是否想拥属于自己的AI问答机器人？“你是否想过拥有一个可以随时为你解答问题、提供建议的AI助手？”随着大语言模型（LLM）的快速发展，打造一个智能问答系统已经成为可能！本文将手把手教你如何利用Python和Flask快速搭建一个属于自己的AI问答系统，并集成强大的语言模型（如OpenAI的GPT-3.5或HuggingFace的LLaMA）。无论是技术小白还是有一定经验的开发者，都能轻
【TVM教程】为 Mobile GPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：LianminZheng,EddieYan针对特定设备的自动调优对于获得最佳性能至关重要。本文介绍如何调优整个卷积网络。TVM中MobileGPU的算子实现是以template形式编写的。该template有许多可调参数（tile因子
从单品到全盘：解锁服装商品企划的全局密码 xss
全局思维，服装行业的胜负手？在如今的服装行业，竞争可谓是白热化状态。从繁华都市的街头巷尾，到电商平台的虚拟世界，各类服装品牌如雨后春笋般涌现，让人目不暇接。大到国际知名品牌，小到街头巷尾的小众潮牌，都在想尽办法吸引消费者的目光。在这个竞争激烈的大环境下，价格战、设计比拼、营销大战等各种竞争手段层出不穷。价格战中，品牌们为了吸引顾客，不断压低价格，利润空间被一再压缩；设计上，大家绞尽脑汁，紧跟潮流甚
入坑 Python 全能实战小白训练营，470 集干货 12.9G 大揭秘！七七知享 Python python 开发语言 pandas numpy matplotlib java php
家人们，我最近挖到了一个Python学习的宝藏——Python全能实战小白训练营。整整470集，内容超丰富，资源包有12.9G，完全就是为咱们这些想系统学习Python的小白量身定制的。接下来就给大家好好唠唠。随着课程深入，会涉及到Python的各种高级特性，比如面向对象编程、模块与包的使用。在讲面向对象编程时，老师通过打造一个小型游戏角色系统，把类、对象、继承、多态这些抽象概念诠释得生动形象，让
深度学习训练中GPU内存管理 @Mr_LiuYang 遇到过的问题内存管理内存溢出 out of memory GPU内存
文章目录概述常见问题1、设备选择和数据迁移2、显存监控函数3、显存释放函数4、自适应batchsize调节5、梯度累积概述在深度学习模型训练中，主流GPU显存通常为8GB~80GB，内存不足会导致训练中断或BatchSize受限，GPU内存管理是优化性能和避免OutOfMemoryError的关键挑战。本博客简介PyTorch中GPU内存管理的核心函数、用法和实战技巧，帮助开发者高效利用显存资源。
深度学习pytorch之简单方法自定义9类卷积即插即用 @Mr_LiuYang 计算机视觉基础卷积类型非对称卷积深度卷积空洞卷积组卷积深度可分离卷积动态卷积
本文详细解析了PyTorch中torch.nn.Conv2d的核心参数，通过代码示例演示了如何利用这一基础函数实现多种卷积操作。涵盖的卷积类型包括：标准卷积、逐点卷积（1x1卷积）、非对称卷积（长宽不等的卷积核）、空洞卷积（扩大感受野）、深度卷积（逐通道滤波）、组卷积（分组独立处理）、深度可分离卷积（深度+逐点组合）、转置卷积（上采样）和动态卷积（动态生成卷积核），帮助读者理解如何通过调整参数灵活
PyCharm 对接 DeepSeek 大模型的详细操作流程程之编 pycharm ide python
以下是使用PyCharm对接DeepSeek大模型的详细操作流程，基于Python开发环境。假设你已具备DeepSeekAPI的访问权限（需提前申请APIKey）：步骤1：PyCharm环境准备创建新项目打开PyCharm→NewProject→选择纯Python项目→指定项目路径→创建虚拟环境（建议选Virtualenv）。安装依赖库打开终端（Terminal）执行以下命令：pipinstall
一学就会的深度学习基础指令及操作步骤（5）使用预训练模型小圆圆666 深度学习人工智能 python 卷积神经网络
文章目录使用预训练模型加载预训练模型图像加载与预处理预测使用预训练模型查看模型库和常用模型加载预训练模型fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16_Weights#VGG16的预训练权重配置#loadtheVGG16network*pre-trained*ontheImageNetd
NTIRE比赛：技术前沿、国内企业表现与计算机视觉未来展望 AndrewHZ 深度学习新浪潮计算机视觉人工智能深度学习调研报告算法 NTIRE 画质算法
一、NTIRE比赛概述：图像恢复与增强领域的全球竞技场1.1NTIRE的定位与历史NTIRE（NewTrendsinImageRestorationandEnhancement）是计算机视觉领域最具影响力的国际赛事之一，聚焦于图像恢复与增强技术的前沿探索。自2017年首次举办以来，NTIRE每年与计算机视觉顶会CVPR联合召开，成为学术界与工业界技术实力的重要展示平台。其竞赛内容涵盖图像超分辨率、
深度学习PyTorch之数据加载DataLoader @Mr_LiuYang 计算机视觉基础深度学习 pytorch 人工智能
深度学习pytorch之简单方法自定义9类卷积即插即用文章目录数据加载基础架构1、Dataset类详解2、DataLoader核心参数解析3、数据增强数据加载基础架构核心类关系图torch.utils.data├──Dataset(抽象基类)├──DataLoader(数据加载器)├──Sampler(采样策略)├──BatchSampler(批量采样)└──IterableDataset(流式数
量子计算如何颠覆能源优化领域：从理论到实践 Echo_Wish 人工智能前沿技术量子计算能源
量子计算如何颠覆能源优化领域：从理论到实践大家好，我是Echo_Wish，一个热爱探索前沿技术的人工智能与Python领域的技术分享者。今天，我们将深入探讨一个激动人心的话题——量子计算在能源优化中的应用。这不仅是科技领域的全新趋势，也可能为全人类的能源利用效率带来革命性突破。从理论模型到实际应用，量子计算已经在一些能源相关领域崭露头角，例如电网优化、可再生能源分配和物流节能规划。以下，让我们一步
电力行业中的AMI系统小赖同学啊人工智能服务器网络运维
在电力行业中，AMI系统（AdvancedMeteringInfrastructure，高级计量基础设施）是一种集成了智能电表、通信网络和数据管理系统的现代化计量体系。AMI系统能够实现电力公司与用户之间的双向通信，提供实时用电数据，支持远程抄表、负荷管理、故障检测等功能，是智能电网的重要组成部分。以下是AMI系统的核心组成、功能、优势及其在电力行业中的应用：AMI系统的核心组成智能电表（Smar
Kibana 单机与集群部署教程闲人编程大数据集群部署教程大数据集群单机部署 Kibana 日志分析数据可视化
目录Kibana单机与集群部署教程第一部分：Kibana概述第二部分：Kibana单机部署教程1.安装Kibana1.1安装依赖项1.2下载和安装Kibana1.3启动Kibana2.单机案例代码实现（Python）3.常见问题及解决方法3.1无法启动Kibana服务3.2Kibana无法连接到Elasticsearch第三部分：Kibana集群部署教程1.配置集群节点1.1配置Elasticse
卷积神经网络（笔记01）天行者@ cnn 人工智能深度学习
视觉处理三大任务：分类、目标检测、图像分割CNN网络主要有三部分构成：卷积层（ConvolutionalLayer）、池化层（PoolingLayer）和激活函数一、解释卷积层中的偏置项是什么，并讨论在神经网络中引入偏置项的好处。在卷积神经网络（CNN）的卷积层里，卷积操作本质上是输入数据与卷积核（滤波器）进行逐元素相乘再求和的过程。偏置项（Bias）是一个额外的可学习参数，对于每个卷积核而言，都
INCA二次开发GUI实例化智海行舟 python 个人开发
【摘要】本文基于ETASINCA二次开发实践，深入探讨如何构建完整的自动化测试GUI系统。通过Python语言结合COM接口技术，实现从软件架构设计到功能模块开发的完整闭环，为汽车电子领域工程师提供可复用的开发范式。一、INCA二次开发技术背景1.1行业应用需求在汽车电子开发领域，ETASINCA作为行业标准标定工具，其自动化测试需求日益增长。传统的手动操作模式存在以下痛点：重复性操作耗时严重（单
如何通过API用Python获取北向资金流向数据？量化问财量化软件 QMT 量化交易 Python 量化炒股 PTrade QMT 量化交易量化软件 deepseek
推荐阅读：《【最全攻略】免费的量化软件有哪些？券商的交易接口怎么获取？》如何通过API用Python获取北向资金流向数据？北向资金指的是通过沪港通和深港通渠道，从香港市场流入A股市场的资金。对于投资者来说，了解北向资金流向对于把握市场趋势和投资决策具有重要意义。本文将介绍如何通过API用Python获取北向资金流向数据。理解北向资金流向数据北向资金流向数据主要包括以下几个方面：资金流入量：指通过沪
go执行java -jar 完成DSA私钥解析并签名 DavidSoCool java jar golang
起因，最近使用go对接百度联盟api需要使用到DSA私钥完成签名过程，在百度提供的代码示例里面没有go代码的支持，示例中仅有php、python2和3、java的代码，网上找了半天发现go中对DSA私钥解析支持不友好，然后决定使用在java中完成签名计算过程，生成可执行jar后由外部传入参数获取签名数据。百度联盟api文档说明：1）权限开通后，登录百度联盟媒体平台（union.baidu.com）
针对AF调试过程中PD多窗机制是如何打分的爱写BUG的长歌人工智能计算机视觉算法
在AF（自动对焦）调试中，PD多窗机制（PhaseDetectionMulti-Window）是提升相位对焦精度和鲁棒性的关键技术，其核心是通过在画面中划分多个相位检测窗口，分别计算各窗口的相位差（PhaseDifference）并进行综合评分，最终选择最优对焦位置。以下是其打分机制的核心逻辑和调试要点：1.多窗口布局与权重分配窗口划分根据Sensor的PDAF像素分布，将画面划分为多个区域（例如
仅仅使用pytorch来手撕transformer架构(4)：解码器和解码器模块类的实现和向前传播 KangkangLoveNLP 手撕系列 #transformer pytorch transformer 人工智能深度学习 python 机器学习
仅仅使用pytorch来手撕transformer架构(4)：解码器和解码器模块类的实现和向前传播仅仅使用pytorch来手撕transformer架构(1)：位置编码的类的实现和向前传播最适合小白入门的Transformer介绍仅仅使用pytorch来手撕transformer架构(2)：多头注意力MultiHeadAttention类的实现和向前传播仅仅使用pytorch来手撕transfor
【30天玩转python】项目实战：从零开始开发一个Python项目爱技术的小伙子 30天玩转python linux 运维服务器
项目实战：从零开始开发一个Python项目在学习Python的过程中，开发一个完整的项目是非常重要的实战练习。它不仅能够帮助你巩固所学的知识，还能提高实际编程能力。本文将带领你从零开始开发一个Python项目，介绍从项目规划、环境搭建、代码实现到项目发布的完整过程。我们将以一个简单的“任务管理系统”为例，逐步讲解如何构建、测试和优化这个项目。1.项目规划1.1项目简介我们将开发一个基于命令行的任务
Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
python递推法_如何使用Python递归函数中的递推？热茶走 python递推法
我们大家都知道，一个函数可能存在多种不同的用法，很少是有函数只针对一个方式，那么基于一种函数，我们肯定要了解多个方式，今日针对递归函数里的递推内容给大家介绍哦~递归是什么？是指函数/过程/子程序在运行过程序中直接或间接调用自身而产生的重入现象。下面是个人理解：递归就是在函数内部调用自己的函数被称之为递归。实例：#直接调用自己：deffunc:print('fromfunc')funcFunc#间接
python递推式_Python 递推式构造列表(List Comprehensions) man One python递推式
你需要构造一个新的列表,列表中的元素是从一个已知列表中的元素计算而得到的.比如你要创建一个列表,里面的元素是另一个列表中的元素加23后得到的.使用递推式构造列表是最理想的方法:thenewlist=[x+23forxintheoldlist]如果你希望用一个列表中大于5的元素构造一个新的列表,使用递推式也是很方便的:thenewlist=[xforxintheoldlistifx>5]如果你希望将
转基因大豆检测仪：快速精准识别，确保大豆安全品质 tianhe8888_ 转基因检测仪转基因检测设备
【TH-ZJY1】在现代农业与食品工业中，转基因作物的安全性一直是公众关注的焦点。为了确保大豆及其制品的安全品质，转基因大豆检测仪应运而生。这种高科技设备以其快速、精准的检测能力，为大豆产业链的安全监管提供了有力支持。一、工作原理基因检测技术转基因大豆检测仪主要依赖于先进的基因检测技术，如聚合酶链反应（PCR）、荧光原位杂交（FISH）或基因芯片等。这些技术能够特异性地识别大豆DNA中的转基因片段
Dash 简介 tankusa dash
Dash是一个基于Python的开源框架，专门用于构建数据分析和数据可视化的Web应用程序。Dash由Plotly团队开发，旨在帮助数据分析师、数据科学家和开发人员快速创建交互式的、基于数据的Web应用，而无需深入掌握前端技术（如HTML、CSS和JavaScript）。Dash的核心优势在于其简单易用性和强大的功能。通过Dash，用户可以使用纯Python代码来构建复杂的Web应用，而无需编写繁
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

人体部位检测：BodyHands

Whose Hands are These? Hand Detection and Hand-Body Association in the Wild解读

摘要

1. 简介

2. Related Work

2.1 Hand Analysis

3. Problem Definition and Proposed Method（问题定义和建议方法）

3.1 Problem Definition

3.2 Architecture Overview

3.3 Hand-Body Association Network

Overlap Estimation Module

Positional Density Module

3.4 Training Objective

3.4 Hungarian Hand-Body Assignment

4. BodyHands Dataset

4.1 Dataset Source

4.2 Annotation and Quality Control

4.3 Statistics

5. Experiments

5.1 Hand-Body Association Experiments

5.1.1 Evaluation Metrics

5.1.2 Competing Methods and Comparison Results

5.1.3 Ablation Studies

5.1.4 Qualitative Results

你可能感兴趣的:(论文笔记,计算机视觉,深度学习,python,手检测)