郑琳潇

OpenMMlab社区开放麦＜第22期：姿态估计领域的前沿进展＞——笔记

姿态估计技术的发展对于行为分析、虚拟现实和自动驾驶等诸多应用都有着重要的意义。本期开放麦我们就邀请到了两位顶会顶刊论文作者和大家分享如何解决姿态估计中的前沿问题和一些新的姿态估计任务和解决方案。

姿态估计领域

什么是姿态估计

姿态估计又叫做关键点的检测。这个任务旨在预测人为定义的、具有明确语义的关键点的位置，比如说肩膀、膝盖等。

这里展示了一张图片，输入一张两个舞者的图片。然后姿态估计网络就会检测出这个人的各个关键点，比如说这个肩膀、膝盖、手臂等等。

姿态估计任务也是最近几年比较热门的一个研究领域。然后研究者们也提出了各种各样的子任务然后我们 MMpose这个框架当中也支持了很多很多的姿态估计的任务，比如说包括这种人体的关键点的检测，人脸的关键点的估计，还有这个手势的姿态估计等等。

姿态估计中应用的场景

它的应用场景其实非常的广泛，比如说在运动健身领域，这个姿态估计可以帮助人们帮助用户去判断自己的运动姿势是不是足够标准，是不是能起到锻炼效果。比如说在 VR 这种场景下，我们可以用手势的姿态估计去做手势的控制。还有像最近几年兴起的这种无人超市，可以用姿态估计的算法检测出人的购买行为。像在这种娱乐等领域，又有这种 VR 这种体感游戏等等，都是跟我们姿态估计非常相关的一些应用。

姿态估计中主要的困难与挑战

首先，是我们的人体姿态是非常多样的，这里列的这张图所示，例如在瑜伽这种很多很困难的很罕见的场景中，估计其实一直是我们的一个比较重大的难点。第二个，是在这种多人的场景下，挡问题是尤其是这种遮非常常见的。像这种人与人之间的遮挡，或者是人在比如侧身的时候，他一半的身子就会被遮挡，像这种互遮挡和自遮挡都会给我们的姿态估计提出比较严峻的挑战。第三个，像第三张图片里边还会有这种尺寸不一的情况，有一些比较近的人，她的尺度可能比较大。然后像离得远的人，她的尺度比较小。同时这个同一个人他的各个部位的尺度可能也不一样。比如说这个人的躯干它的尺度相对较大。然后人的面部表情这种关键点，它的尺度较小。而这种尺度较小的关点又要求它比较能够精确地定位。所以这个尺寸不一的问题也是一个比较困难的问题。最后，在实际应用当中，我们的姿态估计模型往往要部署在手机智能相机、 AI 传感器这种较低算力的场景下，那么就会对我们的模型的速度具有比较高的要求。

今天的分享也会围绕这些挑战来出发。那么就首先进入我们第一篇工作的分享，这篇工作是我们在 ECCV 2022 刚刚发表的一篇工作，叫 Pose Trans 然后给大家起一个比较好听的中文名字，让数据集中的人体动起来。然后这个工作我们其实提出了一个比较简单有效的数据增强的算法，来能够帮助姿态估计的精度提升。PoseTrans: A Simple Yet Effective Pose Transformation Augmentation for Human Pose Estimation

Pose Trans

首先是研究的动机，把现有的 coco 数据集做了一个姿态的聚类。下面这张图就展示了一个聚类的效果，其中，横轴就是我们聚成了 20 个类别。这个柱状图展示了我们每个类别它的频率。也就是它的这个姿态的数量。这个折线图展示了每一个类别它的一个预测精度。
其实我们会发现大量的姿势其实都集中在一些头部类上，比如这种站立的姿姿势，在这种姿势的精度也会非常的高，那可能有 80 多。然后像这些在尾部类的姿态，它们在数据集中的占比相对较小，然后它们的精度也比较低。总而言之，在这些数据集中其实是普遍存在着人体姿态分布的不均衡的问题或者叫做长尾的问题，就很难去覆盖多种多样的人体姿态。
为了解决这个问题，产生了一个直观的想法就是能不能去生成出来这种更多丰富的这种罕见的姿势，我们把这个数据的分布调整一下，能让它更加的均衡，这样就能够解决这些罕见姿势的预测问题。这也就是我们这个工作的一个出发点。我们的这个工作主要包括两个模块，下面先分别介绍两个模块，然后再介绍整体的一个算法流程。

1、PCM人体姿势聚类模块

这个姿势聚类其实非常简单，一共就分为三步。
第一步，就是归一化，会对所有的训练样本（根据人体检测框）进行人体姿态的一个规划。
第二步，把这个归一化后的人体关键点的向量去拟合一个高斯混合模型。这样做姿态的聚类，我们会把它聚类成 20 类，这里就会自然地聚类成这种站立或者侧身或者蹲着的这种不同的姿势。
第三步，有了这样拟合好的高斯混合模型之后，就可以拿它去做预测。我们给定一个输入的图片，就能预测出它是属于哪一个类别，同时能够知道它归属于各个类别的一个高斯分量的概率。

2、PPM姿势变换模块

给定一张原图+姿势的分割结果，我们去生成一张新的姿势的一张图片。
具体做法：
首先会根据这个人体图像的分割结果，将原图像分为人体的各个肢体（limbs）还有就是擦除了人的肢体的一个躯干的图片。
接着把这个人体姿态的变化建模成了每一个肢体的仿射变换，然后把每一个肢体做随机仿射变换之后再重新和这张擦除掉肢体的这个躯干图片做一个组合。就得到了我们一个新的图片。
这张新的图片就是相比于之前的这个原图，就是会动一动这个胳膊，动一动腿。就产生了新这个一个新的姿势。

3、Pose Trans框架

生成data imitation的过程：
1、就是给定一张原图之后，我们会对它做human parsing得到每一个肢体的分割结果。我们有了这个分割结果，再加上原图，就可以对这个肢体做姿态的变换（PTM）。
2、姿态变换之后有一些变换的肢体其实不符合人的人的自然的骨架的形式。这些不符合自然骨架的图像或者是生成的这个图像质量比较差，那这些就是不合格的一些图片，我们就会把它删掉。
3、对于这些合格的图片，我们可能会产生多种多样的姿势。就会形成一个Candidate Pose Pool，这个Pose Pool里就可能有一些候选的生成的结果。接下来我们会对这个候选的结果去判断它们的罕见程度。（这一步骤使用的就是PCM模块）
4、使用PCM模块后，把它聚成若干类，比如这个例子里，会把它聚成了三类，这个 A 类是站立的肢体，然后 B 类是侧身的，C 类是坐着的。
这张图在经过我们的聚类模块之后，它就会得到这样一个聚类结果，它以 0.3 的概率属于这个 A 类，然后 0.4 的概率属于这个 B 类，0.3的概率属于这个 C 类。我们发现在这三张图当中，这一类是相对来说最罕见的，因为它的这个 C 类这个罕见肢体的概率比较高。这样的话我们就会选择这个比较罕见的一个肢体作为我们的训练样本。

姿态变换效果图：

可视化效果对比：
实验结果：

与其他数据增强算法、其他长尾算法对比：

接下来的要介绍的这篇工作其实是解决遮挡问题。然后这篇工作的题目叫做HDR：基于去遮挡和干扰移除的 3D 交互双手姿态估计。3D Interacting Hand Pose Estimation by Hand De-occlusion and Removal

HDR

首先它研究的动机，在这种双手交互的一个图片当中，预测出两只手的关键点的坐标。这里就有两个比较大的难点。
第一个难点是：这个左右手可能存在严重的互相遮挡，难以估计被遮挡的手的姿态。比如说下图，他的右手就被左手基本完全遮挡住了。那其实右手有很大部分其实是看不见的，预测这个看不见的区域就比较困难。
第二个难点是，左手和右手的纹理非常的相似，而且对姿态估计网络来说是有一点歧义性的。我们预测一只手的时候往往会被另一只手干扰。比如说像下图，他想预测右手的关键点，但是他有一些关键点预测到了左手上。这其实也是我们不想看到的。

为了解决这两个难点，所以这就是我们出发点，我们希望把双手的一个图片变成一张单手的图片，这样就可以利用我们现成的单手姿态估计的网络去做一个精准的估计。就能够得到一个比较准确的关联点。

算法流程

我们算法流程其实包括三个模块。分别是HASM、HDRM、SHPE。

HASM（Hand amodal segmentation module）手势分割模块

它的目的就是说输入一张双手的图片，然后它去生成出来左手和右手这种可见部分的分割结果，同时还要预测出它的一个脑补结果，就是说它假设它没有被遮挡，这个手应该长成什么样子。有了这个脑补结果之后，就能够对我们的手做一个粗略的定位，就能够画一个这样的检测框。我们会分别把这个左、右手部分然后输入到 HDRM 里。

HDRM（hand De-occlusion and Removal Module）去遮挡、去干扰模块

比如说针对上图来说，经过HASM后得出的右手，输入HDRM模块，它就会只保留它的右手的一个完整的区域。同理，输入左手，它会得到一个左手的一个完整的一只左手。

SHPE（Single Hand Pose Estimation）单手姿态估计网络

使用一个现成的单手姿态估计网络就能够得到一个比较精准的 3D 人手的估计结果了。

HDRNet——去遮挡模型

这个模块它的网络结构也比较简单，就是一个UNet+partial Convolutions，然后又加了一些 transformer 的 block 来增强我们特征提取的能力。
如上图，它的输入是有被遮挡区域的图片+它的右手有的一个可见部分的 mask +需要移除的部分的一个 mask 图片+背景区域的图片。这个网络需要学习的是用这个背景区域的信息来填充上这个需要移除的区域。同时它还要利用这个可见部分的信息，然后去填充上这个遮挡部分，就能够得到一个比较完整的这个手势的图像。
训练损失就包括一些生成式的Gan的损失还有一些图像迁移相关的一些损失。为了训练我们这一个模型，是需要一个比较大量的数据集的。
数据集的获取，其实是构造了两个虚拟合成的数据集，一个叫做AIH_Syn和一个叫做 AIH_Render。
AIH_Syn的构造方式比较简单，它其实就是把两张单手的图片，把它用贴图的方式贴在一起，这样就能得到一个双手的图片。（这个数据集能够知道每个手的mask 、每个手的可见部分的 mask 、不可见部分的 mask 以及它去遮挡之后的原图应该是长成什么样子）但是这种方式生成的这个手，它的双手是没有交互的，就它只是一个简单的贴图，这个双手之间是没有一个交互关系的。
AIH_Render的生成方式是利用人手的mesh，然后对这个 mesh 进行渲染，渲染出不同的颜色的皮肤，再把它投影到2d 的图片上，就能够得到比较真实的这个双手的姿态。同时他们的这个手势的是个手的纹理能够也能够进行变化。
在实验上，作者一共生成了大概有 200 多万的这样一个数据集，然后用于训练我们的 HDR 网络。这里再展示一下我们的一个实验结果。

实验结果

可视化效果

ZoomNAS

这一块主要以一下三点来介绍ZoomNAS，论文ZoomNAS：Searching for Whole-body Human Pose Estimation in the Wild。
第一个,首先我们提出了一个去考虑这个人在不同part之间的一个相互关系。采用一个 zoom in的方式去提出了这套ZoomNet,去更好地去预测这个像脸和手这样子一个区域比较小的一个关键点。
第二个,我们提出了这个 zoom NAS 的方式，然后在网络结构上包括 sub-module之间的关系上进行一个搜索，并且进行sub-module 之间的这个资源的自动分配。那使得我们这个整一个就是 wholebody 的预测的效果进一步的提升。
第三个,我们提出了这个这个 coco-wholebody的这个数据集，那么使得这个研究方向可以进一步的推进。这个是我们做的一个关于wholebody的一个工作。

Whole-body Pose Estimation（两个方式来做whole body任务）

whold body任务，就是说希望去对这个人进行一个更全面一些关键点的探索。那么由于我们在实际的应用当中，其实除了一些人的整体的姿态以外，我们也希望去了解他的表情和一些手势。所以说我们这个后 body 任务，它本身就是除了关注这个 body的整个的信息以外，还会关注这个人脸、人手和人教的一些关键点。

OpenPose

它尝试使用各种多个模型来分别解决不同的这个 part 的一个 key point 的一个问题。因为我们常规的来说，是用这个body dataset然后设计一个 body 的网络，来预测这个 body 的key point，所以它还是沿用了这套方式，就是说对于 body 在 body 数据上去进行训练，然后设计一个单独的网络，同时对于这个 hand 和 face 也是用类似的方式去做。
缺陷：这种方式其实就是把整个人体给解耦开来了，所以它没有很好地去利用一个全身的信息，那么也没有办法进行一个 end to end 的一个训练。

Single-Network

为了规避用多个模型的问题，所以设计了一个统一的模型。这个模型它能够同时地去预测这些关键点。但是由于这个没有一个whole body的一个数据集，所以它不得不在这个 body 的数据集上去训练一些 body的关键点，然后在hand和face数据上又去训练这个对应的关键点。
缺陷：它可能会引入一些不同数据集带来的一些传送，那也正是基于之前我们观察到的是这样的一个问题。我们认为它这个数据缺失是做这个任务一个很大的目前是存在的一个挑战。

COCO-WholeBody Dataset

为了解决上面所提到的问题，作者去设计了一个叫做coco-wholebody的数据集。这个数据集是基于我们做这个多人在户外的姿态估计最流行的这个 coco 这个数据集去做的。那么 coco 这个数据集它本身是只有标注的body的key point的一些信息。

在这个数据集当中，作者又去标注了脸框和手框，其中，包括脸的key point和手的key point更多的一些信息。
从coco-wholebody这个数据集，可以看到它其实总共是标注了四种类型的这个框，包括人框、脸框还有两个手框，且用了 133 个关键点的标注。

半自动标注方式

实际上去标注人脸和人手是非常困难的，因为它可能存在一些尺度比较小甚至模糊、遮挡的一些情况。所以说直接去标注这个数据其实是会耗费非常多的一个成本。
因此我们去采取了一种半自动标注的一种方式。
首先，我们先去训一个比较好的一个大模型，然后先我们人为地去标这个脸框和手框，那标框其实是相对来说标注成本比较低的。
其次，在这个框内，我们去用大模型先去做一个伪标签的一个预测，然后再做人为的修改。
那么通过这样的一个半自动的标注方式，我们这个的标注时间有将近 90% 的一个减少。同时呢我们这个也通过验证，我们也证明了我们这个标注质量还是非常的高的。

wholebody任务的特点

通过分析，发现其实wholebody这个任务它最大的一个特点是在于它不同的部分之间的差异非常大。比如说它这个 body 这个整个躯干是一个比较大的一个尺度，但是这个脸和手它其实就是一个比较小的一个尺度。
那么如何同时解决好这个不同尺寸的一个问题，那么其实是解决好这个 whole body 这个问题的一个关键。那因此基于这样的一个观察，我们去提出了这个ZoomNet的这么一套就是解决方案。

ZoomNet

首次去使用一个 top-down 的一个模式去解决wholebody的问题。并且我们对于每一个人，去抓住它内部的一个结构信息，然后去进行一个更加精确的一个预测。
详细流程：
首先我们采取 top down 的方式，我们首先是说对于一张图里面，我们对每个人做一个检测。然后对于这检测出来这个人以后，我们对这个人进行一个单独的预测。
其次，在预测的过程当中，首先使用了一个BodyNet 网络，其中，BodyNet 一方面是预测我们这个人的整体躯干的一个关键点以及这个脚的一个关键点。另一方面我们去预测这个人的一个手框和脸框。
最后，得到了这个手框和脸框以后，我们利用两个FaceHead和HandHead去从这个BodyNet中去提取这个特征，然后进一步的对这两个部分进行一个预测。
所以其实在这两个head 进行预测过程中，我们会做一个Zoom in的操作。
就是说把这个区域给剪裁出来，然后放大到一个更高的分辨率下，那么使得就是这两个比较小的一个区域，它能够获得一个更高的精度。

所以说我们这个整体来看，BodyNet中我们使用的是一个 HRNet的一个网络，因为它也是去做 body 的 key point 预测的网络。
对于这个face和head这两个部分，我们用的这个sub-module分别用的是这个做face和hand这个比较流行的一个模型叫做HRNetV2，然后两个sub-module会从BodyNet中去提取对应区域的这个特征，再进一步的一个预测。
所以，整体来说就是利用这三个子模去组成了这个 whole-body 的key point 的一个预测方式。

ZoomNAS

思考：在这个过程中，我们还意识到一个新的问题，就是说由于这个 whole-body 这个任务它需要对于各个part 进行一个预测，那它用了三个 sub-module以后，势必带来就是说我们这个计算复杂度的一个增加。那么在实际使用的过程中，我们可能不光是关心这个精度，我们同时也会关心这个计算的效率。

基于这样的一个思考，我们进一步提出了一套叫做 ZoomNAS 的一个框架来采用这个neural architecture search（神经结构搜索）的一个方式。来更好地获取一个精度和速度之间的一个均衡。
那么具体而言的话，这套 ZoomNAS 的框架对几个维度进行了一个搜索。首先第一个就是网络的结构。其次，第二个是说这些sub-module 之间它的一个连接关系。

ZoomNASA中四个维度上的搜索

第一个是网络深度
第二个是我们网络的 channel 数。
第三个是我们去搜索在这个卷积中它的group number
第四个是我们去搜索每一个sub-module 的输入的resolution，包括就是输入的原图（比如 face那个分支它的特征的一个resolution）

在submodule之间，我们主要关注到两个问题。
第一个：对于我们这个 key point 预测，它其实是一个既需要 high level 信息又需要 low level 信息的一个任务。
因为这个high level信息可以帮助我们获得一些更鲁棒的效果，因为它可能对于一些遮挡的推测会更有帮助。那么low level信息它可以知道更多细节的定位的信息，所以会使得这个预测更准确。

思考时间~：那么这个 bodynet 它到底为这个 face head 它提供哪一个维度的？这个 feature 是 low level feature还是high level feature 其实是一个值得思考的问题。

第二个：ROI Expansion 我们想像搜索这么一个维度。这是什么意思呢？
就是说我们BodyNet去给这个 face 和 hand 预测了一个框，但是这个框它本身是一个预测的框，所以它其实并不是完全准确的。那么如果说这个框太小的话，它可能就没办法包含我们想预测的一些关键点，那它势必就造成了这些关键点丢失。那如果这个框太大的话，我们也知道肯定会造成这个预测精度下降，所以如何去选取这个框又是一个新的问题。
为了解决这个问题，一般我们采用了一些常规的方式，就是说我们对这个框可能做一定程度放大。那么这个放大的比例到底是多少？这个是不太确定的。所以在我们这套 NAS 框架里，我们就对网络的连接这两个维度进行了一个自动的搜索。

sub-module之间的资源分配

让这个网络它自动地去分配这个计算资源

通过我们这套搜索框架得到最终的结果是说给这个 bodynet 分配了将近 70% 的一个计算资源。
这个其实是因为我们这个 bodynet，它其实在wholebody的这个任务当中承担了非常重要的作用。一方面它预测了身体和脚的关键点，另一方面它也去给这个脸和手去预测了一个框。那么这个框它本身的话就是对于这两个就是脸和手的这个关键点，预测又非常重要。所以它这个 bodynet 它势必需要去获得一个比较准确的一个预测结果，因此它也被分配到了这个最多的一个计算量。

实验结果

可视化的结果

Pose for Everything

它对于各种各样的类别（比如，动物、车辆等等）都能够进行一个姿态的预测。这是这篇论文的一个初衷。这一块主要以一下三点来介绍，论文地址：Pose for Everything：Towards Category-Agnostic Pose Estimation
第一个，我们提出了这个类别无关的姿态估计（CAPE）这个任务。然后这个任务它可能是重要的，但是同时也是非常困难的。
第二个，我们去提出了一套解决的方案，叫做POMNet。也构建了一个 MP-100 的数据集来进行训练和测试。
第三个，展望。这个任务其实还是有很多可以继续探究的地方，它可能一方面是有价值的，另一方面也是非常困难的。那么可能可以引发更多未来的工作来进行一个探究。

研究动机

研究动机：解决不同类别之间的一个长尾分布问题。
因为我们知道自然界中各种类别也是长尾分布的。那么像有一些类别，比如说受到关注比较少，也有可能它本身数据比较少。但是事实上对它进行姿态估计也是非常重要的。比如像我们这个姿态估计领域，跟人相关的一个姿态估计，上文已经介绍了很多。那么刚刚说的，比如对于车相关的一个姿态估计，可以用在自动驾驶上。另外，比如说可能有一些关于这个衣服的一些姿态估计，它可能可以做一些换装的任务，所以说实际大家这个需求是非常多的。

从上图中，我们可以看到human相关的姿态，估计的这个数据集是最多的。它可能是占据了绝大部分的一个数据量。那其实对于另外的一些类别，可能相对它的数据量就会比较少，甚至有一些类别大家比较关注。但是实际事实上它缺少这样的数据。

CAPE——类别无关的一个姿态估计

基于上面所说背景的一个情况，首先我们定义了一个新的任务，这个任务就是类别无关的一个姿态估计。这个任务与之前的一些人有什么差异?
可以看到我们之前是如何来做这个姿态估计，这个任务是一个怎么样的一个范式呢？
首先，比如说现在想做一个人体的一个姿态估计，那么我们就收集一个人体的姿态估计的一个数据集。然后我们去设计一个对应的模型网络，在这个数据集上进行一个训练。然后训练完以后，它就可以对这个input的图像它做一个姿态的估计。
如果我想做一个新的任务，那我势必要去收集一个新的数据集，然后重复上面的过程。那这整个过程是非常繁琐的，需要花费很多时间去收集数据集、标注数据集等等。因此，提出CAPE。

首先，我们有一个类别无关的一个姿态估计的检测器，它可以在一个多类的物体上进行一个训练。同时的话在测试阶段，我们给定任何一个类别的物体，这个类别的物体，它可能是一个新类，它从来没有在这个训练类训训练中见过。（比如说这个椅子，它可能在训练类别中根本就没有椅子。那么给定任何一种新类以及它对应的这个关键点定义，就说我要预测这些关键点。那么它对于其他的椅子，它就可以去预测一个相应的 key point 一个结果。）那这是我们想做的一个任务的设计。那基于这个任务的话，其实过往的这个姿态估计的这个方式它已经都失效了，因为他们之前都是认为这个是用大量的数据，学一个回归的一个结果。

POMNet

为了做CAPE这个任务，作者设计了一套新的范式，叫做Pose Matching Network（POMNet）。
具体而言的话，就是利用一张给定的一个参考的图像，然后以及它上面给定的关键点的定义，利用这两个信息来提取这个关键点的一些特征，然后再拿这个关键点特征去和我们真正要去预测的这个图去做一些匹配，在各个位置上做匹配。如果这个最相近的那个位置，我们就认为它可能是这一个关键点的一个位置。那么大，这是我们整体的一个思路。
整个网络由三个部分构成：1、Feature Extractor 2、

Feature Extractor

对于support image：
首先利用一个特征提取去提取它一个全图的特帧。然后我们再利用这个对应的一个关键点的一个定义，然后把这个表征成这个heatmap的一个形式。然后把这个全图的一个特征和这个heatmap去做一个 pixel-wise的相乘，然后再利用一个average pooling来获取这一个关键点的一个特征。
对于query image：
利用另外一个特征提取器来提取这张 query image 的这个全图的特征。在这样做了以后，我们如果直接去对两者进行匹配的话，其实还存在很多问题。那么为此的话我们涉及了一个KIM叫做 keypoint interaction module，只有一个关键点的交互的一个模网络，一个模块来进一步的去 refined这个 key point 的这个特征。

KIM和MH

第一步：
首先第一点就是我们意识到现在有一个问题是说，我们现在这个每一个的keypoint特征它其实是独立提取到的。那么这样带来的问题就是说，它其实这些关键点它本身是都是一个物体中的关键点，所以它们其实本身本质上它是有一些联系的。但是如果它们都是单独提取的话，它其实是去忽略了这些隐藏的、物体结构的一些信息。
那么因此的话我们首先第一步我们用一个 self-attention 的一个方式，然后对这些关键点进行了一个交互，这样子的话它就可以去学习到这个关键点之间的一个相互关系，然后也学习到这个物体一个隐藏的结构特征。

第二步：
对于 support image 的这个 feature 和这个 query image feature 它是单独提取的，所以它们这个 feature 之间可能存在一个没对齐的一个情况，那么它在做 matching 的时候势必会出现一些问题。
因此，我们又使用了这个 cross-attention的一个方式，把这个 keypoint feature 和这个 query image feature 去做一个交互，这样使得两者的 feature 去做一个对齐。也就是通过这样的方式，我们这个KIM能够把这个keypoint feature 提到一个更好的形式。

第三步：
在获得了这个 keypoint feature 和这个 query image feature 之后，我们再使用一个 matching head 去预测当前 query image 的一个head map。

第四步：
具体而言的话就是我们首先对于每一个 keypoint 的这个 feature 和这个 query image feature 我们都把它这个refined到同一个维度。那么在在这样之后，我们再把它就是 concat（这里也不确定。。在图中用红框标起来）起来，然后再利用一个 decoder 去预测这个 heat map 。那么这个 decoder 它就是是由卷积和反卷积来组成的。

MSE Loss

在训练阶段，会采用一个 MSE loss，利用query image的head map去进行一个监督，然后使得我们这个网络进行一个end to end的训练。

在测试阶段，会利用这个 support image 和它这个关键点的定义，然后以及这个 query image 去预测在当前给定的keypoint的定义下，在这样 query image 上去预测它这个对应的一些 key point 的位置。

MP-100数据集

包含多种类别物体的一个姿态估计的一个数据集。我们叫 MP-100，然后这个 MP-100 我们总共是包含了 20k 的一个数据，然后包含 100 类的这个物体，其中包含这个八大类。八大类现在就是可能大家比较关注的一些比较 popular 的一个类别。但同时因为我们是 target 去作为姿态类别无关的一个姿态，估计所以说它其实也可以泛化到这个更更多的类别上去做。
八大类：

实验结果

可视化结果

展望

我们认为这个新提出的这个类别无关的姿态，估计这个任务其实可能是有很大的一个应用场景，一个应用前景的。

今天的开放麦笔记到这里结束啦~~~Thanks♪(･ω･)ﾉ

本笔记来自第22期 @OpenMMLab 社区开放麦

为了方便大家交流，我们创建了OpenMMLab计算机视觉微信交流群，欢迎大家扫码加入和大佬们一对一讨论吧~

你可能感兴趣的:(opencv)

Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
基于OpenCV-python的人脸识别系统 transuperb 完整代码 opencv python 人工智能
importsysimportosimporttkinterastkfromtkinter.ttkimportStyleimportnumpyasnpimportcv2fromPILimportImageTk,ImageDraw,ImageFontfrompanel.models.tabulatorimportthemefromModelimport*fromtkinterimportttk,fi
Python视觉实战项目31讲源码地址机械小蛟龙笔记 opencv python 深度学习
Python视觉实战项目31讲源码地址来源：公众号小白学视觉2月1日使用OpenCV实现猜词游戏https://github.com/spmallick/learnopencv/tree/master/Hangman使用OpenCV实现图像修复https://github.com/spmallick/learnopencv/tree/master/Image-Inpainting自适应显着性的图像
视线实时跟踪项目云博士的AI课堂基于Python计算机视觉视线跟踪 python 计算机视觉机器视觉 opencv 视线检测
GitHub项目antoinelame/GazeTracking的详细介绍，包括项目概述、功能、解决的问题、应用场景、安装与使用说明等：项目概述GazeTracking是一个基于Python的开源库，利用普通网络摄像头实现实时眼动追踪。它能够检测用户瞳孔的精确位置和视线方向，支持Python2和3。该项目通过结合OpenCV和Dlib库，提供了一种低成本、高精度的眼动追踪解决方案，适用于多种应用场
基于OpenCV的银行卡识别 Yang了个羊 OpenCV opencv 人工智能计算机视觉
一、设计思路1、预处理银行卡号序列模版，对其进行一系列形态学操作，继而进行轮廓识别，构建与各个轮廓所对应的数字元组。2、对将要识别的银行卡进行灰度处理、二值化、阈值处理，sobel算子边缘检测等预处理，再通过模版匹配方法找出与已知轮廓高度符合的数字。二、代码复现预操作：自定义一个cv_show函数，便于后来的图像展示。#绘图展示defcv_show(name,img):cv2.imshow(nam
OpenCV实现相机标定的棋盘格制作与应用 BIG-HO
本文还有配套的精品资源，点击获取简介：在计算机视觉领域，棋盘格标定板用于获取相机参数，实现图像校正和三维重建。OpenCV库提供了绘制棋盘格和相机标定的功能。本文将详细介绍如何使用OpenCV制作棋盘格标定板，包括设计、绘制、保存、相机标定过程和应用。通过实际案例，如畸变矫正、三维重建、AR应用和机器人导航，展示棋盘格标定板在视觉技术中的关键作用。1.棋盘格设计与绘制1.1棋盘格的基本概念与应用棋
OpenCV双目视觉棋盘格标定、特征匹配及三维坐标计算
OpenCV双目视觉棋盘格标定、特征匹配及三维坐标计算【下载地址】OpenCV双目视觉棋盘格标定特征匹配及三维坐标计算OpenCV双目视觉棋盘格标定、特征匹配及三维坐标计算本资源库提供了基于OpenCV的双目视觉系统标定和三维重建基础教程，专注于利用棋盘格作为特征目标进行相机校准，特征点匹配以及随后的三维坐标计算项目地址:https://gitcode.com/open-source-toolki
用python解决关于opencv对图片色点选取并与原图形成对照，代码与常见问题枕书眠月 opencv opencv 人工智能计算机视觉 python 嵌入式硬件开发语言
下面我们将学习opencv和HSV，因为RGB相同的颜色在各种照明条件下可能看起来不同，HSV模型将颜色信息（色调）与亮度和强度分开，这使得检测黄色、红色或绿色等颜色变得更加容易，尤其是在不同的光照条件下HSV更胜一筹，RGB不太适合颜色检测。所以使用HSV（色相、饱和度、值）颜色模型来检测图像中的红色。接下来逐步完成每个步骤，包括导入库、加载图像、将图像转换为HSV色彩空间、创建红色蒙版、查找轮
Qt, OpenCV与OpenGL协同作战：图像处理与三维图形界面的完美结合奇树谦 QT qt opencv 图像处理
原文链接：https://developer.aliyun.com/article/1463740文章目录Qt,OpenCV与OpenGL协同作战：图像处理与三维图形界面的完美结合1.引言图像处理与三维图形界面的重要性Qt,OpenCV与OpenGL简介与应用场景QtOpenCVOpenGL结合Qt,OpenCV与OpenGL的优势与价值2.Qt基础知识与特性Qt库的组成与功能Qt库的安装与使用Q
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
【运维】Python与Ansible协同作战：打造自动化服务器配置管理的终极解决方案蒙娜丽宁 Python杂谈人工智能运维 python ansible
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在现代IT运维中，服务器配置管理是一项繁琐但至关重要的任务。手动配置多台服务器不仅耗时，还容易出错。本文深入探讨如何利用Python结合Ansible工具实现自动化服务器配置管理与环境部署。通过Python脚本调用AnsibleAPI，我们可以动态生成配
c语言opencv所用库函数,Py之cv2：cv2库(OpenCV，opencv-python)的简介、安装、使用方法(常见函数、方法等)最强详细攻略... weixin_39729272 c语言opencv所用库函数
##关于OpenCV简介##OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库，可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。OpenCV用C++语言编写，它的主要接口也是C++语言，但是依然保留
Python之cv2：cv2(OpenCV，opencv-python)库pip下载超时、下载失败、无法下载的解决方案大全猫头虎 python opencv pip 人工智能目标检测计算机视觉机器学习
Python之cv2：cv2(OpenCV，opencv-python)库pip下载超时、下载失败、无法下载的解决方案大全在学习和使用OpenCV（Python包名：opencv-python或简称cv2）的过程中，很多初学者常常会遇到通过pipinstallopencv-python下载超时、下载失败或无法下载的问题。本文将从环境检查、网络配置、国内镜像源、手动下载与离线安装、以及替代方案等多个
【CMake基础入门教程】第七课：查找并使用第三方库（以 find_package() 为核心）奇异果冻 CMake入门学习 CMake bash c++开发语言
很好！我们进入第七课：查找并使用第三方库（以find_package()为核心）。本课目标学会使用CMake的find_package()引入外部库；理解find_package背后的机制（Config模式/Module模式）；以常用库如OpenCV/Qt/Boost为例进行实战；掌握target_link_libraries()的现代CMake使用方式。一、什么是find_package()？C
OpenCV中创建Mat对象 Ethan@LM opencv 人工智能计算机视觉
第1章创建Mat对象1.1.创建空的Mat对象cv::Matmat;1.2.创建灰度图像//创建一个3行4列、8位无符号单通道矩阵（相当于灰度图）cv::Matmat(3,4,CV_8UC1);1.3.创建彩色图像//创建三通道矩阵（相当于彩色图像）cv::Matmat_color(480,640,CV_8UC3);CV_8UC1：8位无符号，单通道（灰度图）CV_8UC3：8位无符号，三通道（彩
编译OpenCV支持CUDA视频解码 AI标书 python openvc cuda nvidia docker build
如何在Ubuntu上编译OpenCV并启用CUDA视频解码支持（cudacodec）在深度学习、视频处理等高性能计算领域，OpenCV的GPU加速功能非常重要。特别是它的cudacodec模块，能直接利用NVIDIA硬件实现高效的视频解码，极大提升性能。本文将基于Ubuntu环境，详细介绍从环境准备到编译安装OpenCV，并开启cudacodec模块的全过程。完整的shell脚本以及本次编译所用到
OpenCV CUDA模块设备层-----逐通道的正弦运算函数sin() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述OpenCV的CUDA模块（cv::cudev）中的一个设备端数学函数，用于在CUDA核函数中对uchar4类型（即4通道无符号字符类型）进行逐通道的正弦运算，并将结果转换为float4类型输出。将一个uchar4类型像素值（每个通道取值范围[0,255]）逐通道
零基础学 OpenCV + Python 图像处理：手把手带你做人脸识别（附代码+典型案例）猫头虎 #Python专栏 opencv python 图像处理计算机视觉 AIGC AI编程人工智能
零基础学OpenCV+Python图像处理：手把手带你做人脸识别（附代码+典型案例）关键词：opencv-python、opencv图像处理、opencv人脸识别代码python、python安装opencv库亮点提示：本文面向零基础读者，手把手教你从环境搭建到实战应用，一步步深入，让你快速掌握OpenCV+Python图像处理与人脸识别技术。文中附带完整示例代码与典型案例，可直接复制、运行与深度
AI人工智能领域中OpenCV的深度学习融合 AI大模型应用实战人工智能 opencv 深度学习 ai
AI人工智能领域中OpenCV的深度学习融合关键词：AI人工智能、OpenCV、深度学习融合、计算机视觉、图像识别摘要：本文深入探讨了在AI人工智能领域中OpenCV与深度学习的融合。我们将先介绍OpenCV和深度学习的基本概念，再讲解它们融合的原理和方式，通过实际代码案例展示融合的具体操作，探讨其在不同场景的应用，推荐相关工具和资源，分析未来发展趋势与挑战。希望能让大家对这一融合有全面且深入的了
计算机视觉实战：OpenCV 与深度学习结合 QuantumWalker 计算机视觉 opencv 深度学习 python
```html计算机视觉实战：OpenCV与深度学习结合计算机视觉实战：OpenCV与深度学习结合在当今数字化时代，计算机视觉技术已经渗透到我们生活的方方面面。从智能手机的面部识别解锁，到自动驾驶汽车的环境感知，计算机视觉正在改变我们的世界。而在这个领域中，OpenCV和深度学习的结合，更是推动了计算机视觉技术的发展。什么是OpenCV？OpenCV（OpenSourceComputerVisio
java鱼眼相机标定_鱼眼相机标定以及OpenCV实现元宿six java鱼眼相机标定
开始标定doublefisheye::calibrate(InputArrayOfArraysobjectPoints,InputArrayOfArraysimagePoints,constSize&image_size,InputOutputArrayK,InputOutputArrayD,OutputArrayOfArraysrvecs,OutputArrayOfArraystvecs,int
C++ OpenCV4 实现鱼眼镜头矫正朝风工作室 c++开发语言
一、为什么需要鱼眼镜头矫正？鱼眼镜头通过特殊的光学设计实现180°甚至更广的视野，广泛应用于全景相机、自动驾驶、安防监控等领域。但这种广角特性会引入严重的桶形畸变：直线边缘会向内弯曲（如图像边缘的门框变成弧线），物体尺寸在边缘区域会被拉伸。矫正的核心目标：将鱼眼镜头拍摄的畸变图像还原为接近人眼视觉的正常图像，便于后续的目标检测、图像拼接等处理。矫正前后效果对比（此处可插入图片）矫正前图像（鱼眼畸变
鱼眼相机标定与畸变矫正：高效提升图像质量的利器何盼思Kit
鱼眼相机标定与畸变矫正：高效提升图像质量的利器【下载地址】鱼眼相机标定及畸变矫正工具包`fisheye_cali.zip`包含了一套完整的解决方案，通过使用OpenCV库的功能，本工具能够帮助用户准确地完成鱼眼相机的参数标定，进一步执行图像的畸变矫正。此过程对于增强图像处理应用的精确度至关重要，特别是在需要广阔视野的应用场景中项目地址:https://gitcode.com/open-source
从零理解鱼眼相机的标定与矫正（含 OpenCV 代码与原理讲解）
本文适合初学者系统掌握鱼眼镜头的标定与矫正原理，图文结合，带你从0到1理解K,D,u,v等参数的真实含义。一句话总结鱼眼相机由于镜头视角宽、畸变大，拍出来的画面会“鼓起来”或者变形。通过标定得到的参数，可以让计算机“理解”这种变形是怎么发生的，并据此把图像“拉回正形”。一、什么是内参矩阵K？定义在OpenCV中，内参矩阵（CameraIntrinsicMatrix）通常是一个3x3的矩阵：cfg.
揭开计算机视觉的神秘面纱：从像素到数字图像 DragonAlchemy OpenCV历程计算机视觉
揭开计算机视觉的神秘面纱：从像素到数字图像欢迎来到计算机视觉的奇妙世界！在我们深入研究如何使用OpenCV这样的强大工具来让计算机“看懂”图像和视频之前，理解一些最基本的概念至关重要。就像学习任何新语言都需要先掌握字母和单词一样，计算机视觉也有它的“字母表”。今天，我们就来一起探索这些基础构建块：像素、颜色空间以及图像时如何以数字形式表示的。一、像素(Pixel)：图像的“原子”想象一下，你正在欣
OpenCV边缘填充方式详解慕婉0307 opencv基础 opencv 计算机视觉人工智能
一、边缘填充概述在图像处理中，边缘填充（BorderPadding）是一项基础而重要的技术，特别是在进行卷积操作（如滤波、边缘检测等）时，处理图像边缘像素需要用到周围的像素值。由于图像边缘的像素没有完整的邻域，因此需要通过某种方式对图像边界进行扩展。边缘填充的主要应用场景包括：图像滤波（如高斯滤波、中值滤波等）卷积神经网络（CNN）中的卷积层形态学操作（如膨胀、腐蚀）图像特征提取二、OpenCV中
聚焦OpenVINO与OpenCV颜色通道转换的实践指南
颜色通道顺序问题：OpenVINO模型RGB输入与OpenCVBGR格式的转换在计算机视觉任务中，框架间的颜色通道差异常导致模型推理错误。以下方法解决OpenVINO模型需要RGB输入而OpenCV默认输出BGR的问题。理解核心差异OpenCV的imread()函数遵循BGR通道顺序，源于历史摄像头硬件的数据格式。而OpenVINO等深度学习框架多采用RGB顺序，与TensorFlow/PyTor
用OpenCV实现图像分割：提取Logo中的特定元素并重新着色 Wave还没秃 opencv 人工智能计算机视觉
用OpenCV实现图像分割：提取Logo中的特定元素并重新着色任务：将图片中三个圆形图案以及字母（共四个）单独取出，分别保存为四个新图片，图片大小与原图一致，图案尽量位于图片中心。三个圆形图案在新图片中改成不与于原来的填充色。步骤总览1.读取图片2.预处理：二值化或色彩分割找目标区域3.提取每个圆形图案（红、绿、蓝）和文字区域的掩膜4.将掩膜区域提取出来并改变颜色（对圆形）5.让内容居中对齐，保存
基于 opencv+yolov8+easyocr的车牌追踪识别（ECUT）Edward-tan 人工智能--CV python进阶全栈开发 opencv yolov8 ocr python
（本项目所有代码打包至我的资源中，大家可在我的文章底部选择下载）目录需求实现效果学习视频大致思路代码实现资源下载需求通过车辆识别技术，识别视频中每个车辆及其车牌号，车辆应进行追踪，避免重复计数量。实现效果车牌识别学习视频使用Python、Yolov8和EasyOCR自动识别车牌计算机视觉教程_哔哩哔哩_bilibili大致思路通过opencv将视频转换为帧，对帧应用车辆识别模型，并使用model.
高性能图像处理库：深入了解 Pyvips 萧鼎 python基础到进阶教程图像处理人工智能
高性能图像处理库：深入了解Pyvips在处理超大图像文件或需要高效图像处理的场景中，Pyvips是一个备受推崇的库。与传统的图像处理库（如PIL、OpenCV）相比，Pyvips以其速度快、内存占用低和功能强大而著称。本文将带你全面了解Pyvips，并通过实战案例展示它的高效应用。一、什么是Pyvips？Pyvips是基于libvips的Python绑定。libvips是一个C语言编写的开源图像处
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include