右边是我女神

基于骨骼点特征的视频分割任务——花样滑冰视频的动作解析

文章目录

项目简介
骨骼点特征的提取
- 概述
- Introduction
- Method
- two-branch multi-stage CNN
花样滑冰数据集(MCFS)
我们的方法
- DSTA
- - Introduction
  - Method
  - - 时空注意力模块
    - 解耦的位置编码
    - 空间全局正则化
    - 完整的注意力模块
    - 整体架构
    - 数据解耦
- ETSN
- GCN-ETSN(代码)
- - 整体流程
  - STAttentionBlock
  - - 位置编码
参考文献

项目简介

我们的目的是构建一个花样滑冰智能解析系统，解析部分是一个视频分割任务，不过基于的是骨骼点特征，这是该领域尚未涉足的方向。其余部分通过unity完成。

骨骼点特征的提取

我们的骨骼点特征的提取调用的是OpenPose的API，其能够对每个人提取出25个骨骼点，内容是二维坐标及其置信度的三维特征。我们通过置信度选择最有可能为滑冰选手的一组骨骼点。

该API参考的是论文[1]。接下来，我们会对这篇论文进行一些介绍，可以参考这篇文章。

概述

本文提出了一种检测2D图像中多人的、姿态的方法。

常见的思路是先识别出身体部位，然后再将这些部位连接起来，本文也是这个思路。

该论文的优势是在保证精度的情况下，其速度得到了较大的优化。

具体而言：Part Affinity Fields（PAF，部分亲和场），这是一种非参数的表征方式，用于学习身体部位和个体之间的关系。

Introduction

识别人体姿态的挑战有：

每幅图像的人数不确定，且会出现在任何位置；
人与人之间的相互作用，会造成空间十分复杂；
运行的复杂性随着人数的增多而增大，这使得实时性比较困难。

Method

总体流程为：

输入图像；
用VGG-19进行图像的特征提取；
将其送入two-branch multi-stage CNN，CNN_S用于识别关节点，CNN_L用于识别关节点之间的联系；
通过CNN_L的输出将CNN_S的输出连起来；

two-branch multi-stage CNN

CNN_S输出 $S_t$ 是关节点置信图；CNN_L输出 $L_t$ 是PAFs。

损失函数为：

W的存在是因为GT不一定有确切标注，这使得损失函数的值很大，于是我们令这些位置的w为0。

之后通过公式进行拼接即可，具体而言，是将节点、边进行合适的组合。

花样滑冰数据集(MCFS)

我们的数据集采用的是本实验室在[2]中提出的数据集。其中既包含了骨骼点数据也包含了I3D数据。

其中，提出了当前数据集存在的三大缺陷：

大部分仅包含粗粒度语义信息，这无法胜任细粒度任务。比如说50Salads中的切黄瓜、切芝士，关注的动作都是比较显著的。一旦涉及到横切黄瓜、竖切黄瓜这样的动作就是比较不那么具有关注度。
当前的数据集中，场景和工具需要参与到标签的预测当中，因为比如“切黄瓜”和“切番茄”这样的标签就需要注意物品。但是在大部分应用中注意人体的姿态才是重要的，我们需要一款数据集能够让模型更加注意人体的姿态。
不同动作的速度差异很小，微小的速度变化很难带来帧级别特征的改变，所以大部分数据集的难度不高，换句话说，从长达几十秒的视频中识别几秒的动作是一个值得研究的挑战。

MCFS的优点和挑战在于：

在标注label时分了很多层次，这样使得该数据集同时包含细粒度和粗粒度的语义信息；
额外提供了骨骼点特征；
标签只涉及人体姿态且背景单一，迫使模型关注人体运动；
动作的速度持续时间差异很大；
类别之间高度相似。

我们的方法

我们所期待的系统是能够识别细粒度的语义信息的。所以这加剧了motion speed and duration和similarity of category这两个问题。

因此我们需要一个模型能同时关注动作的时间变化和动作本身的差异。

另外，因为滑冰的动作更强调于动作本身，所以选择骨骼点进行分析会优于I3D特征。

但是当前大部分的能够分析骨骼点的模型都是针对视频识别的，目前还没有应用在视频分割任务中的模型。

我们的思路是先用骨骼点分析模型提取特征，之后进入视频分割模型(MSTCN)来得到逐帧的标签。

DSTA

关于骨骼点分析模型，我们选取的是DSTA[3]，可以参考这篇文章。

Introduction

我们只知道骨骼点的位置，但是要想学习到他们之间的连接关系，常用的方式是手工编写规则。显然这不是最好的选择。本文基于注意力机制提出了自动学习的模型。

根据注意力网络发现骨骼点数据关联的难点有三个：

原始的自注意力机制的输入是序列数据，而骨骼点数据同时存在与空间是时间维度。有一种简单的方法是将时空数据展平成一个单一的序列(比如说骨骼点数据是(T,25,3),我们将其展开变成(T*25,3))。这样的策略将时间和空间同等对待了。本文的想法是在(25,3)内用一个自注意力，在(T,d)中用一个自注意力。这样分解为了时间注意力和空间注意力。为了平衡空间和时间的独立性和互动性，设计了三种策略
当将骨骼点送入注意力网络时，没有预定义的顺序或结构。为了给每个关节提供一个唯一的标记，引入一种位置编码技术。分为了空间编码和时间编码。
基于先验知识的基础上，加入适当的正则化，可以减少过拟合问题，提高模型的泛化性能。这是基于每一帧骨骼点语义意义的固定性，因此这仅用在空间维度。

Method

时空注意力模块

输入的骨骼点数据是(N,T,C)，有个老兄就说，干脆把骨骼点和时间一起排列成一个序列，这样就直接能用上Transformer的自注意力机制了。

但是吧，时间和空间的信息能混为一谈吗？显然不行。所以说就有了三种策略。

每个帧都给算一个注意力矩阵： $A^t=softmax(\sigma(X_t)\phi(X^t)')$ ;
两两帧之间算一个注意力矩阵然后加起来共享： $A^t=softmax(\sum_t^T \sum_\tau^T(\sigma(X_t)\phi(X_\tau)'))$
每个帧都给算一个注意力矩阵然后平均一下共享： $A^t=softmax(\sum_t^T\sigma(X^t)\phi(X_t)')$

空间注意力的输入是 $X_t\in R^{N\times C}$ ，得到的注意力矩阵 $A^t\in R^{N\times N}$ 。

时间注意力的输入是 $X_n\in R^{T\times C}$ ，得到的注意力矩阵 $A^n\in R^{T\times T}$ 。

解耦的位置编码

编码的公式用的是Transformer的。

对于空间编码，同一帧中的关节进行顺序编码，不同帧中的相同关节具有相同的编码；

对于时间编码，同一帧中的关节有相同的编码，不同帧中的相同关节按顺序编码。

空间全局正则化

有一个全局注意力图被加到了所学到的注意力图当中去，这个注意力图它代表了人体关节的关系模式。

另外我们还有一个参数 $\alpha$ 来平衡这个正则化矩阵。

完整的注意力模块

上图就是一个注意力模块，和Transformer的结构很相似哦。

输入 $X\in R^{N\times C_{in}}$ 和空间编码相结合；
被两个线性映射函数编码成 $X\in R^{N\times C_e}$ ，这有助于减少冗余的特征；
然后按照第三种策略计算注意力矩阵，加入空间正则化后和V进行矩阵乘法后输出；
之后进入FFN，得到最后的结果。

整体架构

数据解耦

空间信息是统一框架内两个不同关节的差异，主要包含不同关节之间的相对位置关系；

时间信息是两个具有相同空间意义的关节在不同帧中的差异，主要描绘一个关节在时间维度上的运动轨迹。

此外，对于时间流，还进行了高帧速率采样和低帧速率采样来计算时间运动。

最后，我们将时空流、空间流、快速时间流和慢速时间流这四个模型分别训练，得到的结果取均值。

ETSN

关于ETSN的介绍可以参考这篇文章。

GCN-ETSN(代码)

整体流程

def forward(self, x):

        if self.training:
            # # for training
            outputs = []
            if self.GCN != None:
                # 修正形状
                #x = x.view(1,25,2,-1).permute(0, 2, 3, 1) 
                x = x.view(1,25,2,-1).permute(0, 2, 3, 1)  # B,C,T,N
                # GCN模型  
                x = self.GCN(x)
                # 修正形状
                x = x.permute(0, 3, 1, 2).contiguous().view(1, self.in_channel, -1)

            # Prediction
            out = self.stage1(x)
            outputs.append(out)
            # Refine(Dilated TCN or ETSPNet)
            if self.stages is not None:
                for stage in self.stages:
                    out = stage(F.softmax(out, dim=1))
                    outputs.append(out)
            return outputs
        else:
            # for evaluation
            if self.GCN != None:
                x = x.view(1,25,2,-1).permute(0, 2, 3, 1)   
                x = self.GCN(x)
                x = x.permute(0, 3, 1, 2).contiguous().view(1, self.in_channel, -1)

            out = self.stage1(x)
            if self.stages is not None:
                for stage in self.stages:
                    out = stage(F.softmax(out, dim=1))
            return out

STAttentionBlock

位置编码

class PositionalEncoding(nn.Module):

    def __init__(self, channel, joint_num, time_len, domain):
        super(PositionalEncoding, self).__init__()
        self.joint_num = joint_num
        self.time_len = time_len

        self.domain = domain

        if domain == "temporal":
            # temporal embedding
            pos_list = []
            for t in range(self.time_len):
                for j_id in range(self.joint_num):
                    pos_list.append(t)
        elif domain == "spatial":
            # spatial embedding
            pos_list = []
            for t in range(self.time_len):
                for j_id in range(self.joint_num):
                    pos_list.append(j_id)

        position = torch.from_numpy(np.array(pos_list)).unsqueeze(1).float()
        # pe = position/position.max()*2 -1
        # pe = pe.view(time_len, joint_num).unsqueeze(0).unsqueeze(0)
        # Compute the positional encodings once in log space.
        pe = torch.zeros(self.time_len * self.joint_num, channel)

        div_term = torch.exp(torch.arange(0, channel, 2).float() *
                             -(math.log(10000.0) / channel))  # channel//2
        pe[:, 0::2] = torch.sin(position * div_term)
        pe[:, 1::2] = torch.cos(position * div_term)
        pe = pe.view(time_len, joint_num, channel).permute(2, 0, 1).unsqueeze(0)
        self.register_buffer('pe', pe)

    def forward(self, x):  # nctv
        x = x + self.pe[:, :, :x.size(2)]
        return x

在self.GCN中，我们只采用了DSTA中的STAttention模块。

class STAttentionBlock(nn.Module):
    def __init__(self, in_channels, out_channels, inter_channels, num_subset=2, num_node=25, num_frame=32,
                 kernel_size=1, stride=1, glo_reg_s=True, att_s=True, glo_reg_t=False, att_t=False,
                 use_temporal_att=False, use_spatial_att=True, attentiondrop=0, use_pes=True, use_pet=False):
        super(STAttentionBlock, self).__init__()
        self.inter_channels = inter_channels
        self.out_channels = out_channels
        self.in_channels = in_channels
        self.num_subset = num_subset
        self.glo_reg_s = glo_reg_s
        self.att_s = att_s
        self.glo_reg_t = glo_reg_t
        self.att_t = att_t
        self.use_pes = use_pes
        self.use_pet = use_pet
        self.num_node = num_node

        pad = int((kernel_size - 1) / 2)
        self.use_spatial_att = use_spatial_att
        # 空间注意力
        if use_spatial_att: #T
            atts = torch.zeros((1, num_subset, num_node, num_node))
            self.register_buffer('atts', atts)
            # self.pes = PositionalEncoding(in_channels, num_node, num_frame, 'spatial')
            self.ff_nets = nn.Sequential(
                nn.Conv2d(out_channels, out_channels, 1, 1, padding=0, bias=True),
                nn.BatchNorm2d(out_channels),
            )
            if att_s: #T
                self.in_nets = nn.Conv2d(in_channels, 2 * num_subset * inter_channels, 1, bias=True)
                self.alphas = nn.Parameter(torch.ones(1, num_subset, 1, 1), requires_grad=True)
            if glo_reg_s: #T
                self.attention0s = nn.Parameter(torch.ones(1, num_subset, num_node, num_node) / num_node,
                                                requires_grad=True)

            self.out_nets = nn.Sequential(
                nn.Conv2d(in_channels * num_subset, out_channels, 1, bias=True),
                nn.BatchNorm2d(out_channels),
            )
        else:
            self.out_nets = nn.Sequential(
                nn.Conv2d(in_channels, out_channels, (1, 3), padding=(0, 1), bias=True, stride=1),
                nn.BatchNorm2d(out_channels),
            )
        self.use_temporal_att = use_temporal_att
        if use_temporal_att:
            attt = torch.zeros((1, num_subset, num_frame, num_frame))
            self.register_buffer('attt', attt)
            self.pet = PositionalEncoding(out_channels, num_node, num_frame, 'temporal')
            self.ff_nett = nn.Sequential(
                nn.Conv2d(out_channels, out_channels, (kernel_size, 1), (stride, 1), padding=(pad, 0), bias=True),
                nn.BatchNorm2d(out_channels),
            )
            if att_t:
                self.in_nett = nn.Conv2d(out_channels, 2 * num_subset * inter_channels, 1, bias=True)
                self.alphat = nn.Parameter(torch.ones(1, num_subset, 1, 1), requires_grad=True)
            if glo_reg_t:
                self.attention0t = nn.Parameter(torch.zeros(1, num_subset, num_frame, num_frame) + torch.eye(num_frame),
                                                requires_grad=True)
            self.out_nett = nn.Sequential(
                nn.Conv2d(out_channels * num_subset, out_channels, 1, bias=True),
                nn.BatchNorm2d(out_channels),
            )
        else:
            self.out_nett = nn.Sequential(
                nn.Conv2d(out_channels, out_channels, (7, 1), padding=(3, 0), bias=True, stride=(stride, 1)),
                nn.BatchNorm2d(out_channels),
            )

        if in_channels != out_channels or stride != 1:
            if use_spatial_att:
                self.downs1 = nn.Sequential(
                    nn.Conv2d(in_channels, out_channels, 1, bias=True),
                    nn.BatchNorm2d(out_channels),
                )
            self.downs2 = nn.Sequential(
                nn.Conv2d(in_channels, out_channels, 1, bias=True),
                nn.BatchNorm2d(out_channels),
            )
            if use_temporal_att:
                self.downt1 = nn.Sequential(
                    nn.Conv2d(out_channels, out_channels, 1, 1, bias=True),
                    nn.BatchNorm2d(out_channels),
                )
            self.downt2 = nn.Sequential(
                nn.Conv2d(out_channels, out_channels, (kernel_size, 1), (stride, 1), padding=(pad, 0), bias=True),
                nn.BatchNorm2d(out_channels),
            )
        else:
            if use_spatial_att:
                self.downs1 = lambda x: x
            self.downs2 = lambda x: x
            if use_temporal_att:
                self.downt1 = lambda x: x
            self.downt2 = lambda x: x

        self.soft = nn.Softmax(-2)
        self.tan = nn.Tanh()
        self.relu = nn.LeakyReLU(0.1)
        self.drop = nn.Dropout(attentiondrop)

    def forward(self, x):

        N, C, T, V = x.size() # N batch_size C channels T frame_num V joint_num 1 2 xxxx 25
        # 先进入空间注意力
        if self.use_spatial_att: #T
            # 空间注意力矩阵
            attention = self.atts
            # 进行位置编码
            if self.use_pes:
                self.pes = PositionalEncoding(self.in_channels, self.num_node, T, 'spatial').cuda(x.get_device())
                y = self.pes(x)
            else:
                y = x
            if self.att_s: #T
                # in_nets将c -> 2*num_subset*inter_channels
                # q和k都是从y中来的 q:nsctv k:nsctv
                q, k = torch.chunk(self.in_nets(y).view(N, 2 * self.num_subset, self.inter_channels, T, V), 2,
                                   dim=1)  # nctv -> n num_subset c'tv
                # Attention(Q,K,V) = softmax(QK^T/C^(1/2)) 这里是把ct看做了c softmax变为tan
                # attention:nsvv
                attention = attention + self.tan(
                    torch.einsum('nsctu,nsctv->nsuv', [q, k]) / (self.inter_channels * T)) * self.alphas
                #print(attention.shape)
            # 空间正则化 简简单单加了个矩阵
            if self.glo_reg_s: #T
                attention = attention + self.attention0s.repeat(N, 1, 1, 1)
            attention = self.drop(attention)
            y = torch.einsum('nctu,nsuv->nsctv', [x, attention]).contiguous() \
                .view(N, self.num_subset * self.in_channels, T, V)
            y = self.out_nets(y)  # nctv

            y = self.relu(self.downs1(x) + y)

            y = self.ff_nets(y)

            y = self.relu(self.downs2(x) + y)
        else:
            y = self.out_nets(x)
            y = self.relu(self.downs2(x) + y)

        if self.use_temporal_att:
            attention = self.attt
            if self.use_pet:
                z = self.pet(y)
            else:
                z = y
            if self.att_t:
                q, k = torch.chunk(self.in_nett(z).view(N, 2 * self.num_subset, self.inter_channels, T, V), 2,
                                   dim=1)  # nctv -> n num_subset c'tv
                attention = attention + self.tan(
                    torch.einsum('nsctv,nscqv->nstq', [q, k]) / (self.inter_channels * V)) * self.alphat
            if self.glo_reg_t:
                attention = attention + self.attention0t.repeat(N, 1, 1, 1)
            attention = self.drop(attention)
            z = torch.einsum('nctv,nstq->nscqv', [y, attention]).contiguous() \
                .view(N, self.num_subset * self.out_channels, T, V)
            z = self.out_nett(z)  # nctv

            z = self.relu(self.downt1(y) + z)

            z = self.ff_nett(z)

            z = self.relu(self.downt2(y) + z)
        else:
            z = self.out_nett(y)
            z = self.relu(self.downt2(y) + z)

        return z

参考文献

[1] Cao Z, Simon T, Wei S E, et al. Realtime multi-person 2d pose estimation using part affinity fields[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 7291-7299.
[2] Liu S, Zhang A, Li Y, et al. Temporal Segmentation of Fine-grained Semantic action: A Motion-Centered Figure Skating Dataset[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2021, 35(3): 2163-2171.
[3] Shi L, Zhang Y, Cheng J, et al. Decoupled spatial-temporal attention network for skeleton-based action recognition[J]. arXiv preprint arXiv:2007.03263, 2020.

ES6解构赋值详解漫天转悠 ES6 es6 前端 ecmascript
ES6解构赋值详解ES6解构赋值是JavaScript语言的一项强大特性，它允许从数组或对象中提取数据，并将其赋值给变量。这一特性不仅简化了代码，提高了可读性，还增强了代码的灵活性。本文将详细介绍ES6解构赋值的基本概念、语法、应用场景以及一些高级用法。1.基本概念解构赋值是对赋值运算符的扩展。它允许按照一定的模式，从数组或对象中提取值，并赋值给变量。这种语法使得从复杂数据结构中提取数据变得更加简
C 语言中的数组详解 812503533 c语言 java 开发语言
在C语言中，数组是一种非常基础且常用的数据结构。数组是存储一组相同类型元素的集合，允许我们以统一的方式访问和操作这些元素。C语言中的数组不仅在编程中使用广泛，而且它的灵活性和效率使得它成为了许多算法实现的基础。本篇文章将深入分析C语言中的一维数组，包括定义、存储方式、操作方式、常见问题等等，所有的数据结构都可以从这几个方面来学习。1.数组的定义与存储方式1.1一维数组的定义数组的定义方式包括数组大
【春招笔试真题】饿了么2025.03.07-开发岗真题春秋招笔试突围最新互联网春秋招试题合集 java 算法网络
饿了么2025.03.07-开发岗题目1️⃣：统计01串中0和1的个数，通过计算可能的交换方式确定不同字符串数量2️⃣：使用模板匹配技术识别验证码图片中的"#"符号分布模式3️⃣：构建字典树（Trie）优化异或查询，实现高效的数字黑板游戏整体难度这套题目整体难度适中，由简到难逐步递进：第一题是基础的计数问题，需要理解交换操作的特性第二题是模式识别问题，需要实现模板匹配第三题是高级数据结构应用，需要
C++ time(0)函数宁玉AC c学习
time(0)函数返回当前格林尼治标准时间与格林尼治标准时间1970年0分0秒的时间间隔。头文件#include//问题：得到当前时间。#include#includeusingnamespacestd;intmain(){inttotalSeconds=time(0);intcurrentSeconds=totalSeconds%60;inttotalMinutes=totalSeconds/6
C++随机数宁玉AC c学习 c++开发语言
目录一、名著参考二、详解1.rand()函数2.time(0)3.srand(time(0))4.获取指定范围内的随机数（含指定位数）一、名著参考可以使用cstdlib头文件中的rand()函数来获得随机整数；这个函数返回0~RAND_MAX之间的随机整数；rand()函数生成的是伪随机数。即每次在同一个系统上执行这个函数的时候，rand()函数生成同一序列的数。rand()函数的算法使用一个叫种
C++11之列表初始化 Octopus2077 c++学习笔记
发展历史C++11是C++的第⼆个主要版本，并且是从C++98起的最重要更新。它引⼊了⼤量更改，标准化了既有实践，并改进了对C++程序员可⽤的抽象。在它最终由ISO在2011年8⽉12⽇采纳前，⼈们曾使⽤名称“C++0x”，因为它曾被期待在2010年之前发布。C++03与C++11期间花了8年时间，故⽽这是迄今为⽌最⻓的版本间隔。从那时起，C++有规律地每3年更新⼀次。列表初始化（注意区分列表初始
刷题前必学！二叉树！用JavaScript学数据结构与算法
‍JavaScript算法与数据结构-HowieCong务必要熟悉JavaScript使用再来学！一、树是什么？数据结构中的树，对于现实世界中的树简化——树根抽象为“根节点”，树枝抽象为“边”，树枝的两个端点抽象为“结点”，树叶抽象为“叶子结点”计算机中的树如下：二、树的重点树的层次计算规则：根结点所在的那一层为第一层，其子节点为第二层，以此类推结点和树的高度计算规则：叶子结点高度为1，每向上一层
HarmonyOS Next 实现 2048 小游戏
2048是一款经典的益智游戏，玩家通过滑动屏幕合并相同数字的方块，最终目标是合成数字2048。本文基于鸿蒙ArkUI框架，详细解析其实现过程，解析如何利用声明式UI和状态管理构建此类游戏。一、核心数据结构与状态管理1.游戏网格与得分游戏的核心是一个4x4的二维数组，用于存储每个格子的数字。通过@State装饰器管理网格状态，确保数据变化时UI自动刷新：@Stategrid:number[][]=A
基于llama_cpp 调用本地模型（llama）实现基本推理月光技术杂谈大模型初探 llama llama.cpp python LLM 集成显卡本地模型 AI
零基础实践本地推理模型基本应用：基于llama_cpp的本地模型调用。本文先安装llama_cpppython库，再编写程序，利用其调用llama-2-7b-chat.Q4_K_M.ggu模型。背景llama_cpp是一个基于C++的高性能库（llama.cpp）的Python绑定，支持在CPU或GPU上高效运行LLaMA及其衍生模型（如LLaMA2），并通过量化技术（如GGUF格式）优化内存使用
动态规划双剑合璧：C++与Python征服洛谷三大经典DP问题三流搬砖艺术家动态规划 c++python
动态规划核心思想状态定义→转移方程→边界处理→时空优化本文精选洛谷动态规划题单中三大经典问题，通过C++与Python双语言对比实现，彻底掌握DP精髓！题目一：P1048采药（01背包模板）题目描述在限定时间T内采集草药，每株草药有采集时间time[i]和价值value[i]，求最大总价值。解题思路状态定义：dp[j]表示时间j能获得的最大价值转移方程：dp[j]=max(dp[j],dp[j-t
C语言_数据结构总结7:顺序队列（循环队列） *.✧屠苏隐遥(ﾉ◕ヮ◕)ﾉ*.✧ C语言—数据结构数据结构 c语言开发语言算法 visual studio visualstudio
纯C语言实现，不涉及C++队列简称队，也是一种操作受限的线性表。只允许表的一端进行插入，表的另一端进行删除特性：先进先出针对顺序队列存在的“假溢出”问题，引出的循环队列概念。循环队列将顺序队列臆造为一个环状的空间，即把存储队列元素的表从逻辑上视为一个环。当队首指针Q->front=MaxSize-1后，再前进一个位置就自动到0，这可以利用除法取余运算（%）来实现。循环队列中的判空和判满条件分析：显
C++：入门详解（关于C与C++基本差别）梅茜Mercy c++c语言 java
目录一.C++的第一个程序二.命名空间（namespace）1.命名空间的定义与使用：（1）命名空间里可以定义变量，函数，结构体等多种类型（2）命名空间调用（：：）与展开（3）命名空间的嵌套（4）具体使用场景三.缺省参数1.基本定义：2.几个注意：四.函数重载1.定义与使用：五.引用1.定义：2.引用的特性：3.引用的使用（区别传值返回和传引用返回）：4.const引用：六.inline内联一.C
C++开源库大全大王算法 C/C++开发实战365 C++入门及项目实战宝典 c++开源
程序员要站在巨人的肩膀上，C++拥有丰富的开源库，这里包括：标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。标准库C++StandardLibrary：是一系列类和函数的集合，使用核心语言编写，也是C++ISO自身标准的一部分。
【数据结构】-- LinkedList与链表（2）雨雨雨雨点子数据结构数据结构链表 java 开发语言
文章目录4.LinkedList的模拟实现5.LinkedList的使用5.1什么是LinkedList5.2LinkedList的使用5.2.1LinkedList的构造5.2.2LinkedList的其他常用方法介绍5.2.3LinkedList的遍历6.ArrayList和LinkedList的区别4.LinkedList的模拟实现publicclassMyLinkedList{static
C++11使用mutex和condition_variable实现线程同步追烽少年x C++基础 c++
C++11使用mutex和condition_variable实现线程同步在实现项目的过程中，突然有一个问题：C++中A、B、C三个线程模拟购买100张车票，A输出99，B输出98，C输出97,然后又循环A输出96，B95,C94,直到0，使用线程同步，如何实现？这是一种按顺序执行线程的问题，应该实现？代码如下：#include#include#include#include#include//共
c++计算n的阶乘（用循环和递归） Absinthe_苦艾酒 c/c++c++算法数据结构
1.循环//计算阶乘#includeusingnamespacestd;intfct(int*p){intsum=1;while(*p>=2){sum*=((*p)--);}returnsum;}intmain(){cout>n;coutusingnamespacestd;//使用递归计算阶乘intfct(intn){if(n==1)return1;elsereturnn*fct(n-1);}in
随记5-基础数据结构(栈) Miloの数据结构
轻松搞懂数据结构中的“栈”正文关于“栈”的定义栈(stack)是一种线性数据结构，它遵循后进先出的原则(LastInFirstOut，简称LIFO)所谓的后进先出吧，我浅浅举个例子↓↓↓想象一下你有一摞盘子和一个框，每次只能做两件事情1.(在框里)往最上面放一个新盘子(push入栈操作)即从栈中添加数据2.(在框里)把最上面的盘子拿走(pop出栈操作)即从栈中移除数据核心规则:最后放上去的盘子，必
树莓派-C++之异常 lalalaouhei c++开发语言后端
2021SC@SDUSCC++异常用官方的话来说就是程序在执行过程中产生的问题，换句通俗的话来讲就是程序执行的出现的异常，比如程序崩了、内存泄漏了、数组越界以及其他异常信息的出现，又如运行时耗尽了内存或遇到意外的非法输入。一个简单的例子就是尝试除以零的操作。异常存在于程序的正常功能之外，并要求程序立即处理。不能不处理异常，异常是足够重要的，使程序不能继续正常执行的事件。一、异常处理所谓“处理”，可
C++中map和set的详解 jiajia651304 c++算法开发语言
C++中map和set的介绍与使用一、map的介绍与使用二、set的介绍与使用三、总结在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一
Qt基础之四十一：记一次QVector的bad alloc问题追踪草上爬 Qt那些事儿 qt QVector vector bad alloc
目录一.QVector的特点二.QVector的内存分配策略三.badalloc问题追踪一.QVector的特点QVector是Qt容器类库中的一个重要组成部分，它提供了类似于C++标准库中的std::vector的功能，但同时拥有Qt独特的优势。QVector是一个动态数组，支持添加、插入和删除元素。与其他容器相比，QVector在随机访问元素时具有出色的性能，同时在尾部添加和删除元素时依然高效
每日八股-Redis篇-01 你白勺男孩TT 面经 redis 缓存数据库八股文面试
文章目录1.Redis的数据结构有哪些，以及它们的用途是什么？2.Redis如何实现持久化，并且有哪些方式可以实现持久化？3.Redis的数据淘汰策略有哪些，并如何选择合适的策略？1.Redis的数据结构有哪些，以及它们的用途是什么？回答：Redis支持以下几种数据结构：Strings（字符串）：用于存储字符串、整数或浮点数。Hashes（哈希）：用于存储键值对的无序散列表。Lists（列表）：用
C++内存操纵的艺术 longdong7889 后端学习 c++java 开发语言
C++内存操纵的艺术在C++的混沌宇宙中，指针是打开时空裂缝的密钥。本文将以全新视角解构指针的本质，揭示从堆栈穿梭到多维空间映射的进阶技法，展示现代C++赋予指针的惊人可能性。一、指针本体论：内存的波粒二象性所有指针变量都是量子化的存在，既指向具体内存位置，又携带类型信息波。通过类型系统实验可验证其双重属性：templatevoidquantum_observer(T*ptr){std::cout
C++入门之容易忽视的namespace和函数重载不会的码 c++开发语言后端
目录命名空间命名空间的定义命名空间的用法1.直接把std整个展开2.对部分常用的展开3.指定命名空间缺省参数全缺省：（所有的参数都指定一个默认值）半缺省：(只有部分被参数指定默认值，而不是一半的参数)函数重载那么为什么C语言不支持函数重载，C++支持呢？extern"C"命名空间在C/C++中，变量、函数都是大量存在的，这些变量、函数的名称将都存在于全局作用域中，可能会导致很多冲突。使用命名空间的
C++内存管理秘籍：深入解析与实战代码示例 my1121716951 编程 c++java 开发语言
C++内存管理秘籍：深入解析与实战代码示例一、内存管理的基本概念二、内存泄漏与野指针三、智能指针：现代C++的内存管理利器四、实战代码示例示例1：传统动态内存管理示例2：使用`std::unique_ptr`示例3：使用`std::shared_ptr`五、总结在C++编程的世界里，内存管理是一项既基础又核心的技能。它直接关系到程序的性能、稳定性和可维护性。不同于一些高级语言自动管理内存的特性，C
C++之list删除元素 csdn_zhangchunfeng C++VS 技术管理索引列表 c++
C++之list删除元素对容器list存储的元素执行删除操作的时候，一般都是使用其成员函数实现的：（1）clear（）：删除list容器中的所有元素（2）remove（value）：删除容器中所有为value的元素（3）remove_if（）：删除容器中满足条件的元素（4）unique（）：删除容器中相邻的重复元素，只留下一个（5）erase（）：删除list容器中指定位置处的元素，也可以删除容器
【C++基础学习笔记】C++的输入输出流及缺省参数大家好我叫张同学深入浅出学习C++c++
我要做一个好奇宝宝，带着疑问来阅读，哼~C++如何进行输入输出？和C语言何有区别？C++的缺省参数是什么？如何理解和掌握？文章目录C++的输入&输出缺省参数缺省参数的概念缺省参数的分类1.全缺省参数2.半缺省参数：C++的输入&输出婴儿降生到这个世界上时，会以自己独特的方式向这个崭新的世界打招呼。跟新生婴儿类似，C++语言刚出来后，也算是一个新事物，作为一门新的编程语言也会有自己问候这个美好世界的
数据结构的基本概念和术语的一些介绍王哈哈嘻嘻噜噜数据结构
数据：是客观事物的符号表示，包括两种：数值型（整数，实数）和非数值型（文字，图形，声音数据元素：是数据的基本单位，通常作为一个整体进行表示。与数据的关系：是数据集合的个体数据项：组成数据元素的不可分割的最小单位。以上三者的关系：数据>数据元素>数据项例如：学生表>个人记录>学生的单个年龄，姓名数据对象：是性质相同的数据元素的集合与数据的关系：是数据集合的一个子集例如：整数数据对象是集合N{0，+-
C++之string类讨厌下雨的天空 c++
1.string类的重要性：C语言中，字符串是以“\0”结尾的一些字符的集合，为了操作方便，C标准库中提供了一些str系列的库函数，但是这些库函数与字符串是分离开的，不太符合OPP的思想，而且底层空间需要用户自行管理，稍不留神可能会越界访问。string是一个对象，使用字符的顺序表实现的，就是一个字符顺序表。基本构造：classstring{private:size_tsize;size_tcap
C++——list 回首o c++开发语言
目录前言一、list1.1list的介绍1.2list的使用1.2.1list的构造1.2.2listiterator的使用1.2.3listcapacity1.2.4listelementaccess1.2.5listmodifiers1.2.6list的迭代器失效二、list的模拟实现2.1模拟实现list三、list与vector的对比总结前言今天我们来了解C++中STL库中的list，相当
快速从C过度C++（一）：namespace，C++的输入和输出，缺省参数，函数重载愚润泽 C++学习笔记 c++开发语言 c语言
前言：本文章适合有一定C语言编程基础的读者浏览，主要介绍从C语言到C++过度，我们首先要掌握的一些基础知识，以便于我们快速进入C++的学习，为后面的学习打下基础。这篇文章的主要内容有：1，命名空间namespace2，C++的输入和输出3，缺省参数4，函数重载个人简介：努力学习ing个人专栏：C++学习笔记CSDN主页愚润求学其他专栏：C语言入门基础，python入门基础，python刷题专栏快速
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

基于骨骼点特征的视频分割任务——花样滑冰视频的动作解析

文章目录

项目简介

骨骼点特征的提取

概述

Introduction

Method

two-branch multi-stage CNN

花样滑冰数据集(MCFS)

我们的方法

DSTA

Introduction

Method

时空注意力模块

解耦的位置编码

空间全局正则化

完整的注意力模块

整体架构

数据解耦

ETSN

GCN-ETSN(代码)

整体流程

STAttentionBlock

位置编码

参考文献

你可能感兴趣的:(我的项目,数据结构,c++)