Jason_____Wang

### 论文精读——An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recogniti

论文精读——IIP-Transformer: Intra-Inter-Part Transformer for Skeleton-Based Action Recognition

近期在做基于关键点的人体动作识别研究，调研了几篇基于transformer架构的 skeleton based action recognition 方面的文章，并且进行一个精读。
其中选取的一篇论文题为：IIP-Transformer: Intra-Inter-Part Transformer for Skeleton-Based Action Recognition，来自AIbee 一个AI公司，学生作者分别为北交大和南大的同学。最近刚刚发布在Arxiv上，应该还是在投状态。
个人认为这篇文章的质量还是比较高的，起码对于我来说不仅具有创新性，还有很大的启发性（文章设计的具体步骤，方式思路，以及一些消融实验真的都非常有趣）

#############################################################################

文章来源

题目：IIP-Transformer: Intra-Inter-Part Transformer for Skeleton-Based Action Recognition

链接&下载地址：

论文地址： https://arxiv.org/abs/2110.13385

一些相关连接:

开源代码：

目前该算法暂无开源代码

paper with code ：https://paperswithcode.com/paper/iip-transformer-intra-inter-part-transformer

#############################################################################

1. 简单说背景

目前基于骨骼关键点的动作识别问题（skeleton based action recognition）经过了3DCNN、 2stream 、LSTM的baseline模型阶段，在过去的两年左右时间内，基本上是以GCN（图卷积网络）为baseline 进行解决的。标志性的文章就是 19年的ST-GCN（这个应该不用多讲，网络上随便搜一下就有很多解析）。

ST-GCN 可以视为 GCN 结构解决关键点识别问题的“开创者”，这点是毋庸置疑的，因为它不仅仅贡献了一个网络，而是构建了关键点序列拓扑图的一种架构范式，将其转化成CNN 从而直接进行卷积等特征提取操作，从而使得很多CNN的trick以及模块得以复制和使用到关键点动作识别中。自此之后，大量的基于GCN 的工作得以展开，非常多网络得以提出，也极大的提升了数据集的指标。

基于GCN 的总体思路是将骨骼时序点理解成拓扑学中的图（graph）的概念，利用构建关系矩阵，将没有空间关系的关键点转化为矩阵的形式，从而将每个点的坐标以参数信息的形式表现出来，可以直接转化成“图片” （图片是：C x H x W，关键点是C x T x V ）这种形式，也霸占了主流公开数据集中的SOTA 文章。这点要说明一下，SOTA中还有一个比较特殊的：港中文提出的PoseC3D 是使用了基于heatmap 的3DCNN结构，结构相当简洁，实验相当多，性能相当好，也是比较bug 的存在。。

随着attention 注意力机制的提出，transformer 的提出以及不断发展，目前已经在NLP界达到了统治地位，目前也已经进军CV 界，大有一统CV 和Transformer 的趋势。2020年 ViT 被提出，创建了CV任务的新范式。既然骨骼点序列跟图片的形式比较像，自然也有利用transformer解决骨骼点序列的任务。最早提出的概念的是 ST-TR网络，事实上这个还是一个利用了Attention 机制的 GCN 。随后很快便有很多基于transformer 的文章被提出，并且取得了不错的效果。

2. 摘要

近期，基于transformer 的网络在基于骨架的动作识别任务上展现出了巨大的潜力。捕获全区和局部的依赖关系的能力是transformer优势的所在，但是同时也带来了二次计算与额外的参数以及内存消耗。此外，以往的研究主要集中在单个关节点的关系上，这通常会受到采样质量的或者位姿估计精度以及噪声带来的影响。

为了解决上述问题，本文提出了一种基于transformer的网络——IIP-Transformer。该网络在利用关键点信息的基础上，还将关键点进行组合成为part，并且在joint 和part 的尺度上都进行了关系的特征提取，从而得到了关节级别（intra-part）和 part级别（inter-part）的依赖关系，使得动作是别的任务更加具有效率。

在数据方面，本文提出了一种part-level 的骨架编码方式，这种方式显著的降低了计算的复杂度，并且对joint 的噪声更具鲁棒性。

此外，本文提出了一种新的数据增强方式，用于提升模型性能。

在两个大规模数据集NTU-RGB+D 60和NTU RGB+D 120上，所提出的IIP-Transformer实现了最先进的性能，其计算复杂度比基于SOTA transformer网络的DSTA网络低8倍以上。

3. 关键点总结（亮点&有价值点&问题点）

首先放一下作者自己的总结：

文章的主要贡献：

本文将body parts 的概念引入了基于transformer 的 skeleton action recognition 问题中。基于part 而不是 joint 的思想不仅减少了self-attention 的计算复杂度，而且提升了对于关键点的噪声鲁棒性。
本文提出了一个基于transformer 的关键点识别网络：IIP-Transformer ，可以分别从时间空间维度提取joint 和part 尺度下的特征关系。
本文基于NTU RGB+D 系列下的两个大型公开数据集上达到了 SOTA 级别性能的同时，节省了大量的计算量（2-36倍），取得非常好的综合效果。

记录一些我关注的点

在我看来，本篇文章一个关键贡献点之一就是证明了transformer 在骨骼关键点数据上的有效性。事实上如果了解ViT相关知识的人就可以看出，本文跟ViT 的结构是非常像的，里面有很多思想是借鉴ViT 领域的，包括文中也提到了参考的BRIT 。可以进一步提供思路：关键点序列类型的数据从维度上和分布上来说跟图片格式是很相似的，如果GCN 证明了通过某种编码可以让CNN 网络在skeleton based action recognition这个问题上行之有效，那么以本文为代表的 Transformer for skeleton based action recognition 则是证明了transformer（尤其是ViT）的网络结构在解决该问题上也是有效的，而这又表示在前沿的ViT 有很多新提出的工具以及方法可以借鉴，有很多未知领域等待探索（~~有很多文章可以水~~ ）
本文除了网络模型以外最让我觉得觉的有趣（惊喜）的是消融实验中的关于截取长度的实验。以NTU RGB-D 数据集为例，如果对skeleton based action recognition比较熟悉的小伙伴们可能会知道,这个系列的数据集（分为60 和 120）近些年基本是最常见且最base 的公开数据集。这个数据集的动作输入时长是不定的，最长的一个动作有300帧的输入（30帧每秒的话，大概有10 秒？）所以其他很多模型的输入基本上是取最大值作为输入的。即 Input shape 是 (batchsize ，channels = 3 ，T = 300 ，V =25 ) 。但是事实上一大部分的动作的长度是根本达不到300 帧的，甚至连一半的150帧也达不到，这就造成了大量的空数据被填充。作者做的这个实验中，尝试了改变输入不同时长，并且比较了此因素对于网络的差异。（如下图）

最狗血的是，当输入的帧数为 32时，本文取得了最佳性能。而超过了更长帧数的性能。
事实证明，并不是帧数越长动作是被的更加准确，相反，在本文所提出的方法中，32帧就已经足够用
（注：在这里需要说明的一点就是，使用主动的时长删减并不是本文最早提出的。可以注意到上图中的DSTA 就已经有过这方面的尝试并且将关键帧的数量缩小到128。）

还有一点想吐槽一下：本文重点在打的一个点是在网络规模相当的前提下达到了持平甚至更好的精度。但是我想说的是，模型参数的规模和计算量是和输入的数据有关系的。。你用32帧的输入去跟别人上百帧的模型去比肯定是参数要更少啊。。所以在对这一块的描写方面多少有一点避重就轻的嫌疑（~~学到了~~ ）
想谈一谈作者本文另一个创新点：Part-based Methods ，即将各关键点进行分区的策略。事实上也比较有意思。 ViT中的patch embedding本身就是在做reshape 的事情，而作者巧妙的利用了这个环节设计了一种reshape的策略，称为“part ” ，从本质上来说就是进行了一个指定的分组，并没有其他额外的计算操作。但是作者找到了理由并且赋予了其实际的意义，实验结果也证明这个策略的优越性，在我看来是一个比较有趣的设计。
另一个比较吸引我的点是作者在本文中提到的 Data Augmentation 部分。作者认为对于先前已经提出的
Rotation, GaussianNoise, GaussianBlur, JointMask 等数据增强的策略，并非完全适用于本文的 part-level ，因此，作者在本文使用的数据增强策略有：1. rotation 2. partmask ，并且希望通过这两个方法提升模型鲁棒性。原理都比较简单易懂，但是的确能起到效果。

4. 网络构建

首先看一下网络的结构图：（如上图所示）
网络基于 part 的思想，首先将人体的关键点拆分成了几个part （我可以理解成躯干和肢体），然后根据拆分的情况进行patchembedding，即将三维的数据flatten成2维的patch。随后在进行一个 position encoding 模块。随后再进行一个class token 的过程（这一步暂时还没有看懂，不知道具体是怎么操作的，如果是模仿ViT添加一个class token 的话应该是在postion embedding 之前），pat数据处理以及patchembedding部分完成，得到了n个代码块。
针对上述的具体流程，作者补充了一个流程图用于说明：

ViT 在解决图像分类问题的时候通常会抛弃掉decoder，因此在我理解通常情况下可以划分成三个步骤：
patch embedding ——》encoder ——》分类器（classifier）
本文思路相似，在patchembedding 过程结束之后，接下来是encoder 部分：

1111111111111111111111111111111
在编码部分，作者采用了将class token 和其他token 分开处理的策略（但是从实际具体讲述上来看应该是合并处理的）

经典的self-attention机制：分成qkv 然后有一个res 模块，这部分和 vit 就非常像了，如果想深入了解可以去看ViT。

为数不多的区别是：作者将两个encoder layer 中的一个 FFN 模块删掉然后合并成了一个，在实验中证明这样好像更useful。

在完成了上面两部分的操作之后，接下来就是一个简单的分类器：应该是FC层加上softmax，最后输出动作分类的预测结果。网络部分完事。

5. 实验

IIPA 的设计实验：上文中有讲到，IIPA是对标准的vit 做了一个改进，可以简单理解成从 ATTENTION—FFN 作为一个repeat layer，升级为：ATTENTION-S —ATTENTION-T —FFN 作为一个repeat layer ，可以看出，这个改动还是能够提升性能的，我认为这同时也可以理解成减少参数的一种。

class token 的对比实验，在此证明了class-head 对于分类任务的有效性。

positin emcoding 同上，也是证明了有效性。但是让我不明白的一点是为什么加了position 的比不加position 的要计算量反而更低了？？

数据增强的有效性。比较出乎意料的joint musk 和 part musk 相差的其实比较多。
数据输入帧序列长度的对比实验，这个在我看来是很有意思的。

6. 性能比较

直接看图，在性能方面，无论是GCN系列的方法还是 Transformer系列的方法，作者都有对比，较为综合且全面（少了CTR-GCN和 Pose-C3D 这两个巨头，无疑是一个小小的黑点哈哈）
同时本文的另一个优势是轻量级的模型，因此作者也毫不避讳的将其列出（毕竟只用32帧做输入，肯定小啊）可以肯定的是，本网络还是取得了非常不错的效果，再加上transformer这个新兴的议题，希望能够冲击一篇不错的顶会吧。

图像分类：从基础原理到前沿技术随机森林404 计算机视觉分类数据挖掘人工智能
引言在当今数字化时代，图像数据正以惊人的速度增长。从社交媒体上的照片分享到医疗影像诊断，从自动驾驶到工业质检，图像分类技术已经成为人工智能领域最基础也最重要的应用之一。本文将全面介绍图像分类的基础概念、发展历程、关键技术、应用场景以及未来趋势，帮助读者系统性地理解这一领域。第一章图像分类概述1.1什么是图像分类图像分类（ImageClassification）是计算机视觉中的一项核心任务，其目标是
《dlib库中的聚类》算法详解：从原理到实践 A小庞算法算法聚类数据挖掘机器学习 c++
一、dlib库与聚类算法的关联1.1dlib库的核心功能dlib是一个基于C++的机器学习和计算机视觉工具库，其聚类算法模块提供了多种高效的无监督学习工具。聚类算法在dlib中主要用于：数据分组：将相似的数据点划分为同一簇。特征分析：通过聚类结果发现数据潜在的结构。降维辅助：结合聚类结果进行特征选择或数据压缩。dlib支持的经典聚类算法包括K-Means和ChineseWhispers，适用于图像
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-split_dota.py 红色的山茶花 YOLO 笔记深度学习
split_dota.pyultralytics\data\split_dota.py目录split_dota.py1.所需的库和模块2.defbbox_iof(polygon1:np.ndarray,bbox2:np.ndarray,eps:float=1e-6)->np.ndarray:3.defload_yolo_dota(data_root:str,split:str="train")->
Python语法笔记 XiTang1 python 笔记开发语言
Python的基本语法1.计算机相关的名词知识1.1计算机的组成计算机之父：冯.诺依曼，根据冯.诺依曼结构体系，计算机是分为5部分的1.输入设备把信息传递到计算机中，比如键盘、鼠标2.输出设备信息从计算机中传递出来，比如音响、显示器、打印机等等3.存储区计算机被发明出来就是用于数据的存储和计算的计算机上有两个存储数据的设备：内存、硬盘硬盘：电脑上的磁盘分区，存储在硬盘中的数据都是持久化存储【只要不
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-augment.py
augment.pyultralytics\data\augment.py目录augment.py1.所需的库和模块2.classBaseTransform:3.classCompose:4.classBaseMixTransform:5.classCutMix(BaseMixTransform):6.classCopyPaste(BaseMixTransform):7.defv8_transfo
大语言模型技术系列讲解：大模型应用了哪些技术知世不是芝士语言模型人工智能自然语言处理 chatgpt 大模型
为了弄懂大语言模型原理和技术细节，笔者计划展开系列学习，并将所学内容从简单到复杂的过程给大家做分享，希望能够体系化的认识大模型技术的内涵。本篇文章作为第一讲，先列出大模型使用到了哪些技术，目的在于对大模型使用的技术有个整体认知。后续我们讲一一详细讲解这些技术概念并解剖其背后原理。正文开始大语言模型（LLMs）在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要
解释LLM怎么预测下一个词语的 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 语言模型 python 深度学习人工智能机器学习
解释LLM怎么预测下一个词语的通过上文词的向量进行映射在Transformer架构的大语言模型（如GPT系列、BERT等）中，词语会先被转化为词向量。在预测下一个词时，模型会基于之前所有词的向量表示（并非仅仅上一个词，但上一个词的向量是重要信息来源之一）进行计算。以GPT-2为例，在生成文本时，它会将输入文本中每个词对应的词向量依次输入到模型的多层Transformer编码器-解码器结构中。每一层
【深度学习-Day 33】从零到一：亲手构建你的第一个卷积神经网络（CNN）吴师兄大模型深度学习入门到精通深度学习 cnn 人工智能 python 大模型卷积神经网络（CNN）机器学习
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
【学习】《算法图解》第十二章学习笔记：K近邻算法程序员
前言《算法图解》第十二章介绍了一种简单而强大的机器学习算法——K近邻算法（K-NearestNeighbors，简称KNN）。这是一种基于实例的学习方法，也是机器学习领域中最基础、最直观的算法之一。本章不仅讲解了KNN的基本原理和实现方式，还探讨了特征提取、归一化等重要概念，为读者打开了机器学习的大门。本笔记将梳理KNN算法的核心思想、实现步骤以及应用场景。一、K近邻算法概述（一）基本思想K近邻算
每天40min，我们一起用70天稳扎稳打学完《JavaEE初阶》——1/70 第一天【进程和线程】【虚拟地址空间】 _蓝天IT_ 70天学完JavaEE初阶 java-ee java
专注效率记忆预习笔记复习做题欢迎观看我的博客，如有问题交流，欢迎评论区留言，一定尽快回复！（大家可以去看我的专栏，是所有文章的目录）文章字体风格：红色文字表示：重难点★✔蓝色文字表示：思路以及想法★✔如果大家觉得有帮助的话，感谢大家帮忙点赞！收藏！转发！本系列通过70天学习完JavaEE初阶，我们不图快，只求稳扎稳打。由于我高三是在家自学的，经验告诉我，学习一定要长期积累，并且及时复习，由于现在课
基于深度学习的草莓成熟度检测系统：YOLOv5 + UI界面 + 数据集 YOLO实战营深度学习YOLO实战项目深度学习 YOLO ui 人工智能目标跟踪
引言随着农业科技的发展，智能化的农业生产方式正逐步替代传统农业。果实的成熟度检测对于农业生产的管理至关重要，尤其是在果蔬的采摘、分拣和运输过程中。草莓作为一种广泛种植且受消费者喜爱的水果，其成熟度检测一直是农业智能化的重要研究方向。传统的草莓成熟度检测方法大多依赖人工经验，劳动强度大且容易出现误差，因此，基于计算机视觉和深度学习的草莓成熟度自动检测系统成为了一种理想选择。深度学习技术，尤其是卷积神
C++：指向类的成员的指针是席木木啊 C/C++c++指针 c语言
引：想必接触过C的朋友们对C语言中指针的概念已经有了深入的了解(如果初步进行了解的朋友可以看一下**C语言基础学习笔记**)。指针展开来讲的基本知识点包括：指针的概念、指针的定义和初始化及简单使用、指针函数和函数指针（有关指针函数和函数指针的内容上面的链接中也有介绍）。不得不说，C++作为C语言的扩展，在面向对象这一主体部分处处体现着指针的思想，好比：指针和引用。之所以这么说，是因
【人工智能】 AI的进化之路：大模型如何重塑技术格局蒙娜丽宁 Python杂谈人工智能人工智能 python
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界本文深入探讨了人工智能大模型的进化历程及其对技术格局的深远影响。从早期神经网络到现代大模型的突破，文章分析了关键技术进步，如Transformer架构、预训练机制和分布式计算。结合数学公式和代码示例，详细阐述了大模型的训练原理、优化方法及实际应用场景。文
数字人矩阵源码--基于深度学习的数字人面部表情合成我~18339948121 数字人源码数字人矩阵源码 123数字人源码矩阵深度学习线性代数人工智能 flask tornado python
AI正在席卷全球，数字人市场需求增长，用AI数字分身一天就能生产出几十条高质量短视频，你只需要上传一段视频，甚至都不用开口说话，直接复制粘贴文案，就能得到一个属于你的数字分身。深度学习数字人面部表情合成的关键技术3D面部建模与参数化建立高精度3D面部模型是表情合成的基础，常用Blendshape或面部动作编码系统（FACS）作为参数化控制方法。Blendshape通过线性组合基础表情形状生成新表情
碰一碰发视频源码开发部署--开发要点解析微~18339948121 碰一碰发视频碰一碰源码碰碰贴源码网络 php java python javascript c#ruby
一、什么是碰一碰发视频？碰一碰发视频系统是结合NFC通讯技术的全新门店互动物料。顾客手机解锁后，无需打开APP扫码，碰一下即可快速完成各种互动，例如去小红书发1篇门店种草笔记(AI帮写又好又快)、大众点评收藏打卡等✅怎么用？只需要在店里或者外卖包装上贴上碰碰贴，顾客通过扫描二维码或碰一下NFC感应区，就能直接跳转到你的抖音，视频号、小红书号，给你的视频点赞、分享二、通讯技术的选择与应用近场通信技术
数字人视频剪辑与数字人分身源码开发的的核心技术解析微~18339948121 数字人分身源码数字人剪辑源码数字人源码 django pygame virtualenv plotly scikit-learn flask tornado
数字人视频剪辑与分身的核心技术解析数字人视频剪辑和分身技术是近年来人工智能与计算机视觉领域的热点，涉及虚拟形象生成、动作驱动、语音合成等多项技术。以下从技术实现、应用场景和工具选择三个方面展开分析。数字人视频剪辑的关键技术视频剪辑中数字人的核心在于动态形象的生成与编辑。基于深度学习的生成对抗网络（GAN）和3D建模技术可实现高保真虚拟形象构建。典型流程包括：人物建模：通过多视角图像或视频数据重建3
ReBEL模型的本地部署与运行，用于三元组抽取任务（事件抽取、知识抽取）
1.服务器CUDA11.72.依赖condacreate-nrebel_envpython=3.10-ycondaactivaterebel_env#安装PyTorch（建议与CUDA11.7配合）pipinstalltorchtorchvisiontorchaudio--index-urlhttps://download.pytorch.org/whl/cu117#安装Transformers和
Rust 学习笔记：比较数值 UestcXiye Rust Rust
Rust学习笔记：比较数值Rust学习笔记：比较数值整数类型浮点类型NANRust学习笔记：比较数值整数类型在Rust中，可以用以下运算符比较数值：>、=、i32。但要注意从范围大的类型转换成范围小的类型，编译不会报错，但结果可能不对。解决方法2：使用try_into()进行类型转换try_into()方法：导入std::convert::TryIntotrait。该方法返回Result类型。us
大神之路-起始篇 | 第13章.计算机科学导论之【文件结构】学习笔记全栈工程师修炼指南从业必看书籍专栏学习笔记
欢迎关注「WeiyiGeek」公众号点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！涉及网络安全运维、应用开发、物联网IOT、学习路径、个人感悟等知识“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]作者博客：[https://blog.weiyigeek.top]作者答疑学习交流群：
pytorch官方文档60分钟入门笔记 xiaodidadada 机器学习
文章目录1.张量（Tensors）定义张量张量操作2.自动求导（autograd）变量Variable3.神经网络4.训练一个分类器载入数据5.数据并行day63参考：官方文档https://blog.csdn.net/u014630987/article/details/786690511.张量（Tensors）tensors和numpy的ndarray类似,但是tensors可以使用GPU加快
笔记本安装linux系统_“老笔记本”操作系统的安装彭英韬笔记本安装linux系统
现在科技发展电脑更新速度很很，有很多人已经换了几台电脑了。一是工作需要电脑满足不了需求；二是经济条件好经常更换满足心里需求；三是只会使用电脑不会维修，修不好就换等情况。现在电脑出现问题比较多的操作系统，由于经常上网有一些软件自动就安装了，使用一段时间电脑速度就慢了，有时自己清理电脑就出现进不了系统。还有时候安装自己需要系统时，由于不匹配等因素，导致电脑死机或出现蓝屏现象。虽然上网关系系统安装的软件
Linux操作系统笔记3 wu2790 笔记
接口管理命令：ip命令字符终端nmcli命令字符终端nmtui命令可视化终端ip命令：使用ip命令可以配置临时网络的连接信息，相关命令如下：iplink：显示网络设备运行状态ip-slink：显示更详细的设备信息iplinkshow[网络设备名]：仅显示指定的网络设备名的信息iplinkshowup：仅显示当前处于激活状态的设备信息iplinkset[网络设备名]down：将指定的网络设备下线ip
linux操作系统笔记1 wu2790 linux 笔记服务器
基本命令格式[redhat@localhost~]$$:使用的shell，$表示普通用户，#表示root（管理员）用户redhat：表示当前登录的用户，su(-)切换用户，whoami查看当前登录的用户localhost：表示主机名称，hostname查看主机名称，还可以临时修改（hostname英文名称）,永久修改（hostnamectlset-hostname英文名称）~：表示当前的工作目录,
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
Liunx 操作系统笔记4 wu2790 笔记
进程管理命令ps命令：功能是显示当前系统的进程状态使用ps命令可以查看到进程的所有信息，例如进程的号码，发起者，系统资源使用占比，运行状态等，ps命令可帮助我们及时发现哪些进程出现“僵死”或“不可中断”等异常情况。ps命令经常会与kill命令搭配使用，以中断和删除不必要的服务进程，避免服务器的资源浪费语法格式：ps参数常用参数：-a显示所有进程信息-t显示属于指定终端主机的程序状态-c不显示程序路
【深度学习:进阶篇】--4.2.词嵌入和NLP 西柚小萌新吖(●ˇ∀ˇ●) #深度学习深度学习自然语言处理人工智能
在RNN中词使用one_hot表示的问题假设有10000个词每个词的向量长度都为10000，整体大小太大没能表示出词与词之间的关系例如Apple与Orange会更近一些，Man与Woman会近一些，取任意两个向量计算内积都为0目录1.词嵌入1.1.特点1.3.word2vec介绍1.3.Word2Vec案例1.3.1.训练语料1.3.2.步骤1.3.3.代码2.测试代码1.词嵌入定义：指把一个维数
【深度学习】卷积神经网络(CNN)原理 chaser&upper 深度学习神经网络卷积计算机视觉
【深度学习】卷积神经网络原理1.卷积神经网络的组成2.卷积层2.1卷积运算过程3.padding-零填充3.1ValidandSame卷积3.2奇数维度的过滤器4.stride-步长5.多通道卷积5.1多卷积核（多个Filter）6.卷积总结7.池化层(Pooling)8.全连接层9.总结1.卷积神经网络的组成定义卷积神经网络由一个或多个卷积层、池化层以及全连接层等组成。与其他深度学习结构相比，卷
深度学习学习经验——卷积神经网络（CNN） Linductor 深度学习学习经验深度学习学习 cnn
卷积神经网络卷积神经网络（CNN）1.卷积神经网络的基本组成2.卷积操作3.激活函数（ReLU）4.池化操作5.全连接层6.卷积神经网络的完整实现项目示例项目目标1.加载数据2.卷积层：图像的特征探测器2.1第一个卷积层3.激活函数：增加非线性4.池化层：信息压缩器5.多层卷积和池化：逐层提取更高层次的特征6.全连接层：分类器7.模型训练和测试完整的项目示例代码总结卷积神经网络（CNN）卷积神经网
【V5.0 - 视觉篇】AI的“火眼金睛”：用OpenCV量化“第一眼缘”，并用SHAP验证它的“审美” 爱分享的飘哥 AI 人工智能 opencv 计算机视觉
系列回顾：在上一篇《给AI装上“写轮眼”：用SHAP看穿模型决策的每一个细节》中，我们成功地为AI装上了“透视眼镜”，看穿了它基于数字决策的内心世界。但一个巨大的问题暴露了：它的世界里，还只有数字。它能理解“时长60秒”，却无法感受画面的震撼。它是一个强大的“盲人数学家”。计算机视觉我们没有必要为每个视频进行切帧，可以针对开头的视频或者中间关键点视频进行切帧，让计算机识别。承上启下：“现在，我们来
C++笔记想要入门的程序猿 c++笔记开发语言
一.指针与引用的区别：1.指针是一个实际的变量，引用是一个别名2.指针可以为空，引用不行3.引用在定义的时候只能初始化一次，后面就不能变了，指针可以变4.指针需要通过解引用操作符（*）访问目标对象，而引用直接作为原变量的别名使用，无需特殊符号inta=10;int*p=&a;int&r=a;coutwords={"apple","banana","cherry"};std::sort(words.
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro