zhang_can

[行为识别论文详解]TSN(Temporal Segment Networks)

摘要

本文旨在设计有效的卷积网络体系结构用于视频中的动作识别，并在有限的训练样本下进行模型学习。TSN基于two-stream方法构建。

论文主要贡献：

提出了TSN（Temporal Segment Networks），基于长范围时间结构（long-range temporal structure）建模，结合了稀疏时间采样策略（sparse temporal sampling strategy）和视频级监督（video-level supervision）来保证使用整段视频时学习得有效和高效。
在TSN的帮助下，研究了一系列关于视频数据学习卷积网络的良好实践

数据集表现：HMDB51(69.4%)、UCF101（94.2%）

采用TSN进行行为识别

TSN

two-stream 卷积网络对于长范围时间结构的建模无能为力，主要因为它仅仅操作一帧（空间网络）或者操作短片段中的单堆帧（时间网络），因此对时间上下文的访问是有限的。视频级框架TSN可以从整段视频中建模动作。

和two-stream一样，TSN也是由空间流卷积网络和时间流卷积网络构成。但不同于two-stream采用单帧或者单堆帧，TSN使用从整个视频中稀疏地采样一系列短片段，每个片段都将给出其本身对于行为类别的初步预测，从这些片段的“共识”来得到视频级的预测结果。在学习过程中，通过迭代更新模型参数来优化视频级预测的损失值（loss value）。

TSN网络示意图如下：

图1 TSN网络示意图

由上图所示，一个输入视频被分为 K 段（segment），一个片段（snippet）从它对应的段中随机采样得到。不同片段的类别得分采用段共识函数（The segmental consensus function）进行融合来产生段共识（segmental consensus），这是一个视频级的预测。然后对所有模式的预测融合产生最终的预测结果。

注意：接下来“片段”代表文章中“snippet”，“段”代表文章中“segment”

具体来说，给定一段视频 V ，把它按相等间隔分为 K 段 {S1,S2,⋯,SK} 。接着，TSN按如下方式对一系列片段进行建模：

T S N (T 1, T 2, \dots, T K) = H (G (F (T 1; W), F (T 2; W), \dots, F (T K; W))) (1)

其中：

(T1,T2,⋯,TK) 代表片段序列，每个片段 Tk 从它对应的段 Sk 中随机采样得到。
F(Tk;W) 函数代表采用 W 作为参数的卷积网络作用于短片段 Tk ，函数返回 Tk 相对于所有类别的得分。
段共识函数 G （The segmental consensus function）结合多个短片段的类别得分输出以获得他们之间关于类别假设的共识。
基于这个共识，预测函数 H 预测整段视频属于每个行为类别的概率（本文 H 选择了Softmax函数）。
结合标准分类交叉熵损失（cross-entropy loss），关于部分共识的最终损失函数 G 的形式为：

L (y, G) = - \sum i = 1 C y i (G i - l o g \sum j = 1 C e x p G j) (2)

其中， C 是行为总类别数， yi 是类别 i 的groundtruth，实验中片段的数量 K 设置为3。本工作中共识函数 G 采用最简单的形式，即 Gi=g(Fi(T1),…,Fi(TK)) ，采用用聚合函数 g （aggregation function）从所有片段中相同类别的得分中推断出某个类别分数 Gi 。聚合函数 g 采用均匀平均法来表示最终识别精度。

TSN是可微的，或者至少有次梯度，由 g 函数的选择决定。这使我们可以用标准反向传播算法，利用多个片段来联合优化模型参数 W 。在反向传播过程中，模型参数 W 关于损失值 L 的梯度为：

\partial L ( y , G ) \partial W = \partial L \partial G \sum k = 1 K \partial G \partial F ( T k ) \partial F ( T k ) \partial W (3)

其中，K是TSN使用的段数。TSN从整个视频中学习模型参数而不是一个短的片段。与此同时，通过对所有视频固定 K ，作者提出了一种稀疏时间采样策略，其中采样片段只包含一小部分帧。与先前使用密集采样帧的方法相比，这种方法大大降低计算开销。

学习TSN

为了达到最佳表现，一些好的实践如下：

网络结构

一些工作表明更深的结构可以提升物体识别的表现。然而，two-stream网络采用了相对较浅的网络结构（ClarifaiNet）。本文选择BN-Inception (Inception with Batch Normalization)构建模块，由于它在准确率和效率之间有比较好的平衡。作者将原始的BN-Inception架构适应于two-stream架构，和原始two-stream卷积网络相同，空间流卷积网络操作单一RGB图像，时间流卷积网络将一堆连续的光流场作为输入。

网络输入

TSN通过探索更多的输入模式来提高辨别力。除了像two-stream那样，空间流卷积网络操作单一RGB图像，时间流卷积网络将一堆连续的光流场作为输入，作者提出了两种额外的输入模式：RGB差异（RGB difference）和扭曲的光流场（warped optical flow fields）。

[行为识别论文详解]TSN(Temporal Segment Networks)_第1张图片

图2 四种输入模式的例子

单一RGB图像表征特定时间点的静态信息，从而缺少上下文信息。如上图2所示，两个连续帧的RGB差异表示动作的改变，对应于运动显著区域。故试验将RGB差异堆作为另一个输入模式。

TSN将光流场作为输入，致力于捕获运动信息。在现实拍摄的视频中，通常存在摄像机的运动，这样光流场就不是单纯体现出人类行为。如上图2所示，由于相机的移动，视频背景中存在大量的水平运动。受到iDT（improved dense trajectories）工作的启发，作者提出将扭曲的光流场作为额外的输入。通过估计估计单应性矩阵（homography matrix）和补偿相机运动来提取扭曲光流场。如图2所示，扭曲光流场抑制了背景运动，使得专注于视频中的人物运动。

网络训练

由于行为检测的数据集相对较小，训练时有过拟合的风险，为了缓解这个问题，作者设计了几个训练策略。

交叉输入模式预训练

空间网络以RGB图像作为输入：故采用在ImageNet上预训练的模型做初始化。对于其他输入模式（比如：RGB差异和光流场），它们基本上捕捉视频数据的不同视觉方面，并且它们的分布不同于RGB图像的分布。作者提出了交叉模式预训练技术：利用RGB模型初始化时间网络。

首先，通过线性变换将光流场离散到从0到255的区间，这使得光流场的范围和RGB图像相同。然后，修改RGB模型第一个卷积层的权重来处理光流场的输入。具体来说，就是对RGB通道上的权重进行平均，并根据时间网络输入的通道数量复制这个平均值。这一策略对时间网络中降低过拟合非常有效。

正则化技术

在学习过程中，Batch Normalization将估计每个batch内的激活均值和方差，并使用它们将这些激活值转换为标准高斯分布。这一操作虽可以加快训练的收敛速度，但由于要从有限数量的训练样本中对激活分布的偏移量进行估计，也会导致过拟合问题。因此，在用预训练模型初始化后，冻结所有Batch Normalization层的均值和方差参数，但第一个标准化层除外。由于光流的分布和RGB图像的分布不同，第一个卷积层的激活值将有不同的分布，于是，我们需要重新估计的均值和方差，称这种策略为部分BN。与此同时，在BN-Inception的全局pooling层后添加一个额外的dropout层，来进一步降低过拟合的影响。dropout比例设置：空间流卷积网络设置为0.8，时间流卷积网络设置为0.7。

数据增强

数据增强能产生不同的训练样本并且可以防止严重的过拟合。在传统的two-stream中，采用随机裁剪和水平翻转方法增加训练样本。作者采用两个新方法：角裁剪（corner cropping）和尺度抖动（scale-jittering）。

角裁剪（corner cropping）：仅从图片的边角或中心提取区域，来避免默认关注图片的中心。

尺度抖动（scale jittering）：将输入图像或者光流场的大小固定为 256×340 ，裁剪区域的宽和高随机从 {256,224,192,168} 中选择。最终，这些裁剪区域将会被resize到 224×224 用于网络训练。事实上，这种方法不光包括了尺度抖动，还包括了宽高比抖动。

测试TSN

由于在TSN中片段级的卷积网络共享模型参数，所以学习到的模型可以进行帧评估。具体来说，作者采用与two-stream相同的测试方案——即从动作视频中采样25个RGB帧或光流堆。同时，从采样得到的帧中裁剪4个边角和1个中心以及它们的水平翻转来评估卷积网络。

空间和时间流网络采用加权平均的方式进行融合。相比于two-strean，TSN中空间流卷积网络和时间流卷积网络的性能差距大大缩小。基于此，设置空间流的权重为1，设置时间流的权重为1.5。当正常和扭曲光流场都使用时，将其权重1.5分出1给正常光流场，0.5给扭曲光流场。

在TSN部分说过，段共识函数在Softmax归一化之前。为了根据训练测试模型，在Softmax之前融合了25帧和不同流的预测分数。

实验

数据集和实现细节

实验在两个大型主流动作数据集HMDB51和UCF101上进行。UCF101数据集包含13,320个视频剪辑，其中共101类动作。HMDB51数据集是来自各种来源的大量现实视频的集合，比如：电影和网络视频，数据集包含来自51个动作分类的6,766个视频剪辑。

作者使用小批量随机梯度下降算法（mini-batch stochastic gradient descent algorithm）来学习网络参数，batch size设置为256，momentum设置为0.9。用在ImageNet上预训练的模型对网络权重进行初始化。实验中learning rate设置较小：对于空间网络，初始化为0.01，并且每2,000次迭代降为它的 110 ，训练过程共迭代4,500次；对于时间网络，初始化为0.005，并且在第12,000和18,000次迭代之后降为它的 110 ，训练过程共迭代20,000次。

作者使用TVL1光流算法来提取正常光流场和扭曲光流场。为了加速训练，使用多GPU数据并行策略，在修改过的Caffe和OpenMPI上实现。

UCF101训练总时长（8块TITANX GPUs）：

空间TSNs：大约2小时
时间TSNs：大约12小时

探索研究

作者对四种方案进行实验：（1）从零开始训练；（2）仅仅预训练空间流；（3）采用交叉输入模式预训练；（4）交叉输入模式预训练和部分BN dropout结合。结果总结在下表1中：

表1 在UCF101 split 1上对不同训练策略进行实验的结果

[行为识别论文详解]TSN(Temporal Segment Networks)_第2张图片

由上表可以看出，从零开始训练比基线算法（two-stream卷积网络）的表现要差很多，证明需要重新设计训练策略来降低过拟合的风险，特别是针对空间网络。对空间网络进行预训练、对时间网络进行交叉输入模式预训练，取得了比基线算法更好的效果。之后还在训练过程中采用部分BN dropout的方法，将识别准确率提高到了92.0%。

在上文中提出了两种新的模式：RGB差异和扭曲的光流场。不同输入模式的表现比较如下表2。

表2 不同输入模式的表现比较

[行为识别论文详解]TSN(Temporal Segment Networks)_第3张图片

由上表可以看出：首先，RGB图像和RGB差异的结合可以将识别准确率提高到87.3%，这表明两者的结合可以编码一些补充信息。光流和扭曲光流的表现相近（87.2% vs 86.9%），两者融合可以提高到87.8%。四种模式的结合可以提高到91.7%。由于RGB差异可以描述相似但不稳定的动作模式，作者还评估了其他三种模式结合的表现（92.3% vs 91.7%）。作者推测光流可以更好地捕捉运动信息，而RGB差异在描述运动时是不稳定的。在另一方面，RGB差异可以当作运动表征的低质量、高速的替代方案。

评估TSN

在公式 (1) 中，段共识函数被定义为它的聚合函数 g ，这里评估 g 的三种形式：（1）最大池化；（2）平均池化；（3）加权平均。实验结果见表3。

表3 TSN不同段共识函数的实验结果

[行为识别论文详解]TSN(Temporal Segment Networks)_第4张图片

我们发现平局池化函数达到最佳的性能。因此在接下来的实验中选择平均池化作为默认的聚合函数。然后比较了不同网络架构的表现，结果总结在表4。

表4 在不同深度卷积网络上的实验结果

[行为识别论文详解]TSN(Temporal Segment Networks)_第5张图片

具体来说，比较了3个非常深的网络架构：BN-Inception、GoogLeNet和VGGNet-16。在这些架构中，BN-Inception表现最好，故选择它作为TSN的卷积网络架构。

现在，可以按照上述分析好的设置实现TSN了。从准确率的角度进行组件分析，结果如下：

表5 从准确率的角度进行组件分析的结果

校园打架行为识别检测系统 YOLOv5 燧机科技SuiJi YOLO 人工智能 python 计算机视觉开发语言
校园打架行为识别检测系统基于python深度学习框架+边缘分析技术，校园打架行为识别检测系统自动对校园监控视频图像信息进行分析识别。校园打架行为识别检测系统利用学校监控对校园、广场等区域进行实时监测，当监测到有人打架斗殴时，系统立即抓拍存档语音提醒，并将打架行为回传给学校监控后台，提醒后台人员及时处理打架情况。在YOLO系列算法中，针对不同的数据集，都需要设定特定长宽的锚点框。在网络训练阶段，模型
＜数据集＞考场行为识别数据集＜目标检测＞深度学习lover 深度学习数据集目标检测人工智能计算机视觉 python YOLO
数据集格式：VOC+YOLO格式图片数量：2192张标注数量(xml文件个数)：2192标注数量(txt文件个数)：2192标注类别数：2标注类别名称：['cheating','good']序号类别名称图片数框数1cheating128214412good10671261使用标注工具：labelImg标注规则：对类别进行画水平矩形框图片示例：标注示例：
邮件服务器管理软件,U-Mail 邮件服务器软件(邮件系统) weixin_39730587 邮件服务器管理软件
U-Mail是安全高速的全功能电子邮件服务器系统，融合强大的功能与简易高效的管理为一体，提供最佳的企业级邮箱服务器系统解决方案。内嵌顶级杀毒引擎；基于行为识别和热点等专利技术的反垃圾过滤引擎；终身免费升级；纯WEB管理；提供一站式全程服务！◇全球收发保证！即使您服务器的IP在对方的垃圾邮件黑名单中，邮件照发不误。◇邮件监控、收发审核！企业管理层可以根据实际的需要进行相关监控审核条件的设定。◇业界最
关于学生课堂行为识别算法 NineDays66 算法行为识别深度学习学生行为分析考试分析
目前基于针对学校做了一款考生行为识别算法，算法可以在服务器部署，也可以在前端设备如Jetson、RK等边缘设备运行，目前算法已经投入使用，算法效果如下目前算法在2080Ti服务器运行效率是150帧每秒算法运行平台模型大小吞吐量张/秒PC-2080TI50M150ARM-RK3399PRO10M10行为类别划分如下：学生未到、存在空位学生双手放在桌子下学生左、右看学生传纸条学生举手学生爬桌子睡觉学生
物业服务企业做好专业化，才能多元化王海波w
物业服务企业做好专业化，才能谈未来发展的多元化。根据质量管理体系的标准，其中人员标准和管理标准尤为重要，很多企业只是做了标准化的表面文章，一个想要做出成绩的物业服务企业，要绝对深层次挖掘标准化内涵。CIS形象识别系统行为识别，是企业人力资源管理标准化的具体体现。图片发自App物业服务企业员工行为规范，仪容仪表，自然大方得体，符合工作需要及安全规则。行为举止，姿态端正，工作中做到走路轻，说话清，操作
代理IP技术在云函数中的创新应用与拓展空间小文没烦恼服务器 linux 运维 python tcp/ip
目录前言一、代理IP技术的基本概念和原理二、云函数的基本原理和优势1.弹性伸缩2.省时省力3.按需计费三、代理IP技术在云函数中的创新应用1.反爬虫技术2.访问安全性和隐私保护3.地理定位和访问控制四、代理IP技术在云函数中的拓展空间1.代理IP池的管理和优化2.用户行为分析和行为识别3.安全审计和访问控制五、代码实例六、总结前言随着云计算技术的发展和普及，云函数作为一种基于事件驱动的计算模型，已
多只动物3D姿态估计与行为识别系统 tzc_fly 论文阅读笔记人工智能
动物社会行为的量化是动物科学研究的重要步骤。虽然现有的深度学习方法已经实现了对常见动物的精确姿态估计、识别和行为分类，但由于缺乏注释良好的数据集，其应用依然受到挑战。因此该研究展示了一个计算框架，即社会行为图谱（SBeA，SocialBehaviorAtlas），用于克服由有限数据集引起的问题。SBeA使用数量很少的labelledframes进行多个动物的3D姿态估计，实现后续的无标签识别。SB
第一周文献阅读报告半个轮子工论文阅读物联网
文献阅读报告泛读1.《毫米波与太赫兹技术》2.《基于物联网的智能养老系统》3.《基于空间聚类的FMCW雷达双人行为识别方法》4.《太赫兹应用分析和展望》5.《车载毫米波雷达应用研究》6.《基于压力传感器的跌倒检测系统研究》7.《基于隐马尔可夫模型的老年人跌倒行为检测方法研究望》8.《矿用卡车毫米波雷达防碰撞系统的研究与应用》9.《基于ＹＯＬＯ网络的人体跌倒检测方法》10.《基于多传感器融合的老人跌
打击欺诈活动：如何利用羊毛盾API保护用户与业务安全 API小百科_APISpace
前言随着互联网的不断发展，欺诈活动也日益猖獗。针对企业和用户的欺诈行为可能导致财务损失、声誉受损以及用户信任的丧失。为了保护用户与业务安全，反欺诈技术成为了企业不可或缺的防线之一。在这方面，羊毛盾API作为一种智能反欺诈工具，发挥着越来越重要的作用。反欺诈（羊毛盾）API的作用image.png如何保护用户安全？1.欺诈行为识别反欺诈（羊毛盾）API通过收集和分析大量的用户行为数据，建立了模型和算
人类行为动作数据集大合集地理探险家用于深度学习的数据集行为动作人类数据集图像深度学习
最近收集了一大波关于人类行为动作的数据集，主要包括：动作识别、行为识别、活动预测、动作行为分类等数据集。废话不多说，接下来就给大家介绍这些数据集！！1、用于自动视频编辑的视频Blooper数据集用于自动视频编辑的视频Blooper数据集数据说明：根据网上的消息，基本的视频编辑每分钟需要30分钟到一个小时。这就不鼓励用户制作周期性的内容。目前，自动视频编辑仅限于视频增强和简单的机制，如沉默或鼓掌检测
YOLO+SlowFast+DeepSORT 简单实现视频行为识别 AAI机器之心 YOLO 音视频云计算 openstack 大数据深度学习 python
前段时间刷短视频看到过别人用摄像头自动化监控员工上班状态，比如标注员工是不是离开了工位，在位置上是不是摸鱼。虽然是段子，但是这个是可以用识别技术实现一下，于是我在网上找，知道发现了SlowFast，那么下面就用SlowFast简单测试一下视频的行为识别。工具简介YOLOYOLO是一个基于深度学习神经网络的对象识别和定位算法，前面我也用v5s训练了标注的扑克牌，实现了图片或视频中的点数识别，这里就跳
AI：116-基于深度学习的视频行为识别与分析一见已难忘精通AI实战千例专栏合集人工智能深度学习音视频视频行为识别与分析
点击这里跳转到本专栏，可查阅专栏顶置最新的指南宝典~你的技术旅程将在这里启航！从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参考学习意义。✨✨✨每一个案例都附带有在本地跑过的关键代码，详细讲解供大家学习，希望可以帮到大家。欢迎订阅支持，正在不断更新中~一.基于深度学习的视频行为识别与分析随着人工智能技术的迅猛发展，深度学习成为视频行为识别与分析领域的重要推动
YOLO+SlowFast+DeepSORT 简单实现视频行为识别北桥苏 YOLO python 人工智能
前言前段时间刷短视频看到过别人用摄像头自动化监控员工上班状态，比如标注员工是不是离开了工位，在位置上是不是摸鱼。虽然是段子，但是这个是可以用识别技术实现一下，于是我在网上找，知道发现了SlowFast，那么下面就用SlowFast简单测试一下视频的行为识别。工具简介YOLOYOLO是一个基于深度学习神经网络的对象识别和定位算法，前面我也用v5s训练了标注的扑克牌，实现了图片或视频中的点数识别，这里
基于轻量级神经网络GhostNet开发构建光伏太阳能电池缺陷图像识别分析系统 Together_CZ 神经网络人工智能深度学习
工作中经常会使用到轻量级的网络模型来进行开发，所以平时也会常常留意使用和记录，在前面的博文中有过很多相关的实践工作，感兴趣的话可以自行移步阅读即可。《移动端轻量级模型开发谁更胜一筹，efficientnet、mobilenetv2、mobilenetv3、ghostnet、mnasnet、shufflenetv2驾驶危险行为识别模型对比开发测试》《基于Pytorch框架的轻量级卷积神经网络垃圾分类
基于轻量级GhostNet模型开发构建工业生产制造场景下滚珠丝杠传动表面缺陷图像识别系统 Together_CZ 制造
轻量级识别模型在我们前面的博文中已经有过很多实践了，感兴趣的话可以自行移步阅读：《移动端轻量级模型开发谁更胜一筹，efficientnet、mobilenetv2、mobilenetv3、ghostnet、mnasnet、shufflenetv2驾驶危险行为识别模型对比开发测试》《基于Pytorch框架的轻量级卷积神经网络垃圾分类识别系统》《基于轻量级卷积神经网络模型实践Fruits360果蔬识别
基于轻量级GhostNet模型开发构建生活场景下生活垃圾图像识别系统 Together_CZ 制造
轻量级识别模型在我们前面的博文中已经有过很多实践了，感兴趣的话可以自行移步阅读：《移动端轻量级模型开发谁更胜一筹，efficientnet、mobilenetv2、mobilenetv3、ghostnet、mnasnet、shufflenetv2驾驶危险行为识别模型对比开发测试》《基于Pytorch框架的轻量级卷积神经网络垃圾分类识别系统》《基于轻量级卷积神经网络模型实践Fruits360果蔬识别
计算机视觉全教程目录机器学习杨卓越计算机视觉人工智能
1、OpenCV图像处理框架实战系列总目录OpenCV图像处理框架实战系列总目录2、现代卷积网络实战系列总目录现代卷积网络实战系列总目录3、YOLO物体检测系列教程总目录YOLO物体检测系列教程总目录4、图像分割实战-系列教程总目录图像分割实战-系列教程总目录5、MMLAB计算机视觉框架实战-系列教程总目录MMLAB计算机视觉框架实战-系列教程总目录6、行为识别实战-系列教程总目录行为识别实战-系
初识智慧城市 Mr.Cssust 未来发展智慧城市人工智能
文章目录智慧家居智慧社区智慧交通智慧医疗智慧教育智慧旅游智慧农业智慧安防智慧家居利用智能语音、智能交互等技术,实现用户对家居系统各设备的远程操控和能控制如开关窗帘(窗户)、操控家用电器和照明系统、打扫卫生等操作。利用计算机视觉等技术,对被照看人员如老人、小孩、残障人土等进行行为识别,对危险行为进行预警。智慧社区利用智能识别技术对进出小区人员和车辆进行智能识别,包括身份验证、危险人员和车辆预警等:对
作业-对汽车行业偷税漏税的数据探索-spss 亲爱的十一熊猫
对汽车销售行业纳税人的各个属性指标进行分析，总结衡量纳税人的经营特征，建立偷漏税行为识别模型，识别偷漏税纳税人。数据来源于网络，该数据集提供了汽车销售行业纳税人的各个属性与是否判断为偷漏税标识，该数据不存在缺失值。原始数据的汽车销售平均毛利、维修毛利、企业维修收入占销售收入比重、增值税税负、存货周转率、成本费用利润率、整体理论税负、整体税负控制数、办牌率、单台办牌手续费收入、代办保险率、保费返还率
新型智慧视频监控系统：基于TSINGSEE青犀边缘计算AI视频识别技术的应用 TSINGSEE AI智能解决方案人工智能边缘计算
边缘计算AI智能识别技术在视频监控领域的应用有很多。这项技术结合了边缘计算和人工智能技术，通过在摄像头或网关设备上运行AI算法，可以在现场实时处理和分析视频数据，从而实现智能识别和分析。目前来说，边缘计算AI视频智能技术可以实现以下几类智能识别。1、行为识别：利用边缘设备（TSINGSEE智能分析网关）搭载的深度学习算法，对监控画面中的人员行为进行识别和分析。比如，TSINGSEE智能分析网关内置
新型智慧视频监控系统：基于TSINGSEE青犀边缘计算AI视频识别技术的应用 Black蜡笔小新解决方案 EasyCVR AI识别人工智能边缘计算
边缘计算AI智能识别技术在视频监控领域的应用有很多。这项技术结合了边缘计算和人工智能技术，通过在摄像头或网关设备上运行AI算法，可以在现场实时处理和分析视频数据，从而实现智能识别和分析。目前来说，边缘计算AI视频智能技术可以实现以下几类智能识别。1、行为识别：利用边缘设备（TSINGSEE智能分析网关）搭载的深度学习算法，对监控画面中的人员行为进行识别和分析。比如，TSINGSEE智能分析网关内置
顶刊TPAMI 2022！基于不同数据模态的行为识别：最新综述 Amusi（CVer）计算机视觉机器学习人工智能深度学习大数据
点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>CV微信技术交流群HumanActionRecognitionfromVariousDataModalities:AReview论文：https://arxiv.org/abs/2012.118661.介绍人类行为识别旨在了解人类的行为，并为行为指定标签，例如，握手、吃东西、跑步等。它具有广泛的应用前景，因此在计算机视
【行动识别】基于LSTM实现视频分类附matlab代码机器学习之星主 lstm matlab 人工智能 rnn 深度学习
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab仿真内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机⛄内容介绍笔者对行为识别技术的发展过程进行研究的基础上,深入分析了基于LSTM的视频行为识别技术的特点和实现方法,并针对视频语义中对时间
基于BP神经网络的驾驶模式识别，基于BP神经网络的驾驶行为识别神经网络机器学习智能算法画图绘图 BP神经网络神经网络人工智能深度学习
目录BP神经网络的原理BP神经网络的定义BP神经网络的基本结构BP神经网络的神经元BP神经网络的激活函数，BP神经网络的传递函数遗传算法原理遗传算法主要参数遗传算法流程图完整代码包含数据下载链接：基于BP神经网络的驾驶模式识别，基于BP神经网络的驾驶行为识别（代码完整，数据齐全）资源-CSDN文库https://download.csdn.net/download/abc991835105/885
基于轻量级模型GHoshNet开发构建眼球眼疾识别分析系统，构建全方位多层次参数对比分析实验 Together_CZ 深度学习
工作中经常会使用到轻量级的网络模型来进行开发，所以平时也会常常留意使用和记录，在前面的博文中有过很多相关的实践工作，感兴趣的话可以自行移步阅读即可。《移动端轻量级模型开发谁更胜一筹，efficientnet、mobilenetv2、mobilenetv3、ghostnet、mnasnet、shufflenetv2驾驶危险行为识别模型对比开发测试》《基于Pytorch框架的轻量级卷积神经网络垃圾分类
移动端轻量级模型开发谁更胜一筹，efficientnet、mobilenetv2、mobilenetv3、ghostnet、mnasnet、shufflenetv2驾驶危险行为识别模型对比开发测试 Together_CZ 人工智能
在实际的业务场景中，经常会需要考虑到硬件部署算力的因素，往往因为一些客观成本控制的问题，在实际项目开发中选择使用模型的时候往往会倾向于选择更为轻量级的模型来完成计算，但是也并非一味地轻量化，轻量化的同时还需要保证达到所需要的精度要求，本文选取了经常使用到的六款主流的识别模型，包括：efficientnet、mobilenetv2、mobilenetv3、ghostnet、mnasnet、shuff
python基于轻量级卷积神经网络模型ShuffleNetv2开发构建辣椒病虫害图像识别系统 Together_CZ python cnn 开发语言
轻量级识别模型在我们前面的博文中已经有过很多实践了，感兴趣的话可以自行移步阅读：《移动端轻量级模型开发谁更胜一筹，efficientnet、mobilenetv2、mobilenetv3、ghostnet、mnasnet、shufflenetv2驾驶危险行为识别模型对比开发测试》《基于Pytorch框架的轻量级卷积神经网络垃圾分类识别系统》《基于轻量级卷积神经网络模型实践Fruits360果蔬识别
基于Intel® AI Analytics Toolkits的智能视频监控系统 YoLo♪ 人工智能音视频
【oneAPIDevSummit&OpenVINODevCon联合黑客松】跳转链接：https://marketing.csdn.net/p/d2322260c8d99ae24795f727e70e4d3d目录1方案背景2方案描述3需求分析4技术可行性分析5详细设计5.1数据采集5.2视频解码与帧提取5.3人脸检测5.4行为识别5.5数据分析5.6结果展示6方案优点与适用场景6.1解决的问题6.2
行为识别标注工具 ELAN 使用教程 WAHAJA_1111 常用工具
行为识别标注工具ELAN使用教程文章目录行为识别标注工具ELAN使用教程前言安装+教程标注文件输出格式效果示意使用步骤前言调研行为识别标注工具，要求：标注整段视频片段中动作类型标签文件格式：动作标签时间始末视频标号安装+教程从ELAN官网下载安装包并安装。B站软件使用视频教程标注文件输出格式效果示意使用步骤
基于卷积神经网络的人体行为识别系统开发与设计 wqq_992250277 java java
摘要基于卷积神经网络的人体行为识别的开发与设计摘要：随着计算机领域不断的创新、其它行业对计算机的应用需求的提高以及社会对解放劳动力的迫切，人机交互成为人们关注的问题。深度学习的出现帮助了人们实现人机交互，而卷积神经网络是其的代表算法的一种，被普遍应用在计算机视觉领域实现图片识别。人体行为识别是指将一系列数据喂入训练好的神经网络，计算机对数据进行特征提取然后识别分类，其中数据包括视频、图片序列或者传
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d