supercolar

视频深度学习：行为识别指南

我的小程序：

待办计划：给自己立个小目标吧！

动作识别困难的原因：
1 巨大的计算成本：
一个简单的卷积2D网络用于101个类的分类只有~5M个参数，而相同的结构在膨胀为3D结构时会产生~33M个参数。在UCF101上训练3DConvNet需要3到4天，而在Sports-1M上训练3DConvNet则需要2个月，这使得广泛的架构搜索变得困难，而且可能过拟合

2 捕获长上下文
动作识别涉及跨帧捕获时空上下文。另外，所捕获的空间信息必须补偿照相机的运动。即使有强大的空间目标检测也不够，因为运动信息也携带更精细的细节。有一个局部和全局的背景w.r.t.运动信息，需要捕捉以进行稳健的预测。例如，考虑图2所示的视频表示。一个强大的图像分类器可以识别两个视频中的人体、水体，但是时间周期性动作的性质区分了自由泳和蛙泳

3 设计分类体系结构
设计能够捕获时空信息的体系结构有多种选择，这些选择非常重要，而且评估成本很高。例如，一些可能的策略可以是:
   一个用于捕获时空信息的网络 vs 分成空间和时间两个单独的网络
   跨多个片段融合预测
   端到端训练 vs 先特征提取再分类

4 无通用基准
最受欢迎的基准数据集是UCF101和Sports1M，它们已经存在很长一段时间了。在Sports1M上寻找合理的架构可能非常昂贵。对于UCF101，虽然帧的数目与ImageNet相当，但是视频之间的高空间相关性使得训练中的实际多样性要小得多。此外，鉴于两个数据集的主题（sports）相似，将基准架构推广到其他任务仍然是一个问题。最近通过引入Kinetics数据集解决了这个问题

这里必须指出的是，从三维医学图像中检测异常并不涉及这里提到的所有挑战。医学图像动作识别的主要区别如下：
1 在医学成像的情况下，时间背景可能没有动作识别那么重要。例如，在头颅CT扫描中发现出血可能涉及的跨脑片时间范围要小得多。颅内出血只能从单层切片上检测出来。与此相反，从胸部CT扫描中发现肺结节需要捕捉时间背景，因为结节以及支气管和血管在二维扫描中都像圆形物体。只有当三维环境被捕获时，结节才可以被视为球形物体，而不是像血管这样的圆柱形物体
2 在动作识别方面，大多数的研究思路都是以预先训练好的二维CNNs作为起点，以获得更好的收敛性。如果是医学图像，这种预先训练的网络将是不可用的。

在深入学习出现之前，大多数用于动作识别的传统CV算法变体可以分为以下3个主要步骤：
   1 描述视频区域的局部高维视觉特征被密集地或稀疏地提取出来。
   2 提取的特征被组合成一个固定大小的视频级描述。该步骤的一个流行变体是在视频级别对特征进行编码的视觉词袋（使用分层或k-均值聚类导出）。
   3 一个分类器，如支持向量机或RF，被训练在一袋视觉单词上进行最终预测

在这些使用浅层手工特征的算法中，使用密集采样轨迹特征的改进密集轨迹（iDT）是最先进的。同时，2013年，3D卷积被用于动作识别，但没有太大帮助[7]。2014年之后不久，两篇突破性的研究论文被发表，它们构成了我们将在本文中讨论的所有论文的主干。两者的主要区别在于结合时空信息的设计选择。

方法1：单流网络
在这项工作【2014年6月】中，作者-Karpathy等人。-探索使用二维预训练卷积从连续帧融合时间信息的多种方法。
如图3所示，在所有设置中，视频的连续帧被呈现为输入。单帧使用单个架构，在最后阶段将来自所有帧的信息进行融合。后期融合使用两个共享参数的网络，间隔15帧，最后合并预测。早期融合通过卷积超过10帧在第一层进行合并。慢融合包括多个阶段的融合，是早期和晚期融合的平衡。对于最终预测，从整个视频中抽取多个片段，并对其预测分数进行平均以进行最终预测。
尽管进行了大量的实验，但作者发现，与最先进的手工制作的基于特征的算法相比，结果要差得多。失败有多种原因：
1 学习到的时空特征不能捕捉运动特征
2 由于数据集的多样性较低，学习这些详细的特性非常困难

方法2：双流网络
在Simmoyan和Zisserman【2014年6月】的这项开创性工作中，作者以Karpathy等人之前的工作的失败为基础。考虑到深部结构学习运动特征的韧性，作者以叠加光流矢量的形式显式地模拟了深部结构的运动特征。因此，该架构没有单一的空间上下文网络，而是有两个独立的网络-一个用于空间上下文（预先训练），一个用于运动上下文。空间网络的输入是视频的一个帧。作者对时间网络的输入进行了实验，发现连续10帧的双向光流叠加效果最好。分别对两个流进行训练，并用支持向量机进行组合。最后的预测与前面的论文相同，即在采样帧上进行平均。
虽然该方法通过显式捕捉局部时间运动提高了单流方法的性能，但仍存在一些缺点：
   1 由于视频级预测是通过对采样片段的平均预测获得的，因此在学习到的特征中仍然缺少长距离的时间信息。
   2 由于训练片段是从视频中统一抽取的，因此存在伪标签分配问题。这些片段中的每一个的ground truth被假定为与视频的ground truth相同，但如果动作在整个视频中只是发生了很小的持续时间，则可能不是这样。
   3 该方法包括预先计算光流矢量并将其分开存储。另外，这两个训练是分开的，这意味着进行端到端的训练仍然是一条漫长的道路。

以下的论文在某种程度上是上面两篇论文（单流和双流）的进化版：
    LRCN
    C3D
    Conv3D & Attention
    TwoStreamFusion
    TSN
    ActionVlad
    HiddenTwoStream
    I3D
    T3D

LRCN：Long-term Recurrent Convolutional Networks for Visual Recognition and Description
主要贡献：
   1 在以前工作的基础上，使用RNN而不是基于流的设计
   2 视频编码解码器体系结构的扩展
   3 用于行为识别的端到端可训练架构
简介：
在Ng等人[9]之前的工作中。作者们探索了在单独训练的特征图上使用LSTMs的想法，看看它是否能从片段中捕获时间信息。遗憾的是，他们得出结论：卷积特征的时间池化比经过训练的特征映射后的LSTM叠加更有效。在本文中，作者在卷积块（编码器）之后使用LSTM块（译码器），但在整个体系结构中使用端到端的训练。他们还比较了作为输入选择的RGB和光流，发现基于两种输入的预测加权评分是最好的。
算法：
在训练过程中，从视频中抽取16个帧片段。该架构是端到端训练，输入为RGB或16帧片段的光流。每个片段的最终预测是每个时间步预测的平均值。视频级的最终预测是来自每个片段的预测的平均值。
我的评论：
尽管作者提出了端到端的培训框架，但是仍然有一些缺点：
   1 错误的标签分配，因为视频已分割成片段
   2 无法捕获长久的时间信息
   3 使用光流意味着分别计算流特征
瓦罗尔等人。在他们的工作中[10]试图通过使用较低的视频空间分辨率和较长的片段（60帧）来补偿时间范围不足的问题，这导致了明显更好的性能。

Benchmarks (UCF101-split1):

Score	Comment
82.92	Weighted score of flow and RGB inputs
71.1	Score with just RGB

C3D：Learning Spatiotemporal Features with 3D Convolutional Networks
主要贡献：
   1 将三维卷积网络重新用作特征提取器
   2 广泛搜索最佳三维卷积核和体系结构
   3 用反卷积层解释模型决策
简介：
这项工作是基于arpathy等人的工作。然而，他们没有在帧之间使用二维卷积，而是在视频上使用三维卷积。其想法是在Sports1M上训练这些庞大的网络，然后将它们（或具有不同时间深度的网络集合）用作其他数据集的特征提取器。他们的发现是一个简单的线性分类器，比如支持向量机，在提取特征集合的基础上工作得比现有的算法更好。如果另外使用iDT等手工制作的特性，该模型的性能甚至更好。
这项工作的另一个有趣的部分是使用反卷积层来解释这些决策。他们的发现是，网络在最初的几帧集中于空间外观，并在随后的几帧中跟踪运动。
算法：
在训练过程中，每段视频随机抽取5个2秒的片段，他们的ground truth是整个视频的ground truth。在测试时间内，随机抽取10个片段，对其进行预测，取平均作为最终预测。
我的评论：
长时间建模仍然是一个问题。此外，训练如此庞大的网络在计算上是一个问题——特别是对于医学成像来说，来自自然图像的预训练并没有多大帮助。
注：大约在同一时间，Sun等人[11]引入了因子化3D卷积网络（FSTCN）的概念，在这里，作者探索了将3D卷积分解为空间2D卷积和时间1D卷积的思想。在2d卷积层之后放置的一维卷积被实现为时间和通道维度上的二维卷积。因子化三维卷积（FSTCN）在UCF101上有不错的结果。

Benchmarks (UCF101-split1):

Score	Comment
82.3	C3D (1 net) + linear SVM
85.2	C3D (3 nets) + linear SVM
90.4	C3D (3 nets) + iDT + linear SVM

Conv3D & Attention：Describing Videos by Exploiting Temporal Structure
主要贡献：
   1 一种新的捕获局部时空信息的三维CNN-RNN编解码器结构
   2 使用CNN-RNN编码器-解码器框架中的注意机制捕获全局上下文
简介：
虽然这项工作与动作识别没有直接关系，但它在视频表现方面是一项里程碑式的工作。本文采用三维CNN+LSTM作为视频描述任务的基本架构。在此基础上，作者使用预先训练的3D CNN来提高结果。
算法：
设置与LRCN中描述的编解码器架构几乎相同，但有两个不同之处:
   1 与将特征从3D CNN按原样传递给LSTM不同，片段的3D CNN特征映射与相同帧集的堆叠2D特征映射相连，以丰富每个帧i的表示{v1，v2，…，vn}。注意：所使用的2D和3D CNN是预先训练的，而不是像LRCN那样端到端训练的
   2 使用加权平均来组合时间特征，而不是对所有帧的时间向量进行平均。每   的注意权值都是根据LSTM输出来确定的。
我的评论：
这是2015年首次引入视频表示注意机制的里程碑式工作之一。

TwoStreamFusion:Convolutional Two-Stream Network Fusion for Video Action Recognition
主要贡献：
   1 通过更好的长时间段损失进行长时间段建模
   2 一种新颖的多层融合结构
简介：
在这项工作中，作者使用了两种新方法的基本双流架构，并在不显著增加参数规模的情况下证明了性能的提高。作者探讨了两个主要观点的有效性：
   1 空间和时间流（如何和何时）的融合-对于区分梳头和刷牙的任务-空间网可以捕捉视频中的空间依赖性（是头发或牙齿），而时间网可以捕捉视频中每个空间位置的周期运动。因此，将特定面部区域的空间特征匹配到相应区域的时间特征是非常重要的。为了达到同样的效果，网络需要在早期进行融合，以便在相同像素位置的响应被对应地放置，而不是在末端融合（类似于在基本双流架构中）。
   2 将跨时间帧的时间网络输出结合起来，以便对长时间依赖性进行建模。
双流架构中的所有东西几乎都是相似的，除了：
   1 如下图所示，来自两个流的conv_5层的输出通过卷积和池化进行融合。在最后一层还有另一个融合。最后的融合输出用于时空损失评估。
   2 对于时间的融合，时间网络的输出，跨时间叠加，通过卷积和池化融合，用于时间损失
我的评论：
作者建立了双流融合方法的优势，因为它在没有额外参数的情况下提升了性能，优于C3D。

Benchmarks (UCF101-split1):

Score	Comment
92.5	TwoStreamfusion
94.2	TwoStreamfusion + iDT

TSN：Temporal Segment Networks: Towards Good Practices for Deep Action Recognition
主要贡献：
   1 面向长时间段建模的有效解决方案
   2 将批量归一化、dropout和预训练确立为好的做法
简介：
在这项工作中，作者改进了双流架构，以产生最先进的结果。与之前的论文有两大不同：
他们建议在视频中稀疏地采样片段，以更好地模拟长时间段信号，而不是在整个视频中随机采样。
为了在视频层面进行最终预测，作者探索了多种策略。最好的策略是：
   1 通过对片段平均，分别组合时间和空间流（以及其他输入模式涉及的其他流）的分数
   2 使用加权平均法融合最终空间流和时间流分数，并对所有类别应用softmax。
这项工作的另一个重要部分是解决过度拟合（由于数据集规模较小）的问题，并演示如何使用当前流行的技术，如批量归一化、dropout和预先训练来解决这一问题。作者还评估了两种替代光流的新输入模式，即扭曲光流和RGB差分。
算法：
在训练和预测过程中，视频被分成K段，时间相等。此后，从K个片段中随机抽取片段。其余步骤仍然类似于两流体系结构，并进行了如上所述的更改。
我的评论：
这项工作试图解决行动识别的两大挑战-由于小规模数据而导致的过度拟合以及和长时间段建模，结果真的很强。然而，光流和相关输入模式的预计算问题仍然是一个大问题。

Benchmarks (UCF101-split1):

Score	Comment
94.0	TSN (input RGB + Flow )
94.2	TSN (input RGB + Flow + Warped flow)

ActionVLAD：ActionVLAD: Learning spatio-temporal aggregation for action classification
主要贡献：
1 特征的可学习视频级聚合
2 基于视频级聚合特征的端到端可训练模型来捕获长期依赖性
简介：
与使用maxpool或avgpool的普通聚合相比，本文作者最显著的贡献是使用了可学习特征聚合（VLAD）。聚合技术类似于视觉词汇袋。有多个学习的锚点（比如c1，…ck）为基础的词汇表，表示k个典型动作（或子动作）相关的时空特征。两流体系结构中的每个流的输出是根据k空间“动作词”特征编码的-每个特征是来自任何给定空间或时间位置的对应锚点的输出的差异。
平均或最大池将点的整个分布表示为单个描述子，对于表示由多个子动作组成的整个视频而言，该描述符可能是次优的。相比之下，所提出的视频聚合通过将描述符空间分割成k个单元并在每个单元内进行池化，来表示具有多个子动作的描述子的整个分布。
算法：
除了ActionVLAD层的使用之外，来自双流架构的所有东西几乎都是相似的。作者在conv层确定最佳策略后，实验了多层放置ActionVLAD层和后期融合。
我的评论：
VLAD作为一种有效的池化方式早就被证明了。在端到端可训练的框架中对其进行扩展，使得该技术在2017年初的大多数动作识别任务中都非常强大和先进。

Benchmarks (UCF101-split1):

Score	Comment
92.7	ActionVLAD
93.6	ActionVLAD + iDT

HiddenTwoStream：Hidden Two-Stream Convolutional Networks for Action Recognition
主要贡献：
   1 利用独立网络实时生成光流输入的新结构
简介：
在双流体系结构中使用光流使得必须在预先计算每个采样帧的光流，从而对存储和速度产生不利影响。本文提出了一种无监督的结构来产生一组帧的光流。
光流可以看作是一个图像重建问题。给定一对相邻的帧I1和I2作为输入，CNN生成一个流场V，然后利用预测的流场V和I2，利用逆逆向映射将I1重建为I1'，从而使I1与其重建之间的差异最小化。
算法：
在不影响精度的前提下，探索了多策略、多体系结构来产生最大fps、最小参数的光流。最终的体系结构与两流体系结构相同，其变化如下所述：
   1 时间流现在在一般的时间流体系结构之上叠加了光流生成网（MotionNet）。时间流的输入现在是后续帧，而不是经过预处理的光流；
   2 运动网的无监督训练还有一个额外的多层次损失
作者还演示了使用基于TSN的融合来代替传统的双流方法架构在性能上的改进。
我的评论：
本文的主要贡献是提高预测速度和相关成本。通过流的自动生成，作者减轻了对较慢的传统方法生成光流的依赖。

Benchmarks (UCF101-split1):

Score	Comment
89.8	Hidden Two Stream
92.5	Hidden Two Stream + TSN

I3D：Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset
主要贡献：
1 利用预训练将基于3D的模型组合到双流体系结构中
2 未来的基准数据集Kinetics和改进行为数据集多样性
这篇论文从C3D离开的地方起飞。在双流架构中，作者使用两个不同的3D网络来代替单一的3D网络。此外，为了利用预先训练的二维模型，作者在三维中重复使用了二维预先训练的权重。现在，空间流输入由时间维度上堆叠的帧组成，而不是基本的双流架构中的单帧。
算法：
与基本的双流架构相同，但每个流都有3D网络
我的评论：
本文的主要贡献是证明了使用预先训练的2D conv网的好处。论文中开放的Kinetics数据集是本文的另一个重要贡献。

Benchmarks (UCF101-split1):

Score	Comment
93.4	Two Stream I3D
98.0	Imagenet + Kinetics pre-training

T3D：Temporal 3D ConvNets: New Architecture and Transfer Learning for Video
主要贡献：
1 跨深度组合时间信息的体系结构
2 一种新的训练结构与技术，用于监控二维预训练网络到三维网络的迁移学习
简介：
作者扩展了在I3D上所做的工作，但建议使用基于单流3D DenseNet的体系结构，在密集块之后叠加多深度时间池层（时间转换层），以捕获不同的时间深度。多深度池是通过与不同时间大小的核池来实现的。
除此之外，作者还设计了一种新的监控预训练2D卷积网络和T3D之间迁移学习的技术，2D预训练网络和T3D都是来自视频的帧和片段，其中片段和视频可以来自同一视频，也可以不来自同一视频。在此基础上进行0/1预测试验，并将预测误差通过T3D网络进行反向传播，有效地传递知识。
该体系结构基本上是对DenseNet[12]的3D修改，增加了可变时间池化。
我的评论：
虽然这些结果在I3D的基础上没有得到改善，但这主要是由于与I3D相比，模型的规模小得多，本文最新的贡献是有监督的迁移学习技术。

Benchmarks (UCF101-split1):

Score	Comment
90.3	T3D
91.7	T3D + Transfer
93.2	T3D + TSN

待办计划：给自己立个小目标吧！

参考博文：

Deep Learning for Videos: A 2018 Guide to Action Recognition

参考文献：

ConvNet Architecture Search for Spatiotemporal Feature Learning by Du Tran et al.
Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset
Action recognition by dense trajectories by Wang et. al.
On space-time interest points by Laptev
Behavior recognition via sparse spatio-temporal features by Dollar et al
Action Recognition with Improved Trajectories by Wang et al.
3D Convolutional Neural Networks for Human Action Recognition by Ji et al.
Large-scale Video Classification with Convolutional Neural Networks by Karpathy et al.
Beyond Short Snippets: Deep Networks for Video Classification by Ng et al.
Long-term Temporal Convolutions for Action Recognition by Varol et al.
Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks by Sun et al.
Densely Connected Convolutional Networks by Huang et al.

京东保价流程,京东保价条件有哪些? 日常购物技巧呀
现在京东双十一价格已经出来了，购物车里的宝贝又在蠢蠢欲动了，下单时还是很犹豫，这个价格会是最优惠的价格吗?会不会年终大促的时候又便宜了呢。这是最让人头疼的。对于这一点，京东售后服务还是很到位的。只要我们去申请一个价格保护，如果系统检测出你所购买的商品确实降价了的话，会很快将差价返还到你付款的账户上。那么，京东保价怎么申请?京东申请保价条件要求有哪些?京东怎么申请保价?1.第一步：首先，在手机上打开
如何使用爬虫简单的爬取一个网页的静态前端代码
什么是爬虫？Python爬虫是一种使用Python语言编写的程序，用于自动访问网页并提取所需信息。它通常用于网络数据抓取、数据挖掘和信息收集。Python爬虫可以模拟浏览器行为，向服务器发送请求并接收响应数据，然后解析这些数据以获取有用的信息。爬虫的基本原理（流程）发送请求：爬虫向目标网站的服务器发送HTTP请求（通常是GET请求）。获取响应：服务器返回网页的HTML内容。解析内容：爬虫解析HTM
2024年热门高薪职业,男生最爱的有哪些?快来看看! 氧惠超好用
在这个竞争激烈的社会中，男人赚钱的方式和层次阶段是多种多样的。每个人都有自己的特长和优势，通过不同的方式和层次阶段来实现自己的价值。本文将为你揭示男人赚钱的五种方式和赚钱的五个层次阶段，帮助你更好地了解男人的赚钱之道。一、靠体力赚钱体力是男人最基本的优势之一，通过劳动和体力付出，男人可以获得一定的报酬。这种方式虽然比较基础，但是对于一些没有其他技能的男人来说，是一种比较可靠的方式。同时，这种方式也
2014年最具人气国外WORDPRESS主题 weixin_34355715 php 前端 ux ViewUI
在国外，WrodPress这个博客系统极为受欢迎，使用WordPress来建站可以降低很多成本，另外还能以十分便宜的价格获得一个漂亮的WP网站模板。今天向大家分享来自Themeforest2014年最具人气的高级WrodPress主题，这些主题无论是设计还是技术上，都是目前最新最流行的。比如CSS3、扁平化、响应式设计、全屏视频背景、视差滚动特效等等。本次分享的WP主题实用性非常不错，流行的设计+
.NET 9 RC 2正式发布 li dream .net
距离最终版本还有一个月的时间，Microsoft已经交付了.NET9的第二个也是最后一个候选版本。.NET团队在公告帖子中写道[1]，“当我们为11月的.NET9正式发布（GA）版本做准备时，我们正在对性能、稳定性和任何其他优化进行最后的润色，使其成为.NET9的最佳版本。.NET9ReleaseCandidate2包含在上线许可证中，因此您在生产应用程序中使用它时可以获得支持。我们鼓励开发人员今
在 Conda 中删除环境及所有安装的库 Studying 开龙wu conda
注意事项1.删除环境前确保你没有在该环境中运行任何程序。2.删除操作是不可逆的，所有该环境中的包和配置都会被永久删除。3.如果你想保留环境的配置信息，可以在删除前使用condaenvexport>environment.yml导出环境配置。关于requirements.txt和environment.yaml文件使用介绍详情可参考以往文章，争对机器学习和深度学习里Python项目开发管理项目依赖的
2023-03-22 小郭不会打篮球
3.21笔记一、定位作用：显示定在所有其他元素之上、可以让元素在浏览器中任意位置。a标准流块级元素独占一行→垂直布局行内元素/行内块元素一行显示多个→水平布局b浮动可以让原本垂直布局的块级元素变成水平布局c定位可以让元素自由的摆放在网页的任意位置一般用于盒子之间的层叠情况1、属性名：position静态定位：static相对定位：relative绝对定位：absolute固定定位：fixed向下移
在 Ubuntu 中配置 Samba 实现「特定用户可写，其他用户只读」的共享目录执剑走天涯xp ubuntu windows 网络
需求目标所有认证用户可访问Samba共享目录/path/to/home；**仅特定用户（如developer）**拥有写权限；其他用户仅允许读取；禁止匿名访问。配置步骤1.设置文件系统权限将目录/home3/guest的所有权设为developer用户和所属组，并设置权限：sudochown-Rdeveloper:developer/path/to/homesudochmod-R755/path/
nextjs学习笔记 ainuo5213 web前端框架学习 next react react服务端渲染 next入门
由于本人最近在学习jocky老师的React16.8+Next.js+Koa2开发Github全栈项目关于react的服务端重构项目，然后跟着老师的视频做笔记，记录下自己的所学知识。目录结构pages(必需)：pages目录是nextjs中最终要的一个目录，这个目录的每一个文件都会对应到每一个页面，可以根据地址栏的路由进行跳转。若pages下的js文件在一个目录下，那么nextjs默认会将这个
Python-Django毕业设计养老院老人日常生活管理系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
使用 .NET 6.0 的简单 WebSocket 客户端和服务器应用程序
几个月前，有同事来找我，问能否用.NET创建一个简单的WebSocket服务器（以及之后的客户端）。据我了解，他想用它来控制对方电脑上的进程。或许对其他人也有用，所以我把它发布在这里。让我们从服务器开始。我这里使用的是.NET6和ASP.NETCore，不需要任何额外的配置。它实际上是一个准系统应用程序，没有任何花哨的附加功能。Console.Title="Server";varbuilder=W
日常喵叽呱呱
今天差点就忘记写了，今晚来了一个小朋友，他应该是我带的最差的小学生。数学也太差了吧，方程一点都不会。虽然做作业的速度很快，但是正确率为零。尤其是数学特别特别特别差。今天早上一大早我还去和其他教育机构的老师进行了教研活动。那些老师都好厉害呀。我特别佩服。他们上了讲台之后还能够流利顺畅的完成讲解任务。他们的脑子好好啊，而且还可以证明他们的知识储备非常丰富哦豁，就是一个小菜鸡。不知道我的表现到底怎么样？
比特币价格正在下降这可能就是比特币价格暴跌的原因 mibnag
上个月比特币价格上涨，在几周之内从大约6,300美元攀升至8,400美元的高点，可能已经结束。在过去的12个小时里，比特币下跌了5％，远低于8,000美元的心理关口，因交易商和投资者担心传统金融机构正在采取税收打击和基于区块链的申请。比特币在Coinbase下跌至7,675美元的低点，低于每日高点8,168美元。与此同时，其他加密货币也受到了影响，以太坊在过去24小时内下降了6％，而瑞波下降了约4
物联网系统中-告警配置功能的定义小赖同学啊 test Technology Precious 物联网 struts servlet
物联网系统中的告警配置功能是用户定义异常事件触发条件、通知方式和处理流程的核心管理模块。它通过对设备数据、系统状态的实时监控，在满足预设规则时主动推送风险信息，确保运维人员及时响应。以下是其详细定义与技术实现要点：一、核心定义告警配置功能允许用户通过可视化界面或API，为物联网系统设定异常检测规则与响应策略，包含三大核心要素：触发条件：基于设备数据/系统指标的逻辑判断（如温度＞100℃持续5分钟）
梧州10家正规亲子鉴定中心大全(附2024年权威鉴定地址汇总) 鼎律基因刘主任
实验室实力：配备了多套高端实验设备，包括美国AB公司3500XL遗传分析仪、9700金座PCR扩增仪、普洛麦格公司超精确检测系统PP21+PPY23，准确度高达99.9999%超高精确试剂盒等，保证实验数据的稳定性和准确性。鉴定结果具有权威性。全国各省市均有司法鉴定所协助采样咨询服务点，受理相当方便。梧州亲子鉴定电话：195-4000-6126(微信同号，需要提前预约)1.梧州司法鉴定中心梧州亲子
Nacos和Eureka对比
1、Nacos注册中心原理2、Nacos与Eureka的共同点都支持服务注册和服务拉取都支持服务提供者心跳方式做健康检测3、Nacos与Eureka的区别Nacos支持服务端主动检测提供者状态：临时实例采用心跳模式，非临时实例采用主动检测模式。临时实例心跳不正常会被剔除，非临时实例则不会被剔除。Nacos支持服务列表变更的消息推送模式，服务列表更新更及时；Eureka每隔30秒pull一次服务，服
白帽必备技术栏目一（javascript基础）
直接进入主题正好也在带学生会把笔记同步发送到csdn上后期不管是去就业还是在家里挖洞都都行javascript基础注意事项局部作用域里面给到的变量不加var就会变成全局变量数据类型boolean布尔类型boolean除了0和空字符串以及nullundefined其他的都是truevarbool=true;varbool=false;number类型varnum=10;//10varnum=0x23
笔趣阁&《生命最后倒计时，妻子选择丢下我跑路》郑薇顾源~精彩言情新书免费阅读神书阁
笔趣阁&《生命最后倒计时，妻子选择丢下我跑路》郑薇顾源~精彩言情新书免费阅读主角：郑薇顾源简介：生命进入了倒计时，妻子却对我百般折磨。侮辱！殴打！在我面前和其他男人做苟且之事！我要让这个女人付出代价！----阅读全文小说内容请翻阅文章最底部---第1章三周年结婚纪念日当天，我和郑薇提了离婚。别人都以为我们浓情蜜意，是圈子里的模范夫妻。只有我知道，郑薇爱的人，一直是她的青梅竹马。郑薇拒绝了我的提议，
人的行为读书笔记，2-7 夕颜剑主
第二章人的行为科学在认识论层次的一些问题第七节历史的范畴和专门的研究方法1.历史的研究范畴与历史家如何进行真正的历史工作历史的范畴是研究所有关于人的行为的经验资料。历史学家收集、批判、筛选所有可以取得的文件，以这种证据为基础，着手进行真正的历史工作。2.错误的历史研究方法有人说，历史的任务是揭露一些事件实际上是如何发生的，不允许有所遐想，亦不许有价值判断（也即，对于一切价值判断保持中立）。他们认为
这五节课浸润在书香里渡过（一）——教师小组读书分享，我一直在场教育行走林
今天上午第三节课一直到下午第四节课我始终在三楼会议室，基本没有动地方，听取七八年级五个小组的四月份阶段性读书交流汇报。四月份共读书目为于永正老师的《教海漫记》，但因为疫情原因，没有办法买快递，所以有的老师纸质版书没有能够及时买到，就读的电子书或者读的其他书目，当然这里面也包括个别人耍小聪明——嫌书贵，没有买这本书，书贵吗？买化妆品、买衣服、买鞋、买零食毫不心慈手软，一点也不嫌贵，说到底是思想认识的
OpenCV学习（二）-二维、三维识别香蕉可乐荷包蛋 #OpenCV opencv 学习人工智能
OpenCV是一个功能强大的计算机视觉库，可以用于识别和处理二维图像和三维图像。以下是关于二维图像和三维图像识别的基础知识和示例代码。1.二维图像识别二维图像识别通常包括图像分类、对象检测、特征提取等任务。以下是一些常见的操作：1.1图像分类使用预训练模型对图像进行分类，例如使用深度学习模型（如ResNet、MobileNet等）。importcv2#加载预训练的深度学习模型net=cv2.dnn
R语言绘制散点图 Ora_ge R语音
［转自：http://blog.sina.com.cn/s/blog_69ffa1f90101siek.html］函数。简单地说，把一些R语句（赋值、计算或其他操作步骤）包装起来并给它一个名称，这就是函数。我们前面接触过的getClass(),class(),head(),rep(),cbind(),rbind()等都是函数。显示（打印）对象也有函数print()，但R有更简单的方法：输入对象名（
【人工智能之深度学习】6. 卷积核工作原理：从边缘检测到特征抽象的逐层演进（附可视化工具与行业实战代码） AI_DL_CODE 人工智能深度学习卷积核特征提取卷积神经网络边缘检测特征可视化
摘要：卷积核是卷积神经网络（CNN）的核心组件，其通过局部感受野与参数共享机制实现高效特征提取。本文从数学本质出发，揭示卷积操作的空域-频域对偶性：空域卷积等价于频域乘积（F{f∗g}=F{f}⋅F{g}F\{f*g\}=F\{f\}⋅F\{g\}F{f∗g}=F{f}⋅F{g}），解释边缘检测核（Sobel、Laplacian）的频域响应特性。通过特征可视化实验表明，CNN特征呈现逐层抽象规律：
47、确保文件属性设置的安全性 vv45678 C语言安全编码指南解析文件属性安全性只读
确保文件属性设置的安全性1.文件属性概述文件属性是操作系统用于管理和控制文件访问权限的重要机制。常见的文件属性包括只读、隐藏、系统文件、存档等。这些属性不仅影响文件的可见性和可访问性，还对文件的读写操作、备份行为等产生重要影响。因此，正确设置文件属性对于保护文件的安全至关重要。文件属性的作用只读：防止文件内容被修改。隐藏：使文件在默认情况下不显示，增加隐私性。系统文件：标记为操作系统的一部分，通常
脱岗离岗逃岗监测识别软件系统平台标检测算法#YOLO
值班脱岗智能监测识别系统是一种利用AI视频智能分析技术的智能化系统，能够对办公工作岗位区域、岗亭、值班室、生产线岗位等进行7*24小时不间断实时监测。该系统的出现，有助于提高工作效率，确保工作秩序的正常运行，同时也能有效避免值班人员脱岗、懈怠等现象的发生。该系统的工作原理是通过高清摄像头捕捉实时画面，然后利用AI视频智能分析技术对画面进行实时分析，识别出是否有人脱岗、懈怠或者有其他异常情况发生。当
人生的边界承谦
周围有很多强势的人他们的强势来自边界的明晰面对外界的问题可以马上建立框架比如面对外界的错误可以很快的站在正确方的角度理直气壮的进行批评不会像另外一类人觉得这种行为是可以理解的于是便没有那种苛求
和生活死磕到底 Echo念念
懒惰是很奇怪的东西，它使你以为那是安逸，是休息，是福气，但实际上它所给你的是无聊，是倦怠，是消沉；它剥夺你对前途的希望，割断你和别人之间的友情，使你心胸日渐狭窄，对人生也越来越怀疑。--罗兰《忙碌进取》无需时刻保持敏感，迟钝有时即为美德。尤其与人交往时，即便看透了对方的某种行为或者想法的动机，也需装出一副迟钝的样子。此乃社交之诀窍，亦是对人的怜恤。--尼采人生就像迷宫，我们用上半生找寻入口，用下半
颠覆未来：创新代码引领人工智能与量子计算深度融合金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能量子计算
摘要在信息时代飞速演进的背景下，人工智能与量子计算正以前所未有的速度互相融合，推动着科技边界的不断拓展。本文回顾了经典算法的智慧，展示了前沿深度学习模型的构建，并通过量子电路设计探讨了创新代码的可能性，为探索未来科技变革提供了全新视角。1.引言当前，科技创新正处于高速迭代的关键阶段，传统计算方法与新型技术的交汇处正成为研究热点。人工智能的发展已渗透到各行各业，而量子计算的崛起则为解决复杂计算问题提
Transformers基础组件—Datasets 小蒋的学习笔记 python 人工智能机器学习
目录datasets基本使用加载在线数据集加载数据集合集中的某一项任务按照数据集划分进行加载查看数据集数据集划分数据选取与过滤数据映射保存与加载加载本地数据集直接加载文件作为数据集加载文件夹内全部文件作为数据集通过预先加载的其他格式转换加载数据集通过自定义加载脚本加载数据集DatasetwithDataCollatordatasets基本使用fromdatasetsimport*加载在线数据集da
使用UV管理PyTorch项目
PyTorch是深度学习研究和开发的流行选择。可以使用uv管理PyTorch项目，包括不同Python版本依赖、管理环境、甚至加速器选择等。安装Pytorch从打包角度来看，PyTorch有几个不常见的特点：许多PyTorchwheel托管在专门的索引上，而非Python包索引（PyPI）。因此，安装PyTorch通常需要配置项目使用PyTorch专属索引。PyTorch为每种加速器生成不同的构建
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情

视频深度学习：行为识别指南

我的小程序：

你可能感兴趣的:(其他,计算机视觉,行为识别,视频深度学习,视频分析,行为检测,动作识别)