三木今天学习了嘛

【论文阅读】视频理解系列论文精读

文章目录

1. Large-scale Video Classification with Convolutional Neural Networks
- 摘要
- 1. 介绍
- 2. 相关工作
- 3. 模型
- - 3.1 时间信息的融合
  - 3.2 多分辨率CNN
- 4. 实验细节、训练结果
- 5. 结论和未来工作
2. Two-Stream Convolutional Networks for Action Recognition in Videos
- 摘要
- 1. 介绍
- 2. 用于视频识别的双流架构
- 3. 光流卷积网络
- - 3.1 ConvNet输入配置：
- 4. 实验细节、训练结果
- 5. 结论
3. Beyond Short Snippets: Deep Networks for Video Classification
- 摘要
- 1. 介绍
- 2. 相关工作
- 3. 模型
- - 3.1 特征池化结构
  - 3.2 LSTM架构
- 4. 训练结果
- 5. 结论
4. Convolutional Two-Stream Network Fusion for Video Action Recognition
- 摘要
- 1. 介绍
- 2. 相关工作
- 3. 方法
- - 3.1 空间融合
  - 3.2 在哪融合网络
  - 3.3 时间融合
- 4. 实验与训练结果
- - 4.1 融合双流网络的方式
  - 4.2 在哪融合
  - 4.3 精度对比
- 5. 结论
5. Temporal Segment Networks: Towards Good Practices for Deep Action Recognition
- 摘要
- 1. 介绍
- 2. 相关工作
- 3. 模型
- - 3.1 时序段网络TSN
  - 3.2 学习时序段网络
- 4. 训练结果
- 5. 结论

视频理解论文串讲（上）【论文精读】

1. Large-scale Video Classification with Convolutional Neural Networks

摘要

我们研究了多种扩展CNN在时域上的连接性的方法，以利用局部的时空信息，并建议采用多分辨率、凹陷的架构作为加速训练的一种有希望的方式。

1. 介绍

在图像领域积极成果的鼓舞下，我们研究了CNN在大规模视频分类中的表现，在这种情况下，网络不仅可以获得单个静态图像中的外观信息，还可以获得其复杂的时间演变。在这种情况下，扩展和应用CNN有几个挑战。

目前还没有与现有图像数据集的规模和种类相匹配的视频分类基准，为了获得足够的数据量来训练我们的CNN架构，我们收集了一个新的Sports-1M数据集，以支持这一领域的未来工作。
从建模的角度来看，我们通过评估多个CNN架构来实证研究这些问题，这些架构都采取了不同的方法来结合整个时域的信息。
从计算的角度来看，加快CNN运行性能的有效方法是修改架构，使其包含两个独立的处理流：一个是在低分辨率帧上学习特征的上下文流，一个是只在帧的中间部分操作的高分辨率凹陷流。我们观察到，由于输入维度的降低，网络的运行时间性能增加了2-4倍，同时保留了分类精度。
我们根据经验调查了转移学习问题，通过重新利用在Sports-1M数据集上学到的低级特征，在UCF-101上取得了明显更好的性能。

2. 相关工作

视频分类的标准方法包括三个主要阶段。首先，描述视频区域的局部视觉特征被密集地提取出来或在一组稀疏的兴趣点上提取。接下来，这些特征被组合成一个固定大小的视频级描述。最后，训练一个分类器（如SVM），以区分感兴趣的视觉类别。
与图像数据领域相比，在视频分类中应用CNN的工作相对较少。由于CNN在图像领域的所有成功应用都有大量的训练集，我们推测这部分是由于缺乏大规模的视频分类基准。我们的模型是在完全监督下进行端到端的训练。

3. 模型

3.1 时间信息的融合

我们将每个视频视为一袋短的、固定大小的片段。由于每个片段在时间上包含几个连续的帧，我们可以在时间维度上扩展网络的连接性，以学习空间-时间特征。对于扩展连接的精确细节有多种选择，我们在下面描述了三种广泛的连接模式类别（早期融合、晚期融合和缓慢融合）。

红色、绿色和蓝色方框分别表示卷积层、归一化和池化层。在慢速融合模型中，所描述的列共享参数。

Single Frame。我们使用一个单帧基线结构来了解静态外观对分类准确性的贡献。这个网络类似于简单的卷积神经网络。最后一层连接到一个softmax分类器。
Late Fusion。在第一个全连接层中合并这两个数据流。因此，两个单帧塔都不能单独检测到任何运动，但第一个全连接层可以通过比较两个塔的输出来计算全局运动特征。
Early Fusion。将整个时间窗口的信息立即在像素层面上结合起来。这是通过修改单帧模型中第一个卷积层的过滤器来实现的，将其扩展为11×11×3×T像素大小，其中T是时间范围。早期与像素数据的直接连接使网络能够精确地检测局部运动方向和速度。
Slow Fusion。慢速融合模型是这两种方法的平衡组合，它在整个网络中缓慢地融合时间信息，使高层在空间和时间维度上逐渐获得更多的全局信息。

3.2 多分辨率CNN

输入帧被送入两个独立的处理流：一个是模拟低分辨率图像的上下文流，一个是处理高分辨率中心作物 （因为感兴趣的对象往往占据中心区域） 的凹陷流。这两个流由交替的卷积（红色）、归一化（绿色）和池化（蓝色）层组成。两个数据流都汇聚到两个完全连接层（黄色）。

4. 实验细节、训练结果

5. 结论和未来工作

多分辨率和slow fusion可以提高网络的性能。
我们还确定了混合分辨率架构，它由低分辨率的上下文和高分辨率的凹流组成，是在不牺牲精度的情况下加快CNN的有效方法。
我们在UCF-101上进行的迁移学习实验表明，所学的特征是通用的，并能概括其他视频分类任务。

未来的工作中，我们希望在数据集中纳入更广泛的类别，以获得更强大和通用的特征，研究明确推理摄像机运动的方法，并探索循环神经网络作为一种更强大的技术，将片段级预测结合到全局视频级预测中。

2. Two-Stream Convolutional Networks for Action Recognition in Videos

摘要

我们研究了用于视频中动作识别的辨别性训练的深度卷积网络（ConvNets）的架构。我们面临的挑战是如何从静止帧和帧之间的运动中捕捉到互补的外观信息。
我们的贡献有三个方面。首先，我们提出了一个包含空间和时间网络的双流ConvNet架构。其次，我们证明，尽管训练数据有限，但在多帧密集光流上训练的ConvNet能够达到非常好的性能。最后，我们展示了多任务学习，应用于两个不同的动作分类数据集，可以用来增加训练数据量并提高两者的性能。

1. 介绍

与静态图像分类相比，视频的时间成分为识别提供了额外的（重要的）线索，因为一些动作可以根据运动信息被可靠地识别。此外，视频为单一图像（视频帧）分类提供了自然的数据增强（抖动）。
我们研究了一种基于两个独立识别流（空间和时间）的不同架构，然后通过后期融合将其结合起来。空间流从静止的视频帧中进行动作识别，而时间流则被训练为从密集的光流形式的运动中识别动作。

2. 用于视频识别的双流架构

视频可以自然地被分解为空间和时间部分。空间部分，以单个帧的形式出现，带有视频中描述的场景和物体的信息。时间部分，以跨帧运动的形式，表达了观察者（摄像机）和物体的运动。

3. 光流卷积网络

一个ConvNet模型，它构成了我们架构的时间识别流，模型的输入是由几个连续帧之间的光流位移场堆叠而成。这种输入明确地描述了视频帧之间的运动，这使得识别更容易。

3.1 ConvNet输入配置：

光流的叠加：
密集的光流可以被看作是一组连续帧t和t+1之间的位移矢量场dt，矢量场的水平和垂直分量，d x t和d y t，可以被看作是图像通道，非常适合使用卷积网络进行识别。为了表示一连串帧的运动，我们将L个连续帧的流动通道堆叠在一起，形成总共2L个输入通道。

轨迹叠加：

左图：光流堆叠（1）在多帧中的同一位置对位移向量d进行采样。右图：轨迹堆叠（2）对轨迹上的向量进行采样。帧和相应的位移向量以相同的颜色显示。
涨点方法：（需要在代码中体现）

双向的光流
平均流量减法。一般来说，对网络输入进行零中心化是有益的

4. 实验细节、训练结果

训练采用了很多技巧：裁剪、翻转、RGB抖动、多GPU加速、光流图被缩放到[0，255]并保存为JPEG格式。

在使用迁移学习，如果对所有网络做微调，则Dropout率设大一点可以防止过拟合。如果只做最后一层的参数更新的话，Dropout率应设置小一点，因为只有最后一层参数参与学习。

5. 结论

(i) 时间和空间识别流是互补的，因为它们的融合对两者都有明显的提高（比时间网提高6%，比空间网提高14%）；
(ii) 基于SVM的软分数融合优于平均法的融合；
(iii) 在ConvNet融合的情况下，使用双向流没有好处；
(iv) 使用多任务学习训练的时间ConvNet，单独和与空间网融合时都表现最好。

3. Beyond Short Snippets: Deep Networks for Video Classification

摘要

我们提出了两种能够处理全长视频的方法。第一种方法探索了各种卷积时间特征池架构，研究了在为这项任务调整CNN时需要做出的各种设计选择。第二种提议的方法明确地将视频建模为一个有序的帧序列。为此，我们采用了一个循环神经网络，该网络使用长短期记忆（LSTM）单元，这些单元与底层CNN的输出相连。

1. 介绍

我们评估了两种能够满足这一要求的方法：特征集合和递归神经网络。特征汇集网络使用CNN独立处理每一帧，然后使用各种汇集层结合帧级信息。我们采用的递归神经网络架构源自长短时记忆（LSTM）单元，并使用记忆单元来存储、修改和访问内部状态，使其能够发现长范围的时间关系。与特征池一样，LSTM网络在帧级CNN激活的基础上运行，可以学习如何随着时间的推移整合信息。通过通过时间共享参数，这两种架构都能够保持恒定的参数数量，同时捕捉到视频的时间演变的全局描述。
为了在保持低计算量的同时学习视频的全局描述，我们建议每秒钟只处理一帧。为了弥补隐性运动信息的丢失，我们以相邻帧计算的光流图像的形式纳入显性运动信息。光流使我们能够保留运动信息的好处（通常通过高帧率采样实现），同时仍然捕捉到全局视频信息。

我们的贡献可以概括为以下几点：

我们提出了用于获得全局视频级描述符的CNN架构，并证明使用越来越多的帧数可以显著提高分类性能。
通过时间共享参数，在特征池和LSTM架构中，参数的数量与视频长度的关系保持不变。
我们确认光流图像可以极大地有利于视频分类。

2. 相关工作

我们没有试图在小时间段内学习空间-时间特征，而是考虑了几种不同的方法，在视频的长时间内（几十秒）聚集强大的CNN图像特征，包括特征池和递归神经网络。由于梯度消失和爆炸的问题，标准的递归网络在长序列的学习上有困难。相比之下，长短时记忆（LSTM）使用记忆单元来存储、修改和访问内部状态，使其能够更好地发现长距离的时间关系。

3. 模型

3.1 特征池化结构

不同的特征池架构。堆叠的卷积层用 "C "表示。蓝色、绿色、黄色和橙色的矩形分别代表最大池、时域卷积层、全连接层和softmax层。

3.2 LSTM架构

与产生顺序不变的表征的Max-pooling相比，我们建议使用一个循环神经网络来明确考虑CNN激活的序列。由于视频包含动态内容，帧与帧之间的变化可能编码了额外的信息，这对做出更准确的预测很有帮助。

这里作者介绍了LSTM的模型，但现在LSTM使用的很少。

深度视频LSTM在每个连续的视频帧中接受最后一个CNN层的输出的输入。CNN输出通过时间向前处理，并通过五层堆叠的LSTM向上处理。一个softmax层预测每个时间步骤的类别。卷积网络（粉色）和softmax分类器（橙色）的参数在不同的时间步骤中共享。

4. 训练结果

5. 结论

与以前在几秒钟的视频上进行训练的工作不同，我们的网络利用了长达两分钟的视频（120帧）来获得最佳的分类性能。如果对速度有要求，我们的方法可以在一次拍摄中处理整个视频。通过将较小的网络扩展到逐渐变大的网络并进行微调，可以进行训练。由此产生的网络在Sports-1M和UCF-101基准上都达到了最先进的性能，支持了学习应该在整个视频而不是短片段中进行的想法。
我们也表明，使用光流并不总是有帮助的，特别是如果视频没有被预处理，如Sports-1M数据集的情况。为了在这种情况下利用光流的优势，有必要采用更复杂的序列处理架构，如LSTM。此外，在图像帧上使用LSTM和光流，可以产生Sports-1M基准的最高公开性能指标。

4. Convolutional Two-Stream Network Fusion for Video Action Recognition

摘要

我们研究了一些在空间和时间上融合ConvNet的方法，有如下的：
(i)利用卷积代替softmax可以节约参数，不损失精度
(ii)在最后一个卷积层融合这种网络的空间性比早期更好，另外在类预测层融合可以提高准确性
(iii)在时空邻域汇集抽象的卷积特征进一步提高性能

1. 介绍

利用卷积网络解决动作识别问题的效果不如卷积网络在其他任务中的表现。可能原因是数据集太小而且噪声很大，而且卷积网络专注与空间信息，无法充分利用时间信息。

双流结构（或以前的任何方法）无法利用视频中两个非常重要的线索进行动作识别。(i) 识别什么东西在哪里移动，即把外观识别（空间线索）与光流识别（时间线索）登记在一起；
(ii) 这些线索如何随时间演变。

2. 相关工作

C3D在有限时间学习3D卷积，卷积核为3×3×3。另一种方法是将三维卷积拆分成二维空间卷积与一维时间卷积。
截止到目前为止（2016年），双流网络是深度学习应用于动作识别的最有效方法。

3. 方法

作者的结构构建在双流网络上。该网络有两个主要缺点：

融合只在最后一层，所以不能学习空间和时间的特征。
在时间尺度上的记忆是有限的，因为空间卷积只在单帧上操作，而时间卷积只在时间上相邻的L个光流帧的堆栈。

3.1 空间融合

作者列举了一系列融合空间层的方式：Sum fusion，Max fusion，Concatenation fusion，Conv fusion，Bilinear fusion
在实验部分，我们评估和比较了这些可能的融合方法在分类准确性方面的表现

3.2 在哪融合网络

左边的例子显示了在第四个卷积层之后的融合。从融合的角度看，只使用了一个网络塔。右图显示了在两层（conv5之后和fc8之后）的融合，其中两个网络塔都被保留，一个是混合时空网，一个是纯粹的空间网。

融合时间信息的不同方式。( a ) 二维汇集忽略了时间，只是在空间邻域上进行汇集，单独缩小每个时间样本的特征图的大小。( b ) 三维汇集从局部时空邻域汇集，首先跨时间堆叠特征图，然后收缩这个时空立方体。( c ) 三维卷积+三维汇集在三维汇集之前，还用一个跨越特征通道、空间和时间的融合核进行了卷积。

3.3 时间融合

将特征图xt与时间t相结合，有3D Pooling，3D Conv + Pooling

在细的时间尺度上捕捉短期信息，在粗的时间尺度上捕捉时间相邻的输入。

4. 实验与训练结果

4.1 融合双流网络的方式

对于表中所示的所有融合方法，与ReLU5相比，FC层的融合导致了较低的性能，方法的排序与表1相同，除了双线性融合不可能在FC层实现。在所有FC层中，FC8比FC7和FC6表现更好，Conv融合为85.9%，其次是Sum融合为85.1%。我们认为ReLU5表现稍好的原因是在这一层，外观和运动之间的空间对应关系被融合了，这在FC层就已经被折叠。

4.2 在哪融合

在ReLU5或ReLU5+FC8融合时，性能最好（但涉及的参数几乎是两倍）。

4.3 精度对比

5. 结论

（1）相比在最后的Softmax层融合，在中间的卷积层融合既能够提升性能，又不会增加太多参数（见融合方式）
（2）在最后一个卷积层融合（relu5）的性能是最好的，如果再配合最后一个全连接层融合（fc8），性能还能再提升一点（见融合位置）
（3）在融合后使用pool3d代替代替pool2d能更进一步地提高性能（见3D Conv和3D Pooling）

5. Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

摘要

作者主要想通过较少的训练样本，高效的训练出用于动作识别的ConvNet，主要贡献有两点：

提出temporal segment network(TSN)网络模型：
TSN采样，具备稀疏性和全局性的特征，能够建模间隔更长帧之间时间依赖关系，确保获取视频级信息
TSN包含提取空间信息和提取时间信息两路模型，并基于后期融合方式来融合两路模型的结果
提出了一系列最佳实践方案，如数据增强、正则化、交叉模态预训练等。并取得了非常好的效果

1. 介绍

在动作识别中，有两个关键和互补的方面：外观和动态。识别系统的性能在很大程度上取决于它是否能够从中提取和利用相关信息。然而，由于许多复杂因素，如比例变化、视点变化和相机运动，提取此类信息并非易事。
主流ConvNet框架通常侧重于外观和短期运动，因此缺乏整合长期时间结构的能力。

ConvNets在基于视频的动作识别中的应用受到两个主要障碍的阻碍。首先，长距离的时间结构在理解动作视频的动态方面起着重要作用。
然而，主流的ConvNet框架通常专注于表象和短期运动，因此缺乏纳入长程时间结构的能力。其次，在实践中，训练深度ConvNets需要大量的训练样本以达到最佳性能。但数据集有限。因此，卷积网络面临着过拟合的风险。
时空段网络（TSN），这个框架用稀疏的采样方案在一个长的视频序列上提取短的片段，其中的样本沿着时间维度均匀分布。在此基础上，采用分段式结构来汇总采样片段的信息。在这个意义上，时间段网络能够对整个视频的长距离时间结构进行建模。此外，这种稀疏的抽样策略以极低的成本保留了相关的信息，从而在合理的时间和计算资源预算下实现了长视频序列的端到端学习。

探索了一些好的做法来克服上述因训练样本数量有限而造成的困难，包括：1）跨模态预训练；2）正则化；3）增强数据增量。

作者认为，在训练视频分类模型时，连续的帧会造成冗余，所以密集采样的策略是没必要的，所以作者采用了稀疏采样的策略。

2. 相关工作

主要有两种做法：

双流结构，一个模型学习图像层面的信息，一个模型学习时间层面的信息，最后融合两路模型的结果
使用3D卷积核，同时抽取图像层面和时间层面的信息，这衍生出了不同3D卷积核的变种

3. 模型

3.1 时序段网络TSN

具体来说，我们提出的时间段网络框架，旨在利用整个视频的视觉信息来进行视频级预测，也是由空间流ConvNets和时间流ConvNets组成。
时间段网络不是在单帧或帧堆上工作，而是在整个视频中稀疏采样的短片段序列上工作。

一个输入视频被分成K个片段，并从每个片段中随机选择一个简短的片段。不同片段的等级分数通过片段共识函数进行融合，产生片段共识，这是一个视频级别的预测。然后，来自所有模式的预测被融合以产生最终的预测。所有片段的ConvNets共享参数。

3.2 学习时序段网络

模型架构：之前的two-stream模型采用的是相对浅的模型结构，作者选择BN-Inception这种比较深的模型结构来当做building block，因为该模型在速度和准确率上都不错。
模型输入：之前two-stream模型采用RGB作为spatial stream的输入，采用光流作为temporal stream的输入。作者研究了额外的两种模态，RGB difference和warped光流。

图2. 四种类型的输入模式的例子。RGB图像、RGB差分、光流场（x,y方向）和扭曲的光流场（x,y方向）

。

模型训练：由于视频样本较少，训练较深的ConvNet可能会过拟合。为了解决该问题，作者提出了如下的策略：

跨模态预训练：RGB网络可以使用ImageNet预训练，但是光流网络没有预训练的数据集，所有作者采用ImageNet上预训练的参数来初始化光流模型参数。
正则化：Batch Normalization用来解决协变量偏移的问题。在学习过程中，BN将估计每批中的激活均值和方差，并使用它们将这些激活值转换为标准高斯分布。该操作会使得模型收敛速度变快，但是同时会带来了过拟合的问题。因为，作者通过固定住除了第一层以外，其他层的BN参数，来解决该问题。而且，作者在BN-Inception模型后面加入了dropout层，来解决过拟合的问题。

数据增强：random cropping、horizontal flipping、corner cropping、scale jittering。

4. 训练结果

（1）跨模态预训练和partial BN with dropout实验：

（2）新模态特征：RGB Difference和warped optical flow fields实验

RGB Difference和RGB特征有一定的互补性
结合RGB和光流特征，能取得非常好的效果

所以在下面的实验中，我们选择平均池化作为默认的聚合函数。

"BN-Inception+TSN "指的是在性能最好的BN-Inception架构上应用时间段网络框架的设置。

UCF101数据集上的拟议方法的成分分析。从左到右，我们一个一个地添加组件。BN-Inception被用作ConvNet架构

基于时间段网络（TSN）的方法与其他最先进的方法的比较。分别介绍了使用两种输入模式（RGB+Flow）和三种输入模式（RGB+Flow+Warped Flow）的结果。

5. 结论

作者提出了Temporal Segment Network，用于建模视频级模型，捕获长时间的运动特征。通过稀疏采样的分段结构以及各种数据增强策略，该模型在HMDB51和UCF101上取得了非常好的效果。

element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
特殊的拜年飘雪的天堂
文/雪儿大年初一，家家户户没有了轰响的鞭炮声，大街上没有了人流涌动的喧闹，几乎看不到人影，变得冷冷清清。天刚亮不大会儿，村里的大喇叭响了起来：由于当前正值疾病高发期，流感流行的高峰期。同时，新型冠状病毒感染的肺炎进入第二波流行的上升期。为了自己和他人的健康安全着想，请大家尽量不要串门拜年，不要在街里走动。可以通过手机微信，视频，电话，信息拜年……今年的春节真是特别。禁止燃放鞭炮，烟花爆竹，禁止出村
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
2023-10-22 奥雷里亚诺第n
昨天在B站看到关于猫喜欢挠人的视频，视频教导说猫挠人的话就抓住它的后脖颈然后用手打打挠人的那个爪子。视频本身没什么，但评论区却炸开了锅（真是符合挑食者厌食心理）。令我印象最深刻的一个甚至上升到了关于我是谁这种终极问题。它说，猫就是畜生，它挠人就打它别惯着它，反正我六道轮回成了人就应该保持人的高贵，谁都别想来打破。我顿时汗颜，但看到下面全是类似的言论只不过后面的理由各有不同，本来想骂人的心都凉了一半
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
如何成为段子手欣雅阅读
我是一个尬聊大师，与朋友聊天经常把话题聊死，留我一个人在群里，望着自己打下的最后一句话无语凝噎。看到风趣幽默的朋友与人聊天，很是艳羡，觉得自己何时才能成为这样的段子手呢？一、段子是什么？“段子”一词在百度百科上的解释：本是相声中的一个艺术术语，指的是相声作品中一节或一段艺术内容。我的理解：段子就是一些搞笑的故事或者笑话。二、为什么要会说段子？不知道大家有没有这样的朋友，本来很无趣的聚会，只要有他参
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
心有蓝天白云，爱情便会晴空万里，然后有花香有鸟鸣有美好的未来曹十二吖
丁南的婚姻，来自于一场她对生命的对比。她曾经说过，当她最爱的母亲用生命去逼迫她结婚的时候，她曾一度不理解到愤怒，甚至于想过用轻生来对抗母亲的不理智。庆幸的是，丁南是一个自我调节能力非常强的人，她想如果我连死亡都不怕，还怕不能经营好一段婚姻吗？抱着这样的念头，24年没有谈过恋爱的她，用短短三个月的时间，完成了少女到女人的蜕变。她曾经说过：“我要把自己最珍贵的东西留给自己命中注定的那个人。”闺蜜几人中
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析
在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、
2019-01-19 王小康KK
姓名:王康公司:扬州市方圆建筑工程有限公司2018年3月16日～3月18日上海361期《六项精进》感谢二组学员【日精进打卡第307天】【知～学习】《六项精进》大纲3遍共862遍《大学》通篇3遍共860遍《六项精进》全书40页【经典名句】思想决定行为，行为决定习惯，习惯决定性格，性格决定命运。【行～实践】一、修身：（对自己个人）1、践行六项精进的理念。二、齐家：（对家庭和家人）1、和女朋友视频聊天。
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
STM32中的计时与延时 lupinjia STM32 stm32 单片机
前言在裸机开发中，延时作为一种规定循环周期的方式经常被使用，其中尤以HAL库官方提供的HAL_Delay为甚。刚入门的小白可能会觉得既然有官方提供的延时函数，而且精度也还挺好，为什么不用呢？实际上HAL_Delay中有不少坑，而这些也只是HAL库中无数坑的其中一些。想从坑里跳出来还是得加强外设原理的学习和理解，切不可只依赖HAL库。除了延时之外，我们在开发中有时也会想要确定某段程序的耗时，这就需要
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
为什么瘦子很难增胖？我的狗毛毛
我是个标准的瘦子，168，100斤。用一句通俗的话来讲，我连马甲线都瘦出来了（体脂含量比较低）。但是我反而很羡慕那些比较丰满的女人，我的理想是再增重十五斤，练成前凸后翘的魔鬼身材。为此我开始纠正自己不规律的作息，吃高热量的食物，减少运动量，能坐着绝不站着，能躺着绝不坐着。但是结果却没有丝毫变化。我一直很苦恼，直到最近在网上看到一个视频，英国的某个研究机构做了一个实验，想要知道瘦子能否在高热量的食物
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
如何在心上用功？余超林AIA财富管家
思考：如何在心上用功？学习心得：心-道-德-事的理解心-道-德-事这四部曲，本质上就是一个人的思维智慧的四个层面：事是最底层，这是所有人在这个社会谋求生存的基础，一个人能够把事情彻底做好，保质保量的完成，才会有真正的结果，但是这个层面要获得真正成功很困难，因为会做事的人很多，最终会出现恶性竞争；德是第三层，如果说整个社会做事的竞争激烈程度为100%，那么上升到德上的竞争激烈程度降低为80%，德是一
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

【论文阅读】视频理解系列论文精读

文章目录

1. Large-scale Video Classification with Convolutional Neural Networks

摘要

1. 介绍

2. 相关工作

3. 模型

3.1 时间信息的融合

3.2 多分辨率CNN

4. 实验细节、训练结果

5. 结论和未来工作

2. Two-Stream Convolutional Networks for Action Recognition in Videos

摘要

1. 介绍

2. 用于视频识别的双流架构

3. 光流卷积网络

3.1 ConvNet输入配置：

4. 实验细节、训练结果

5. 结论

3. Beyond Short Snippets: Deep Networks for Video Classification

摘要

1. 介绍

2. 相关工作

3. 模型

3.1 特征池化结构

3.2 LSTM架构

4. 训练结果

5. 结论

4. Convolutional Two-Stream Network Fusion for Video Action Recognition

摘要

1. 介绍

2. 相关工作

3. 方法

3.1 空间融合

3.2 在哪融合网络

3.3 时间融合

4. 实验与训练结果

4.1 融合双流网络的方式

4.2 在哪融合

4.3 精度对比

5. 结论

5. Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

摘要

1. 介绍

2. 相关工作

3. 模型

3.1 时序段网络TSN

3.2 学习时序段网络

4. 训练结果

5. 结论

你可能感兴趣的:(Video,Understanding,论文阅读,视频理解,双流卷积网络)