黑洞是不黑

图像分割（四）—— Is Space-Time Attention All You Need for Video Understanding?

Timeformer

- Abstract
- 1. Introduction
- 2. Related Work
- 3. The TimeSformer Model
- 4. Experiments
- - 4.1. Analysis of Self-Attention Schemes
- 4.2. Comparison to 3D CNNs

Abstract

我们提出了一种无卷积的视频分类方法，专门建立在空间和时间上的自注意。我们的方法被命名为“时间转换器”，通过直接从一系列 frame-level patches中学习时空特征，将标准的变压器架构适应于视频。我们的实验研究比较了不同的自注意方案，并提出了“分散注意”，即时间注意和空间注意，可以在考虑的设计选择中获得最佳的视频分类精度。尽管采用了全新的设计，时间传感器在几个动作识别基准上取得了最先进的结果，包括 Kinetics-400和Kinetics-600的最佳报告精度。最后，与3D卷积网络相比，我们的模型训练速度更快，它可以实现显著更高的测试效率（精度略有下降），而且它也可以应用于更长的视频剪辑（超过一分钟）。

1. Introduction

视频理解与NLP的相似点

Sequential 连续性：视频和句子都是连续的
Contextual 具有上下文联系：句子中某个单词的意思通常需要通过将其与句子中的其他单词联系起来来理解；对于视频来说，为了消除歧义，片段中的行为也需要与视频的其余部分结合起来。

所以，NLP的自注意模型可能会对视频建模有效。因为其不仅可以捕捉跨时序的依赖关系，还可以通过对不同空间位置的特征进行两两比较，从而揭示每一帧中的上下文信息

因此，人们认为来自NLP的长期自注意模型对视频建模也非常有效。然而，在视频领域，二维或三维卷积仍然代表了不同视频任务的时空特征学习的核心操作，而自注意在应用于卷积层之上时也显示出了好处。

在这项工作中，我们提出了一个问题，即是否有可能通过用自注意完全取代卷积算子来建立一个无卷积性能的视频架构。我们认为，这样的设计有潜力克服视频分析的卷积模型的一些固有限制。

Inductive Bias 归纳偏置

首先，虽然它们存在的强归纳偏差（例如，local connectivity and translation equivariance）无疑对小的训练集有益，但它们可能会过度限制模型在数据可用性充足且可以从例子中学习到的情况下的表达性。与cnn相比，变压器施加的限制性感应偏差更小。这扩大了它们可以表示的函数族，并使它们更适合现代大数据机制，在那里不太需要强归纳先验。

增强数据操作的可能性
Short Range Temporal-spatial Imformation 捕捉的信息范围小

其次，虽然卷积内核是专门为捕获短程时空信息而设计的，但它们不能建模扩展到接受域之外的依赖关系。虽然deep stacks of convolutions自然地扩展了接受域，但这些策略在通过聚合短程信息来捕获远程依赖方面受到固有的限制，相反，自注意机制可以通过直接比较所有时空位置的特征激活来捕获局部和全局的长期依赖关系，这远远超出了传统卷积滤波器的接受域。
硬件计算

尽管在GPU硬件加速方面取得了进步，但训练深度cnn仍然非常昂贵，特别是当应用于高分辨率和长视频时。最近在still-image领域的工作已经证明，与cnn相比，变压器享受更快的训练和推理，这使得在相同的计算预算下构建具有更大学习能力的模型成为可能。

基于这些观察结果，我们提出了一个完全建立在自注意力的基础上的视频架构。我们通过将自注意机制从图像空间扩展到时空三维体积，将图像模型“视觉变压器”(ViT)应用于视频。我们提出的模型，名为“TimeSformer”，将视频视为从单个帧中提取的patch序列。与ViT一样，每个patch都线性映射到嵌入并添加位置信息。这使得可以将生成的向量序列解释为可以输入给变压器编码器的标记嵌入，类似于从NLP中的单词计算出的标记特征。

标准变压器的自注意力的一个缺点是，它需要计算所有标记对的相似性度量。在我们的设置中，由于视频中存在大量的patch，这在计算上是昂贵的。为了解决这些挑战，我们提出了几种可伸缩的时空体积上的自注意设计，并在大规模的行动分类数据集上对它们进行了实证评估。在提出的方案中，我们发现最佳设计是由“分散注意”架构表示的，该架构在网络的每个块中分别应用时间注意和空间注意，与已建立的基于卷积的视频架构范式相比，时间形成器遵循了一个完全不同的设计。然而，它所达到的精度可与该领域的最先进水平相媲美，而且在某些情况下更优越。我们还表明，我们的模型可以用于跨越许多分钟的视频的远程建模。

2. Related Work

我们的方法受到了最近的工作的影响，这些工作使用自注意力进行图像分类，要么结合卷积算子，甚至作为它的完全替代，在前一类中，非局部网络(Wang et al. 2018b)采用了一种非局部均值，有效地推广了变压器的自注意力函数；Bello等人提出了一种二维自注意机制，该机制作为二维卷积的替代品具有竞争力，但当用于用自注意特征增强卷积特征时，会得到更强的结果。

我们的方法与利用自注意代替卷积的图像网络更密切相关，由于这些工作使用单个像素作为query，为了保持可管理的计算成本和较小的内存消耗，它们必须将自我注意的范围限制在局部邻域，或者在严重缩小的图像上使用全局自我注意。完整图像的可伸缩性替代策略包括稀疏键值采样(Child et al. 2019)或限制沿空间轴计算自注意力。在我们的实验中考虑的一些自注意力算子采用类似的稀疏和轴向计算，虽然推广到时空体积。然而，我们的方法的效率主要源于将视频分解为一系列帧级patch，然后将这些补丁的线性嵌入作为输入token输入到转换器。这一策略最近在视觉变压器(ViT)中引入(doso维特斯基等人，2020)显示，在图像分类方面提供了令人印象深刻的性能。在这项工作中，我们建立在ViT设计的基础上，并通过提出和经验比较几种可扩展的时空自我关注方案，将其扩展到视频。

3. The TimeSformer Model

Input clip. The TimeSformer takes as input a clip $X∈R^{H×W×3×F}$ consisting of $F$ RGB frames of size $H \times W$ sampled from the original video.

Decomposition into patches. 根据ViT，我们将每一帧分解为N个不重叠的patch，每个大小为 $P\times P$ ，N个patch跨越整个帧， $N=HW/P^2$ . 接着将这些patch拉成一个向量 $\mathbb{x}_{p,t}\in \mathbb{R}^{3p^2}$ 其中 $p = 1, ..., N$ 表示空间位置， $t = 1, ..., F$ 表示帧上的索引。

Linear embedding. 我们通过一个可学习的矩阵 $E\in \mathbb{R}^{D\times 3P^2}$ 将每个patch $\mathbb{x}_{(p,t)}$ 线性映射到一个嵌入向量 $\mathbb{z}^{(0)}_{(p,t)}\in \mathbb{R}^D$ :
$\mathbf{z}_{(p, t)}^{(0)}=E \mathbf{x}_{(p, t)}+\mathbf{e}_{(p, t)}^{p o s}\tag{1}$
嵌入向量 $\mathbf{z}_{(p, t)}^{(0)}$ 表示变压器的输入，发挥类似于NLP中输入文本变压器的嵌入词序列的作用。与最初的BERT变压器一样，我们在序列的第一个位置添加了一个特殊的可学习向量 $\mathbf{z}_{(0, 0)}^{(0)}$ ，表示分类标记的嵌入。

Query-Key-Value computation. .我们的变压器由 $L$ 个编码块组成。对于每个块 $l$ ，每个patch的查询/键/值向量都是从之前的块编码表示 $\mathbf{z}_{(p, t)}^{(l-1)}$ 计算得来：
$\begin{array}{l} \mathbf{q}_{(p, t)}^{(\ell, a)}=W_{Q}^{(\ell, a)} \operatorname{LN}\left(\mathbf{z}_{(p, t)}^{(\ell-1)}\right) \in \mathbb{R}^{D_{h}} \\ \mathbf{k}_{(p, t)}^{(\ell, a)}=W_{K}^{(\ell, a)} \operatorname{LN}\left(\mathbf{z}_{(p, t)}^{(\ell-1)}\right) \in \mathbb{R}^{D_{h}} \\ \mathbf{v}_{(p, t)}^{(\ell, a)}=W_{V}^{(\ell, a)} \operatorname{LN}\left(\mathbf{z}_{(p, t)}^{(\ell-1)}\right) \in \mathbb{R}^{D_{h}} \end{array}$
$a = 1, ..., A$ 是多个注意力头的索引，A表示注意力头的总数，每个注意头的潜在维数设置为 $D_h=D/A$

Self-attention computation. 自注意权重通过点积计算，每个query patch (p,t)的自注意力权重计算公式为：
$\boldsymbol{\alpha}_{(p, t)}^{(\ell, a)}=\operatorname{SM}\left(\frac{\mathbf{q}_{(p, t)}^{(\ell, a)^{\top}}}{\sqrt{D_{h}}} \cdot\left[\mathbf{k}_{(0,0)}^{(\ell, a)}\left\{\mathbf{k}_{\left(p^{\prime}, t^{\prime}\right)}^{(\ell, a)}\right\}_{\substack{p^{\prime}=1, \ldots, N \\ t^{\prime}=1, \ldots, F}}\right]\right)\tag{5}$
其中，SM为softmax激活函数。当注意力只在一个维度上计算（例如，仅空间或仅时间）时，计算量会显著减少。例如，在空间注意的情况下，只使用N+1个query-key进行比较，即只使用与query来自同一帧的key：
$\boldsymbol{\alpha}_{(p, t)}^{(\ell, a)space}=\operatorname{SM}\left(\frac{\mathbf{q}_{(p, t)}^{(\ell, a)^{\top}}}{\sqrt{D_{h}}} \cdot\left[\mathbf{k}_{(0,0)}^{(\ell, a)}\left\{\mathbf{k}_{\left(p^{\prime}, t^{\prime}\right)}^{(\ell, a)}\right\}_{\substack{p^{\prime}=1, \ldots, N }}\right]\right)\tag{6}$
Encoding. $\mathbf{z}_{(p, t)}^{(l)}$ 是通过首先使用每个注意头的自注意系数计算值向量的加权和得到的：
$\mathbf{s}_{(p, t)}^{(\ell, a)}=\alpha_{(p, t),(0,0)}^{(\ell, a)} \mathbf{v}_{(0,0)}^{(\ell, a)}+\sum_{p^{\prime}=1}^{N} \sum_{t^{\prime}=1}^{F} \alpha_{(p, t),\left(p^{\prime}, t^{\prime}\right)}^{(\ell, a)} \mathbf{v}_{\left(p^{\prime}, t^{\prime}\right)}^{(\ell, a)}\tag{7}$
然后，来自所有头的向量的连接被投影并通过一个MLP，每次操作后使用残差连接：
$\begin{array}{l} \mathbf{z}_{(p, t)}^{\prime(\ell)}=W_{O}\left[\begin{array}{c} \mathbf{s}_{(p, t)}^{(\ell, 1)} \\ \vdots \\ \mathbf{s}_{(p, t)}^{(\ell, \mathcal{A})} \end{array}\right]+\mathbf{z}_{(p, t)}^{(\ell-1)} \\ \mathbf{z}_{(p, t)}^{(\ell)}=\operatorname{MLP}\left(\operatorname{LN}\left(\mathbf{z}_{(p, t)}^{\prime(\ell)}\right)\right)+\mathbf{z}_{(p, t)}^{(\ell)} \end{array}$
Classifification embedding. The fifinal clip embedding is

obtained from the fifinal block for the classifification token:
$\mathbf{y}=\operatorname{LN}\left(\mathbf{z}_{(0,0)}^{(L)}\right) \in \mathbb{R}^{D}\tag{10}$
在此表示之上，我们附加了一个1-hidden-layer MLP，用于预测最终的视频类。

Space-Time Self-Attention Models. 我们可以通过用每个帧内的空间注意力Eq(6) 替换Eq(5) 的时空注意来降低计算代价，然而，这样的模型忽略了捕获跨帧的时间依赖关系。正如我们的实验所示，与完全时空关注相比，这种方法导致分类精度下降，特别是在需要强时间建模的基准测试上。

我们提出了一种更有效的时空注意结构，称为“分割时空注意”(用T+S表示)，其中时间注意和空间注意分别被逐个应用。

图1 中该结构与空间和联合时空注意进行了比较

图2中给出了一个视频例子上不同注意模型的可视化

本文所研究的五种时空自注意方案的可视化研究，每个视频剪辑被视为一系列大小为16×16像素的帧级补丁。为了说明，我们用蓝色表示查询补丁，并用非蓝色表示其在每个方案下的自注意时空邻域。没有颜色的补丁不用于蓝色补丁的自注意计算。方案中的多种颜色表示分别应用于不同维度（例如（T+S）的空间和时间）或不同社区（例如（L+G））的注意。请注意，视频剪辑中的每个patch都计算了自注意力，也就是说，每个patch都作为一个Query. 我们还注意到，虽然注意力模式只显示了两个相邻的帧，但它以相同的方式扩展到剪辑的所有帧。

对于分散注意，在每个block $l$ 内，我们首先通过将每个patch (p,t)与其他帧中相同空间位置的所有patch进行比较来计算时间注意力：
$\boldsymbol{\alpha}_{(p, t)}^{(\ell, a) \text { time }}=\operatorname{SM}\left(\frac{\mathbf{q}_{(p, t)}^{(\ell, a)}}{\sqrt{D_{h}}} \cdot\left[\mathbf{k}_{(0,0)}^{(\ell, a)}\left\{\mathbf{k}_{\left(p, t^{\prime}\right)}^{(\ell, a)}\right\}_{t^{\prime}=1, \ldots, F}\right]\right)\tag{11}$
利用时间注意应用Eq (8) 所得到的编码 $\mathbf{z}_{(p, t)}^{\prime(\ell)time}$ 被反馈给空间注意计算，而不是传递给MLP. 换句话说，新的键/查询/值向量从 $\mathbf{z}_{(p, t)}^{\prime(\ell)time}$ 得来，空间注意力通过等式(6) 计算得到。得到的向量 $\mathbf{z}_{(p, t)}^{\prime(\ell)time}$ 通过等式(9)的MLP去计算最终的编码 $\mathbf{z}_{(p, t)}^{(l)}$ 在block $l$ 的每个patch上，对于分散注意力的模型，我们学习不同的查询/键/值矩阵 $\left\{W_{Q^{\text {time }}}^{(\ell,a)}, W_{K^{\text {time }}}^{(\ell,a)}, W_{V^{\text {time }}}^{(\ell, a)}\right\}$ 和 $\left\{W_{Q^{\text {time }}}^{(\ell,a)}, W_{K^{\text {time }}}^{(\ell,a)}, W_{V^{\text {time }}}^{(\ell, a)}\right\}$ 在时间和空间维度上。值得注意的是，与等式5联合时空注意模型需要的每个patch (NF+1)比较相比，实验表明，这种时空分解不仅效率更高，而且提高了分类精度。

我们还实验了“稀疏局部全局”(L+G)和“轴向”(T+W+H)注意模型。它们的架构如图1所示，而图2显示了这些模型考虑注意的补丁。对于每个patch(p,t)，(L+G)首先考虑相邻的F×H/2×W/2斑块计算局部注意，然后沿时间维度和2个patch的步幅计算整个片段的稀疏全局注意。因此，它可以被视为使用局部-全局分解和稀疏模式的全时空注意近似，类似于(Childetal.，2019)中使用的。最后，“轴向”注意力将注意力计算分解为三个不同的步骤：随着时间的推移、宽度和高度。(Ho等人，2019年提出了分解注意力；Huang等人，2019；Wang等人，2020b)和我们的(T+W+H)为视频的情况添加了第三维度（时间），所有这些模型都是通过为每个注意步骤学习不同的查询/键/值矩阵来实现

4. Experiments

我们对四个流行的动作识别数据集进行了时间分析评估：Kinetics-400 , Kinetics-600, Something-Something-V2, Diving-48 。我们采用在ImageNet-1K或ImageNet-21K, 除非有不同说明，我们使用大小为8×224×224的剪辑，帧采样速率为1/32。补丁大小为16×16像素。在推理过程中，除非另有说明，我们在视频中间采样单个时间片段。我们从时间剪辑中使用3种空间作物（左上、中、右下），并通过对这3种作物的平均得分得到最终的预测。

4.1. Analysis of Self-Attention Schemes

对于这第一组实验，我们从在ImageNet-21K上预训练的ViT开始。在表1中，我们给出了时间分析器对Kinetics-400 (K400)和Something-Something-V2 (SSv2)的五种时空注意方案的结果。首先，我们注意到具有仅空间注意(S)的时间s形成器在K400上表现良好。这是一个有趣的发现。事实上，之前的工作已经表明，在K400上，空间线索比时间信息更重要。在这里，我们证明了它是可能获得坚实的精度在K400没有任何时间建模。但是，仅空间注意在SSv2上表现很差。这强调了对后一个数据集进行时间建模的重要性。

在图3中，我们还比较了在使用更高的空间分辨率（左）和更长的（右）视频时，联合时空与分割的时空注意力的计算成本。我们注意到，在这两种设置下，划分时空尺度的方案很优雅。相比之下，随着分辨率或视频长度时，联合时空注意方案的成本显著提高。在实践中，当空间帧分辨率达到448像素时，或当帧数增加到32像素时，联合时空注意就会导致GPU内存溢出，因此它实际上不适用于大帧或长视频。因此，尽管有更多的参数，但在更高空间分辨率或更长的视频时，分割时空注意比联合时空注意更有效。因此，在所有后续的实验中，我们都使用了一个由分割的时空自注意块构造的时间分析器。

4.2. Comparison to 3D CNNs

在本小节中，我们进行了一项实证研究，旨在理解TimeSformer与三维卷积架构的区别特性，这是近年来视频理解的突出方法。我们将比较重点放在两种3D CNN模型上：1)SlowFast，这是最先进的视频分类，和2)I3D，它已被证明受益于基于图像的预训练，类似于我们自己的模型。我们在表2中对这两个网络进行了定量比较，并强调了下面的关键观察结果。

Model Capacity.
从表2中，我们首先观察到，虽然TimeSformer具有较大的学习能力(参数数为121.4M)，但它的推理成本较低(TFLOPs为0.59)。相比之下，SlowFast 8x8 R50尽管只包含34.6M个参数，但仍具有更大的推理成本(1.97个TFLOPs)。类似地，I3D 8x8 R50也有更大的推理成本(1.11 TFLOPs)，尽管包含更少的参数(28.0M)。这表明，时间分布表更适合于涉及大规模学习的设置。相比之下，现代3Dcnn的计算成本很大，使得在进一步提高模型容量的同时保持效率。

Video Training Time
ImageNet预训练的一个显著优点是，它能够对视频数据进行非常有效的时间器训练，相反，即使在图像数据集上进行了预先训练，最先进的3Dcnn的训练成本也要昂贵得多。在表2中，我们比较了Timeformer在Kinetics-400的视频训练时间与SlowFast和I3D的视频训练时间。从在ImageNet-1K上预训练的ResNet50开始，SlowFast 8×8 R50需要3 840 Tesla V100 GPU hours才能在Kinetics-400上达到75.6%的精度。在类似的设置下，训练I3D需要1 440 Tesla V100 GPU hours，准确率为73.4%. 相比之下，同样在ImageNet-1K上进行预训练的时间发生器只需要416 Tesla V100 GPU hours就能达到更高的75.8%的准确率。此外，如果我们限制 SlowFast 在与Timeformer相似的计算预算下进行训练(即448 GPU hours)，其准确率降至70.0%. 类似地，使用类似的计算预算（即444个GPU hours）来训练I3D会导致准确率较低，为71.0%。这突出了一个事实，即一些最新的3Dcnn需要一个非常长的优化计划来实现良好的性能（即使使用ImageNet预训练），相比之下，Timformer 为实验室提供了一个更有效的替代方案。

The Importance of Pretraining.
由于有大量的参数，从头开始训练我们的模型是很困难的。因此，在对视频数据训练时间形成器之前，我们用从ImageNet学习的权值初始化它。相比之下，慢速度可以从头开始通过视频数据学习，尽管代价是非常高的训练成本（见表2）。我们还尝试直接训练Kinetics-400，不需要任何ImageNet预训练。通过使用更长的训练计划和更多的数据扩充，我们发现可以从头开始训练模型，尽管视频水平的精度要低得多，为64.8%。因此，基于这些结果，在所有后续研究中，我们继续使用ImageNet进行预训练（Deng et al.，2009）

在表3中，我们研究了ImageNet-1K与ImageNet-21K对K400和SSv2的预训练的好处。对于这些实验，我们使用三个版本的模型的： (1) Timesformer，这是模型的默认版本操作8×224×224视频剪辑，(2) Timesformer-HR，高空间分辨率变体操作 $16 \times 448 \times 448$ 视频剪辑，最后(3) Timesformer-L，我们的模型运行在 $96 \times 224 \times 224$ 视频剪辑与帧采样速度为1/4.

根据表3中的结果，我们观察到ImageNet- 21K预训练对K400有益，与ImageNet-1K预训练相比，它始终具有更高的准确性。另一方面，在SSv2上，我们观察到ImageNet-1K和ImageNet-21K的预训练导致了相似的精度。这是有意义的，因为SSv2需要复杂的时空推理，而K400更偏向于空间场景信息，因此，它从在更大的训练前数据集上学习到的特征中获益更多。

The Impact of Video-Data Scale.
为了理解视频数据规模对性能的影响，我们在K400和SSv2的不同子集上训练了时间s形成器：完整数据集的{25%, 50%, 75%, 100%}. 我们在图4中展示了这些结果，其中我们还将我们的方法与SlowFast R50 和I3DR50 进行了比较。由于我们没有使用在ImageNet-21K上进行预训练的ResNet，所以我们对所有3种架构都使用ImageNet-1K进行预训练。

图4的结果显示，在K400上，时间器对所有训练子集的性能都优于其他模型。然而，我们在SSv2上观察到不同的趋势，只有在75%或100%的完整数据上训练时才是最强的模型。这可能是因为与K400相比，SSv2需要学习更复杂的时间模式，因此时间模式timefor需要更多的例子来有效地学习这些模式。

图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
SAM 图像分割算法计算物体表面积 loong_XL 深度学习图像CV 算法 SAM 图像面积计算图像算法 cv 图像分割
参考：https://enpeicv.com/forum.php?mod=viewthread&tid=90&extra=page%3D1使用SAM算法进行图像分割，计算出分割图像有多少像素，然后根据像素数量计算实际面积局限：此方法适用于物体与参考物体一个平面内，如果物体在参考物体的前后立体位置，准确性可能不大好SAM安装及模型下载：https://github.com/facebookresea
OpenCV图像边缘检测慕婉0307 opencv基础 opencv 人工智能计算机视觉
一、边缘检测基础概念边缘检测是图像处理中最基本也是最重要的操作之一，它能识别图像中亮度或颜色急剧变化的区域，这些区域通常对应物体的边界。OpenCV提供了多种边缘检测方法，从传统的算子到基于深度学习的现代方法。1.1为什么需要边缘检测？数据降维：将图像转换为边缘表示可大幅减少数据量特征提取：边缘是图像最重要的视觉特征之一预处理步骤：为物体识别、图像分割等高级任务做准备噪声抑制：某些边缘检测方法具有
CVPR2024 分割Segmentation相关论文37篇速览木木阳 CVPR2024 Segmentation 分割论文
Paper1MFP:MakingFullUseofProbabilityMapsforInteractiveImageSegmentation摘要小结:最近的交互式分割算法中，将先前的概率图作为网络输入，以帮助当前分割轮次的预测。然而，尽管使用了先前的掩膜，概率图中包含的有用信息并没有很好地传播到当前预测中。在本文中，为了克服这一局限性，我们提出了一种新颖有效的基于点击的交互式图像分割算法MFP，
【EI会议征稿】东北大学主办第三届机器视觉、图像处理与影像技术国际会议（MVIPIT 2025）诗远Yolanda 图像处理计算机视觉考研视频机器学习论文阅读
一、会议信息大会官网：www.mvipit.org官方邮箱：[email protected]会议地点：辽宁沈阳主办单位：东北大学会议时间：2025年9月27日-9月29日二、征稿主题集中但不限于“机器视觉、图像处理与影像技术”等其他相关主题。机器视觉：视觉中的统计机器学习；立体视觉标定；几何建模与处理；人脸识别与手势识别；早期视觉和生物学启发的视觉；光流法和运动追踪；图像分割和图像分类；基于模型的视觉
遥感影像数据处理-大图滑窗切分为小图 GIS潮流遥感语义分割
功能需求据所周知，遥感影像的尺寸有大有小，大的达到几万x几万像素，而图像分割算法模型在训练中尺寸适中，比如256x256，512x512，1024x1024等等，如果直接将遥感影像的原图输入模型中进行训练，大概率会提示内存和显存不足，因此针对遥感影像的模型训练，一般都需要将影像裁剪为小图。裁剪后的效果图如下：解决思路基于上面的需求，写了一套裁剪算法流程。主要考虑的是在裁剪过程中，从左往右、从上到下
基于OpenCV图像分割与PyTorch的增强图像分类方案从零开始学习人工智能 opencv pytorch 分类
在图像分类任务中，背景噪声和复杂场景常常会对分类准确率产生负面影响。为了应对这一挑战，本文介绍了一种结合OpenCV图像分割与PyTorch深度学习框架的增强图像分类方案。通过先对图像进行分割提取感兴趣区域（RegionofInterest，ROI），再进行分类，可以有效减少背景干扰，突出关键特征，从而提高分类准确率。该方案在多种复杂场景下表现出色，尤其适用于图像背景复杂或包含多个对象的情况。一、
【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
高斯混合模型（Gaussian Mixture Model, GMM）不想秃头的程序神经网络语音识别人工智能深度学习网络
高斯混合模型（GaussianMixtureModel,GMM）是一种概率模型，用于表示数据点由多个高斯分布（GaussianDistribution）混合生成的过程。它广泛应用于聚类分析、密度估计、图像分割、语音识别等领域，尤其适合处理非球形簇或多模态数据。以下是GMM的详细介绍：一、核心思想GMM假设数据是由多个高斯分布混合生成的，每个高斯分布代表一个簇（Cluster），并引入隐变量（Lat
10个基于Python的计算机视觉实战项目云博士的AI课堂基于Python计算机视觉 python 计算机视觉机器视觉人工智能
10个基于Python的计算机视觉实战项目，涵盖多个领域和应用场景，每个项目均附有GitHub地址、概述、解决的问题及应用场景：1.PCV图像处理与计算机视觉库GitHub地址:jesolem/PCV概述:提供计算机视觉基础算法的Python实现，包括图像分割、直方图均衡化、图像增强等。解决的问题:简化图像处理流程，支持快速实现算法原型。应用场景:学术研究、教学实验、图像预处理任务。2.基于朴素贝
用OpenCV实现图像分割：提取Logo中的特定元素并重新着色 Wave还没秃 opencv 人工智能计算机视觉
用OpenCV实现图像分割：提取Logo中的特定元素并重新着色任务：将图片中三个圆形图案以及字母（共四个）单独取出，分别保存为四个新图片，图片大小与原图一致，图案尽量位于图片中心。三个圆形图案在新图片中改成不与于原来的填充色。步骤总览1.读取图片2.预处理：二值化或色彩分割找目标区域3.提取每个圆形图案（红、绿、蓝）和文字区域的掩膜4.将掩膜区域提取出来并改变颜色（对圆形）5.让内容居中对齐，保存
CVPR 2024 图像处理方向总汇（图像去噪、图像增强、图像分割和图像恢复等）点云SLAM 图形图像处理深度学习计算机视觉图像分割图像增强 CVPR2024 人工智能
1、ImageProgress(图像处理)去鬼影GeneratingContentforHDRDeghostingfromFrequencyView去阴影HomoFormer:HomogenizedTransformerforImageShadowRemoval去模糊UnsupervisedBlindImageDeblurringBasedonSelf-EnhancementLatencyCorr
UNet改进（5）：线性注意力机制（Linear Attention）-原理详解与代码实现摸鱼许可证人工智能计算机视觉
引言在计算机视觉领域，UNet架构因其在图像分割任务中的卓越表现而广受欢迎。近年来，注意力机制的引入进一步提升了UNet的性能。本文将深入分析一个结合了线性注意力机制的UNet实现，探讨其设计原理、代码实现以及在医学图像分割等任务中的应用潜力。UNet架构概述UNet最初由Ronneberger等人提出，主要用于生物医学图像分割。其独特的U形结构由编码器（下采样路径）和解码器（上采样路径）组成，通
OpenCV C++ 边缘检测与图像分割 achene_ql opencv c++计算机视觉人工智能
一、边缘检测在数字图像处理领域，边缘检测是一项至关重要的基础技术。它如同为图像赋予“骨架”，帮助计算机快速识别图像中的物体轮廓、形状与结构，广泛应用于目标识别、图像分割、图像配准等多个领域。1.1概念边缘检测的核心目标是找出图像中像素灰度发生剧烈变化的区域边界。这些边界往往对应着图像中物体的轮廓、不同物体的交界处或纹理变化明显的地方。通过提取这些边缘信息，可以有效减少图像数据量，同时保留图像中最关
【GitHub项目实战】Roboflow Sports 实战解析：构建多场景运动视觉系统的开源工具集与工程落地路径观熵 GitHub开源项目实战 github 开源人工智能
RoboflowSports实战解析：构建多场景运动视觉系统的开源工具集与工程落地路径关键词RoboflowSports、计算机视觉、体育目标检测、关键点识别、球体追踪、OpenCV、YOLOv8、图像分割、PoseEstimation、数据集标注与训练摘要RoboflowSports是由Roboflow团队推出的面向体育分析场景的开源视觉工具集，涵盖目标检测、图像分割、关键点检测等常用任务，支持
Matlab | matlab中的图像处理详解北斗猿程序语言设计（C语言 C++Matlab Python等）matlab 算法图像处理
MATLAB图像处理详解这里写目录标题图像处理MATLAB图像处理详解一、图像基础操作1.图像读写与显示2.图像信息获取3.图像类型转换二、图像增强技术1.对比度调整2.去噪处理3.锐化处理三、图像变换1.几何变换2.频域变换四、图像分割1.阈值分割2.边缘检测3.区域分割五、形态学操作1.基本操作2.高级形态学六、特征提取与分析1.区域属性2.纹理特征七、彩色图像处理1.色彩空间转换2.彩色分割
医图论文 AAAI‘25 | VOILA: 基于体素与语言交互的复杂度感知CT图像通用分割方法小白学视觉医学图像处理论文解读人工智能计算机视觉医学图像处理论文解读深度学习 AAAI
论文信息题目：VOILA:Complexity-AwareUniversalSegmentationofCTimagesbyVoxelInteractingwithLanguageVOILA:基于体素与语言交互的复杂度感知CT图像通用分割方法作者：ZishuoWan,YuGao,WanyuanPang,DaweiDing论文创新点引入体素级对比学习：本文首次将体素级对比学习引入医学图像分割任务。通
OpenCV C++ 图像处理教程：灰度变换与直方图分析 achene_ql opencv c++图像处理计算机视觉人工智能
在数字图像处理领域，灰度变换与直方图分析是最基础且核心的技术，它们如同“图像的化妆师”，能够通过调整像素灰度分布显著改善图像视觉效果，为后续的目标检测、图像分割等高级任务奠定基础。无论是校正图像的亮度与对比度，还是从低质量图像中提取有效信息，掌握这些技术都是图像处理从业者的必备技能。一、点运算（PointOperation）1.概念点运算是图像处理中最基础的操作之一，指对图像中每个像素点的灰度值进
基于深度学习的智能图像分割系统：技术与实践 Blossom.118 机器学习与人工智能深度学习人工智能 python 机器学习 tensorflow 神经网络 sklearn
前言图像分割是计算机视觉领域中的一个核心任务，其目标是将图像划分为多个有意义的区域或对象。图像分割在医学影像分析、自动驾驶、安防监控等多个领域有着广泛的应用。近年来，深度学习技术，尤其是卷积神经网络（CNN）及其变体，为图像分割带来了显著的改进。本文将详细介绍基于深度学习的智能图像分割系统的原理、实现方法以及实际应用案例。一、图像分割的基本概念1.1什么是图像分割？图像分割是一种将图像划分为多个互
图像的形态学操作 Suniaun原型机 OpenCV入门 opencv 计算机视觉 c++
OpenCV中的形态学操作图像的形态学操作（MorphologicalOperations）是一种基于图像形状的处理方法，通常用于二值图像的分析和处理。形态学操作通过对图像中各个区域的结构进行改变或分析，来提取或增强图像中的形态特征（如边缘、物体、空洞等）。这些操作在许多计算机视觉任务中非常常见，例如噪声去除、边缘检测、图像分割、物体识别等。它们主要基于图像的几何形状进行分析，通过设置形态学核（通
医图论文 Arxiv‘24 | SEG-SAM：用于统一医学图像分割的语义引导SAM 小白学视觉医学图像处理论文解读医学图像处理医学图像顶会 Arxiv 论文解读深度学习
论文信息题目：SEG-SAM:Semantic-GuidedSAMforUnifiedMedicalImageSegmentationSEG-SAM：用于统一医学图像分割的语义引导SAM作者：ShuangpingHuang,HaoLiang,QingfengWang,ChulongZhong,ZijianZhou,MiaojingShi论文创新点语义感知解码器：作者提出了一个独立的语义感知解码器（
RV1106 图像分割基于paddleseg Linzhenghan 凌智视觉模块(RV1106)目标检测计算机视觉 opencv 人工智能
RV1106图像分割基于paddleseg图像分割1.基本知识简介1.1人像分割简介1.2人像分割常用方法2.C++API文档2.1RKNPU2Backend类2.1.1头文件2.1.2构造类函数2.1.3Initialize函数2.1.4Run函数2.1.5GetInputAttrs函数2.1.6GetOutputAttrs函数3.PP-Humanseg人像分割代码解析3.1流程图3.2核心代码
目标检测与图像分割：协同分析图像信息 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1计算机视觉领域的重要任务目标检测和图像分割是计算机视觉领域中两个至关重要的任务，它们在许多应用场景中扮演着关键角色，例如自动驾驶、医疗影像分析、机器人视觉等。目标检测旨在识别图像中特定目标的位置和类别，而图像分割则将图像分割成不同的区域，每个区域代表一个特定的对象或部分。1.2从粗粒度到细粒度的图像理解目标检测提供了一种粗粒度的图像理解方式，它能够告诉我们图像中存在哪些目标以及它
树莓派 5 AI 套件（Hailo-8L）使用教程 kuan_li_lyg 树莓派 &Jetson 教程人工智能树莓派机器人开发语言嵌入式硬件 python 神经网络
系列文章目录目录系列文章目录前言一、人工智能模块功能二、安装三、入门3.1前提条件3.2硬件设置3.3演示3.3.1目标检测3.3.2图像分割3.3.3姿势估计四、更多资源五、产品简介前言TheRaspberryPiAIKitRaspberryPiAI套件将RaspberryPiM.2HAT+与HailoAI加速模块捆绑在一起，供RaspberryPi5使用。套件包含以下内容：包含神经处理单元（N
将对透视变换后的图像使用Otsu进行阈值化，来分离黑色和白色像素。这句话中的Otsu是什么意思？黄卷青灯77 计算机视觉 opencv 人工智能自动化阈值OTSU
Otsu是一种自动阈值化方法，用于将图像分割为前景和背景。它通过最小化图像的类内方差或等价地最大化类间方差来选择最佳阈值。这种方法特别适用于图像的二值化处理，能够自动确定一个阈值，将图像中的像素分为黑色和白色两类。Otsu方法的原理Otsu方法的核心思想是将图像的像素分为两类（前景和背景），并通过统计分析找到一个阈值，使得这两类之间的差异最大化。具体步骤如下：计算图像的直方图：统计每个灰度值的像素
nnUNet V2修改网络——暴力替换网络为Swin-Unet w1ndfly nnU-Net V2修改网络 nnunet 深度学习人工智能机器学习 nnunetv2
更换前，要用nnUNetV2跑通所用数据集，证明nnUNetV2、数据集、运行环境等没有问题阅读nnU-NetV2的U-Net结构，初步了解要修改的网络，知己知彼，修改起来才能游刃有余。Swin-Unet是一种基于纯Transformer的U型编码器-解码器架构，专为医学图像分割任务设计。传统方法主要依赖卷积神经网络（CNN），尤其是U-Net及其变体，通过局部卷积操作和跳跃连接提取多尺度特征。然
使用 MMDetection 实现 Pascal VOC 数据集的目标检测项目练习（一）开端深蓝海拓 Pascal VOC图像集的练习项目目标检测人工智能计算机视觉 pytorch 深度学习
一、背景知识PascalVOCPascalVOC（PatternAnalysis,StaticalModelingandComputationalLearning和VisualObjectClasses）是一个知名的计算机视觉数据集，专注于目标检测、图像分割等任务。它包含20个不同物体类别的图像注释，如人、动物、交通工具等。PascalVOC挑战赛自2005年至2012年每年举办，其中VOC200
跨视角差异-依赖网络用于体积医学图像分割|文献速递-生成式模型与transformer在医学影像中的应用
Title题目Cross-viewdiscrepancy-dependencynetworkforvolumetricmedicalimagesegmentation跨视角差异-依赖网络用于体积医学图像分割01文献速递介绍医学图像分割旨在从原始图像中分离出受试者的解剖结构（例如器官和肿瘤），并为每个像素分配语义类别，这在许多临床应用中起着至关重要的作用，如器官建模、疾病诊断和治疗规划（Shamsh
七天速成数字图像处理之五（图像分割） ZzzZ31415926 图像处理计算机视觉算法人工智能数学建模
图像分割（ImageSegmentation）是数字图像处理中最核心、最具挑战性的任务之一，其目标是将图像划分为具有一致特征的区域，从而实现对图像中目标或结构的提取、理解与分析。下面我将从概念、分类、经典方法、实际应用四个层面为你系统性地讲解图像分割。一、什么是图像分割？定义：图像分割是指将图像划分为若干个互不重叠的区域，使得每个区域内部具有某种一致性（如灰度、纹理、颜色、边缘等），而不同区域之间
【MATLAB源码】机器视觉与图像识别技术(4)---模式识别与视觉计数 §ꦿCFོ༉ 机器视觉与图像识别技术计算机视觉算法人工智能图像处理 matlab 深度学习
系列文章目录第一篇文章：【MATLAB源码】机器视觉与图像识别技术—视觉系统的构成(视频与图像格式转换代码及软件下载)第二篇文章：【MATLAB源码】机器视觉与图像识别技术(2)—图像分割基础第三篇文章：【MATLAB源码】机器视觉与图像识别技术(2)续—图像分割算法第四篇文章：【MATLAB源码】机器视觉与图像识别技术(3)—数字形态学处理以及图像特征点提取模式识别与视觉计数
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f