无水先生

使用 PyTorch 进行高效图像分割：第 4 部分

一、说明

在这个由 4 部分组成的系列中，我们将使用 PyTorch 中的深度学习技术从头开始逐步实现图像分割。本部分将重点介绍如何实现基于视觉转换器的图像分割模型。

图 1：使用视觉转换器模型架构运行图像分割的结果。

从上到下，输入图像、地面实况分割掩码和预测分割掩码。来源：作者

二、文章大纲

在本文中，我们将参观风靡深度学习世界的变压器架构。变压器是一种多模态架构，可以对语言、视觉和音频等不同模态进行建模。

在本文中，我们将

了解变压器架构和所涉及的关键概念
了解视觉变压器架构
介绍从头开始编写的视觉转换器模型，以便您可以欣赏所有构建块和移动部件
跟踪输入到该模型的输入张量，并检查它如何改变形状
使用此模型对牛津 IIIT 宠物数据集执行图像分割
观察此分割任务的结果
简要介绍SegFormer，一种用于语义分割的最先进的视觉转换器

在本文中，我们将引用此笔记本中的代码和结果进行模型训练。如果要重现结果，则需要一个 GPU 来确保第一个笔记本在合理的时间内完成运行。

三、本系列文章

本系列面向所有深度学习经验水平的读者。如果您想了解深度学习和视觉AI的实践以及一些扎实的理论和实践经验，那么您来对地方了！这将是一个由 4 部分组成的系列，包含以下文章：

概念和想法
基于 CNN 的模型
深度可分离卷积
基于视觉变压器的模型（本文）

让我们从对变压器架构的介绍和直观理解开始我们的视觉变压器之旅。

四、变压器架构

我们可以将变压器架构视为交错的通信和计算层的组合。图 2 直观地描述了这一想法。变压器有N个处理单元（图3中的N为2），每个单元负责处理输入的1/N部分。为了使这些处理单元产生有意义的结果，每个处理单元都需要具有输入的全局视图。因此，系统将有关每个处理单元中的数据的信息重复传达给每个其他处理单元;使用从每个处理单元到每个其他处理单元的红色、绿色和蓝色箭头进行显示。接下来是基于此信息进行的一些计算。在充分重复此过程后，模型能够产生预期的结果。

图 2：变压器中的交错通信和计算。该图像仅显示了 2 层通信和计算。

值得注意的是，大多数在线资源通常会讨论变压器的编码器和解码器，如题为“注意力是你所需要的”的论文中所述。但是，在本文中，我们将仅描述变压器的编码器部分。

让我们仔细看看变压器中的通信和计算构成。

4.1 变压器中的通信：注意

在变压器中，通信由称为注意力层的层实现。在 PyTorch 中，这被称为 MultiHeadAttention。我们稍后会谈到这个名字的原因。

文档说：

“允许模型共同关注来自不同表示子空间的信息，如论文中所述：注意力就是你所需要的。

注意力机制使用形状（批处理、长度、特征）的输入张量 x，并生成形状相似的张量 y，以便根据张量在同一实例中关注的其他输入更新每个输入的特征。因此，在大小为“长度”的实例中，长度为“特征”的每个张量的特征会根据其他每个张量进行更新。这就是注意力机制的二次成本的用武之地。

图3：相对于句子中其他单词显示的单词“it”的注意。我们可以看到，“它”是在同一句话中注意“动物”、“太”和“tire（d）”等词。

在视觉变压器的上下文中，变压器的输入是图像。假设这是一个 128 x 128（宽度、高度）的图像。我们将其分成多个较小的大小块（16 x 16）。对于 128 x 128 的图像，我们得到 64 个补丁（长度），每行 8 个补丁和 8 行补丁。

这 64 个大小为 16 x 16 像素的块中的每一个都被视为变压器模型的单独输入。在不深入细节的情况下，将此过程视为由 64 个不同的处理单元驱动就足够了，每个处理单元都在处理单个 16x16 图像补丁。

在每一轮中，每个处理单元中的注意力机制负责查看它负责的图像补丁，并查询其余 63 个处理单元中的每一个，以询问它们可能相关和有用的任何信息，以帮助它有效地处理自己的图像补丁。

通过注意力的沟通步骤之后是计算，我们接下来将研究。

4.2 变压器中的计算：多层感知器

变压器中的计算只不过是一个多层感知器（MLP）单元。该单元由 2 个线性层组成，介于两者之间具有 GeLU 非线性。也可以考虑使用其他非线性。该单元首先将输入投影到大小的 4 倍，然后将其重新投影回 1 倍，这与输入大小相同。

在我们将在笔记本中看到的代码中，此类称为多层感知器。代码如下所示。

class MultiLayerPerceptron(nn.Sequential):
    def __init__(self, embed_size, dropout):
        super().__init__(
            nn.Linear(embed_size, embed_size * 4),
            nn.GELU(),
            nn.Linear(embed_size * 4, embed_size),
            nn.Dropout(p=dropout),
        )
    # end def
# end class

现在我们了解了变压器架构的高级工作原理，让我们把注意力集中在视觉转换器上，因为我们将执行图像分割。

五、视觉转换器

视觉转换器最初是由题为“图像价值16x16字：大规模图像识别的变压器”的论文介绍的。本文讨论了作者如何将原版变压器架构应用于图像分类问题。这是通过将图像拆分为大小为 16x16 的补丁，并将每个补丁视为模型的输入令牌来完成的。转换器编码器模型被馈送这些输入令牌，并被要求预测输入图像的类。

图 4：来源：用于大规模图像识别的变压器。

在我们的例子中，我们对图像分割感兴趣。我们可以将其视为像素级分类任务，因为我们打算预测每个像素的目标类。

我们对原版视觉转换器进行了一个小但重要的更改，并更换了MLP头，以便由MLP头进行像素级分类。我们在输出中有一个线性层，由每个补丁共享，其分割掩模由视觉变压器预测。此共享线性层预测作为模型输入发送的每个补丁的分割掩码。

在视觉转换器的情况下，大小为 16x16 的补丁被视为等效于特定时间步长的单个输入令牌。

图 5：用于图像分割的视觉转换器的端到端工作。使用此笔记本生成的图像。

5.1 在视觉转换器中构建张量维度的直觉

当使用深度CNN时，我们大部分使用的张量维度是（N，C H，W），其中字母代表以下内容：

N：批量大小
C：通道数
H：身高
W：宽度

您可以看到这种格式面向 2D 图像处理，因为它闻起来非常特定于图像的特征。

另一方面，有了变压器，事情变得更加通用和领域无关。我们将在下面看到的内容适用于视觉、文本、NLP、音频或其他输入数据可以表示为序列的问题。值得注意的是，当张量流经我们的视觉转换器时，在张量的表示中几乎没有视觉特定偏差。

在使用转换器和一般情况下，我们希望张量具有以下形状：（B，T，C），其中字母代表以下内容：

B：批量大小（与CNN相同）
T：时间维度或序列长度。此维度有时也称为 L。在视觉变压器的情况下，每个图像块对应于这个维度。如果我们有 16 个图像补丁，那么 T 维度的值将为 16
C：通道或嵌入大小维度。此维度有时也称为 E。处理图像时，大小为 3x16x16（通道、宽度、高度）的每个补丁通过补丁嵌入层映射到大小为 C 的嵌入。我们稍后会看到如何做到这一点。

让我们深入了解输入图像张量在预测分割掩码的过程中如何变异和处理。

5.2 视觉转换器中张量的旅程

在深度CNN中，张量的旅程看起来像这样（在UNet，SegNet或其他基于CNN的架构中）。

输入张量通常是形状为（1， 3， 128， 128）。该张量经过一系列卷积和最大池化操作，其中其空间维度减小，通道维度增加，通常每个增加 2 倍。这称为特征编码器。在此之后，我们执行反向操作，增加空间维度并减少通道维度。这称为特征解码器。在解码过程之后，我们得到一个形状的张量（1，64，128，128）。然后将其投影到我们希望的输出通道 C 的数量中，使用 1x128 无偏差的逐点卷积作为（128， C， 1， 1）。

图 6：张量形状通过用于图像分割的深度 CNN 的典型进展。

使用视觉变压器时，流程要复杂得多。让我们看一下下面的一张图片，然后尝试了解张量如何在每一步中转换形状。

图 7：张量形状通过用于图像分割的视觉转换器的典型进展。

让我们更详细地看一下每个步骤，看看它如何更新流经视觉转换器的张量的形状。为了更好地理解这一点，让我们为张量维度取具体值。

批量规范化：输入和输出张量具有形状（1， 3， 128， 128）。形状保持不变，但值归一化为零均值和单位方差。
图像到补丁：形状（1， 3， 128， 128）的输入张量被转换为 16x16 图像的堆叠块。输出张量具有形状（1， 64， 768）。
补丁嵌入：补丁嵌入层将 768 个输入通道映射到 512 个嵌入通道（在本例中）。输出张量的形状为（1， 64， 512）。补丁嵌入层基本上只是一个 nn。PyTorch 中的线性层。
位置嵌入：位置嵌入层没有输入张量，但有效地贡献了一个可学习的参数（PyTorch 中的可训练张量），其形状与补丁嵌入相同。这是形状（1，64，512）。
加：贴片和位置嵌入分段地加在一起，以产生视觉变压器编码器的输入。这个张量的形状是（1，64，512）。您会注意到，视觉变压器的主要主力，即编码器基本上保持这种张量形状不变。
变压器编码器：形状为（1，64，512）的输入张量流经多个变压器编码器块，每个转换器编码器块具有多个注意头（通信），后跟一个MLP层（计算）。张量形状保持不变，如（1， 64， 512）。
线性输出投影：如果我们假设要将每个图像分成 10 个类，那么我们需要每个大小为 16x16 的补丁有 10 个通道。该 nn.用于输出投影的线性层现在会将 512 个嵌入通道转换为 16x16x10 = 2560 个输出通道，此张量将类似于（1， 64， 2560）。在上图中 C' = 10。理想情况下，这将是一个多层感知器，因为“MLP 是通用函数近似器”，但我们使用单个线性层，因为这是一项教育练习
补丁到映像：该层将编码为（64， 1， 64）张量的 2560 个补丁转换回看起来像分割掩码的东西。这可以是 10 个单通道图像，或者在本例中是单个 10 通道图像，每个通道是 10 个类别之一的分割掩码。输出张量的形状为（1， 10， 128， 128）。

就是这样 — 我们已经使用视觉转换器成功分割了输入图像！接下来，让我们看一个实验以及一些结果。

5.3 视觉变压器的实际应用

此笔记本包含此部分的所有代码。

就代码和类结构而言，它非常模仿上面的框图。上面提到的大多数概念都与此笔记本中的类名 1：1 对应。

有一些与注意力层相关的概念是我们模型的关键超参数。我们之前没有提到多头关注的细节，因为我们提到它超出了本文的范围。如果您对变压器中的注意力机制没有基本的了解，我们强烈建议您在继续之前阅读上述参考资料。

我们将以下模型参数用于视觉变压器进行分割。

补丁嵌入层的 768 个嵌入维度
12 变压器编码器块
每个变压器编码器块中有 8 个注意头
多头注意力和 MLP 中 20% 的辍学率

这种配置可以在 VisionTransformerArgs Python 数据类中看到。

@dataclass
class VisionTransformerArgs:
    """Arguments to the VisionTransformerForSegmentation."""
    image_size: int = 128
    patch_size: int = 16
    in_channels: int = 3
    out_channels: int = 3
    embed_size: int = 768
    num_blocks: int = 12
    num_heads: int = 8
    dropout: float = 0.2
# end class

在模型训练和验证期间使用了与以前类似的配置。配置指定如下。

随机水平翻转和颜色抖动数据增强应用于训练集以防止过度拟合
在非宽高比保留调整大小操作中将图像大小调整为 128x128 像素
不会对图像应用任何输入归一化，而是使用批量归一化层作为模型的第一层
该模型使用 LR 为 50.0 的 Adam 优化器和每 0004 个 epoch 将学习率衰减 0.8 倍的 StepLR 调度器训练 12 个 epoch
交叉熵损失函数用于将像素分类为属于宠物、背景或宠物边框

该模型具有 86.28M 参数，经过 85 个训练周期后，验证准确率为 89.50%。这低于深度 CNN 模型在 88 个训练周期后达到的 28.20% 的准确率。这可能是由于一些需要通过实验验证的因素。

最后一个输出投影图层为单个 nn。线性而非多层感知器
16x16 色块大小太大，无法捕获更细粒度的细节
训练时期不足
没有足够的训练数据 - 众所周知，与深度CNN模型相比，转换器模型需要更多的数据来有效训练
学习率太低

我们绘制了一个 gif，显示了模型如何学习预测验证集中 21 张图像的分割掩码。

图 8：显示图像分割模型的视觉转换器预测的分割掩码进程的 gif。

我们在早期训练时期注意到一些有趣的事情。预测的分割掩码有一些奇怪的阻塞伪影。我们能想到的唯一原因是，我们将图像分解为大小为 16x16 的补丁，经过很少的训练时期，模型除了一些非常粗略的信息之外，没有学到任何有用的东西关于这个 16x16 补丁通常被宠物或背景像素覆盖。

图 9：使用视觉转换器进行图像分割时，预测分割中看到的阻塞伪影会掩盖。

现在我们已经看到了一个基本的视觉转换器，让我们把注意力转向用于分割任务的最先进的视觉转换器。

5.4 SegFormer：使用转换器进行语义分割

本文于 2021 年提出了 SegFormer 架构。我们在上面看到的转换器是SegFormer 架构的简化版本。

图 10：SegFormer 架构。资料来源：

最值得注意的是，SegFormer：

生成 4 组映像，其中包含大小为 4x4、8x8、16x16 和 32x32 的修补程序，而不是具有大小为 16x16 的修补程序的单个修补映像
使用 4 个变压器编码器块，而不仅仅是 1 个。这感觉就像一个模型合奏
在自我注意的前阶段和后期阶段使用卷积
不使用位置嵌入
每个变压器模块以空间分辨率 H/4 x W/4、H/8 x W/8、H/16 x W/16 和 H/32、W/32 处理图像
同样，当空间维度减小时，通道也会增加。这感觉类似于深度CNN
对多个空间维度的预测进行上采样，然后在解码器中合并在一起
MLP 将所有这些预测结合起来，提供最终预测
最终的预测是在空间维度H/4，W/4，而不是在H，W。

六、结论

在本系列的第 4 部分中，我们特别介绍了变压器架构和视觉变压器。我们对视觉变压器的工作原理以及视觉变压器的通信和计算阶段所涉及的基本构建块有了直观的理解。我们看到了视觉转换器采用的基于补丁的独特方法，用于预测分割掩模，然后将预测组合在一起。

我们回顾了一个实验，该实验显示了视觉转换器的实际作用，并能够将结果与深度CNN方法进行比较。虽然我们的视觉转换器不是最先进的，但它能够取得相当不错的结果。我们提供了对最先进的方法的一瞥，例如SegFormer。

现在应该很清楚，与基于深度CNN的方法相比，变压器具有更多的活动部件，并且更复杂。从原始FLOP的角度来看，变压器有望提高效率。在变压器中，唯一计算繁重的实层是nn。线性。这是在大多数架构上使用优化的矩阵乘法实现的。由于这种架构的简单性，与基于深度CNN的方法相比，变压器有望更容易优化和加速。

恭喜你走到了这一步！我们很高兴您喜欢阅读有关 PyTorch 中高效图像分割的系列文章。如果您有任何问题或意见，请随时将其留在评论部分。

七、延伸阅读

注意力机制的细节超出了本文的范围。此外，您还可以参考许多高质量的资源来详细了解注意力机制。以下是我们强烈推荐的一些内容。

图解变压器
使用 PyTorch 从头开始 NanoGPT

我们将在下面提供文章的链接，这些文章提供了有关视觉转换器的更多详细信息。

在 PyTorch 中实现视觉转换器（ViT）：本文详细介绍了在 PyTorch 中实现用于图像分类的视觉转换器。值得注意的是，它们的实现使用 einops，我们避免这样做，因为这是一个以教育为中心的练习（我们建议学习和使用 einops 以提高代码可读性）。我们改用原生 PyTorch 运算符来排列和重新排列张量维度。此外，作者在一些地方使用 Conv2d 而不是线性图层。我们希望构建一个完全不使用卷积层的视觉转换器实现。
视觉转换器：AI之夏
在 PyTorch 中实现 SegFormer

德鲁夫·马塔尼

揭秘低调却成就富豪的行业奇迹高省飞智导师
在我们日常生活中，经常可以发现一些不起眼的行业，但它们却能够在悄无声息中赚取丰厚的利润。特别是这5个行业，看似不起眼，但利润很不错。一、药品销售。药品销售行业，是一个利润空间极大的领域。虽然药品销售行业竞争激烈，但只要具备一定实力和专业知识，就能够在市场中占据一席之地。此外，随着人们生活水平的提高，越来越多的人开始关注健康和保健，药品需求也日益增加。因此，药品销售行业仍然具有很大的发展潜力。二、有
京东零售重磅开源 | OxyGent：像搭乐高一样组装AI团队，实现群体智能京东零售技术零售开源人工智能
京东零售Oxygen团队正式开源发布多智能体协作框架——OxyGent。这一创新框架致力于帮助开发者高效组装多智能体协作系统，实现智能体间的无缝协作、弹性扩展与全链路可追溯。推动人工智能从“单点突破”迈向“群体智能”时代。OxyGent已在开源社区正式上线。开源地址：https://github.com/jd-opensource/OxyGent官网地址：https://oxygent.jd.co
西安市能做亲子鉴定的地址中心最全汇总（附2024年鉴定手续指南）国医基因周主任
西安亲子鉴定中心地址在哪里？西安亲子鉴定中心地址在西安市新城区自强东路1118号。本文为您介绍西安10个亲子鉴定中心和10家正规鉴定机构。注：各鉴定机构的鉴定范畴不同。请根据自身情况和鉴定机构的经营范围进行选择，内容仅供参考。西安亲子鉴定中心1.西安国医基因亲子鉴定中心西安亲子鉴定中心地址：西安市新城区自强东路1118号西安亲子鉴定中心电话：13193325921西安亲子鉴定中心工作时间：8：00
返利app都有哪些平台?全网佣金超高的返利平台推荐10款直返APP淘宝优惠券
随着电商平台的迅猛发展，返利APP也应运而生，它们能够为我们提供额外的优惠和返利，让我们的网购更加实惠。下面，我将为您推荐10款全网佣金超高的返利平台，让您在享受购物乐趣的同时，也能获得更多的返利。一、直返直返的口号是“返利就用直返”，它强调没有上级赚差价，直接为用户提供商家和消费者之间的综合优惠券返利平台。用户可以在直返上获取自己感兴趣的商品，购买后可以获得一定比例的返利。直返的返利速度快、金额
远逝的岁月若小说(2o6) 张春发_66a0
我悠悠地走在去生产队菜园子的路上，边走边如此联想，人家工人家庭出身的大人小孩，因穿戴的不同，其精神风貌也与真正的农家子弟大相径庭，截然不同，说话办事也比一身儿破烂粗布衣的农人自然爽利一百倍，人前人后办啥事儿也无所顾及大大方方。哪是撕呱撕流呱流衣不蔽体的农民所能比拟和摩仿得了的？我分明记得，有一次家大人让我去替我家人去分菜，我一看队列里有那大红小红在那里站着，我就先自怵了。为什么？自卑么！人家大红二
企业文化就是行动、就是战略、就是商业策略、就是业务王学秀
长期以来，因为痛感企业文化在企业经营管理实践中的“无力”甚至“虚妄”，我在各种场合持续强调企业文化的实践性和动作化，倡导将企业文化与经营管理融为一体，使其成为企业人的“生存模式与样法”。而实现这一目标的前提，就是尽量减少企业文化的理论化、道德化、思想化，将其与员工在工作实践中的“动作”紧密结合起来。值得欣慰的是，无论在理论层面还是实践层面，类似这样的观点，越来越多地得到大家的赞同。而有的观点与做法
一比一高仿名牌服装哪里有货源，推荐这十个品质优良的厂家金源皮具
一比一高仿名牌服装哪里有货源，推荐这十个品质优良的厂家在时尚界，名牌服装总是引领潮流，但高昂的价格往往让人望而却步。因此，一比一高仿名牌服装成为了许多消费者的选择。这些高仿服装不仅外观与正品相似，甚至在材质和做工上也力求完美。那么，一比一高仿名牌服装哪里有货源呢？本文将为您推荐十个品质优良的厂家，帮助您找到心仪的货源。1.广州丽影服饰有限公司广州丽影服饰有限公司专注于高端仿牌服装的生产，拥有多年的
具身智能的视觉-语言导航综述
24年2月来自曲阜师范、华东师大和哈工大的论文“Vision-LanguageNavigationwithEmbodiedIntelligence:ASurvey”。作为人工智能领域的长期愿景，具身智能的核心目标是提升智体与环境的感知、理解和交互能力。视觉-语言导航（VLN）作为实现具身智能的重要研究路径，致力于探索智体如何利用自然语言与人进行有效沟通，接收并理解指令，并最终依靠视觉信息实现精准导
20181207 旅一30王思宁
1.在文章中我学到的重要概念:讲故事不要平铺直叙2.这篇中我学到的怦然心动词汇:facialrecognition刷脸smogfog雾霾3.本篇文章中我最喜欢的句子:Forgetthememories,continuetobelife,miss,justpassby.4.本周学习中我遇到的困难:东西太多，不知道从哪开始复习5.语伴给我的建议:好好复习吧，别挂科6.我的一些其他感受和收获:游戏的坑真
python折半查找算法_python二分查找代码试用递归法编写python程序实现折半查找算法...
python二分查找算法函数bi_search(),该函数实现检回忆，很美却很伤；回忆只是回不到过去的记忆。输入格式:第一行为正整数n接下来若干行为待查找的数字，每行输入一个总是女人为了天长地久而烦恼，男人却可以洒脱地出乎意料。defprime(n):ifnend:return-1mid=(start+end)//2ifprimelist[mid]==prime:returnmidelifprim
2022暑假总结 yanpinghappy
这个假期，娃都是按照每天的学习计划做事（10天日照旅游期间除外），大概是因为之前两三个寒暑假都是如此规律，所以娃也适应了这种按部就班的节奏。学习时间表，几乎都是我俩商量的结果，中间遇到时间紧张或者无法执行的情况，我们会再做调整。美中不足的是，复盘这一项我俩做得极少，这一点下次寒假时一定要加强起来。暑假第一个月，报了两个课程奥数和《水浒传》，时间排得满满的，把头一年报的游泳课挤出去了，到了第二个月才
小萝莉与猴神大叔王刚画框
巴国”天使萝莉在“印国”境地与妈妈走失，巧遇“印国”憨厚大叔猴神，并由大叔一路艰辛护送回到自己的国家与家人团聚。在两国特殊的宗教、政治等大环境因素下，亲遇了社会的百态和人情的温暖。是她人生某个时间段最深刻的经历，应该是一辈子的记忆。她乖巧可爱，却不能发声，差点走失，却又在众人帮助下回到母亲的怀抱，他性格刚直，宗教信仰情怀浓厚，最后差点客死他乡。开始相遇，一个眼神的交汇后使两人的生活和命运开始了转折
大同20家可以做亲子鉴定的机构合集（附2024年鉴定汇总）国医基因
大同哪里可以做亲子鉴定？国医基因亲子鉴定中心可以做亲子鉴定，机构地址：大同市新建南路医卫街1号。大同有很多亲子鉴定中心。为了方便快捷地找到大同亲子鉴定中心的地址，小编专门整理了大同亲子鉴定中心名单供您参考。有24家正规的鉴定机构，排名不分先后。机构建议如下：注：各鉴定中心的鉴定类别不同。请根据自身情况和鉴定中心的经营范围进行选择。内容仅供参考。大同正规亲子鉴定机构目录大全1.大同国医基因亲子鉴定中
每周复盘——第十七周马幸运
本周计划完成情况:本周除了补齐打卡，还有剩下收尾，别的都完了。而且弹琴有进步，还被老师夸奖了，很开心，以后继续保持。下周计划:1.练琴一个小时以上。2.准时完成日更。3.继续坚持跑步，一周一次起。4.给家人至少打一次电话。5.把之前的为了打卡的文章补齐。收获:通过和小伙伴交流，发现了自己在沟通表达上可以提高的地方，发现她好会和男朋友相处沟通交流呀，有学到很多。本周又是磕到糖的一周。其实，挺好的，可
HashMap和ConcurrentHashMap源码精讲
HashMap类结构图HashMap源码讲解//HashMap默认初始容量是2的4次方，也就是16；staticfinalintDEFAULT_INITIAL_CAPACITY=1implementsMap.Entry{finalinthash;finalKkey;Vvalue;Nodenext;Node(inthash,Kkey,Vvalue,Nodenext){this.hash=hash;t
BootstrapValidator表单验证效果无效，不验证蓝色天空的银码星技术问题表单验证网页前端
BootstrapValidator是一款非常好用的前端验证插件，但是因为很多问题，一直没有效果。果然不是代码问题，而是因为Bootstrap版本和BootstrapValidator的版本问题。下载地址：https://download.csdn.net/download/weixin_37674052/11175279首先贴出来我的引用的文件代码表单代码：要用BootstrapValidato
具身智能：从理论到实践的跨越
具身智能（EmbodiedAI）的概念起源与发展是一个跨越半个多世纪的学术探索历程，其核心思想在不同学科的交叉碰撞中逐渐成型。以下从理论源头、技术奠基、术语演进三个维度展开解析，揭示这一概念的学术脉络与产业价值：一、理论源头：从图灵的哲学构想到认知科学的具身化转向1.图灵的"感官机器"设想（1950年）在人工智能奠基性论文《计算机器与智能》中，图灵提出了两种智能发展路径：抽象计算路径：如国际象棋等
PyCharm高效入门指南：从零开始掌握Python开发利器软考和人工智能学堂 Python开发经验强化学习 PyCharm
引言PyCharm是JetBrains公司推出的一款强大的Python集成开发环境(IDE)，被全球数百万Python开发者所青睐。无论你是Python初学者还是经验丰富的开发者，掌握PyCharm都能显著提升你的开发效率。本文将带你从零开始，全面了解PyCharm的核心功能和使用技巧。1.PyCharm的安装与配置1.1下载与安装首先访问JetBrains官网下载PyCharm。PyCharm有
java开发安卓和kotlin对比哈哈皮皮虾的皮 java android kotlin
Java和Kotlin都是用于Android开发的编程语言，它们各自具有独特的特点和优势。以下是对Java和Kotlin在Android开发中的对比：一、语法与简洁性Java：Java的语法相对繁琐，需要编写较多的样板代码。例如，在Java中，每一行代码的末尾都需要一个分号来表示语句的结束。Kotlin：Kotlin的语法更为简洁，支持更多的语法糖，可以减少冗余的代码。在Kotlin中，换行符通常
曾龙·精选文章：《丹巴，唯有音乐与美》开问
未到中路不知有天堂，不来嘉绒未曾见美人。幸运，降落我在丹巴的旅途上，才能够遇见丹巴最隆重的这次山地旅游节。五点起床，赶到中路乡时，早已人头攒动，粉色的花海悄无声息的爬入眼帘，等云朵在山顶扎好了帐篷，那雪白的藏寨，也随着袅袅的炊烟升入了碧蓝色的梦。于是，在这中国最美的乡村里便有了中国最美的舞台，在这中国最美的舞台上便有了最美的歌声和姑娘。彩色的云雾腾起开幕的篇章，摩尔多山下实景歌舞剧，用一根纯净的哈
爱是包容和鼓励朱氏家族的家
老公出差，儿子回到家第一句话就是问我爸呢，我说爸爸出差了。儿子的脸一下垮了下来，伤感地说：“好想爸爸。”早上还一起骑自行车，这也仅仅几个小时而已。我有点羡慕又有点吃醋。儿子的教育上，我和老公商量，总要有人唱白脸有人唱红脸，小学的时候一直是我严厉，老公慈爱。源于自然。到了初中，老公加入了几个家长群，瞬间被严重的形势震撼，也加入了我的阵营。看着儿子的沮丧，我郑重地跟老公谈话，绝对不能这样下去。我让他坚
恋爱八年，我逃婚了(江苒顾现许曼)免费小说全集_阅读免费小说恋爱八年，我逃婚了江苒顾现许曼喵喵美文
《恋爱八年，我逃婚了》主角：江苒顾现许曼简介：我和顾现恋爱八年。在婚期前三天，却发现他电脑里存了上万张同一个女生的照片。我偷偷订下婚礼当天出国的机票。静静看着他若无其事地表演。婚礼当天新娘逃婚，他却疯了。路上顾现的手机几次震动，都是许曼发来消息问他有没有安全到家。我解锁了屏幕，本来想礼貌性地回一句。却看见他和朋友的聊天记录。【假结婚是我最后的机会，如果她还是不回来，我就真的要放弃了。】【你在班级群
职场小说（9）职场中的瞎混沌—上茉糖J
T今天第一天刚上任，做高级工程经理。他已是这个岗位6年内第三任。平均2年一轮换。已经邮件告知该部门文员和口头知会需要提前准备文具和电脑，仍无动于衷，还说不是她的职责，以前那任经理都不是她准备的。人事经理Jane亲自下去找部门副经理了解此事，果然口气如出一辙的，还觉得理直气壮，以前新员工也是一样，为何来了个经理就搞特殊。来了新员工才带他们领电脑或者文具。让新人自己找人领工具！第一次听说，如果你到了别
【Android】UI布局工具及详解米莱虾 #Android ui android
ViewGroup1.简介ViewGroup是一种View，他是View容器，也就是里边可以包含其他View.分类：（1）layout布局类的ViewGroup（2）ScrollView带滚动条的ViewGroup（3）高级View容器（适配器View）（4）其他ViewGroup2.布局类的ViewGroup布局类的容器主要是用来控制子元素的排布方式和排列位置分类：（1）线性布局（2）相对布局（
Android Room使用方法与底层原理详解你过来啊你 android room
Room是一个强大的SQLite对象映射库，旨在提供更健壮、更简洁、更符合现代开发模式的数据库访问方式。核心价值：消除大量样板代码，提供编译时SQL验证，强制结构化数据访问，并流畅集成LiveData、Flow和RxJava以实现响应式UI。一、使用流程(Step-by-StepWorkflow)Room的使用遵循一个清晰的结构化流程：添加依赖：//build.gradle(Module)depe
2023-05-09 论文小天才
2023年社会科学、人文艺术与文化国际会议（SSHAC2023)大会简介2023年社会科学、人文、艺术和文化国际会议（SSHAC2023）将在四川省成都市举行。会议旨在为从事“社会科学”和“人文艺术”研究的专家学者提供一个平台，分享科研成果和前沿技术，了解学术发展趋势，拓宽研究思路，加强学术研究和讨论，促进学术成果产业化合作。大会邀请了来自国内外高校和研究机构的专家、学者、企业家等相关人员。热忱欢
过完年，我跟妈妈说：我想定下来了软妹莫爷
春节假期我回家呆了10天。什么都没做，像一条咸鱼。“在外”和“在家”是两种截然不同的时间维度。在外保持的一切习惯，在家的时候就会停摆。比如我保持了几个月的每天运动，一回到家就不做了；明明坚持每天化妆护肤，一回到家，连脸都不洗。在外，我每天屁滚尿流，被生活揍得鼻青脸肿。回家后，我看到扎根在家乡的旧日同学，他们结婚生子摆满月酒；我看见自己爸爸妈妈那种熟悉如常、日复一日的安定生活。常年在外的我，在“故乡
三观，三观，到底什么是三观星星的彼岸
无论是在网上还是在和同学交流，当对于一个问题的答案有争论的时候，总会听到一句话：“我们三观不合，所以，答案不同”，这句话听多了也就习以为常了，但是“三观”这个词真的知道是什么意思吗？三观究竟是一个什么东西？这个问题我们并没有去探讨过。在高中的时候，我们会听老师说：“三观，三观，就是人生观，价值观，世界观的统称”，然而，什么是人生观，什么是价值观和世界观，都不知道，于是今天就和我爸在交流这个问题。世
盘点MacOS和Linux操作系统互传文件的几种方法，你应该用得着！(1)
ps-e|grepssh如下，只有客户端//返回root@SongyangJi-Ubuntu-DeskStop:/home/songyangji#ps-e|grepssh2020?00:00:00ssh-agent这个也是不成功的。songyangji@SongyangJi-Ubuntu-DeskStop:~$sshlocalhostssh:connecttohostlocalhostport22
python作业陈小铃子 python 开发语言
基础练习练习目标函数01.计算车费题目描述小红打车，起步价8元(3公里),每公里收费2元，她打车行驶了n公里，通过函数封装并计算车费输入描述输入一个公里数输出描述输出应付车费示例输入：5输出：12defcalculate_fare(distance):base_price=8#起步价per_km_cost=2#每公里费用min_distance=3#最小计费距离ifdistance0:sum_nu
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比