谢眠

CNN-day11-注意力机制

day12-注意力机制

一、卷积注意力机制

神经网络能够在同样的计算资源下获得更强的表征能力和更优的性能表现。

1 注意力认知

AM： Attention Mechanism，注意力机制。

注意力机制 是一种让模型根据任务需求动态地关注输入数据中重要部分的机制。

通过注意力机制，模型可以做到对图像中不同区域、句子中的不同部分给予不同的权重，从而增强感兴趣特征，并抑制不感兴趣区域。

2 注意力应用

注意力机制最初应用于机器翻译（如Transformer），后逐渐被广泛应用于各类任务，包括：

NLP：如机器翻译、文本生成、摘要、问答系统等。
计算机视觉：如图像分类（细粒度识别）、目标检测（显著目标检测）、图像分割（图像修复）等。
跨模态任务：如图文生成、视频描述等。

二、通道注意力

对不同的特征通道进行增强或抑制，也就是赋予不同的权重参数。

不同卷积核卷之后会得到不同的96个特征：边缘、形状、颜色等，不同的任务关注不同的特征。

1 SENet

https://arxiv.org/pdf/1709.01507

Squeeze-and-Excitation Networks

挤压 - 和 - 激活、激发

即插即用

1.1流程详解

SENet采用具有全局感受野的池化操作进行特征压缩，并使用全连接层学习不同特征图的权重

通道数在加入注意力机制之后前后不发生改变

1.1.1Squeeze阶段

该阶段通过全局平均池化完成全局信息提取，

$$
z_c=\mathbf{F}_{sq}(\mathbf{u}_c)=\frac1{H\times W}\sum_{i=1}^H\sum_{j=1}^Wu_c(i,j)
$$

1.1.2Excitation阶段

Squeeze的输出作为Excitation阶段的输入，经过两个全连接层，动态地为每个通道生成权重，

$$
\mathbf{s}=\mathbf{F}_{ex}(\mathbf{z},\mathbf{W})=\sigma(g(\mathbf{z},\mathbf{W}))=\sigma(\mathbf{W}_2\delta(\mathbf{W}_1\mathbf{z}))
$$

全连接层加入激活函数，用于引入非线性变化：

第一个全连接层（ReLU），将通道数从C降维为C/r。
r是缩放因子，Ratio，比例的意思，用以减少运算量和防止过拟合。
$$
通过第二个全连接层（si4）将维度恢复为C，输出一个1 \times 1 \times C的权重向量。
$$

4.权重归一化：使用sigmoid确保权重在0~1之间。

5.该向量代表每个通道的重要性，也就是注意力的权重。

1.1.3输出阶段

$$
特征 \mathbf{u}_c 和 Excitation阶段产出的 \mathbf{s}_c 进行相乘操作，用于对不同的通道添加权重：\widetilde {x}_{c} = F_{scale}(u_{c},s_{c}) =s_{c}u_{c}
$$

1.2融入模型

作为一种即插即用模块，可以添加到任意的层后，只要保证输出通道不变即可

1.3性能对比

1.4缩放因子

作为一种即插即用模块，可以添加到任意的层后，只要保证输出通道不变即可

1.5 有无Squeeze

我们可以考虑不要Squeeze做平均池化，直接在Excitation阶段进行卷积操作。从下标看的出来，这个Squeeze阶段还是很有必要的。

1.6 池化方式

我们也可以考虑采用最大池化，不过效果不如平均池化。因为对注意力来讲更多的是维持原始信息，而不是强化特征。

1.7 激活函数

这里是针对第二个全连接层，我们想要的是一个概率向量，无疑返回值在(0 ~ 1)之间的Sigmoid是最好的选择。

1.8 网络位置

SE模块灵活度较高

性能对比如下：POST模式最差

1.9 不同阶段添加

比如ResNet是分很多个阶段的，不同的阶段添加SE模块效果是不一样的。

看的出来，越靠后的位置效果越好，因为越靠后特征学习的越好，此时加入效果就越好。当然全加SE的效果最好，不过参数量也不少。

2 SKNet

Selective Kernel Networks可选择的卷积核尺寸

https://arxiv.org/pdf/1903.06586

SK是对SE的改进版，可以动态调整感受野大小，分为Split-Fuse-Select共3个阶段

2.1Split阶段

在Split阶段会分出多个分支，每个分支实现不同大小的感受野，从而捕获不同的特征。
为提高效率，传统的5×5卷积被替换为带有3×3卷积核和膨胀大小为2的膨胀卷积。
$$
\widetilde{\mathcal{F}}:\mathbf{X}\to\widetilde{\mathbf{U}}\in\mathbb{R}^{H\times W\times C} \\ \widehat{\mathcal{F}}:\mathbf{X}\to\widehat{\mathbf{U}}\in\mathbb{R}^{H\times W\times C}
$$

2.2Fuse阶段

整合分支信息，具体步骤如下：

1.通过element-wise summation得到 U

$$
\mathbf{U}=\widetilde{\mathbf{U}}+\widehat{\mathbf{U}}
$$

2.通过global average pooling得到特征 s

$$
s_c=\mathcal{F}_{gp}(\mathbf{U}_c)=\frac1{H\times W}\sum_{i=1}^H\sum_{j=1}^W\mathbf{U}_c(i,j)
$$

平均池化操作

$$
通过FC全连接层得到 \mathbf{z}\in\mathbb{R}^{d\times1}
$$

$$
\mathbf{z}=\mathcal{F}_{fc}(\mathbf{s})=\delta(\mathcal{B}(\mathbf{W}\mathbf{s}))
$$

$$
其中 \mathcal{B} 是batch normalization，\delta 是ReLU，\mathbf{W}\in\mathbb{R}^{d\times{C}}。注意这里通过reduction ratio r 和阈值 L 两个参数控制 z 的输出通道 d：
$$

$$
d=\max(C/r,L)，L默认值是32
$$

4.通过两个不同的FC层(即矩阵A、B)分别得到 a 和 b，这里将通道从 d 又映射回原始通道数 C。

5.对 a,b 对应通道 c 处的值进行 softmax 处理。

$$
a_{c}=\frac{e^{ {\mathbf{A}_{c}\mathbf{z}}}}{e^{ {\mathbf{A}_{c}\mathbf{z}}}+e^{ {\mathbf{B}_{c}\mathbf{z}}}} \\ \\ b_{c}=\frac{e^{ {\mathbf{B}_{c}\mathbf{z}}}}{e^{ {\mathbf{A}_{c}\mathbf{z}}}+e^{ {\mathbf{B}_{c}\mathbf{z}}}}
$$

$$
在公式中，A,B\in\mathbb{R}^{d\times C}，A_c z 和 B_c z 分别代表不同（3×3、5×5）的卷积核经过全局池化（F_{gp}）和全连接层（F_{fc}）后得到的特征。
$$

$$
a,b分别表示 \widetilde{\mathbf{U}} 和 \widehat{\mathbf{U}} 的注意力系数。
$$

2.3Select阶段

softmax分别对不同卷积核的结果做抑制和增强

$$
\widetilde{\mathbf{U}} 和 \widehat{\mathbf{U}} 分别与 sofmax 处理后的 a,b 相乘，再相加，得到最终输出的 V 和原始输入 X的维度一致。
$$

$$
\mathbf{V}_c=a_c\cdot\widetilde{\mathbf{U}}_c+b_c\cdot\widehat{\mathbf{U}}_c \\ \quad a_c+b_c=1
$$

$$
其中 \mathbf{V} = [\mathbf{V}_1,\mathbf{V}_2,...,\mathbf{V}_c], \mathbf{V}_c \in \mathbb{R}^{H\times W}
$$

2.4融入模型

2.5注意力权重分析

图标注解：前景图越大，5×5和3×3的注意力权重差值越小

SK_X_Y 中的 X 代表网络的不同层级（Stage），数字越大表示层越深。
Y 代表该层级中的第几个SK模块。
不同的SK模块在不同的层级负责提取不同尺度、不同语义的特征。
从第2层到第5层，特征从低级（如边缘、纹理）逐渐过渡到高级语义信息（如物体、场景等）。
channel index（32、64、96等）表示不同通道编号。
activation表示每个通道上的注意力权重值。这个值越高，表明网络对该通道上的特征越重视。

通过对比5×5和3×3卷积核的注意力值，可以表明较大卷积核在捕捉大目标时更有优势。

3 SENet搭建

可以在任意位置添加SE模块。

3.1构建SE模块

import torch.nn as nn


class SeNet(nn.Module):
    def __init__(self, inchannel, reduction=16):
        super(SeNet, self).__init__()
        #  global average pooling：目标是池化为一个固定大小的输出 1 * 1
        self.gavgpool = nn.AdaptiveAvgPool2d(1)
        # 两个全连接层
        self.fc1 = nn.Sequential(
            nn.Linear(inchannel, inchannel // reduction, bias=False),
            nn.ReLU(inplace=True),
        )

        self.fc2 = nn.Sequential(
            nn.Linear(inchannel // reduction, inchannel, bias=False),  # 1
            nn.Sigmoid(),  # 2
        )

    def forward(self, x):
        identity = x
        # 获取形状的值
        N, C, _, _ = x.size()
        # 进行SENet的Squeeze操作
        x = self.gavgpool(x)  # NCHW --> N*C*1*1

        # 进行SENet的Excitation操作 --> N*C
        x = x.view(N, C)
        x = self.fc1(x)
        x = self.fc2(x)
        # 输出的是通道的注意力值（不是参数）
        x = x.view(N, C, 1, 1)
        return x * identity

3.2融入ResNet

3.2.1Standard SE block

import torch
import torch.nn as nn

# 导入注意力模块
from SENet import SeNet

from torchvision.models.resnet import resnet18, ResNet18_Weights, _resnet, BasicBlock


# 类：封装、继承、重写
class SEBasicBlock(BasicBlock):
    expansion: int = 1

    def __init__(
        self,
        inplanes: int,
        planes: int,
        stride: int = 1,
        downsample=None,
        groups: int = 1,
        base_width: int = 64,
        dilation: int = 1,
        norm_layer=None,
    ):
        super(SEBasicBlock, self).__init__(
            inplanes,
            planes,
            stride,
            downsample,
            groups,
            base_width,
            dilation,
            norm_layer,
        )
        # 加入注意力机制：上一层的输入是下一层的输入
        self.se = SeNet(planes * self.expansion, 16)

    def forward(self, x):
        identity = x

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)

        out = self.conv2(out)
        out = self.bn2(out)

        # 加入注意力机制:即插即用  Standard SE
        out = self.se(out)

        if self.downsample is not None:
            identity = self.downsample(x)

        out += identity

        out = self.relu(out)

        return out


def SEResnet18(*, weights=None, progress=True, **kwargs):
    weights = ResNet18_Weights.verify(weights)

    return _resnet(SEBasicBlock, [2, 2, 2, 2], weights, progress, **kwargs)


def test001():
    model = SEResnet18()
    # 导出为onnx
    input = torch.randn(1, 3, 224, 224)

    # 导出onnx
    torch.onnx.export(model, input, "SEResnet18.onnx", opset_version=11)
    print(model)


if __name__ == "__main__":
    test001()

模型使用

import torch
from StandardSEResnet18 import SEResnet18


def test001():
    model = SEResnet18()
    # 导出为onnx:预热数据
    input = torch.randn(1, 3, 224, 224)

    # 导出onnx:路径没有特别在意
    torch.onnx.export(
        model,  # 1
        input,  # 2
        "SEResnet18-STANDARD.onnx", 
        opset_version=11
    )
    
    print('模型导出success......')


if __name__ == "__main__":
    test001()

3.2.2SE-pre block

import torch
import torch.nn as nn

# 导入注意力模块
from SENet import SeNet

from torchvision.models.resnet import resnet18, ResNet18_Weights, _resnet, BasicBlock


# 类：封装、继承、重写
class SEBasicBlock(BasicBlock):
    expansion: int = 1

    def __init__(
        self,
        inplanes: int,
        planes: int,
        stride: int = 1,
        downsample=None,
        groups: int = 1,
        base_width: int = 64,
        dilation: int = 1,
        norm_layer=None,
    ):
        super(SEBasicBlock, self).__init__(
            inplanes,
            planes,
            stride,
            downsample,
            groups,
            base_width,
            dilation,
            norm_layer,
        )
        # 加入注意力机制：上一层的输入是下一层的输入
        self.se = SeNet(inplanes, 16)

    def forward(self, x):
        identity = x

        # 加入注意力机制:即插即用  SE-PRE
        x = self.se(x)

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)

        out = self.conv2(out)
        out = self.bn2(out)

        # 加入注意力机制:即插即用  Standard SE
        # out = self.se(out)

        if self.downsample is not None:
            identity = self.downsample(x)

        out += identity

        out = self.relu(out)

        return out


def SEResnet18(*, weights=None, progress=True, **kwargs):
    weights = ResNet18_Weights.verify(weights)

    return _resnet(SEBasicBlock, [2, 2, 2, 2], weights, progress, **kwargs)

3.2.3SE-POST block

import torch
import torch.nn as nn

# 导入注意力模块
from SENet import SeNet

from torchvision.models.resnet import (
    ResNet18_Weights,
    BasicBlock,
    _ovewrite_named_param,
    ResNet,
)


class SEResNet(ResNet):
    def __init__(
        self,
        block,
        layers,
        num_classes: int = 1000,
        zero_init_residual: bool = False,
        groups: int = 1,
        width_per_group: int = 64,
        replace_stride_with_dilation=None,
        norm_layer=None,
    ):
        # 执行父类的构造函数
        super(SEResNet, self).__init__(
            block,
            layers,
            num_classes,
            zero_init_residual,
            groups,
            width_per_group,
            replace_stride_with_dilation,
            norm_layer,
        )
        # self.layer1 - self.layer4 已经有了,这里是加入SE模块
        self.layer1 = self._modify_layer(self.layer1)
        self.layer2 = self._modify_layer(self.layer2)
        self.layer3 = self._modify_layer(self.layer3)
        self.layer4 = self._modify_layer(self.layer4)

    def _modify_layer(self, layer):
        modify_layer = []
        for block in layer:
            # 获取每个 BasicBlock 的输出通道数
            out_channels = block.conv2.out_channels
            # 创建SE模块
            se_block = SeNet(out_channels, 16)
            # 加入到原始的 BasicBlock 后面
            modified_block = nn.Sequential(block, se_block)
            modify_layer.append(modified_block)

        # 构建新的顺序容器
        return nn.Sequential(*modify_layer)


def SEResnet18(*, weights=None, progress=True, **kwargs):

    weights = ResNet18_Weights.verify(weights)

    return _resnet(BasicBlock, [2, 2, 2, 2], weights, progress, **kwargs)


def _resnet(block, layers, weights, progress, **kwargs):
    if weights is not None:
        _ovewrite_named_param(kwargs, "num_classes", len(weights.meta["categories"]))

    model = SEResNet(block, layers, **kwargs)

    if weights is not None:
        model.load_state_dict(
            weights.get_state_dict(progress=progress, check_hash=True)
        )

    return model


def test001():
    model = SEResnet18()
    print(model)


if __name__ == "__main__":
    test001()

3.2.4SE-Identity block

import torch
import torch.nn as nn

# 导入注意力模块
from SENet import SeNet

from torchvision.models.resnet import resnet18, ResNet18_Weights, _resnet, BasicBlock


# 类：封装、继承、重写
class SEBasicBlock(BasicBlock):
    expansion: int = 1

    def __init__(
        self,
        inplanes: int,
        planes: int,
        stride: int = 1,
        downsample=None,
        groups: int = 1,
        base_width: int = 64,
        dilation: int = 1,
        norm_layer=None,
    ):
        super(SEBasicBlock, self).__init__(
            inplanes,
            planes,
            stride,
            downsample,
            groups,
            base_width,
            dilation,
            norm_layer,
        )
        # 加入注意力机制：上一层的输入是下一层的输入
        self.se = SeNet(inplanes, 16)

    def forward(self, x):
        identity = x

        # 加入注意力机制:即插即用  SE-Identity
        se_identity = self.se(x)

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)

        out = self.conv2(out)
        out = self.bn2(out)

        # 加入注意力机制:即插即用  Standard SE
        # out = self.se(out)

        if self.downsample is not None:
            identity = self.downsample(x)

        # 形状可能不一致
        if self.downsample is not None:
            se_identity = self.downsample(se_identity)
            
        # out += identity
        out = self.relu(out)

        return out + se_identity


def SEResnet18(*, weights=None, progress=True, **kwargs):
    weights = ResNet18_Weights.verify(weights)

    return _resnet(SEBasicBlock, [2, 2, 2, 2], weights, progress, **kwargs)

三、空间注意力

空间注意力（Spatial Attention）主要用于CV，它在空间维度上选择性地关注输入特征图的不同位置，从而提升模型对关键区域的感知能力。其实现原理是基于不同像素位置，生成对应概率掩码，是比较低层的注意力机制。

1 Learn to Pay Attention

论文地址：https://arxiv.org/pdf/1804.02391

源代码地址：https://github.com/SaoYan/LearnToPayAttention

结合全局特征和局部特征获得注意力机制，使用加权的局部特征来识别目标。

Local features：局部特征

如头部、轮子、尾翼、发动机、机身标志或窗户等，包含丰富的细节，对于识别飞机的具体种类、型号等非常有帮助。
Global features：全局特征

如整体形状、轮廓、大小、相对背景中的位置等；对于识别是什么飞机很重要，如战斗机、客机还是直升机。
特征融合：

在生成注意力权重前会对输入的局部和全局特征进行融合。通过全局池化（Global Average Pooling）来获得全局上下文信息。
Attention Estimator：

对输入特征图进行多层卷积、池化、激活等操作，用来挖掘特征之间的关系，从而生成注意力权重图。权重图的每个位置对应特征图中的一个空间位置，表示该位置的重要性。
Att. Weighted Combination：

将生成的注意力图与原始特征图逐点相乘，得到加权后的特征图。

1.1融入模型

基于VGG16网络的多层注意力融合：是为了适配不同大小的目标

1.2实验效果

2 仿射变换

Affine Transformation，是一种线性空间变换，可以保持图形的平直性和共线性，但不一定保持角度和长度。

2.1数学表达

2.2常见类型

2.2.1平移（Translation）

$$
只改变位置，不改变形状，即 t_x 和 t_y是非零值：\begin{pmatrix} 1 & 0 & t_x \\ 0 & 1 & t_y \end{pmatrix}
$$

2.2.2旋转（Rotation）

绕某一点旋转，通常绕原点：

$$
\begin{pmatrix} \cos \theta & -\sin \theta & 0 \\ \sin \theta & \cos \theta & 0 \end{pmatrix}其中 \theta 是旋转角度。
$$

2.2.3缩放 (Scaling)

改变大小，横向或纵向进行比例缩放：

$$
\begin{pmatrix} s_x & 0 & 0 \\ 0 & s_y & 0 \end{pmatrix}其中 s_x 和 s_y 分别控制水平和垂直方向的缩放比例。
$$

2.2.4倾斜 (Shear)

$$
Shear变换使得图像沿着 x或 y 方向进行倾斜：\begin{pmatrix} 1 & k_x & 0 \\ k_y & 1 & 0 \end{pmatrix}其中 k_x 和 k_y是剪切系数。
$$

2.2.5复合变换(Composite Transformation)

仿射变换可以叠加多个基本变换，如旋转加缩放、旋转加平移等。通过矩阵乘法可以将多个变换结合成一个统一的仿射变换。

2.3具体应用

图像增强和几何校正：仿射变换常用于图像增强任务，比如在照片失真时，仿射变换可以纠正视角失真。
目标检测和跟踪：仿射变换用于将不规则形状的图像转换为标准形式，便于检测和跟踪。
数据扩增：在机器学习中，仿射变换可以生成多样化的数据集，用于增强模型的泛化能力。
仿射变换完成的是图形的像素点在整个图像中的坐标位置变换

像素点本身的值并没有进行改变

3 Spatial Transformer Network

https://arxiv.org/pdf/1506.02025

Spatial Transformer Network，STN，空间变换网络。它会学习空间特征图的形变，完成适合任务的预处理操作。STN 主要解决的问题是自动校正输入数据中的几何变换（如旋转、缩放、平移等）。

3.1 Localisation net

两个全连接层，用于生成仿射变换系数

输入：C×H×W维的图像
输出：仿射变换系数矩阵

$$
\left[\begin{array}{ccc}\theta_{11}&\theta_{12}&\theta_{13}\\\theta_{21}&\theta_{22}&\theta_{23}\end{array}\right]
$$

这个值并不总是整数。

3.2 Grid generator

Grid generator完成仿射变换

做几次仿射变换：目标字符数+1

3.2.1仿射变换公式

$$
\begin{bmatrix}x^{\prime}\\y^{\prime}\end{bmatrix}=\begin{bmatrix}a&b\\c&d\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}+\begin{bmatrix}e\\f\end{bmatrix}\quad f_l(x,y)=f_{l-1}(ax+by+e,cx+dy+f)
$$

$$
(x, y) ：第 l 层的坐标。\\ (x', y') ：通过仿射变换后映射到第 l-1 层的坐标。\\ 仿射变换由矩阵 \begin{pmatrix} a & b \\ c & d \end{pmatrix}和偏移向量 \begin{pmatrix} e \\ f \end{pmatrix}控制，表示在第 l-1 层上对坐标进行的缩放、旋转、平移等操作。
$$

3.2.2实例

3.3 Sampler

采样器根据Grid Generator生成的网格坐标，从输入图像中提取像素值。

由于 Grid Generator 生成的坐标通常不是整数，需要使用插值技术（双线性插值）来获得精确的输出值。

3.3.1采样过程

3.3.2插值方法

3.3.3输出

3.4实验效果

3.4.1MNIST数据集

在MNIST数据集上的表现：目标更大且在核心位置3.4.2 SVHN数据集

3.4.2SVHN数据集

在SVHN数据集上的表现：多尺度应用，把STN插入到不同位置

3.4.3细粒度分类

3.5STN实战

搭建一个即插即用的STN模块，再融入到模型中

3.5.1构建STN模块

import torch
import torch.nn as nn
import torch.nn.functional as F


class STN(nn.Module):
    def __init__(self, c, h, w):
        super(STN, self).__init__()
        self.fc = nn.Sequential(
            nn.Linear(in_features=c * h * w, out_features=32),
            nn.Tanh(),
            nn.Linear(in_features=32, out_features=6),
            nn.Tanh(),
        )

    def forward(self, x):
        batch_size, c, h, w = x.size()
        # 2行3列的矩阵
        theta = self.fc(x.view(batch_size, -1)).view(batch_size, 2, 3)
        
        # 仿射变换矩阵
        grid = F.affine_grid(
            theta, torch.Size((batch_size, c, h, w)), align_corners=False
        )
        
        # 开始采样
        sample = F.grid_sample(x, grid, align_corners=False)
        
        
        return sample

3.5.2融入模型

import torch
import torch.nn as nn
from STN import STN


class LeNet5s(nn.Module):
    def __init__(self, c, h, w):
        super(LeNet5s, self).__init__()  # 继承父类
        self.stn = STN(c=1, h=32, w=32)  # 新增STN模块
        # 第一个卷积层
        self.C1 = nn.Sequential(
            nn.Conv2d(
                in_channels=1,  # 输入通道
                out_channels=6,  # 输出通道
                kernel_size=5,  # 卷积核大小
            ),
            nn.ReLU(),
        )
        # 池化：平均池化
        self.S2 = nn.AvgPool2d(kernel_size=2)

        # C3:3通道特征融合对应的 卷积层  代码风格1
        self.C3_unit_6x3 = nn.ModuleList([nn.Conv2d(3, 1, 5) for i in range(6)])

        # C3:4通道特征融合单元  代码风格2 ，和上面完全一样
        self.C3_unit_6x4 = nn.ModuleList(
            [
                nn.Conv2d(
                    in_channels=4,
                    out_channels=1,
                    kernel_size=5,
                )
                for i in range(6)
            ]
        )

        # C3:4通道特征融合单元，剔除中间的1通道
        self.C3_unit_3x4_pop1 = nn.ModuleList(
            [
                nn.Conv2d(
                    in_channels=4,
                    out_channels=1,
                    kernel_size=5,
                )
                for i in range(3)
            ]
        )

        # C3:6通道特征融合单元
        self.C3_unit_1x6 = nn.Conv2d(
            in_channels=6,
            out_channels=1,
            kernel_size=5,
        )

        # S4:池化
        self.S4 = nn.AvgPool2d(kernel_size=2)
        # 全连接层
        self.fc1 = nn.Sequential(
            nn.Linear(in_features=16 * 5 * 5, out_features=120), nn.ReLU()
        )
        self.fc2 = nn.Sequential(nn.Linear(in_features=120, out_features=84), nn.ReLU())
        self.fc3 = nn.Linear(in_features=84, out_features=10)

    def forward(self, x):
        # 使用STN模块进行变换
        stnimg = self.stn(x)  # 加入STN模块

        # 训练数据批次大小batch_size
        num = stnimg.shape[0]

        x = self.C1(stnimg)
        x = self.S2(x)
        # 生成一个empty张量
        outchannel = torch.empty((num, 0, 10, 10))
        # 6个3通道的单元
        for i in range(6):
            # 定义一个元组：存储要提取的通道特征的下标
            channel_idx = tuple([j % 6 for j in range(i, i + 3)])
            x1 = self.C3_unit_6x3[i](x[:, channel_idx, :, :])
            outchannel = torch.cat([outchannel, x1], dim=1)

        # 6个4通道的单元
        for i in range(6):
            # 定义一个元组：存储要提取的通道特征的下标
            channel_idx = tuple([j % 6 for j in range(i, i + 4)])
            x1 = self.C3_unit_6x4[i](x[:, channel_idx, :, :])
            outchannel = torch.cat([outchannel, x1], dim=1)

        # 3个4通道的单元，先拿五个，干掉中那一个
        for i in range(3):
            # 定义一个元组：存储要提取的通道特征的下标
            channel_idx = tuple([j % 6 for j in range(i, i + 5)])
            # 删除第三个元素
            channel_idx = channel_idx[:2] + channel_idx[3:]
            x1 = self.C3_unit_3x4_pop1[i](x[:, channel_idx, :, :])
            outchannel = torch.cat([outchannel, x1], dim=1)

        x1 = self.C3_unit_1x6(x)
        # 平均池化
        outchannel = torch.cat([outchannel, x1], dim=1)
        outchannel = nn.ReLU()(outchannel)

        x = self.S4(outchannel)
        # 对数据进行变形
        x = x.view(x.size(0), -1)
        # 全连接层
        x = self.fc1(x)
        x = self.fc2(x)
        # TODO:SOFTMAX
        output = self.fc3(x)

        return stnimg, output


def test001():
    print(torch.__version__)
    torch.random.manual_seed(1)
    # 输入数据 batch-size = 4
    x = torch.randn(4, 1, 32, 32)
    model = LeNet5s(1, 32, 32)
    stnimg, out = model(x)
    print(stnimg.shape)
    # 导出模型onnx
    torch.onnx.export(model, x, "LeNet5s-STN.onnx", opset_version=20)


if __name__ == "__main__":
    test001()

四、混合注意力

混合注意力机制（Hybrid Attention Mechanism）是一种结合空间和通道注意力的策略，旨在提高神经网络的特征提取能力。

1 CBAM

Convolution Block Attention Module ，卷积块注意力模块

https://arxiv.org/pdf/1807.06521

轻量级的注意力模块，它通过增加空间和通道两个维度的注意力，来提高模型的性能。

$$
一维的通道注意力图：\mathcal{M}_{\mathbf{c}}\in\mathbb{R}^{C\times1\times1}\\ 二维的空间注意力图：\mathbf{M_s}\in\mathbb{R}^{1\times H\times W}
$$

$$
\begin{aligned}\mathbf{F^{\prime}}&=\mathbf{M_{c}}(\mathbf{F})\otimes\mathbf{F},\\\mathbf{F^{\prime\prime}}&=\mathbf{M_{s}}(\mathbf{F^{\prime}})\otimes\mathbf{F^{\prime}}\end{aligned}
$$

1.1通道注意力模块

通道注意力模块的目的是为每个通道生成一个注意力权重

1.2空间注意力模块

空间注意力模块通过卷积操作为特征图的每个空间位置生成权重，聚焦在图像中的关键区域。

1.3不同策略效果对比

效果最好的就是CBAM，并且池化不需要参数

2 BAM

Bottleneck Attention Module，瓶颈注意力模块。

https://arxiv.org/pdf/1807.06514

BAM是通过在空间和通道两个维度上分别构建注意力模块，它们是并行处理的。

形状不同的张量会自动进行广播机制

2.1通道注意力模块

2.2空间注意力模块

2.3注意力融合

2.4注意力应用

2.5实验结果

3 CBAM搭建

3.1通道注意力搭建

import torch
import torch.nn as nn
import torch.nn.functional as F


class ChannelAttention(nn.Module):
    def __init__(self, in_planes, ratio=16):
        super(ChannelAttention, self).__init__()
        self.max_pool = nn.AdaptiveMaxPool2d(1)
        self.avg_pool = nn.AdaptiveAvgPool2d(1)

        self.fc1 = nn.Sequential(
            nn.Conv2d(in_planes, in_planes // ratio, 1, bias=False),
            nn.ReLU(),
            nn.Conv2d(in_planes // ratio, in_planes, 1, bias=False),
        )
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        max_out = self.fc1(self.max_pool(x))
        avg_out = self.fc1(self.avg_pool(x))
        out = max_out + avg_out
        return self.sigmoid(out)

3.2空间注意力搭建

import torch
import torch.nn as nn
import torch.nn.functional as F


class ChannelAttention(nn.Module):
    # 和前面一致，略......
		

class SpatialAttention(nn.Module):
    def __init__(self, kernel_size=7):
        super(SpatialAttention, self).__init__()
        assert kernel_size in (3, 7), "kernel size must be 3 or 7"
        self.conv = nn.Conv2d(2, 1, kernel_size, padding=kernel_size // 2, bias=False)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        avg_out = torch.mean(x, dim=1, keepdim=True)
        max_out, _ = torch.max(x, dim=1, keepdim=True)
        x = torch.cat([avg_out, max_out], dim=1)
        x = self.conv(x)
        return self.sigmoid(x)

3.3模型融入CBAM

import torch
import torch.nn as nn
import torch.nn.functional as F
from torchvision.models import resnet50
from torchvision.models.resnet import ResNet50_Weights, ResNet, _resnet, Bottleneck
from CBAMAttention import ChannelAttention, SpatialAttention


# 重定义Resnet50：resnet50CBAM
def resnet50CBAM(*, weights=None, progress=True, **kwargs) -> ResNet:

    weights = ResNet50_Weights.verify(weights)

    return _resnet(BottleneckCBAM, [3, 4, 6, 3], weights, progress, **kwargs)


# 重新定义瓶颈结构：加入CBAM模块
class BottleneckCBAM(Bottleneck):
    expansion: int = 4  # 通道数在 conv3 后会扩大到 planes * expansion

    def __init__(
        self,
        inplanes: int,
        planes: int,
        stride: int = 1,
        downsample=None,
        groups=1,
        base_width: int = 64,
        dilation: int = 1,
        norm_layer=None,
    ):
        super(BottleneckCBAM, self).__init__(
            inplanes,
            planes,
            stride,
            downsample,
            groups,
            base_width,
            dilation,
            norm_layer,
        )
        # 新增的CBAM模块：注意通道数有个倍增系数
        self.ca = ChannelAttention(planes * self.expansion)
        self.sa = SpatialAttention()

    def forward(self, x):
        identity = x

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)

        out = self.conv2(out)
        out = self.bn2(out)
        out = self.relu(out)

        out = self.conv3(out)
        out = self.bn3(out)

        # 加入CBAM模块：即插即用
        out = self.ca(out) * out
        out = self.sa(out) * out

        if self.downsample is not None:
            identity = self.downsample(x)

        out += identity
        out = self.relu(out)

        return out


def testCBAM():
    model = resnet50CBAM(weights=None, num_classes=10)
    # 导出模型为onnx
    x = torch.randn(1, 3, 224, 224)
    torch.onnx.export(model, x, "resnet50CBAM.onnx")

    print("模型注意力添加成功......")


if __name__ == "__main__":
    testCBAM()

你可能感兴趣的:(深度学习,cnn,深度学习,人工智能)

AI 技术&AI开发框架 34号树洞人工智能深度学习人工智能机器学习 NLP GAI
目录一、AI技术及其开发框架1.AI技术分类与代表方向2.主流AI开发框架3.AI应用开发流程简述4.补充：基础依赖与生态二、AI技术方向1.机器学习（MachineLearning,ML）✦核心概念：✦关键方法：✦应用案例：2.深度学习（DeepLearning,DL）✦核心概念：✦网络结构举例：✦技术趋势：3.自然语言处理（NLP）✦核心任务：✦代表模型：4.计算机视觉（ComputerVis
MCP如何助力智能交通系统？从数据融合到精准决策 Echo_Wish Python 进阶 python 开发语言
MCP如何助力智能交通系统？从数据融合到精准决策近年来，智能交通系统（ITS）正在全球范围内快速发展，它结合人工智能（AI）、物联网（IoT）和数据分析，致力于提高交通效率、减少拥堵、增强安全性。而MCP（Multi-ConstraintPathfinding，多约束路径寻优）技术作为一种复杂路径优化算法，在智能交通系统中扮演着重要角色，尤其是在导航优化、公共交通调度、应急响应等场景。今天，我们就
AI如何提升个性化广告精准度——让投放更智能、更懂用户 Echo_Wish 前沿技术人工智能人工智能
AI如何提升个性化广告精准度——让投放更智能、更懂用户随着人工智能（AI）技术的发展，个性化广告已经从粗暴推送演变为智能匹配，广告主再也不想把预算砸给不感兴趣的人，而是精准触达有购买意向的用户。AI在广告投放中的核心优势在于深度数据分析、智能推荐、实时优化，让广告投放更精准、更有效。今天，我们就来聊聊AI如何提升个性化广告的精准度，并用Python代码演示其中的关键技术。1.为什么传统广告投放越来
道可云人工智能每日资讯｜江苏首个机器人训练中心在苏州吴江启动道可云道可云人工智能人工智能机器人 ar DeepSeek xr 百度
道可云人工智能&元宇宙每日简报（2025年6月26日）讯，今日人工智能&元宇宙新鲜事有：江苏首个机器人训练中心在苏州吴江启动近日，长三角一体化示范区智能机器人训练中心在东太湖度假区（太湖新城）正式启用，成为江苏省首个机器人智能训练中心。该中心占地1500平方米，设有8个训练场景和30个生产工位，涵盖智能制造、商业服务、特种应用三大领域，年产数据可超200万条，旨在加速机器人从实验室走向真实产业场景
道可云人工智能每日资讯｜《辽宁省促进人工智能创新发展实施方案》发布道可云道可云人工智能人工智能 ar DeepSeek xr
道可云人工智能&元宇宙每日简报（2025年6月13日）讯，今日人工智能&元宇宙新鲜事有：《辽宁省促进人工智能创新发展实施方案》发布近日，辽宁省人民政府办公厅印发《辽宁省促进人工智能创新发展实施方案》。根据《实施方案》可知，到2027年，实现以沈阳、大连“双核”牵引辐射带动，各地协同共进，千行百业深度赋能，打造人工智能创新发展和融合应用的新高地。人工智能赋能可持续发展论坛于成都市天府国际会议中心举办
【深度学习|冰川制图3】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构努力毕业的小土博^_^ 论文推荐深度学习学习架构人工智能机器学习
【深度学习|冰川制图3】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构【深度学习|冰川制图3】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构文章目录【深度学习|冰川制图3】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构引言欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校硕博生毕业要求需要参加学术会议，发
【深度学习|冰川制图4】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构努力毕业的小土博^_^ 论文推荐深度学习学习架构人工智能
【深度学习|冰川制图4】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构【深度学习|冰川制图4】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构文章目录【深度学习|冰川制图4】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构数据与方法2.1数据欢迎铁子们点赞、关注、收藏！祝大家逢考必过！逢投必中！上岸上岸上岸！upupup大多数高校硕博生毕业要求需要
【深度学习|冰川制图5】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构努力毕业的小土博^_^ 优秀论文推荐深度学习学习人工智能
【深度学习|冰川制图5】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构【深度学习|冰川制图5】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构文章目录【深度学习|冰川制图5】GlacierNet2：一种面向高山冰川制图的混合多模型学习架构数据与方法2.2深度学习模型2.2.1GlacierNet模型2.2.2DeepLabV3+模型欢迎铁子们点赞、关注、收藏！祝大
【深度学习|学习笔记】什么是k折交叉验证？K折交叉验证的步骤详解？以及如何在K折交叉验证中选择k? 努力毕业的小土博^_^ 机器学习基础算法优质笔记2 深度学习学习笔记人工智能
【深度学习|学习笔记】什么是k折交叉验证？K折交叉验证的步骤详解？以及如何在K折交叉验证中选择k?【深度学习|学习笔记】什么是k折交叉验证？K折交叉验证的步骤详解？以及如何在K折交叉验证中选择k?文章目录【深度学习|学习笔记】什么是k折交叉验证？K折交叉验证的步骤详解？以及如何在K折交叉验证中选择k?一、什么是K折交叉验证？✅目的：二、K折交叉验证的发展背景三、K折交叉验证的步骤详解步骤如下：数学
【深度学习|学习笔记】网格搜索（GridSearchCV）和随机搜索（RandomizedSearchCV）详解，附代码。努力毕业的小土博^_^ 深度学习学习笔记深度学习学习笔记机器学习人工智能
【深度学习|学习笔记】网格搜索（GridSearchCV）和随机搜索（RandomizedSearchCV）详解，附代码。【深度学习|学习笔记】网格搜索（GridSearchCV）和随机搜索（RandomizedSearchCV）详解，附代码。文章目录【深度学习|学习笔记】网格搜索（GridSearchCV）和随机搜索（RandomizedSearchCV）详解，附代码。一、背景与发展：为什么需要
Java AI 新纪元：Spring AI 与 Spring AI Alibaba 的崛起小沛9 Spring AI Alibaba Spring AI java 人工智能 spring spring ai SAA
此章节没什么营养，只是一个描述，同时也能看到AI的能力（文章基本都是AI进行生成的），小沛觉得开始不写点引言好像差了点什么东西，好像鱼离开了自行车。引言：AI时代对Java开发者的机遇与挑战，Java在AI领域的现状在当今技术飞速发展的时代，人工智能（AI）已不再是遥不可及的未来概念，而是深刻地融入到我们生活的方方面面，从智能推荐系统到自动驾驶，从自然语言处理到计算机视觉，AI正以前所未有的速度改
统一认证、限流、Mock 一网打尽！用 APISIX/Kong 让低代码平台更清爽网罗开发实战源码前端 kong 低代码
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
CNN-LSTM神经网络多输入单输出回归预测【MATLAB】沅_Yuan 炼丹师神经网络 cnn lstm
1CNN（卷积神经网络）部分作用：特征提取：CNN主要用于从输入数据中提取空间特征。它能够处理图像、视频帧或其他形式的空间数据。组成部分：卷积层：使用卷积核对输入数据进行卷积操作，生成特征图。激活函数：通常使用ReLU（线性整流单元）激活函数，增加非线性。池化层：通过最大池化（MaxPooling）或平均池化（AveragePooling），减少特征图的尺寸，保留最重要的特征，减少计算复杂度。流程
DAY 41 简单CNN 冬天给予的预感 cnn 人工智能神经网络
知识回顾数据增强卷积神经网络定义的写法batch归一化：调整一个批次的分布，常用与图像数据特征图：只有卷积操作输出的才叫特征图调度器：直接修改基础学习率卷积操作常见流程如下：1.输入→卷积层→Batch归一化层（可选）→池化层→激活函数→下一层Flatten->Dense(withDropout，可选)->Dense(Output)importtorchimporttorch.nnasnnimpo
Python打卡训练营-Day41-简单CNN traMpo1ine cnn python 深度学习
@浙大疏锦行知识回顾数据增强卷积神经网络定义的写法batch归一化：调整一个批次的分布，常用与图像数据特征图：只有卷积操作输出的才叫特征图调度器：直接修改基础学习率卷积操作常见流程如下：1.输入→卷积层→Batch归一化层（可选）→池化层→激活函数→下一层Flatten->Dense(withDropout，可选)->Dense(Output)这里相关的概念比较多，如果之前没有学习过复试班强化班中
学习三维动画心得 2501_92205961 开发语言青少年编程
在大二学年的三维动画设计学习进程中，我围绕3dsMax和Blender两大核心软件展开深入钻研，并在此基础上探索技术应用与创新。不仅熟练掌握了基础操作，还深入到代码编写与复杂技术问题解决领域，逐步构建起系统的三维动画设计知识与技能体系，以下是详细的学习总结。一、3dsMax的深度学习与技术实践（一）高级建模与脚本优化在3dsMax的学习中，基础建模掌握后，我开始挑战高级建模技术。利用NURBS建模
生成式AI技术对未来知识生产模式的颠覆性影响：跨学科案例分析德宿人工智能
引言随着人工智能技术的迅猛发展，生成式AI作为一种革命性技术正在深刻地改变人类知识生产和学术研究的范式。生成式AI不仅能够创建原创内容，还能模拟人类思维过程，处理和生成大量数据，从而在各个学科领域展现出广阔的应用前景。本研究报告旨在深入探讨生成式AI技术对未来知识生产模式的颠覆性影响，通过对比传统学术研究与AI辅助研究的范式差异，并选取医学、法学、文学、经济学和艺术学等五个典型领域进行深度案例分析
ChatGPT驱动的跨学科研究灵感挖掘指南学境思源AcademicIdeas 学境思源 AI写作 ChatGPT chatgpt
跨学科研究已成为解决复杂问题的重要手段。学境思源，无论是人工智能与心理学的结合，一键生成论文初稿！还是生态学与经济学的融合，越来越多的研究者正试图打破学科界限，探索全新问题域。但问题是：acaids.com。我们如何高效发现这些跨学科交叉点？使用传统方式，像文献综述、领域专家访谈或大型头脑风暴虽有效，但耗时，且受限于已有认知。今天为大家分享一种高效、智能、可复制的方法——利用ChatGPT进行跨学
大模型本地部署，拥有属于自己的ChatGpt 小妖同学学AI chatgpt
ChatGpt以其强大的信息整合和对话能力惊艳了全球，在自然语言处理上面表现出了惊人的能力。不管用于文案撰写还是程序辅助开发都大大提高了我们的工作效率，但是其使用有一定的门槛，让我们大多数人都望而却步，今天我们利用ollama实现本地大模型的步骤，让我们轻松拥有自己的人工智能。Ollama作为一个轻量级的工具，可以帮助用户在本地运行这些大型语言模型，无需持续依赖云服务，既保护了数据隐私，又能减少网
PPT 要你好看（全彩）又是一个装逼的
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！PPT,要你好看（全彩）杨臻编著ISBN978-7-121-14725-82011年11月出版定价：49.90元16开264页宣传语：般若黑洞▪百万点击之升华16位知名PPT高手联袂热议内容简介此刻呈现在你面前的
Spring AI 结合 MCP MySQL 实现对话式数据库查询没刮胡子软件开发技术实战专栏人工智能AI Spring 数据库 spring 人工智能 spring-ai mcp-server mysql
在现代应用开发中，将人工智能与数据库查询结合可以创造更自然、更智能的用户交互方式。下面我将详细介绍如何使用SpringAI框架结合MCP（可能指MySQL连接池或相关组件）实现对话中的数据库查询功能。什么是SpringAI和MCPMySQLSpringAI框架概述SpringAI是基于Spring生态的人工智能集成框架，它提供了：与大型语言模型(LLM)的集成能力对话管理和自然语言处理功能业务逻辑
MiniMax - M1：开源大模型的革命性突破
开源大模型MiniMax-M1研究报告一、引言在人工智能技术飞速发展的当下，大模型领域的竞争愈发激烈。开源大模型以其开放性、可定制性和社区协作的优势，逐渐成为推动人工智能技术进步的重要力量。MiniMax-M1作为全球首个开源大规模混合架构的推理模型，一经发布便引起了广泛关注。它在长上下文处理、推理效率和成本控制等方面展现出了卓越的性能，为人工智能的发展带来了新的思路和方向。本文将对MiniMax
信息抽取领域关键Benchmark方法：分类体系
信息抽取领域关键Benchmark方法：分类体系摘要信息抽取（InformationExtraction,IE）作为自然语言处理的核心任务之一，旨在从非结构化文本中识别并结构化关键信息（如实体、关系、事件等），广泛应用于知识图谱构建、智能问答和数据分析等领域。近年来，随着深度学习技术的快速发展，信息抽取方法在性能和应用范围上取得了显著进步，但同时也面临着任务多样性、跨领域泛化性以及低资源场景下的适
基于级联深度学习算法在双参数MRI中检测前列腺病变的评估| 文献速递-AI辅助的放射影像疾病诊断有Li 人工智能深度学习算法
Title题目EvaluationofaCascadedDeepLearning–basedAlgorithmforProstateLesionDetectionatBiparametricMRI基于级联深度学习算法在双参数MRI中检测前列腺病变的评估Background背景MultiparametricMRI(mpMRI)improvesprostatecancer(PCa)detectionc
深度学习使用Pytorch训练模型步骤 vvvdg 深度学习 pytorch 人工智能
训练模型是机器学习和深度学习中的核心过程，旨在通过大量数据学习模型参数，以便模型能够对新的、未见过的数据做出准确的预测。训练模型通常包括以下几个步骤：1.数据准备：收集和处理数据，包括清洗、标准化和归一化。将数据分为训练集、验证集和测试集。2.定义模型：选择模型架构，例如决策树、神经网络等。初始化模型参数（权重和偏置）。3.选择损失函数：根据任务类型（如分类、回归）选择合适的损失函数。4.选择优化
深度学习中Embedding原理讲解 zhishidi ai笔记深度学习 embedding 人工智能
我们用最直白的方式来理解深度学习中Embedding（嵌入）的概念。核心思想一句话：Embedding就是把一些复杂、离散的东西（比如文字、类别、ID）转换成计算机更容易理解和计算的“数字密码”，这些“数字密码”能代表这个东西的本质特征或含义。为什么需要Embedding？想象一下，你要教计算机认识“苹果”和“橙子”：原始表示（不好用）：你告诉计算机：“苹果”的编号是1，“橙子”的编号是2。问题来
基于人工智能的图表生成器警世龙开发记录人工智能自然语言处理
基于人工智能的图表生成器软件需求分析本项目旨在开发一个基于Web的图表生成工具，利用人工智能技术将自然语言描述转换为专业的流程图、时序图等可视化图表。具体需求如下：支持用户输入自然语言描述来生成图表。提供实时预览功能，让用户能够即时看到生成的图表。允许用户对生成的Mermaid代码进行编辑。支持图表的缩放和平移操作。提供代码保存和图片导出功能。具备快捷键支持，提高用户操作效率。技术选型前端HTML
Edge-TTS在广电系统中的语音合成技术的创新应用
Edge-TTS在广电系统中的语音合成技术的创新应用作者：本人是一名县级融媒体中心的工程师，多年来一直坚持学习、提升自己。喜欢Python编程、人工智能、网络安全等多领域的技术。摘要随着人工智能技术的快速发展，文字转语音(Text-to-Speech,TTS)系统已成为多种应用的重要组成部分，尤其在广播电视领域。本文介绍了一种基于Edge-TTS大模型的文字转语音工具，该工具结合了现代文本处理和语
掌握编程：数字时代的必备技能 afsdfewasdf AI编程
编程在现代社会的必要性学习编程在当今数字化时代具有显著优势。随着科技发展，编程技能已成为许多行业的基础需求，从软件开发到数据分析，甚至传统行业也在逐步依赖技术解决方案。掌握编程能力可以提升个人竞争力，开拓职业机会。就业市场需求旺盛技术岗位如软件工程师、数据科学家、人工智能专家等持续增长。非技术岗位如市场营销、金融分析也要求基础编程知识处理自动化任务或数据分析。掌握编程技能能显著提高薪资水平和职业发
Python助力自动驾驶：深度学习模型优化全攻略 Echo_Wish Python！实战！python 自动驾驶深度学习
Python助力自动驾驶：深度学习模型优化全攻略说起自动驾驶，大家第一反应往往是“高精地图”“传感器融合”“路径规划”等等，背后真正的“大脑”其实是各式各样的深度学习模型。它们负责感知环境、识别路况、预测行为，甚至实时做出决策。可是，跑在车上的这些模型不仅要精准，还得轻量、实时、稳定，这可不是简单的“丢GPU就能解决”的问题。今天，咱们就从Python开发者的视角，聊聊自动驾驶里深度学习模型的优化
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数