求你涨点吧

自己实现的unet3+模型，以及简单分析 (unet3plus tensorflow2 keras)

文章目录

简介
一、unet3+
二、完整代码（keras）
- 1.引入库
- 2.辅助函数
- 3.搭建网络
- 4.创建模型

简介

很早之前看了unet3+医学图像分割的论文，本来想直接去github找keras/Tensorflow的实现，奈何找到的似乎都和源码有一些出入，于是自己按照论文和源码写了一下，不过也不能保证和源码完全一致，发出来抛砖引玉。很多讲unet3+的博客都写的挺不错的，要想了解全文可以看看这篇翻译【UNet3+(UNet+++)论文解读玖零猴】，这篇文章也简单讲一下自己的理解。

unet3+论文
源码（Pytorch）

一、unet3+

简单来说，unet3+有三个特点：
1 跨尺度连接，防止语义在下采样/上采样之间存在损失
2 全尺度深监督，学习深层次的特征表示
3 为了消除医学图像中噪声导致的假阳性分割，提出一个分类指导模块
4 一个新的混合损失函数（TODO）

呃，前面三点其实各有槽点，后面再说

unet3+的网络结构如上图，总的来说还是非常易懂的，作者认为unet和unet++都没有做到跨尺度的特征图连接，于是想到将编码器不同尺度地信息传递到解码器，解码器中的信息也进行了跨层传递，以此减少信息丢失（真是简单粗暴=_=）。

以解码器3为例，解码器3融合了编码器1、2、3和解码器4、5的特征，这些特征通过最大池化（来自编码器的特征）或上采样（来自解码器的特征）调整到和解码器3一样的特征图大小，并且通过卷积层（源码里是卷积+BN+ReLu）将特征数调整到一致。这些拼接的特征图再经过一个卷积+BN+ReLu块输出特征就OK。

这张图解释了另外两个特点，一个是全尺度深监督，另一个是分类指导模块（CGM）。
全尺度深监督是针对所有解码器每一层的输出计算损失函数。
为了防止噪声导致的假阳性分割，作者提出了分类指导模块。分类指导模块是添加在网络瓶颈层(编码器底层，En5)的模块，这一层网络最深，特征图数量最多，且特征图最小，可能过滤掉了一定的噪声。作者在这一层后面添加了一个小的分类头（Dropout + Conv1x1 + Pooling + Sigmoid），这个分类头输出一个概率，表示输入图像中有无目标器官，将这个分类结果和分割头相乘，可以消除假阳性。

结果比较，直接看图叭：

特点讲完了，说说槽点：
1 全尺度连接好是好，而且作者特地提到了，unet3+的参数是少于unet和unet++的，但实际上训练需要的时间和占用的内存好像都更多一些，似乎是因为unet3+用到了更多的卷积操作（比如，unet解码器每层只需要2次卷积，但看看上面的Fig.2，unet3+的每层解码器需要6次卷积）
2 还没想好
3 CGM只是一个简单的模块，在我自己的实验中，就算加了Dropout也很快就过拟合了，图像分割头的验证集损失还在降低，CGM这边的损失函数却已经不降反升了。

二、完整代码（keras）

注：小孩子不懂事，代码写着玩的，不一定正确，如果有问题欢迎指出和讨论，转载请注明出处。
CGM输出这块的实现还是有待商榷的，我的代码里CGM和分割掩膜是分别输出的，所以后面要手动相乘一下。

1.引入库

import tensorflow as tf
import numpy as np
from keras.models import Model
from keras.layers import Conv2D, Input, concatenate, MaxPooling2D, UpSampling2D, Activation, BatchNormalization, LayerNormalization, Dropout, GlobalMaxPooling2D

2.辅助函数

# helper function to build unet3+
def normalization(input_tensor, normalization):

    if normalization=='batch':
        return(BatchNormalization()(input_tensor))
    elif normalization=='layer':
        return(LayerNormalization()(input_tensor))
    elif normalization == None:
        return input_tensor
    else:
        raise ValueError('Invalid normalization')

def conv2d_block(input_tensor, filters, kernel_size, 
                norm_type, use_residual, act_type='relu',
                double_features = False, dilation=[1, 1]):

    x = Conv2D(filters, kernel_size, padding='same', dilation_rate=dilation[0], use_bias=False, kernel_initializer='he_normal')(input_tensor)
    x = normalization(x, norm_type)
    x = Activation(act_type)(x)

    if double_features:
        filters *= 2

    x = Conv2D(filters, kernel_size, padding='same', dilation_rate=dilation[1], use_bias=False, kernel_initializer='he_normal')(x)
    x = normalization(x, norm_type)

    if use_residual:
        if K.int_shape(input_tensor)[-1] != K.int_shape(x)[-1]:
            shortcut = Conv2D(filters, kernel_size=1, padding='same', use_bias=False, kernel_initializer='he_normal')(input_tensor)
            shortcut = normalization(shortcut, norm_type)
            x = add([x, shortcut])
        else:
            x = add([x, input_tensor])

    x = Activation(act_type)(x)

    return x

def down_layer_2d(input_tensor, down_pattern, filters, norm_type=None):
    if down_pattern == 'maxpooling':
        x = MaxPooling2D(pool_size=(2, 2))(input_tensor)
    elif down_pattern == 'avgpooling':
        x = AveragePooling2D(pool_size=(2, 2))(input_tensor)
    elif down_pattern == 'conv':
        x = Conv2D(filters, kernel_size=(2, 2), strides=(2, 2), padding='same', use_bias=False if norm_type is None else True, kernel_initializer='he_normal')(input_tensor)
        normalization(x, norm_type)
    elif down_pattern == 'normconv':
        x = normalization(input_tensor, norm_type)
        x = Conv2D(filters, kernel_size=(2, 2), strides=(2, 2), padding='same', kernel_initializer='he_normal')(x)
    else:
        raise ValueError('Invalid down_pattern')
    return x

def conv_norm_act(input_tensor, filters, kernel_size , norm_type='batch', act_type='relu', dilation=1):
    output_tensor = Conv2D(filters, kernel_size, padding='same', dilation_rate=(dilation, dilation), use_bias=False if norm_type is not None else True, kernel_initializer='he_normal')(input_tensor)
    output_tensor = normalization(output_tensor, normalization=norm_type)
    output_tensor = Activation(act_type)(output_tensor)
    return output_tensor

def aggregate(l1, l2, l3, l4, l5, filters, kernel_size, norm_type='batch', act_type='relu'):
    out = concatenate([l1, l2, l3, l4, l5], axis = -1)
    out = Conv2D(filters * 5, kernel_size, padding = 'same', use_bias=False if norm_type is not None else True, kernel_initializer = 'he_normal')(out)
    out = normalization(out, norm_type)
    out = Activation(act_type)(out)

    return out

def cgm_block(input_tensor, class_num, dropout_rate = 0.):
    x = Dropout(rate = dropout_rate)(input_tensor)
    x = Conv2D(class_num, 1, padding='same', kernel_initializer='he_normal')(x)
#     x = BatchNormalization()(x)
    x = GlobalMaxPooling2D()(x) # 用全局最大池化代替原文中的自适应最大池化，这里的效果应该是一样的
    x = Activation('sigmoid', name='cgm_output')(x)
    # x = Lambda(lambda x: K.expand_dims(x, axis=1))(x)
    # x = Lambda(lambda x: K.expand_dims(x, axis=1), name = 'cgm_output')(x)
#     x = Reshape((batch_size, 1, 1, class_num))(x)

    return x

3.搭建网络

# build unet3+ model
def unet3p_2d(input_shape, initial_features=32, kernel_size=3,
              class_num=1, norm_type='batch', double_features=False,
              use_residual=False, down_pattern='maxpooling', using_deep_supervision=True, 
              using_cgm=False, cgm_drop_rate=0.5, show_summary=True):
    '''
    input_shape: (height, width, channel)
    initial_features: int, 初始特征图数量,每次下采样特征图数量加倍, unet3+原文中用的是64
    kernel_size: int, 卷积核大小
    class_num: int, 图像分割的类别数
    norm_type: str, 标准化方式, 'batch' 或 'layer', unet3+使用的是BatchNormalization
    double_features: bool, 在conv2d_block模块中是否在第二个卷积中将特征图数量翻倍,3dunet论文中提出该方法可以避免瓶颈问题,通常可以设为False
    use_residual: bool, 编码器部分是否使用残差连接
    down_pattern: str, 下采样方式, 'maxpooling' 或 'avgpooling' 或 'conv' 或 'normconv', unet3+使用的是MaxPooling
    using_deep_supervision: bool, 是否使用全尺度深度监督
    using_cgm: bool, 是否使用分类指导模块(CGM)
    cgm_drop_rate: float, CGM模块中Dropout比率
    show_summary: bool, 是否显示模型概况
    '''

    if class_num == 1:
        last_layer_activation = 'sigmoid'
    else:
        last_layer_activation = 'softmax'
    
    inputs = Input(input_shape)

    xe1 = conv2d_block(input_tensor=inputs, filters=initial_features, kernel_size=kernel_size, 
                    norm_type=norm_type, double_features=double_features, use_residual=use_residual)
    xe1_pool = down_layer_2d(input_tensor=xe1, down_pattern=down_pattern, filters=initial_features)

    xe2 = conv2d_block(input_tensor=xe1_pool, filters=initial_features * 2, kernel_size=kernel_size, 
                       norm_type=norm_type, double_features=double_features, use_residual=use_residual)
    xe2_pool = down_layer_2d(input_tensor=xe2, down_pattern=down_pattern, filters=initial_features * 2)

    xe3 = conv2d_block(input_tensor=xe2_pool, filters=initial_features * 4, kernel_size=kernel_size, 
                       norm_type=norm_type, double_features=double_features, use_residual=use_residual)
    xe3_pool = down_layer_2d(input_tensor=xe3, down_pattern=down_pattern, filters=initial_features * 4)

    xe4 = conv2d_block(input_tensor=xe3_pool, filters=initial_features * 8, kernel_size=kernel_size, 
                       norm_type=norm_type, double_features=double_features, use_residual=use_residual)
    xe4_pool = down_layer_2d(input_tensor=xe4, down_pattern=down_pattern, filters=initial_features * 8)

    xe5 = conv2d_block(input_tensor=xe4_pool, filters=initial_features * 16, kernel_size=kernel_size, 
                       norm_type=norm_type, double_features=double_features, use_residual=use_residual)

    if using_cgm:
        cgm = cgm_block(input_tensor = xe5 , class_num = class_num ,dropout_rate = cgm_drop_rate)

    xd4_from_xe5 = UpSampling2D(size=(2,2), interpolation='bilinear')(xe5)
    xd4_from_xe5 = conv_norm_act(input_tensor=xd4_from_xe5, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd4_from_xe4 = conv_norm_act(input_tensor=xe4, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd4_from_xe3 = MaxPooling2D(pool_size = (2, 2))(xe3)
    xd4_from_xe3 = conv_norm_act(input_tensor=xd4_from_xe3, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd4_from_xe2 = MaxPooling2D(pool_size = (4, 4))(xe2)
    xd4_from_xe2 = conv_norm_act(input_tensor=xd4_from_xe2, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd4_from_xe1 = MaxPooling2D(pool_size = (8, 8))(xe1)
    xd4_from_xe1 = conv_norm_act(input_tensor=xd4_from_xe1, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd4 = aggregate(xd4_from_xe5, xd4_from_xe4, xd4_from_xe3, xd4_from_xe2, xd4_from_xe1, filters=initial_features, kernel_size=kernel_size, norm_type=norm_type)

    xd3_from_xe5 = UpSampling2D(size=(4, 4), interpolation='bilinear')(xe5)
    xd3_from_xe5 = conv_norm_act(input_tensor=xd3_from_xe5, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd3_from_xd4 = UpSampling2D(size=(2, 2), interpolation='bilinear')(xd4)
    xd3_from_xd4 = conv_norm_act(input_tensor=xd3_from_xd4, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd3_from_xe3 = conv_norm_act(input_tensor=xe3, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd3_from_xe2 = MaxPooling2D(pool_size = (2, 2))(xe2)
    xd3_from_xe2 = conv_norm_act(input_tensor=xd3_from_xe2, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd3_from_xe1 = MaxPooling2D(pool_size = (4, 4))(xe1)
    xd3_from_xe1 = conv_norm_act(input_tensor=xd3_from_xe1, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd3 = aggregate(xd3_from_xe5, xd3_from_xd4, xd3_from_xe3, xd3_from_xe2, xd3_from_xe1, filters=initial_features, kernel_size=kernel_size, norm_type=norm_type)

    xd2_from_xe5 = UpSampling2D(size=(8, 8), interpolation='bilinear')(xe5)
    xd2_from_xe5 = conv_norm_act(input_tensor=xd2_from_xe5, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd2_from_xd4 = UpSampling2D(size=(4, 4), interpolation='bilinear')(xd4)
    xd2_from_xd4 = conv_norm_act(input_tensor=xd2_from_xd4, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd2_from_xd3 = UpSampling2D(size=(2, 2), interpolation='bilinear')(xd3)
    xd2_from_xd3 = conv_norm_act(input_tensor=xd2_from_xd3, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd2_from_xe2 = conv_norm_act(input_tensor=xe2, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd2_from_xe1 = MaxPooling2D(pool_size = (2, 2))(xe1)
    xd2_from_xe1 = conv_norm_act(input_tensor=xd2_from_xe1, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd2 = aggregate(xd2_from_xe5, xd2_from_xd4, xd2_from_xd3, xd2_from_xe2, xd2_from_xe1, filters=initial_features, kernel_size=kernel_size, norm_type=norm_type)

    xd1_from_xe5 = UpSampling2D(size=(16, 16), interpolation='bilinear')(xe5)
    xd1_from_xe5 = conv_norm_act(input_tensor=xd1_from_xe5, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd1_from_xd4 = UpSampling2D(size=(8, 8), interpolation='bilinear')(xd4)
    xd1_from_xd4 = conv_norm_act(input_tensor=xd1_from_xd4, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd1_from_xd3 = UpSampling2D(size=(4, 4), interpolation='bilinear')(xd3)
    xd1_from_xd3 = conv_norm_act(input_tensor=xd1_from_xd3, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd1_from_xd2 = UpSampling2D(size=(2, 2), interpolation='bilinear')(xd2)
    xd1_from_xd2 = conv_norm_act(input_tensor=xd1_from_xd2, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd1_from_xe1 = conv_norm_act(input_tensor=xe1, filters=initial_features, kernel_size=kernel_size ,norm_type=norm_type)
    xd1 = aggregate(xd1_from_xe5, xd1_from_xd4, xd1_from_xd3, xd1_from_xd2, xd1_from_xe1, filters=initial_features, kernel_size=kernel_size, norm_type=norm_type)

    if using_deep_supervision:
        xd55 = Conv2D(class_num, kernel_size, activation=None, padding='same')(xe5)
        xd55 = UpSampling2D(size=(16, 16))(xd55)
        xd55 = Activation(last_layer_activation, name='output_de5')(xd55)

        xd44 = Conv2D(class_num, kernel_size, activation=None, padding='same')(xd4)
        xd44 = UpSampling2D(size=(8, 8))(xd44)
        xd44 = Activation(last_layer_activation, name='output_de4')(xd44)

        xd33 = Conv2D(class_num, kernel_size, activation=None, padding='same')(xd3)
        xd33 = UpSampling2D(size=(4, 4))(xd33)
        xd33 = Activation(last_layer_activation, name='output_de3')(xd33)

        xd22 = Conv2D(class_num, kernel_size, activation=None, padding='same')(xd2)
        xd22 = UpSampling2D(size=(2, 2))(xd22)
        xd22 = Activation(last_layer_activation, name='output_de2')(xd22)

        xd11 = Conv2D(class_num, kernel_size, activation=None, padding='same')(xd1)
        xd11 = Activation(last_layer_activation, name='output_de1')(xd11)

        if using_cgm: outputs=[xd11, xd22, xd33, xd44, xd55, cgm]
        else: outputs=[xd11, xd22, xd33, xd44, xd55]

    else:
        conv_output = Conv2D(class_num, 1, activation=last_layer_activation, name='output')(xd1)
        if using_cgm: outputs=[conv_output, cgm]
        else: outputs = conv_output

    model = Model(inputs, outputs)
    if show_summary: model.summary()

    return model

4.创建模型

如果以上代码都在同一个.py文件下，可以加上以下代码尝试构建网络：

if __name__ == '__main__':
    model = unet3p_2d(input_shape=(256, 256, 1), initial_features=32, kernel_size=3,
                      class_num=1, norm_type='batch', double_features=False,
                      use_residual=False, down_pattern='maxpooling', 
                      using_deep_supervision=True, using_cgm=False, show_summary=True)
    model = unet3p_2d(input_shape=(256, 256, 1), initial_features=32, kernel_size=3,
                      class_num=1, norm_type='batch', double_features=False,
                      use_residual=False, down_pattern='maxpooling', 
                      using_deep_supervision=True, using_cgm=True, show_summary=True)
    model = unet3p_2d(input_shape=(256, 256, 1), initial_features=32, kernel_size=3,
                      class_num=1, norm_type='batch', double_features=False,
                      use_residual=False, down_pattern='maxpooling', 
                      using_deep_supervision=False, using_cgm=False, show_summary=True)

如果用到了预训练的主干网络，需要修改下编码器（En）部分。

感觉自己好菜，不知道能不能顺利be yeah，哎TAT

深度学习项目十一：mmdetection训练自己的数据集小啊磊_Vv 深度学习和视觉项目实战目标跟踪人工智能计算机视觉 python 深度学习
mmdetection训练自己的数据集这里写目录标题mmdetection训练自己的数据集一：环境搭建二：数据集格式转换(yolo转coco格式)yolo数据集格式coco数据集格式yolo转coco数据集格式yolo转coco数据集格式的代码三：训练dataset数据文件配置configs1.在configs/faster_rcnn/faster-rcnn_r101_fpn_1x_coco.py
深度学习和机器学习的差异 The god of big data 教程深度学习机器学习人工智能
一、技术架构的本质差异传统机器学习（MachineLearning）建立在统计学和数学优化基础之上，其核心技术是通过人工设计的特征工程（FeatureEngineering）构建模型。以支持向量机（SVM）为例，算法通过核函数将数据映射到高维空间，但特征提取完全依赖工程师的领域知识。这种"人工特征+浅层模型"的结构在面对复杂非线性关系时容易遭遇性能瓶颈。深度学习（DeepLearning）作为机器
利用CUDA与OpenCV实现高效图像处理：全面指南快撑死的鱼 C++（C语言）算法大揭秘 opencv 图像处理人工智能
利用CUDA与OpenCV实现高效图像处理：全面指南前言在现代计算机视觉领域，图像处理的需求日益增加。无论是自动驾驶、安防监控，还是医疗影像分析，图像处理技术都扮演着至关重要的角色。然而，图像处理的计算量非常大，往往需要强大的计算能力来保证实时性和高效性。幸运的是，CUDA和OpenCV为我们提供了一种高效的图像处理解决方案。本篇文章将详细介绍如何结合CUDA与OpenCV，利用GPU的强大计算能
深度学习 PyTorch 中 18 种数据增强策略与实现 @Mr_LiuYang 计算机视觉基础数据增强深度学习 torchvision transforms
深度学习pytorch之简单方法自定义9类卷积即插即用数据增强通过对训练数据进行多种变换，增加数据的多样性，它帮助我们提高模型的鲁棒性，并减少过拟合的风险。PyTorch提供torchvision.transforms模块丰富的数据增强操作，我们可以通过组合多种策略来实现复杂的增强效果。本文将介绍18种常用的图像数据增强策略，并展示如何使用PyTorch中的torchvision.transfor
【无标题】东东就是我 opencv 计算机视觉人工智能
1.计算机视觉与图像处理计算机视觉技术涵盖从图像预处理到目标检测的全流程，是工业视觉系统的核心部分。知识点扩展OpenCV基础cv2.imread()、cv2.imshow()、cv2.imwrite()进行基本图像读取、显示、保存cv2.cvtColor()进行颜色空间转换（RGB↔GRAY，RGB↔HSV）cv2.resize()进行图像缩放cv2.flip()进行图像翻转（水平/垂直）imp
Win11及CUDA 12.1环境下PyTorch安装及避坑指南：深度学习开发者的福音郁云爽
Win11及CUDA12.1环境下PyTorch安装及避坑指南：深度学习开发者的福音【下载地址】Win11及CUDA12.1环境下PyTorch安装及避坑指南本资源文件旨在为在Windows11操作系统及CUDA12.1环境下安装PyTorch的用户提供详细的安装步骤及常见问题解决方案。无论你是初学者还是有经验的开发者，这份指南都将帮助你顺利完成PyTorch的安装，并避免常见的坑项目地址:htt
深度学习笔记——Resnet和迁移学习肆—— 深度学习深度学习笔记迁移学习
1.ResNet的提出深度学习与网络深度的挑战：在深度学习中，网络的“深度”(即层数)通常与模型的能力成正比。然而，随着网络深度的增加，一些问题也随之出现，最突出的是梯度消失/爆炸问题。这使得深层网络难以训练。梯度消失：梯度消失是指在训练深度神经网络时，通过多层传递的梯度(误差)变得非常小，接近于零。这导致网络中较早层的权重更新非常缓慢，甚至几乎不更新。梯度爆炸：梯度爆炸是指在训练深度神经网络时，
深度学习在SSVEP信号分类中的应用分析自由的晚风深度学习分类人工智能
目录前言1.SSVEP信号分类的处理流程2.模型输入和数据预处理3.模型结构设计3.1卷积神经网络（CNN）3.2长短期记忆网络（LSTM）4.训练方法与激活函数5.性能评估与挑战6.未来方向前言随着脑机接口（BCI）技术的发展，SSVEP（稳态视觉诱发电位）因其高信息传输速率和短训练时间而成为最受欢迎的BCI范式之一。近年来，深度学习方法在SSVEP信号分类中取得了显著的成果。本文通过对31个深
PSPNet在图像超分辨率中的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
PSPNet在图像超分辨率中的应用1.背景介绍图像超分辨率(ImageSuper-Resolution,ISR)是计算机视觉领域的一个重要研究方向,旨在从低分辨率图像中重建高分辨率图像。传统的ISR方法主要基于插值算法,如双线性插值、双三次插值等,但这些方法往往无法恢复图像的高频细节信息。近年来,随着深度学习的发展,基于卷积神经网络(ConvolutionalNeuralNetwork,CNN)的
基于文本特征的微博谣言检测机器懒得学习人工智能大数据图像处理计算机视觉
随着社交媒体的普及，微博等平台成为了信息传播的重要渠道。然而，虚假信息和谣言的传播也带来了严重的社会问题。因此，自动化的谣言检测技术变得尤为重要。本文将介绍如何基于文本特征，使用深度学习模型（如LSTM、CNN）和传统机器学习模型（如SVM）来实现微博谣言检测，并对这些模型的性能进行比较。完整项目地址：基于文本特征的微博谣言检测1.项目概述本项目旨在通过分析微博文本内容，自动检测其中的谣言。系统通
基于深度学习的恶意软件检测系统：设计与实现机器懒得学习深度学习人工智能
引言随着信息技术的飞速发展，恶意软件（如病毒、木马、勒索软件等）对全球网络安全构成了严重威胁。传统的恶意软件检测方法（如特征码匹配、行为分析等）在面对新型恶意软件变种时往往力不从心。近年来，深度学习技术在模式识别和分类任务中取得了显著成效，为恶意软件检测领域带来了新的机遇。本文将详细介绍一个基于深度学习的恶意软件检测系统的开发过程，该系统利用长短期记忆网络（LSTM）对Windows可执行程序的A
多宠识别：基于计算机视觉的智能宠物管理系统架构解析深圳市快瞳科技有限公司计算机视觉宠物系统架构
一、行业痛点与技术方案演进在多宠家庭场景中，传统方案面临三大技术瓶颈：1.生物特征混淆：同品种/毛色宠物识别准确率低于65%2.动态场景适应：进食/奔跑状态下的误检率达30%+3.数据孤岛问题：离线设备无法实现持续学习优化快瞳科技采用**双模态视觉融合架构**，结合轻量化YOLOv7-Tiny模型与CLIP多模态大模型，实现：-98.7%的跨品种宠物识别准确率（CVPR2024最新测试数据）-单次
AI Agent: AI的下一个风口从图形用户界面到自然语言的进化 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AIAgent:AI的下一个风口从图形用户界面到自然语言的进化文章目录AIAgent:AI的下一个风口从图形用户界面到自然语言的进化1.背景介绍1.1人机交互的演变历程1.1.1命令行界面时代1.1.2图形用户界面时代1.1.3自然语言交互的兴起1.2AI技术的发展现状1.2.1机器学习和深度学习的突破1.2.2自然语言处理技术的进步1.2.3知识图谱和语义理解的发展1.3AIAgent的概念与意
基于PyTorch的深度学习4——使用numpy实现机器学习vs使用Tensor及Antograd实现机器学习 Wis4e 深度学习机器学习 pytorch
首先，给出一个数组x，然后基于表达式y=3x2+2，加上一些噪音数据到达另一组数据y。然后，构建一个机器学习模型，学习表达式y=wx2+b的两个参数w、b。利用数组x，y的数据为训练数据。最后，采用梯度梯度下降法，通过多次迭代，学习到w、b的值。以下为具体步骤：1)导入需要的库。importnumpyasnp%matplotlibinlinefrommatplotlibimportpyplotas
AI 大模型应用数据中心建设：数据中心成本优化杭州大厂Java程序媛 DeepSeek R1 &AI人工智能与大数据 java python javascript kotlin golang 架构人工智能
AI大模型应用数据中心建设：数据中心成本优化1.背景介绍在人工智能（AI）和大模型应用的快速发展中，数据中心（DataCenter）成为了一个至关重要的组成部分。无论是进行深度学习模型的训练，还是大模型应用的推理，数据中心都需要提供充足的计算资源、存储空间和网络带宽。随着AI模型和大数据量的增长，数据中心的建设和管理成本逐渐成为AI技术落地和应用的核心挑战之一。为了优化数据中心成本，同时保持高性能
深度学习-144-Text2SQL之基于langchain的少量样本提示词模板FewShotPromptTemplate的应用实战(三) 皮皮冰燃深度学习深度学习 langchain Text2SQL
文章目录1基本组件1.1大模型1.2数据库Chinook1.2.1创建并载入数据1.2.2SQLDatabase2年龄最大的员工姓名和年龄3少量样本提示词模板3.1创建示例集3.2创建格式化程序3.3创建示例选择器3.4创建少量示例提示词模板3.5应用测试3.6添加新示例4参考附录1基本组件1.1大模型fromlangchain_ollamaimportChatOllamaimportosos.e
Pytorch 第九回：卷积神经网络——ResNet模型 Start_Present pytorch cnn python 分类深度学习
Pytorch第九回：卷积神经网络——ResNet模型本次开启深度学习第九回，基于Pytorch的ResNet卷积神经网络模型。这是分享的第四个卷积神经网络模型。该模型是基于解决因网络加深而出现的梯度消失和网络退化而进行设计的。接下来给大家分享具体思路。本次学习，借助的平台是PyCharm2024.1.3，python版本3.11numpy版本是1.26.4，pytorch版本2.0.0+cu11
RoPE——Transformer 的旋转位置编码机智的小神仙儿深度学习大模型 transformer 深度学习人工智能
在自然语言处理领域，Transformer是现代深度学习模型的基础，而位置编码（PositionEmbedding）则是Transformer处理序列数据的关键模块之一。近年来，一种新型的位置编码方法RoPE（RotaryPositionEmbedding）得到了广泛关注。本文将全面解读RoPE的背景、原理、实现、优势及其应用场景，帮助读者深入理解这一方法。1.什么是RoPE？RoPE（Rotar
每天五分钟深度学习pytorch：基于Pytorch搭建ResNet模型的残差块每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 人工智能 ResNet 机器学习
残差块我们分析一下这个残差块，x经过两个卷积层得到F(x)，然后F(x)+x作为残差块的输出，此时就有一个问题，这个问题就是F(x)+x的维度问题，如果图片数据经过两个卷积层之后F(x)变小（height和weight变小）或者通道数发生了变化，那么此时F(x)是没有办法和x相加的，当然我们可以学习前面的GoogLeNet的方式，也就是说卷积之后的F(x)和x一样，大小不变，或者对x变道和F(x)
Training-free Neural Architecture Searchthrough Variance of Knowledge of Deep Network Weights（预览版本）境心镜免训练深度学习人工智能 NAS
代码位置摘要深度学习彻底改变了计算机视觉，但它使用深度网络架构取得了巨大的成功，而这些架构大多是手工制作的，因此可能不是最理想的。神经架构搜索(NAS)旨在通过遵循明确定义的优化范式来弥补这一差距，该范式系统地寻找最佳架构，给定客观标准，例如最大分类准确度。然而，NAS的主要限制是其天文数字般的计算成本，因为它通常需要从头开始训练每个候选网络架构。在本文中，我们旨在通过基于Fisher信息提出一种
智能教育：DeepSeek在课堂管理中的应用与代码实现 Evaporator Core #DeepSeek快速入门系统架构设计师 Python开发经验 deepseek
课堂管理是教育领域的重要组成部分，它直接影响教学效果和学生的学习体验。随着人工智能技术的发展，DeepSeek正在通过其强大的算法和数据处理能力，推动课堂管理的智能化和高效化。本文将结合代码实现，深入探讨DeepSeek在课堂管理中的应用。一、智能课堂管理系统：从数据到实时监控智能课堂管理的核心在于通过实时监控学生的学习行为，提供及时的反馈和调整。DeepSeek通过深度学习算法，能够从课堂数据中
基于PyTorch的深度学习5——神经网络工具箱 Wis4e 深度学习 pytorch 神经网络
可以学习如下内容：•介绍神经网络核心组件。•如何构建一个神经网络。•详细介绍如何构建一个神经网络。•如何使用nn模块中Module及functional。•如何选择优化器。•动态修改学习率参数。5.1核心组件神经网络核心组件不多，把这些组件确定后，这个神经网络基本就确定了。这些核心组件包括：1)层：神经网络的基本结构，将输入张量转换为输出张量。2)模型：层构成的网络。3)损失函数：参数学习的目标函
python可應用在金融分析的那一個方面，如何部署在linux server上面。蠟筆小新工程師金融
Python在金融分析中應用廣泛，以下是幾個主要方面：###1.**數據處理與分析**-使用**Pandas**和**NumPy**等庫來處理和分析大規模數據集，進行清理、轉換和統計運算。-舉例：處理歷史市場數據，分析價格趨勢、交易量等。###2.**機器學習與預測**-使用**scikit-learn**、**TensorFlow**或**PyTorch**建立模型進行股票價格預測、信用風險評估
深度学习-Android-图片加载框架-Glide-(二)-切入源码层深入分析-Glide-缓存策略 2401_84123077 程序员 android glide 缓存
介绍在上一篇中，我们知道了Glide框架的最基本的执行流程，那么只知道基本执行流程，这显然是不够的，我们要深挖Glide框架的细节处理原理，比如缓存机制，图片处理等，这一篇我们就一起去探索Glide的缓存机制。Glide缓存机制可以说是设计的非常完美，考虑的非常周全，下面就以一张表格来说明下Glide缓存。缓存类型缓存代表说明活动缓存ActiveResources如果当前对应的图片资源是从内存缓存
构建一个完整的视觉Transformer（ViT）图像分类模型 VIT （vision transformer）图像分类 Jackie_AI transformer 分类深度学习
构建一个完整的视觉Transformer（ViT）图像分类模型VIT（visiontransformer）图像分类根据提供的截图内容，我们可以看到一个名为VitNet的视觉Transformer（VisionTransformer，简称ViT）网络架构的部分代码。下面我将提供完整的VitNet类以及相关的辅助函数和训练流程示例代码。计算机视觉、图像处理、毕业辅导、作业帮助、代码获取，远程协助，代码
【人工智能基础】生成模型：让数据“无中生有”的神奇魔法 roman_日积跬步-终至千里 #人工智能基础知识人工智能
文章目录一、生成模型的发展脉络二、生成模型的基本原理三、主要生成模型及其逻辑1、生成对抗网络（GAN）2、变分自编码器（VAE）3、扩散模型（DPM）4、基于能量的模型（EBM）5、正规化流（NF）四、生成模型对比分析五、生成模型的应用拓展一、生成模型的发展脉络在深度学习尚未兴起的时期，计算机视觉领域的传统图像生成算法主要依赖纹理合成和纹理映射等技术。这些算法基于手工设计的特征进行图像构建，然而，
2024年最新PyTorch深度学习项目实战100例数据集_python 深度学习项目演练 2401_84585440 程序员深度学习 python pytorch
前言最近很多订阅了《PyTorch深度学习项目实战100例》的用户私信咨询有些数据集下载不了以及一些文章中没有给出数据集链接，为了解决这个问题，专门开设了本篇文章，提供数据集下载链接，打包100例的所有数据集。本专栏适用人群：深度学习初学者，刚刚接触PyTorch的用户群体，专栏将具体讲解如何快速搭建深度学习模型用自己的数据集实现深度学习小项目，快速让新手小白能够对基于深度学习方法有个基本的框架认
PyTorch 学习路线 gorgor在码农 #python入门基础 python pytorch
学习PyTorch需要结合理论理解和实践编码，逐步掌握其核心功能和实际应用。以下是分阶段的学习路径和资源推荐，适合从入门到进阶：1.基础知识准备前提条件Python基础：熟悉Python语法（变量、函数、类、模块等）。数学基础：了解线性代数、微积分、概率论（深度学习的基础）。机器学习基础：理解神经网络、损失函数、优化器（如梯度下降）等概念。学习资源Python入门：Python官方教程机器学习基础
Imagen原理与代码实例讲解 AI天才研究院计算 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Imagen原理与代码实例讲解1.背景介绍在人工智能领域中,图像生成一直是一个具有挑战性的任务。传统的计算机视觉模型通常专注于理解和分析现有图像,而生成全新的高质量图像则需要更高级的技术。随着深度学习技术的不断发展,生成式对抗网络(GenerativeAdversarialNetworks,GAN)等新型模型逐渐展现出了令人惊叹的图像生成能力。谷歌的Imagen就是一种基于大型视觉语言模型的全新图
当深度学习遇见禅宗：用东方智慧重新诠释DQN算法带上一无所知的我智能体的自我修炼：强化学习指南深度学习算法人工智能 DQN
当深度学习遇见禅宗：用东方智慧重新诠释DQN算法“好的代码如同山水画，既要工笔细描，又要留白写意”——一个在终端前顿悟的开发者DQN是Q-Learning算法与深度神经网络的结合体，通过神经网络近似Q值函数，解决传统Q-Learning在高维状态空间下的"维度灾难"问题。引言：代码与禅的碰撞♂️在某个调试代码到凌晨三点的夜晚，我突然意识到：强化学习的过程，竟与佛家修行惊人地相似。智能体在环境中探索
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要