cjopengler

第六课 Tensorflow Cifar10 CNN 卷积神经网络

对于train来说，基本就是几个步骤:

读取数据
构建训练网络
训练

# coding:utf-8
"""
训练
"""

from abc import ABCMeta
from abc import abstractmethod


class ITrain(object):

    __metaclass__ = ABCMeta

    @abstractmethod
    def train(self):
        """
        训练.
        :return: train op
        """
        pass

# coding:utf-8
"""
cifar10 train
"""

from train import ITrain
import tensorflow as tf
from cifar10_data_input import CIFAR10DataInput
from cifar10_inference import CIFAR10Inference
import time
import datetime


class CIFAR10Train(ITrain):

    INPUT_PATH = 'input/cifar10_bin_data/*.bin'
    TRAIN_PATH = 'output/train'
    BATCH_SIZE = 128
    NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN = 50000

    LEARNING_RATE_INITILAIZE = 0.1
    LEARING_RATE_DECAY_FACTOR = 0.1
    NUM_EPOCHS_PER_DECAY = 350.0

    def train(self):

        input_paths = tf.train.match_filenames_once(CIFAR10Train.INPUT_PATH)
        cifar10_input = CIFAR10DataInput(input_file_paths=input_paths,
                                         batch_size=CIFAR10Train.BATCH_SIZE,
                                         example_per_epoch_num=CIFAR10Train.NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN)

        image_batch, label_batch = cifar10_input.read_data()

        tf.summary.image('images', image_batch)

        cifar10_inference = CIFAR10Inference(image_channel=3,
                                             batch_size=CIFAR10Train.BATCH_SIZE,
                                             label_class_num=10)
        logits = cifar10_inference.inference(images=image_batch)
        loss = cifar10_inference.loss(logits, label_batch)

        train_op = self._train_op(loss)

        class _LoggerHook(tf.train.SessionRunHook):

            def __init__(self):
                super(_LoggerHook, self).__init__()
                self._step = -1
                self._start_time = time.time()
                self._log_frequency = 100

            def begin(self):
                self._step = -1
                self._start_time = time.time()
                self._log_frequency = 100

            def before_run(self, run_context):
                self._step += 1
                # loss会作为参数一起被运行 会在after_run运行结束后 将run_values 也就是这里的loss值传回
                return tf.train.SessionRunArgs(loss)

            def after_run(self, run_context, run_values):
                if self._step % self._log_frequency == 0:
                    current_time = time.time()
                    duration = current_time - self._start_time
                    self._start_time = current_time

                    loss_value = run_values.results
                    examples_per_sec = self._log_frequency* CIFAR10Train.BATCH_SIZE / duration
                    sec_per_batch = float(duration / self._log_frequency)

                    format_str = ('%s: step %d, loss = %.2f (%.1f examples/sec; %.3f '
                                  'sec/batch)')
                    print(format_str % (datetime.datetime.now(), self._step, loss_value,
                                        examples_per_sec, sec_per_batch))

        with tf.train.MonitoredTrainingSession(checkpoint_dir=CIFAR10Train.TRAIN_PATH,
                                               hooks=[tf.train.StopAtStepHook(last_step=1000),  # 在执行了last_step会request stop
                                                      tf.train.NanTensorHook(loss), # 监控loss 为None
                                                      _LoggerHook()],
                                               config=tf.ConfigProto(log_device_placement=False)) as mon_sess:
            while not mon_sess.should_stop():
                mon_sess.run(train_op)

    def _train_op(self, loss):

        # 用来记录全局的global steps 也就是一共运行了多少步
        global_step = tf.contrib.framework.get_or_create_global_step()

        num_batchs_per_epoch = CIFAR10Train.NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN / CIFAR10Train.BATCH_SIZE
        decay_steps = int(num_batchs_per_epoch * CIFAR10Train.NUM_EPOCHS_PER_DECAY)

        # 使用指数衰减来计算变化的学习率
        learning_rate = tf.train.exponential_decay(CIFAR10Train.LEARNING_RATE_INITILAIZE,
                                                   global_step,
                                                   decay_steps=decay_steps,
                                                   decay_rate=CIFAR10Train.LEARING_RATE_DECAY_FACTOR,
                                                   staircase=True)
        tf.summary.scalar('learning_rate', learning_rate)

        # 计算平均loss
        loss_averages_op = self._add_loss_summaryies(total_loss=loss)

        # 表示控制执行的顺序 是计算完loss之后 在进行loss的优化
        # 如果不这样做，在并行计算的时候，就会出问题。所以 control_dependencies就相当于并行计算的汇总
        with tf.control_dependencies([loss_averages_op]):
            opt = tf.train.GradientDescentOptimizer(learning_rate)
            grads = opt.compute_gradients(loss)

        apply_gradient_op = opt.apply_gradients(grads, global_step=global_step)

        # vairablie add to histogram
        for var in tf.trainable_variables():
            tf.summary.histogram(var.op.name, var)

        for grad, var in grads:
            if grad is not None:
                tf.summary.histogram(var.op.name + '/gradients', grad)

        # 为什么变量也要计算移动平均，因为 最终可以使用移动平均的值来代替最终的变量。可以消除抖动引起的影响
        variable_averages = tf.train.ExponentialMovingAverage(0.9999, global_step)
        viariables_averages_op = variable_averages.apply(tf.trainable_variables())

        with tf.control_dependencies([apply_gradient_op, viariables_averages_op]):
            train_op = tf.no_op(name='train')

        return train_op

    def _add_loss_summaryies(self, total_loss):
        """
        计算total loss的移动平均
        :param total_loss: 每一次的total loss
        :return:
        """

        # ExponentialMovingAverage 这个的含义是创建移动平均
        # 也就是说收集所有的loss，这些会存储在 GraphKeys.MOVING_AVERAGE_VARIABLES
        # 所以这是一个存储的全局变量 session级别的生命周期
        # 初始化的时候 每一个初始值设置为0，然后 后面每一轮迭代产生的新的值会叠加上去
        loss_averages = tf.train.ExponentialMovingAverage(decay=0.9, name='avg')

        losses = tf.get_collection('losses')

        # apply 表示要对下面的每一个变量进行每一次迭代的移动平均计算. 不是list中的所有变量进行移动平均计算
        loss_averages_op = loss_averages.apply(losses + [total_loss])

        for l in losses + [total_loss]:
            # 输出查看需要看原始数据
            tf.summary.scalar(l.op.name + ' (raw)', l)
            # 和移动平均的数据
            tf.summary.scalar(l.op.name, loss_averages.average(l))

        return loss_averages_op

# coding:utf-8
"""
数据输入接口，包含数据的读取以及变换产出标准的数据格式供模型使用
"""

import tensorflow as tf
from abc import ABCMeta
from abc import abstractmethod


class IDataInput(object):
    """
    数据的输入
    """

    __metaclass__ = ABCMeta

    def __init__(self,
                 input_file_paths,
                 batch_size,
                 example_per_epoch_num,
                 parallel_thread_num=16):
        """
        初始化
        :param input_file_paths: 输入的文件路径列表
        :param batch_size: batch size大小
        :param example_per_epoch_num: 每一个epoch的样本数量 一般来说是总的样本数
        :param parallel_thread_num: 并行处理的线程数
        """
        self._input_file_paths = input_file_paths
        self._batch_size = batch_size
        self._parallel_thread_num = parallel_thread_num
        self._example_per_echo_num = example_per_epoch_num

    def read_data(self):
        """
        读取数据
        :return: (data_batch, image_batch)
        """

        # 创建输入的queue
        file_path_queue = tf.train.string_input_producer(self._input_file_paths)

        record = self._read_data_from_queue(file_path_queue)

        stander_data, label = self._preprocess_data(record)

        data_batch, label_batch = self._generate_train_batch(stander_data, label, shuffle=False)
        return data_batch, label_batch

    @abstractmethod
    def _read_data_from_queue(self, file_path_queue):
        """
        根据queue 读取数据并返回需要的格式
        :param file_path_queue:
        :return:
        """
        pass

    def test_read_data_from_queue(self):
        # 创建输入的queue
        file_path_queue = tf.train.string_input_producer(self._input_file_paths)
        return self._read_data_from_queue(file_path_queue)

    @abstractmethod
    def _preprocess_data(self, record):
        """
        对读入的record进行一些预处理。对于图像来说，进行一些扭曲，加入噪音等操作
        :param record: 在_read_data_from_queue读取的record
        :return:
        """
        pass

    def _generate_train_batch(self, train_data, label, shuffle=True):
        """
        通过队列创建数据batch
        :param train_data: 训练数据
        :param label: label
        :param shuffle: 是否将样本随机后生成batch
        :return:
        """

        # 队列的capacity，设置来保证内存够用
        capacity = self._example_per_echo_num * 0.4 + 3 * self._batch_size

        if shuffle:
            data_batch, label_batch = tf.train.shuffle_batch([train_data, label],
                                                             batch_size=self._batch_size,
                                                             num_threads=self._parallel_thread_num,
                                                             capacity=capacity,
                                                             min_after_dequeue=self._example_per_echo_num * 0.4)
        else:
            data_batch, label_batch = tf.train.batch([train_data, label],
                                                     batch_size=self._batch_size,
                                                     num_threads=self._parallel_thread_num,
                                                     capacity=capacity)
        return data_batch, tf.reshape(label_batch, [self._batch_size])

# coding:utf-8
"""
CIFAR10的输入读取
"""

import tensorflow as tf
from data_input import IDataInput


class CIFAR10Record(object):
    """
    CIFAR10 读取的record
    """
    pass


class CIFAR10DataInput(IDataInput):
    """
    Cifar10的数据输入.

    数据集说明如下:

    data_batch_1.bin - data_batch_5.bin 5个bin用作训练集.

    bin 中的数据，第1个字是label，接下来的3072表示图片, 前1024字节是R，接下来1024是G，最后1024字节是B，
    所以是32 * 32=1024的R G B图片. 每个bin包含 10000 个图片，所以总共有5W个训练图片。

    test_batch.bin 1个bin用作测试集。
    它的结构与训练集是一样的。这样是方便做评估。实际的问题中测试集是不包含label的。

    batches.meta.txt 说明每个label对应的含义
    """

    def __init__(self,
                 input_file_paths,
                 batch_size,
                 example_per_epoch_num,
                 parallel_thread_num=16,
                 label_bytes=1,
                 image_height=32,
                 image_width=32,
                 target_image_height=24,
                 target_image_width=24,
                 channel=3):

        """
        初始化
        :param label_bytes: lable占的字节数
        :param image_height: 原始读入的图片高度
        :param image_width: 原始读入的图片宽度
        :param target_image_height: 目标生成的image height
        :param target_image_width: 目标生成的image width
        :param channel: 图片channel
        """
        super(CIFAR10DataInput, self).__init__(input_file_paths=input_file_paths,
                                               batch_size=batch_size,
                                               example_per_epoch_num=example_per_epoch_num,
                                               parallel_thread_num=parallel_thread_num)
        self._label_bytes = label_bytes
        self._image_height = image_height
        self._image_width = image_width
        self._target_image_height = target_image_height
        self._target_image_width = target_image_width
        self.channel = channel

    def _read_data_from_queue(self, file_path_queue):

        record = CIFAR10Record()

        record.channel = 3
        record.height = self._image_height
        record.width = self._image_width

        image_bytes = self._image_height * self._image_width*self.channel
        record_bytes = self._label_bytes + image_bytes

        # 从queue中读取
        reader = tf.FixedLengthRecordReader(record_bytes=record_bytes)

        # retern, key, value就是我们要的数据
        record.key, value = reader.read(file_path_queue, name='image_reader')

        # 对value解码成图片 和 label的字节
        image_label_bytes = tf.decode_raw(value, tf.uint8)

        # 提取label
        record.label = tf.cast(tf.slice(image_label_bytes, [0], [self._label_bytes]), tf.int32)

        # 提取image
        image_bytes = tf.slice(image_label_bytes, [0+self._label_bytes], [image_bytes])

        # reshape成 3 * 32 * 32 的矩阵。因为数据的存储就是 (R, G, B) => 1024, 1024, 1024
        image_bytes = tf.reshape(image_bytes, [record.channel, record.height, record.width])

        # 而tensorflow要的image是 => 32 * 32 * 3的格式. 将[0, 1, 2] (c,h,w)变成 [1, 2, 0](h,w,c)
        record.uint8image = tf.transpose(image_bytes, [1, 2, 0])

        return record

    def _preprocess_data(self, record):
        """
        对图像的预处理 加入噪音
        :param record: 在_read_data_from_queue读取到record
        :return:
        """

        # 将image cast成float32数据
        reshaped_image = tf.cast(record.uint8image, tf.float32)

        height = self._target_image_height
        width = self._target_image_width

        # 随机crop
        distorted_image = tf.random_crop(reshaped_image, [height, width, 3])

        # 随机翻转
        distorted_image = tf.image.random_flip_left_right(distorted_image)

        # 加入brithness
        distorted_image = tf.image.random_brightness(distorted_image, max_delta=63)

        # 调整对比度
        distorted_image = tf.image.random_contrast(distorted_image, lower=0.2, upper=1.8)

        # 图片标准化
        float_image = tf.image.per_image_standardization(distorted_image)

        return float_image, record.label

# coding:utf-8
"""
建立前向模型
"""

from abc import ABCMeta
from abc import abstractmethod

import tensorflow as tf


class IInference(object):
    """
    建立前向模型
    """

    def __init__(self):
        self._loss_name = 'losses'

    @abstractmethod
    def inference(self, data):
        """
        建立前向模型
        :param data: 输入的数据
        :return: tensorflow op
        """
        pass

    @abstractmethod
    def loss(self, inference, label):
        """
        计算loss
        :param inference: inference中产生的前向数据
        :param label: label
        :return:
        """
        pass

    def bias(self, name, shape, initializer=tf.constant_initializer(0.0)):
        """
        创建bias
        :param name: bias名字
        :param shape: bias的shape
        :param initializer: initializer
        :return: bias variable
        """

        return tf.get_variable(name=name,
                               shape=shape,
                               initializer=initializer)

    def viariable_with_weight_decay(self, name, shape, stddev, l2_decay):
        """
        创建viariable
        :param name: 名称
        :param shape: shape
        :param stddev: 标准差
        :param l2_decay: l2loss 的系数. 如果l2_decay=None 则不进行l2 loss.
        :return: 生成viaralibe tensor
        """
        var = tf.get_variable(name=name,
                              shape=shape,
                              initializer=tf.truncated_normal_initializer(stddev=stddev, dtype=tf.float32),
                              dtype=tf.float32)

        # 增加l2loss

        if l2_decay is not None:
            weight_decay = tf.multiply(tf.nn.l2_loss(var), l2_decay, name='weight_loss')

            # 产生的l2 regular 是在最后计算的时候，将所有的l2 添加进去，所以需要先保存起来.
            # add_to_collection 相当于维护了一个key, value结构,value是一个list.
            tf.add_to_collection(self._loss_name, weight_decay)

        return var

# coding:utf-8
"""
CIFAR10的inference
"""

from inference import IInference

import tensorflow as tf
import re


class CIFAR10Inference(IInference):
    """
    CIFAR10的Inference使用cnn
    """

    def __init__(self, image_channel, batch_size, label_class_num):
        """
        初始化
        :param image_channel: image_channel
        """
        super(CIFAR10Inference, self).__init__()
        # 定义卷积核shape, 5*5*channel
        self._kernel_width = 5
        self._kernel_height = 5
        self._image_channel = image_channel
        self._batch_size = batch_size
        self._label_class_num = label_class_num

    @staticmethod
    def activation_summary(x):
        """
        将激活后的结果summary出来
        :param x:
        :return:
        """
        tower_name = 'tower'
        tensor_name = re.sub('%s_[0-9]*/' % tower_name, '', x.op.name)
        tf.summary.histogram(tensor_name + '/activations', x)
        tf.summary.scalar(tensor_name + '/sparsity', tf.nn.zero_fraction(x))

    def inference(self, images):

        # 构建 卷积层1
        conv1_kernel_num = 64  # 第一层 64个神经元
        with tf.variable_scope('conv1') as scope:
            kernel = self.viariable_with_weight_decay(
                name='weight',
                shape=[self._kernel_height, self._kernel_width, self._image_channel, conv1_kernel_num],
                stddev=5e-2,
                l2_decay=0.0)

            # 卷积
            conv = tf.nn.conv2d(images, kernel, [1, 1, 1, 1], padding='SAME')

            # bias
            bias = self.bias('bias', [conv1_kernel_num])

            pre_activation = tf.nn.bias_add(conv, bias=bias)

            # 激活函数 relu
            conv1 = tf.nn.relu(pre_activation, name=scope.name)

            # summary conv1
            CIFAR10Inference.activation_summary(conv1)

        # max pooling
        pool1 = tf.nn.max_pool(conv1, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],
                               padding='SAME', name='pool1')
        # 对pool1 normalize
        norm1 = tf.nn.lrn(pool1, depth_radius=4, bias=1,
                          alpha=0.001/9.0, beta=0.75,
                          name='norm1')

        # 构建conv2
        conv2_kernel_num = 64  # 第一层 64个神经元
        with tf.variable_scope('conv2') as scope:
            kernel = self.viariable_with_weight_decay(
                name='weight',
                shape=[self._kernel_height, self._kernel_width, conv1_kernel_num, conv2_kernel_num],
                stddev=5e-2,
                l2_decay=0.0)

            # 卷积
            conv = tf.nn.conv2d(norm1, kernel, [1, 1, 1, 1], padding='SAME')

            # bias
            bias = self.bias('bias', [conv2_kernel_num], tf.constant_initializer(0.1))

            pre_activation = tf.nn.bias_add(conv, bias=bias)

            # 激活函数 relu
            conv2 = tf.nn.relu(pre_activation, name=scope.name)

            # summary conv1
            CIFAR10Inference.activation_summary(conv2)

        # 对pool1 normalize
        norm2 = tf.nn.lrn(conv2, depth_radius=4, bias=1,
                          alpha=0.001 / 9.0, beta=0.75,
                          name='norm2')
        # max pooling
        pool2 = tf.nn.max_pool(norm2, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1],
                               padding='SAME', name='pool1')

        # local3 对卷积层进行全连接
        with tf.variable_scope('local3') as scope:
            reshape = tf.reshape(pool2,
                                 shape=[self._batch_size, -1])

            # 将pool2打平之后的一维向量
            dim = reshape.get_shape()[1].value

            weights = self.viariable_with_weight_decay('weights',
                                                       shape=[dim, 384],
                                                       stddev=0.04,
                                                       l2_decay=0.004)
            bias = self.bias('bias',
                             shape=[384],
                             initializer=tf.constant_initializer(0.1))

            local3 = tf.nn.relu(tf.matmul(reshape, weights) + bias, name=scope.name)

            self.activation_summary(local3)

        # local4 全连接
        with tf.variable_scope('local4') as scope:

            weights = self.viariable_with_weight_decay('weights',
                                                       shape=[384, 192],
                                                       stddev=0.04,
                                                       l2_decay=0.004)
            bias = self.bias('bias',
                             shape=[192],
                             initializer=tf.constant_initializer(0.1))

            local4 = tf.nn.relu(tf.matmul(local3, weights) + bias, name=scope.name)

            self.activation_summary(local4)

        # 最后一层softmax
        with tf.variable_scope('softmax') as scope:
            weights = self.viariable_with_weight_decay('weights',
                                                       shape=[192, self._label_class_num],
                                                       stddev=0.04,
                                                       l2_decay=0.004)
            bias = self.bias('bias',
                             shape=[self._label_class_num],
                             initializer=tf.constant_initializer(0.0))

            softmax_linear = tf.add(tf.matmul(local4, weights), bias, name=scope.name)
            self.activation_summary(softmax_linear)

        return softmax_linear

    def loss(self, logits, label):
        label = tf.cast(label, tf.int64)
        cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(
            labels=label,
            logits=logits,
            name='corss_entropy_per_exampel'
        )

        cross_entropy_mean = tf.reduce_mean(cross_entropy, name='cross_entropy_mean')
        tf.add_to_collection(self._loss_name, cross_entropy_mean)

        # 最后将l2 loss叠加上
        return tf.add_n(tf.get_collection(self._loss_name), name='total_loss')

神经网络中层与层之间的关联 iisugar 神经网络深度学习计算机视觉
目录1.层与层之间的核心关联：数据流动与参数传递1.1数据流动（ForwardPropagation）1.2参数传递（BackwardPropagation）2.常见层与层之间的关联模式2.1典型全连接网络（如手写数字分类）2.2卷积神经网络（CNN，如图像分类）2.3循环神经网络（RNN/LSTM，如文本生成）2.4Transformer（如机器翻译）3.层间关联的核心原则3.1数据传递的“管道
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
卷积神经网络 - 理解卷积核的尺寸 k×k×Cin 谦亨有终 AI学习笔记 cnn 人工智能神经网络深度学习机器学习
卷积神经网络中，每个卷积核的尺寸为k×k×Cin，这一设计的核心原因在于多通道输入的数据结构和跨通道特征整合的需求。以下是详细解释：1.输入数据的结构输入形状：假设输入数据为三维张量，形状为H×W×Cin，其中：H：高度（Height）W：宽度（Width）Cin：通道数（Channelsin）多通道的物理意义：对于RGB图像，Cin=3（红、绿、蓝三通道）。对于中间层的特征图，Cin可能为64、
【最新】TensorFlow、cuDNN、CUDA三者之间的最新版本对应及下载地址江上_酒开发环境及工具配置 TensorFlow CUDA cuDNN
TensorFlow、cuDNN、CUDA对应关系官网查询地址CUDA下载地址cuDNN下载地址VersionPythonversionCompilerBuildtoolscuDNNCUDAtensorflow_gpu-2.9.03.7-3.10MSVC2019Bazel5.0.08.111.2tensorflow_gpu-2.8.03.7-3.10MSVC2019Bazel4.2.18.111.
【图像去噪】论文精读：CVPR 2025 | DnLUT: Ultra-Efficient Color Image Denoising via Channel-Aware Lookup Tables 十小大图像去噪深度学习计算机视觉人工智能图像处理论文阅读论文笔记
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）文章目录前言Abstract1.Introduction2.Relatedworks2.1.ColorImagedenoising2.2.ReplacingCNNwithLUT3
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
卷积神经网络Batch Normalization的作用 arron8899 cnn batch 人工智能
BatchNormalization的作用（通俗版）1.像“稳定器”一样校准每层输入想象你在烤多层蛋糕，每层蛋糕的烘烤温度不同（相当于神经网络的每一层数据分布不同）。没有BN时，烤箱温度忽高忽低，导致有的层烤焦（梯度爆炸），有的层不熟（梯度消失）。BN的作用相当于给每一层装了一个自动温度调节器，实时将输入数据调整到标准温度（均值为0，方差为1），保证每层都能均匀受热，训练更稳定。2.让模型训练“少
CBNet--一种新的目标检测的复合骨干网体系结构 weixin_45963617 深度学习系列
一、Introduction一般来说，在一个典型的基于CNN的目标检测器中，使用主干网络来提取检测对象的基本特征，该网络通常是为图像分类任务而设计的，并在ImageNet上预训练。毫无疑问，更强大的主干网可以带来更好的检测性能。尽管最先进的基于深度的大骨干网络的探测器取得了很好的结果，但仍有很大改进空间。此外，通过设计一个新的更强大的主干网络并在ImageNet上预训练来获取好的检测性能是十分昂贵
机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现 Hardess-god WRF 算法人工智能
随着人工智能的发展，机器学习技术在气象预报领域展现出巨大潜力。本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。技术路线：伏羲模型提供大尺度气象数据和预报使用机器学习模型（如CNN、LSTM、XGBoost）进行降尺度2.数据准备与处理2.1气象数据获取
TensorFlow和Pytorch在功能上的区别以及优势 Honeysea_70 #算法 tensorflow pytorch 人工智能
功能上的区别1.计算图TensorFlow：使用静态计算图（StaticGraph）。在运行模型之前，需要先构建完整的计算图，然后通过会话（Session）运行图。优点是性能优化更高效，适合大规模分布式训练和生产环境部署。缺点是调试相对复杂，因为计算图的构建和运行是分离的。PyTorch：使用动态计算图（DynamicGraph）。计算图是动态构建和执行的，每次迭代都会重新构建图。优点是调试方便，
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
常见经典目标检测算法 109702008 人工智能 #深度学习目标检测人工智能
ChatGPT目标检测（ObjectDetection）是计算机视觉领域的一个重要分支，其目的是识别数字图像中的不同对象，并给出它们的位置和类别。近年来，许多经典的目标检测算法被提出并广泛应用。以下是一些常见的经典目标检测算法：1.R-CNN（RegionswithCNNfeatures）:R-CNN通过使用区域提议方法（如选择性搜索）首先生成潜在的边界框，然后使用卷积神经网络(CNN)提取特征，
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
DeepLabv3+改进18:在主干网络中添加REP_BLOCK AICurator 深度学习 python 机器学习 deeplabv3+语义分割
【DeepLabv3+改进专栏！探索语义分割新高度】你是否在为图像分割的精度与效率发愁？本专栏重磅推出：✅独家改进策略：融合注意力机制、轻量化设计与多尺度优化✅即插即用模块：ASPP+升级、解码器PS:订阅专栏提供完整代码论文简介我们提出了一种通用的卷积神经网络（ConvNet）构建模块，可在不增加推理时间成本的情况下提升性能。该模块名为多样化分支块（DBB），通过结合不同尺度和复杂度的多样化分支
查看 CUDA cudnn 版本查看Navicat GPU版本 FergusJ 备份 python 开发语言
查看显卡型号：lspci|grepVGA（lspci是linux查看硬件信息的命令），屏幕会打印出主机的集显几独显信息python中查看显卡型号fromtensorflow.python.clientimportdevice_libdevice_lib.list_local_devices()
错误moduleNotFoundError: No module named 'matplotlib' 逆着tensor tensorflow2.0学习 tensorflow
错误ModuleNotFoundError:Nomodulenamed‘matplotlib’问题tensorflow2.0中jupyternotebook编写线性回归例子，出现ModuleNotFoundError:Nomodulenamed'matplotlib’错误解决办法好了，重新加载程序，已经可以用了。
下一代模型技术演进与场景应用突破智能计算研究中心其他
内容概要当前模型技术正经历多维度的范式跃迁，可解释性模型与自动化机器学习（AutoML）成为突破传统黑箱困境的核心路径。在底层架构层面，边缘计算与量子计算的融合重构了算力分配模式，联邦学习技术则为跨域数据协作提供了安全可信的解决方案。主流框架如TensorFlow和PyTorch持续迭代优化能力，通过动态参数压缩与自适应超参数调优策略，显著提升模型部署效率。应用层创新呈现垂直化特征，医疗诊断模型通
TikTokenizer 项目常见问题解决方案齐飞锴Timothea
TikTokenizer项目常见问题解决方案tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目基础介绍TikTokenizer是一个开源项目，主要用于文本处理，特别是将文本转化为可用于深度学习的格式。该项目是基于TensorFlow和Keras开发
YOLO魔改之频率分割模块（FDM）清风AI YOLO算法魔改系列 YOLO 人工智能计算机视觉目标检测 python 深度学习
目标检测原理目标检测是一种将目标分割和识别相结合的图像处理技术，旨在从图像中定位并识别特定目标。深度学习方法，如FasterR-CNN和YOLO系列，已成为主流解决方案。这些方法通常采用两阶段或单阶段策略，通过卷积神经网络(CNN)提取特征并进行分类和定位。在小目标检测中，为克服分辨率低和特征不明显的问题，模型设计中会特别注重特征融合和多尺度处理，以增强对小目标的感知能力。YOLOv8基础YOLO
目标检测YOLO实战应用案例100讲-基于毫米波雷达与摄像头协同的道路目标检测与识别（续）林聪木目标检测 YOLO 人工智能
目录3.2实测数据采集与分析3.2.1回波数据处理3.2.2毫米波雷达数据采集实验3.3基于传统图像特征的目标识别算法3.3.1基于灰度共生矩阵的时频图特征提取3.3.2支持向量机分类器3.3.3实验及结果分析3.4基于卷积神经网络的目标识别算法3.4.1卷积神经网络的基本理论3.4.2卷积神经网络框架设计3.4.3实验及结果分析基于图像的目标检测算法4.1目标检测算法一般流程4.2典型目标检测算
软件定义世界下的教育创新：高校计算机实验室应重心转向开源平台开源
一、一键式教学环境部署，节省90%准备时间•应用模板库：提供200+预置教学工具模板（如JupyterLab+TensorFlow、MySQL集群），教师可根据课程需求选择模板，5分钟内完成包含依赖库、运行环境的全栈部署。•多版本隔离：支持同一服务器并行运行不同版本框架（如Django3.2教学版与4.1开发版），避免版本冲突导致30%的课堂时间浪费。•自助式环境创建：学生通过命令行快速申请带GP
使用 TensorFlow 进行图像处理：深度解析卷积神经网络（CNN）一碗黄焖鸡三碗米饭人工智能前沿与实践 tensorflow 图像处理 cnn 人工智能机器学习 python ai
目录使用TensorFlow进行图像处理：深度解析卷积神经网络（CNN）1.什么是卷积神经网络（CNN）？CNN的基本结构为什么CNN适合图像处理？2.使用TensorFlow构建CNN2.1环境准备2.2加载并预处理MNIST数据集2.3构建CNN模型2.4编译和训练模型2.5评估模型3.CNN的优化与改进3.1使用数据增强3.2调整网络结构4.CNN在其他图像处理任务中的应用5.总结参考文献在
LeetCode98-验证二叉搜索树学习的学习者 LeetCode Python 二叉搜索树
上个星期和导师去了华农一趟名义上是和导师去参加一个国家级的项目其实没我啥事都是我导师在那口若悬河当时和那边的本科生去了另一间会议室交流了关于GAN的知识偶然听说大家都在用pytorch好像最新版的也挺好用的反正就是学术界目前主要用这个框架工业界主要用Tensorflow(没办法，Google出品)这两天也拿来瞧了瞧好像也确实可以的！！！98-验证二叉搜索树给定一个二叉树，判断其是否是一个有效的二叉
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
人工智能（AI）系统化学习路线 xiaoyu❅ python 人工智能学习
一、为什么需要系统化学习AI？人工智能技术正在重塑各行各业，但许多初学者容易陷入误区：❌盲目跟风：直接学习TensorFlow/PyTorch，忽视数学与算法基础。❌纸上谈兵：只看理论不写代码，无法解决实际问题。❌方向模糊：对CV/NLP/RL等细分领域缺乏认知，难以针对性提升。正确的学习姿势：“金字塔式”分层学习（理论→算法→框架→应用→工程化），逐步构建完整的AI知识体系。二、人工智能学习路线
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

第六课 Tensorflow Cifar10 CNN 卷积神经网络

你可能感兴趣的:(第六课 Tensorflow Cifar10 CNN 卷积神经网络)