GaryBigPig

Tensorflow官网CIFAR-10数据分类教程代码详解

标题

概述

对CIFAR-10 数据集的分类是机器学习中一个公开的基准测试问题，本教程代码通过解决CIFAR-10数据分类任务，介绍了Tensorflow的一些高阶用法，演示了构建大型复杂模型的一些重要技巧，着重于建立一个规范的网络组织结构，训练并进行评估，为建立更大规模更加复杂的模型提供一个范例，可以作为学习Tensorflow的一个经典示例。本文章对每行代码做了详细注释，以便对其他学习的朋友有所帮助，并欢迎读者对不恰当处提出意见，以帮助完善。

CIFAR-10数据介绍

CIFAR-10数据集是一组大小为32x32的RGB图像，这些图像涵盖了10个类别：飞机，汽车，鸟，猫，鹿，狗，青蛙，马，船以及卡车。

数据集总共包含60000张图片，每个类别6000张。其中，训练集包含50000张图片，测试集包含10000万张图片。数据集被分为5个训练batch和一个测试batch，每个batch包含10000张图片。从每个类别的图片中随机选出1000张图片共10000张图片作为测试的batch，将剩余图片按照随机排序组成测试batch，每个训练batch中各个类别的图片数量不一定相等，某些类别可能会多一些，某些类别可能会少一些，但是所有训练batch加一起，每个类别的图片数量为5000。各个类别的图片是互斥的，不存在一张图片属于两个或两个以上类别的情况。

数据集的数据类型分Python versions、Matlab versions和Binary version三种，本文代码使用Binary version，故主要介绍这个类型的数据格式。Binary version的数据下载解压后包括data_batch_1.bin、data_batch_2.bin、data_batch_3.bin、data_batch_4.bin data_batch_5.bin和test_batch.bin五个文件，每个文件包含10000个图片数据，每个图片数据包含3073字节，由于每个图片数据之间没有分隔符，所以每个文件共30730000字节。

每个图片数据格式为：

第一个字节为0-9的数字，为10个类别的标签，对应的类别名称在batches.meta.txt文件中存储，batches.meta.txt包含10行数据，类别标签i对应第i行的名称；
每张图片为32*32=1024个像素，第2-1025字节为每个像素的red值，第1026-2049字节为每个像素的green值，第2050-3073字节为每个像素的blue值。
由于数据是按照行主序排列，所以2-33为图片的第一行像素的red值，以此类推。

更多信息请参考CIFAR-10 page

代码详解

代码文件包括：

文件	作用
cifar10_input.py	读取本地CIFAR-10的二进制文件格式的内容。
cifar10.py	建立CIFAR-10的模型。
ccifar10_train.py	读在CPU或GPU上训练CIFAR-10的模型。
cifar10_multi_gpu_train.py	在多GPU上训练CIFAR-10的模型。
cifar10_eval.py	评估CIFAR-10模型的预测性能。

cifar10_input.py

# 绝对引入，忽略目录下相同命名的包，引用系统标准的包
from __future__ import absolute_import
# 导入精确除法
from __future__ import division
# 使用python 3.x的print函数
from __future__ import print_function

import os
# xrange返回类，每次遍历返回一个值，range返回列表，一次计算返回所有值，xrange效率要高些
from six.moves import xrange
import tensorflow as tf

IMAGE_SIZE = 24
# CIFAR10的数据分类数为10
NUM_CLASSES = 10
# CIFAR10的训练集有50000个图片
NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN = 50000
# CIFAR10的测试集有10000个图片
NUM_EXAMPLES_PER_EPOCH_FOR_EVAL = 10000

def read_cifar10(filename_queue):
    # 创建空类，方便数据结构化存储
    class CIFAR10Record(object):
        pass
    result = CIFAR10Record()
    # 1 for cifar-10；2 for cifar-100
    label_bytes = 1
    # cifar10的图片包含32*32个像素，每个像素包含三个RGB值
    result.height = 32
    result.width = 32
    result.depth = 3
    # 计算每幅图片特征向量的字节数
    image_bytes = result.height * result.width * result.depth
    # 计算每条记录的字节数=标签字节数+每幅图片特征向量的字节数
    record_bytes = label_bytes + image_bytes
    # 读取固定长度字节数信息，可以参看文章https://blog.csdn.net/fegang2002/article/details/83046584
    reader = tf.FixedLengthRecordReader(record_bytes=record_bytes)
    result.key, value = reader.read(filename_queue)
    # CIFAR10数据通过Reader读取后通过Record传输变为字符串类型，既value为字符串类型
    # 但是要使用的话，需要还原为CIFAR10原始数据格式tf.uint8（8位无符号整形）类型，可以通过tf.decode_raw函数实现
    record_bytes = tf.decode_raw(value, tf.uint8)
    # 从读取的数据记录中截取出标签值
    result.label = tf.cast(tf.strided_slice(record_bytes, [0], [label_bytes]), tf.int32)
    # 从读取的数据记录中截取出图片数据，并且转换为【深，高，宽】的形状[3，32，32]
    depth_major = tf.reshape(
        tf.strided_slice(record_bytes, [label_bytes], [label_bytes + image_bytes]),
        [result.depth, result.height, result.width],
    )
    # 转换depth_major的维度，将第一个维度放在最后，既更新为【高，宽，深】的形状[32，32，3]
    result.uint8image = tf.transpose(depth_major, [1, 2, 0])

    return result


def _generate_image_and_label_batch(
    image, label, min_queue_examples, batch_size, shuffle
):
    # 设置入列的线程？
    num_preprocess_threads = 16
    if shuffle:
        # 把输入的图片像素数据和标签数据随机打乱后，按照批次生成输出的图片像素数据和标签数据
        images, label_batch = tf.train.shuffle_batch(
            [image, label],
            batch_size=batch_size,
            num_threads=num_preprocess_threads,
            capacity=min_queue_examples + 3 * batch_size,
            # 出列后，队列中要保持的最小元素数？
            min_after_dequeue=min_queue_examples,
        )
    else:
        # 把输入的图片像素数据和标签数据按照原顺序、按照批次生成输出的图片像素数据和标签数据
        images, label_batch = tf.train.batch(
            [image, label],
            batch_size=batch_size,
            num_threads=num_preprocess_threads,
            capacity=min_queue_examples + 3 * batch_size,
        )
    # 将输入的图像数据记录到缓存中，为后续展示准备
    tf.summary.image("image", image)

    return images, tf.reshape(label_batch, [batch_size])


def destorted_inputs(data_dir, batch_size):
    # 设置CIFAR10数据文件的位置和名称
    filename = [os.path.join(data_dir, "data_batch_%d.bin" % i) for i in xrange(1, 6)]
    # 如果设置的CIFAR10数据文件不存在，报错退出
    for f in filename:
        if not tf.gfile.Exists(f):
            raise ValueError("Failed to find file: " + f)

    # 将filename中包含的文件打包生成一个先入先出队列（FIFOQueue）
    # 并且在计算图的QUEUE_RUNNER集合中添加一个QueueRunner（QueueRunner包含一个队列的一系列的入列操作）
    # 默认shuffle=True时，会对文件名进行随机打乱处理
    filename_queue = tf.train.string_input_producer(filename)

    with tf.name_scope("data_augmentation"):
        # 调用read_cifar10函数，将队列filename_queue进行处理，返回值赋予read_input
        read_input = read_cifar10(filename_queue)
        # 将图片像素数据read_input.uint8image转化为tf.float32类型，赋予reshaped_image
        reshaped_image = tf.cast(read_input.uint8image, tf.float32)

        height = IMAGE_SIZE
        width = IMAGE_SIZE
        # 对图片进行随机切割，转化尺寸为[24,24,3]
        distorted_image = tf.random_crop(reshaped_image, [height, width, 3])
        # 对切割后图片沿width方向随机翻转，有可能的结果就是从左往右，从左往左等于没有翻转
        distorted_image = tf.image.random_flip_left_right(distorted_image)
        # 对切割翻转后的图片随机调整亮度，实际上是在原图的基础上随机加上一个值(如果加上的是正值则增亮否则增暗)，
        # 此值取自[-max_delta,max_delta)，要求max_delta>=0。
        distorted_image = tf.image.random_brightness(distorted_image, max_delta=63)
        # 对切割、翻转和随机调整亮度的图片随机调整对比度，对比度调整值取自[lower,upper]
        distorted_image = tf.image.random_contrast(
            distorted_image, lower=0.2, upper=1.8
        )
        # 对切割、翻转、随机调整亮度和对比度的图片进行标准化处理，将RGB像素的值限定在一个范围，可以加速神经网络的训练
        # 标准化处理可以使得不同的特征具有相同的尺度（Scale）。这样，在使用梯度下降法学习参数的时候，不同特征对参数的影响程度就一样了。
        float_image = tf.image.per_image_standardization(distorted_image)
        # 设置切割、翻转、随机调整亮度、对比度和标准化后的图片数据设置尺寸为[24,24,3]
        float_image.set_shape([height, width, 3])
        # 设置标签数据的形状尺寸为[1]
        read_input.label.set_shape([1])
        # 设置队列中最少样本数为每轮样本的40%？
        min_fraction_of_examples_in_queue = 0.4
        min_queue_examples = int(
            NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN * min_fraction_of_examples_in_queue
        )

        print(
            "Filling queue with %d CIFAR images before starting to train. "
            "This will take a few minutes." % min_queue_examples
        )

    return _generate_image_and_label_batch(
        float_image, read_input.label, min_queue_examples, batch_size, shuffle=True
    )


def inputs(eval_data, data_dir, batch_size):
    if not eval_data:
        # 如果不是测试数据，就从训练数据文件中读取数据
        filenames = [
            os.path.join(data_dir, "data_batch_%d.bin" % i) for i in xrange(1, 6)
        ]
        # 设置每轮样本数为训练数据每轮样本数
        num_examples_per_epoch = NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN
    else:
        # 如果是测试数据，就从测试数据文件中读取数据
        filenames = [os.path.join(data_dir, "test_batch.bin")]
        # 设置每轮样本数为测试数据每轮样本数
        num_examples_per_epoch = NUM_EXAMPLES_PER_EPOCH_FOR_EVAL
    # 检验文件是否存在
    for f in filenames:
        if not tf.gfile.Exists(f):
            raise ValueError("Failed to find file:" + f)
    with tf.name_scope("input"):
        # 将filename中包含的文件打包生成一个先入先出队列
        filename_queue = tf.train.string_input_producer(filenames)
        # 调用read_cifar10函数，将数据文件处理成结构化的类对象CIFAR10Record，并返回给read_input
        read_input = read_cifar10(filename_queue=filename_queue)
        # 将read_input中的图片像素数据转换为tf.float32类型以便后续处理
        reshaped_image = tf.cast(read_input.uint8image, tf.float32)

        height = IMAGE_SIZE
        width = IMAGE_SIZE
        # 将reshaped_image图片数据修剪为宽24，高24的尺寸
        resized_image = tf.image.resize_image_with_crop_or_pad(
            reshaped_image, height, width
        )
        # 标准化处理resized_image图片数据返回给float_image
        float_image = tf.image.per_image_standardization(resized_image)
        # 设置float_image尺寸为[24,24,3]
        float_image.set_shape([height, width, 3])
        # 设置标签数据尺寸为[1]
        read_input.label.set_shape([1])
        # 设置队列中最少样本数为每轮样本的40%？
        min_fraction_of_examples_in_queue = 0.4
        min_queue_examples = int(
            num_examples_per_epoch * min_fraction_of_examples_in_queue
        )
        # 调用_generate_image_and_label_batch处理float_image数据
        return _generate_image_and_label_batch(
            float_image,
            read_input.label,
            min_queue_examples=min_queue_examples,
            batch_size=batch_size,
            shuffle=False,
        )

cifar10.py

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import os
import re
import sys
import tarfile

from six.moves import urllib
import tensorflow as tf

import cifar10_input

# 创建命令行参数
FLAGS = tf.app.flags.FLAGS

tf.app.flags.DEFINE_integer(
    "batch_size", 128, """Number of images to process in a batch."""
)
tf.app.flags.DEFINE_string(
    "data_dir",
    os.path.join(os.getcwd(), "cifar10_train_data"),
    """Path to the CIFAR-10 data directory.""",
)
tf.app.flags.DEFINE_boolean("use_fp16", False, """Train the model using fp16.""")

# 设置全局变量
IMAGE_SIZE = cifar10_input.IMAGE_SIZE
NUM_CLASSES = cifar10_input.NUM_CLASSES
NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN = cifar10_input.NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN
NUM_EXAMPLES_PER_EPOCH_FOR_EVAL = cifar10_input.NUM_EXAMPLES_PER_EPOCH_FOR_EVAL
MOVING_AVERAGE_DECAY = 0.9999  # The decay to use for the moving average.
NUM_EPOCHS_PER_DECAY = 350.0  # Epochs after which learning rate decays.
LEARNING_RATE_DECAY_FACTOR = 0.1  # Learning rate decay factor.
INITIAL_LEARNING_RATE = 0.1  # Initial learning rate.
TOWER_NAME = "tower"
DATA_URL = "https://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz"


def _activation_summary(x):
    # 设置tensor_name，如果输入的tensor的名称里，包含'tower_'+数字+'/'的字符串，将其替换成''
    tensor_name = re.sub("%s_[0-9]*/" % TOWER_NAME, "", x.op.name)
    # 为输入的tensor创建直方图，节点命名为tensor_name + "/activations"，可以在tensorboard中显示
    tf.summary.histogram(tensor_name + "/activations", x)
    # 因为relu激活函数有可能造成大量参数为0，所以使用tf.nn.zero_fraction计算输入tensor x中0元素个数在所有元素个数中的比例
    # 在tensorboar中打印，节点命名为tensor_name + "/sparsity"
    # 参考https://blog.csdn.net/fegang2002/article/details/83539768
    tf.summary.scalar(tensor_name + "/sparsity", tf.nn.zero_fraction(x))


def _variable_on_cpu(name, shape, initializer):
    # 创建变量运行在CPU中
    with tf.device("/cpu:0"):
        # 根据参数FLAGS.use_fp16，设置变量的类型
        dtype = tf.float16 if FLAGS.use_fp16 else tf.float32
        # 初始化变量
        var = tf.get_variable(
            name=name, shape=shape, initializer=initializer, dtype=dtype
        )
    return var


def _variable_with_weight_decay(name, shape, stddev, wd):
    # 根据参数FLAGS.use_fp16设置确定变量的类型
    dtype = tf.float16 if FLAGS.use_fp16 else tf.float32
    # 使用函数_variable_on_cpu创建变量，使用tf.truncated_normal随机生成数据
    # 在tf.truncated_normal中如果x的取值在区间（μ-2σ，μ+2σ）之外则重新进行选择
    # 横轴区间（μ-2σ，μ+2σ）内的面积为95.449974%，这样保证了生成的值都在均值附近。
    var = _variable_on_cpu(
        name=name,
        shape=shape,
        initializer=tf.truncated_normal(stddev=stddev, dtype=dtype),
    )
    if wd is not None:
        # 如果wd参数有值的话，将张量var的各个元素的平方和除以2，
        # 然后与wd点乘，命名为weight_loss
        weight_decay = tf.multiply(tf.nn.l2_loss(var), wd, name="weight_loss")
        # 将weight_decay加入losses集合
        tf.add_to_collection("losses", weight_decay)
    return var


def distorted_inputs():
    # 如果FLAGS.data_dir为空，报错提示
    if not FLAGS.data_dir:
        raise ValueError("Please supply a data_dir")
    # cifar10的数据解压后保存在data_dir
    data_dir = os.path.join(FLAGS.data_dir, "cifar-10-batches-bin")
    # 对cifar10的数据做切割、翻转、随机调整亮度、对比度和标准化处理，并按照FLAGS.batch_size参数生成批次数据
    images, labels = cifar10_input.distorted_inputs(
        data_dir=data_dir, batch_size=FLAGS.batch_size
    )
    # 如果FLAGS.use_fp16设置为真，将images,labels的类型转换为tf.float16
    if FLAGS.use_fp16:
        images = tf.cast(images, tf.float16)
        labels = tf.cast(labels, tf.float16)
    return images, labels


def inputs(eval_data):
    # 如果FLAGS.data_dir为空，报错提示
    if not FLAGS.data_dir:
        raise ValueError("Please supply a data_dir")
    # cifar10的数据解压后保存在data_dir
    data_dir = os.path.join(FLAGS.data_dir, "cifar-10-batches-bin")
    # 调用cifar10_input.inputs函数对cifar10数据进行处理
    images, labels = cifar10_input.inputs(
        eval_data=eval_data, data_dir=data_dir, batch_size=FLAGS.batch_size
    )
    # 如果FLAGS.use_fp16设置为真，将images,labels的类型转换为tf.float16
    if FLAGS.use_fp16:
        images = tf.cast(images, tf.float16)
        labels = tf.cast(labels, tf.float16)
    return images, labels


def inference(images):
    # 定义卷积层，变量的作用域为conv1
    with tf.variable_scope("conv1") as scope:
        # 创建变量kernel作为卷积核，命名为'weights'，
        # 卷积核高为5，宽为5，输入通道也即是图片的通道为3，输出通道也即是卷积核的数量为64
        # 按照标准差为5e-2的正态分布随机生成数据，抛弃均值左右2倍标准差外的数据
        # 不设置调整参数wd
        kernel = _variable_with_weight_decay(
            "weights", shape=[5, 5, 3, 64], stddev=5e-2, wd=None
        )
        # 创建卷积层，输入为images[image_batch,image_height,image_width,image_channel]
        # 卷积核为kernel[kernel_height,kernel_width,image_channel,kernel_channel]，kernel_channel为卷积核的数量
        # 步长strides为[1, 1, 1, 1]，为卷积核分别在images的四个维度[image_batch,image_height,image_width,image_channel]上的步长，
        # padding： string类型，值为“SAME” 和 “VALID”，表示的是卷积的形式，是否考虑边界。
        # "SAME"是考虑边界，不足的时候用0去填充周围，"VALID"则不考虑
        conv = tf.nn.conv2d(images, kernel, [1, 1, 1, 1], padding="SAME")
        # 设置偏置，命名为'biases'，长度为64的一维向量，所有元素都为0
        biases = _variable_on_cpu("biases", [64], tf.constant_initializer(0.0))
        # 将卷积层和偏置加到一起
        pre_activation = tf.nn.bias_add(conv, biases)
        # 卷积层和偏置加在一起后添加relu的激活函数，得到第一层卷积，命名为'conv1'，relu激活函数可能会造成大量参数为0
        conv1 = tf.nn.relu(pre_activation, name=scope.name)
        # 在tensorboad中打印conv1的分布和0元素占比，0元素占比可以反映此层对于训练的作用，占比高作用小，占比低作用大
        _activation_summary(conv1)

        # 设置最大池化层对conv1层做最大池化处理，命名为"pool1"
        # 池化窗口的大小设置为[1, 3, 3, 1]，分别对应conv1的四个维度[batch,height,width,channel]
        # 步长为[1, 2, 2, 1]，分别对应conv1的四个维度[batch,height,width,channel]
        # padding设置"SAME"，当滑动到边界尺寸不足时用'0'填充
        pool1 = tf.nn.max_pool(
            conv1,
            ksize=[1, 3, 3, 1],
            strides=[1, 2, 2, 1],
            padding="SAME",
            name="pool1",
        )
        # 对池化后的结果pool1做局部相应标准化处理，类似于dropout，防止过拟合
        norm1 = tf.nn.lrn(
            pool1, 4, bias=1.0, alpha=0.001 / 9.0, beta=0.75, name="norm1"
        )

    # 定义卷积层，变量的作用域为conv2
    with tf.variable_scope("conv2") as scope:
        # 创建变量kernel作为卷积核，命名为'weights'，
        # 卷积核高为5，宽为5，输入通道也即是图片的通道为64，输出通道也即是卷积核的数量为64
        # 按照标准差为5e-2的正态分布随机生成数据，抛弃均值左右2倍标准差外的数据
        # 不设置调整参数wd
        kernel = _variable_with_weight_decay(
            "weights", shape=[5, 5, 64, 64], stddev=5e-2, wd=None
        )
        # 创建卷积层，输入为norm1，卷积核为kernel，步长strides为[1, 1, 1, 1]
        # padding："SAME"是考虑边界，不足的时候用0去填充周围
        conv = tf.nn.conv2d(norm1, kernel, [1, 1, 1, 1], padding="SAME")
        # 设置偏置，命名为'biases'，长度为64的一维向量，所有元素都为0.1
        biases = _variable_on_cpu("biases", [64], tf.constant_initializer(0.1))
        # 将卷积层和偏置加到一起
        pre_activation = tf.nn.bias_add(conv, biases)
        # 卷积层和偏置加在一起后添加relu的激活函数，得到第二层卷积，命名为'conv2'，relu激活函数可能会造成大量参数为0
        conv2 = tf.nn.relu(pre_activation, name=scope.name)
        # 在tensorboad中打印conv2的分布和0元素占比，0元素占比可以反映此层对于训练的作用，占比高作用小，占比低作用大
        _activation_summary(conv2)

        # 对卷积后的结果conv2做局部相应标准化处理，类似于dropout，防止过拟合
        norm2 = tf.nn.lrn(conv2, 4, bias=1.0, alpha=0.001 / 9.0, beta=0.75, name="norm2")
        # 设置最大池化层对norm2层做最大池化处理，命名为"pool2"
        # 池化窗口的大小设置为[1, 3, 3, 1]，分别对应pool2的四个维度[batch,height,width,channel]
        # 步长为[1, 2, 2, 1]，分别对应pool2的四个维度[batch,height,width,channel]
        # padding设置"SAME"，当滑动到边界尺寸不足时用'0'填充
        pool2 = tf.nn.max_pool(
            norm2, ksize=[1, 3, 3, 1], strides=[1, 2, 2, 1], padding="SAME", name="pool2"
    )

    # 定义全连接层，变量的作用域为local3
    with tf.variable_scope("local3") as scope:
        # Move everything into depth so we can perform a single matrix multiply.
        # 将pool2转化为二维张量，第一维的尺寸为image的第一维的尺寸，其余的元素自动换算为第二维的尺寸，返回张量reshape
        reshape = tf.reshape(pool2, [images.get_shape().as_list()[0], -1])
        # 获取reshape张量的第二维的尺寸
        dim = reshape.get_shape()[1].value
        # 创建权重变量weights为二维张量，第一维的尺寸为张量reshape的第二维尺寸，第二维的尺寸为384
        # 按照标准差为0.04的正态分布随机生成数据，抛弃均值左右2倍标准差外的数据
        # 设置调整参数wd=0.004
        weights = _variable_with_weight_decay(
            "weights", shape=[dim, 384], stddev=0.04, wd=0.004
        )
        # 设置偏置，命名为'biases'，长度为64的一维向量，所有元素都为0.1
        biases = _variable_on_cpu("biases", [384], tf.constant_initializer(0.1))
        # 设置local3为reshape和weights相乘再与biases相加，再添加激活函数relu，relu激活函数可能会造成大量参数为0
        local3 = tf.nn.relu(tf.matmul(reshape, weights) + biases, name=scope.name)
        # 在tensorboad中打印local3的分布和0元素占比，0元素占比可以反映此层对于训练的作用，占比高作用小，占比低作用大
        _activation_summary(local3)

    # 定义全连接层，变量的作用域为local4
    with tf.variable_scope("local4") as scope:
        # 创建权重变量weights为二维张量，第一维的尺寸为384，第二维的尺寸为192
        # 按照标准差为0.04的正态分布随机生成数据，抛弃均值左右2倍标准差外的数据
        # 设置调整参数wd=0.004
        weights = _variable_with_weight_decay(
            "weights", shape=[384, 192], stddev=0.04, wd=0.004
        )
        # 设置偏置，命名为'biases'，长度为192的一维向量，所有元素都为0.1
        biases = _variable_on_cpu("biases", [192], tf.constant_initializer(0.1))
        # 设置local4为local3和weights相乘再与biases相加，再添加激活函数relu，relu激活函数可能会造成大量参数为0
        local4 = tf.nn.relu(tf.matmul(local3, weights) + biases, name=scope.name)
        # 在tensorboad中打印local4的分布和0元素占比，0元素占比可以反映此层对于训练的作用，占比高作用小，占比低作用大
        _activation_summary(local4)

    # 定义全连接层，变量的作用域为softmax_linear
    with tf.variable_scope("softmax_linear") as scope:
        # 创建权重变量weights为二维张量，第一维的尺寸为192，第二维的尺寸为图片的分类数
        # 按照标准差为1/192.0的正态分布随机生成数据，抛弃均值左右2倍标准差外的数据
        # 不设置调整参数wd
        weights = _variable_with_weight_decay(
            "weights", [192, NUM_CLASSES], stddev=1 / 192.0, wd=None
        )
        # 设置偏置，命名为'biases'，长度为图片分类数的一维向量，所有元素都为0
        biases = _variable_on_cpu("biases", [NUM_CLASSES], tf.constant_initializer(0.0))
        # 设置softmax_linear为local4和weights相乘再与biases相加
        softmax_linear = tf.add(tf.matmul(local4, weights), biases, name=scope.name)
        # 在tensorboad中打印softmax_linear的分布和0元素占比，0元素占比可以反映此层对于训练的作用，占比高作用小，占比低作用大
        _activation_summary(softmax_linear)
    # 张量softmax_linear作为函数输出
    return softmax_linear


def loss(logits, labels):
    # 将labels的类型转化为tf.int64
    labels = tf.cast(labels, tf.int64)
    # 求logits和labels之间的交叉熵，命名"cross_entropy_per_example"
    # tf.nn.sparse_softmax_cross_entropy_with_logits（）比tf.nn.softmax_cross_entropy_with_logits多了一步将labels稀疏化
    # 此例用非稀疏的标签，所以用tf.nn.sparse_softmax_cross_entropy_with_logits（）
    cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(
        labels=labels, logits=logits, name="cross_entropy_per_example"
    )
    # 对logits和labels之间的交叉熵cross_entropy求均值返回给cross_entropy_mean，命名"cross_entropy"
    cross_entropy_mean = tf.reduce_mean(cross_entropy, name="cross_entropy")
    # 将cross_entropy_mean存入losses集合
    tf.add_to_collection("losses", cross_entropy_mean)
    # 将集合中的元素相加作为函数的返回值
    return tf.add_n(tf.get_collection("losses"), name="total_loss")


def _add_loss_summaries(total_loss):
    # 设置移动平均模型，设置参数decay=0.9
    # 参考https://blog.csdn.net/qq_14845119/article/details/78767544
    loss_averages = tf.train.ExponentialMovingAverage(0.9, name="avg")
    # 从集合Losses中取出损失函数的值
    losses = tf.get_collection("losses")
    # 将从集合Losses中取出损失函数的值losses和输入的total_loss作和，然后做移动平均，作为函数的返回值
    loss_averages_op = loss_averages.apply(losses + [total_loss])

    for l in losses + [total_loss]:
        # Name each loss as '(raw)' and name the moving average version of the loss
        # as the original loss name.
        # 在tensorboard中打印所有的lose的值
        tf.summary.scalar(l.op.name + " (raw)", l)
        # 在tensorboard中打印所有的lose移动平均之后的值？
        tf.summary.scalar(l.op.name, loss_averages.average(l))

    return loss_averages_op


def train(total_loss, global_step):
    # 设置每个epoch训练的batch数
    num_batches_per_epoch = NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN / FLAGS.batch_size
    # 设置每个epoch中learning rate的衰减次数
    decay_steps = int(num_batches_per_epoch * NUM_EPOCHS_PER_DECAY)
    # 初始化学习率INITIAL_LEARNING_RATE后，训练过程中按照LEARNING_RATE_DECAY_FACTOR比例衰减学习率，以免学习率过大造成震荡
    # staircase为True,每decay_steps步数后，更新learning_rate=learning_rate*(decay_rate**decay_steps)
    # staircase为False，每一步更新learning_rate=learning_rate*decay_rate
    # global_step为学习步数
    lr = tf.train.exponential_decay(
        INITIAL_LEARNING_RATE,
        global_step,
        decay_steps,
        LEARNING_RATE_DECAY_FACTOR,
        staircase=True,
    )
    # 在tensorboard中打印Learning rate
    tf.summary.scalar("learning_rate", lr)
    # 将从集合Losses中取出损失函数的值losses和输入的total_loss作和，然后做移动平均
    loss_averages_op = _add_loss_summaries(total_loss)
    # 上下文管理器，控制计算流图，指定计算顺序，优先执行loss_averages_op
    with tf.control_dependencies([loss_averages_op]):
        # 设置梯度下降优化算法，学习率lr为随着学习的步数逐渐衰减
        opt = tf.train.GradientDescentOptimizer(lr)
        # 计算total_loss的梯度
        grads = opt.compute_gradients(total_loss)
    # 执行梯度下降，执行之前根据上下文管理器先操作loss_averages_op对total_loss做移动平均
    # 然后再对total_loss做梯度下降优化
    apply_gradient_op = opt.apply_gradients(grads, global_step=global_step)
    # 在tensorboard中打印所有的可训练变量
    for var in tf.trainable_variables():
        tf.summary.histogram(var.op.name, var)
    # 在tensorboard中打印所有梯度优化过程中更新的梯度
    for grad, var in grads:
        if grad is not None:
            tf.summary.histogram(var.op.name + "/gradients", grad)
    # 设置移动平均模型，设置参数decay=MOVING_AVERAGE_DECAY，num_updates=global_step？
    variable_averages = tf.train.ExponentialMovingAverage(
        MOVING_AVERAGE_DECAY, global_step
    )
    # 上下文管理器，控制计算流图，指定计算顺序，优先执行apply_gradient_op
    with tf.control_dependencies([apply_gradient_op]):
        # 先执行apply_gradient_op，更新tf.trainable_variables()
        # 然后再对tf.trainable_variables()做移动平均
        variables_averages_op = variable_averages.apply(tf.trainable_variables())
    # 返回根据梯度下降优化且经过移动平均的参数变量
    return variables_averages_op


def maybe_download_and_extract():
    # 下载cifar10的样本数据，并解压
    # 设置cifar10样本数据存储的文件夹，如果文件夹不存在，系统自动创建
    dest_directory = FLAGS.data_dir
    if not os.path.exists(dest_directory):
        os.makedirs(dest_directory)
    # 将cifar10的样本数据的下载链接DATA_URL按照'/'截取后取最后一个元素，其为文件名称
    filename = DATA_URL.split("/")[-1]
    # 组合cifar10的样本数据的完整路径
    filepath = os.path.join(dest_directory, filename)
    if not os.path.exists(filepath):
        # 如果cifar10的样本数据在系统中不存在，下载
        # 定义_progress回调函数，显示下载的进度
        def _progress(count, block_size, total_size):
            # 打印下载进度
            sys.stdout.write(
                "\r>> Downloading %s %.1f%%"
                % (filename, float(count * block_size) / float(total_size) * 100.0)
            )
            # linux系统下系统刷新输出，每秒输出一个结果，windows系统不需要，总是每秒输出一个结果
            sys.stdout.flush()

        # 从DATA_URL下载cifar10的样本数据，保存为filepath
        # 使用回到函数_progress显示下载进度
        # urlretrieve每下载一部分数据块后将下载的数据块数量count、数据库大小block_size和
        # 下载文件的总大小total_size传给回调函数_progress处理，打印下载进度
        filepath, _ = urllib.request.urlretrieve(DATA_URL, filepath, _progress)
        print()
        # 获取cifar10样本数据的系统状态信息
        statinfo = os.stat(filepath)
        # 打印cifar10样本数据下载成功信息，显示下载后的文件路径、名称和大小
        print("Successfully downloaded", filename, statinfo.st_size, "bytes.")
    # cifar10样本数据解压后会生成文件夹cifar-10-batches-bin
    extracted_dir_path = os.path.join(dest_directory, "cifar-10-batches-bin")
    if not os.path.exists(extracted_dir_path):
        # 如果extracted_dir_path在系统中不存在，说明cifar10样本数据还未解压
        # 将cifar10样本数据解压后保存到dest_directory
        tarfile.open(filepath, "r:gz").extractall(dest_directory)

cifar_train.py

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

from datetime import datetime
import time

import tensorflow as tf

import cifar10

# 设置输入参数
FLAGS = tf.app.flags.FLAGS
tf.app.flags.DEFINE_string(
    "train_dir",
    "/cifar10_train_check",
    """Directory where to write event logs and checkpoint.""",
)
tf.app.flags.DEFINE_integer("max_steps", 100000, """Number of batches to run.""")
tf.app.flags.DEFINE_boolean(
    "log_device_placement", False, """Whether to log device placement."""
)
tf.app.flags.DEFINE_integer(
    "log_frequency", 10, """How often to log results to the console."""
)


def train():
    # 创建上下文管理器，使用默认计算图
    with tf.Graph().as_default():
        # 从默认计算图中创建并返回glob step变量，初始化后为0
        global_step = tf.train.get_or_create_global_step()
        # 设置运行在cpu下
        with tf.device("/cup:0"):
            # 对cifar10的数据做切割、翻转、随机调整亮度、对比度和标准化处理，并按照FLAGS.batch_size参数生成批次数据
            images, labels = cifar10.distorted_inputs()
        # 通过cifar10.inference定义的深层学习框架（2层卷积，3层全链接）对cifar10.distorted_inputs()处理的图片数据进行学习
        # 得到各个分类的特征值
        logits = cifar10.inference(images)
        # 将各个分类的特征值和标签数据通过cifar10.loss得到损失值
        loss = cifar10.loss(logits, labels)
        # 通过cifar10.train对损失值进行训练，训练的总步数为global_step
        train_op = cifar10.train(loss, global_step)

        # 创建类_LoggerHook，是继承tf.train.SessionRunHook的子类，生成钩子程序，用来监视训练过程
        class _LoggerHook(tf.train.SessionRunHook):
            # 创建会话之前调用，调用begin()时，default graph会被创建，
            def begin(self):
                # 初始化训练的起始步数
                self._step = -1
                # 获取当前时间的时间戳（1970纪元后经过的浮点秒数）初始化会话的起始时间
                self._start_time = time.time()

            # 每个sess.run()执行之前调用，返回tf.train.SessRunArgs(op/tensor),在即将运行的会话中加入op/tensor loss
            # 加入的loss会和sess.run()中已定义的op/tensor合并，然后一起执行
            def before_run(self, run_context):
                # 叠加训练的步数，第一次训练从步数0开始
                self._step += 1
                # 返回SessionRunArgs对象，作为即将运行的会话的参数，将loss添加到会话中
                return tf.train.SessionRunArgs(loss)

            # 每个sess.run()执行之后调用，run_values是befor_run()中的op/tensor loss的返回值
            # 可以调用run_context.qeruest_stop()用于停止迭代，sess.run抛出任何异常after_run不会被调用
            def after_run(
                # tf.train.SessRunContext提供会话运行所需的信息，tf.train.SessRunValues保存会话运行的结果
                self, run_context, run_values  # pylint: disable=unused-argument
            ):
                # 判断迭代步数是否为FLAGS.log_frequency=10的整数倍
                if self._step % FLAGS.log_frequency == 0:
                    # 获取当前时间的时间戳（1970纪元后经过的浮点秒数）
                    current_time = time.time()
                    # 获取每10个会话运行的持续时间
                    duration = current_time - self._start_time
                    # 更新会话的起始时间
                    self._start_time = current_time
                    # 获取before_run中加入的操作loss的返回值
                    loss_value = run_values.results
                    # 计算每秒钟处理的样本数
                    examples_per_sec = FLAGS.log_frequency * FLAGS.batch_size / duration
                    # 计算每个会话的运行时间，单位为秒
                    sec_per_batch = float(duration / FLAGS.log_frequency)
                    # 打印当前系统时间，当前步数下的loss的值（标示：每秒处理的样本数和每个批次样本处理所需要的时间）
                    format_str = (
                        "%s: step %d, loss = %.2f (%.1f examples/sec; %.3f sec/batch)"
                    )
                    print(
                        format_str
                        % (
                            datetime.now(),
                            self._step,
                            loss_value,
                            examples_per_sec,
                            sec_per_batch,
                        )
                    )

        with tf.train.MonitoredTrainingSession(
            # 设置恢复变量的文件路径为FLAGS.train_dir
            checkpoint_dir=FLAGS.train_dir,
            hooks=[
                # 设置HOOK程序在FLAGS.max_steps=100000后停止
                tf.train.StopAtStepHook(last_step=FLAGS.max_steps),
                # 设置如果loss的值为Nan，停止训练
                tf.train.NanTensorHook(loss),
                # 调用自己定义的_LoggerHook() HOOK类
                _LoggerHook(),
            ],
            # 对会话进行设置，log_device_placement为True时，会在终端打印出各项操作是在哪个设备上运行的
            config=tf.ConfigProto(log_device_placement=FLAGS.log_device_placement),
        ) as mon_sess:
            # 创建循环在没有符合程序退出条件的情况下，运行train_op训练数据
            while not mon_sess.should_stop():
                mon_sess.run(train_op)


def main(argv=None):
    # 下载并解压cifar10的数据，防止没有数据可训练
    cifar10.maybe_download_and_extract()
    # 创建目录存储Log和checkpoint文件，如果目录存在，删除重新创建，以保证保存最新的训练信息
    if tf.gfile.Exists(FLAGS.train_dir):
        tf.gfile.DeleteRecursively(FLAGS.train_dir)
    tf.gfile.MakeDirs(FLAGS.train_dir)
    # 训练数据
    train()


if __name__ == "__main__":
    # 处理FLAGS参数解析，运行main()函数
    tf.app.run()

cifar_eval.py

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

from datetime import datetime
import math
import time

import numpy as np
import tensorflow as tf

import cifar10
# 定义参数变量
FLAGS = tf.app.flags.FLAGS

tf.app.flags.DEFINE_string('eval_dir', '/cifar10_eval',
                           """Directory where to write event logs.""")
tf.app.flags.DEFINE_string('eval_data', 'test',
                           """Either 'test' or 'train_eval'.""")
tf.app.flags.DEFINE_string('checkpoint_dir', '/cifar10_train_check',
                           """Directory where to read model checkpoints.""")
tf.app.flags.DEFINE_integer('eval_interval_secs', 60 * 5,
                            """How often to run the eval.""")
tf.app.flags.DEFINE_integer('num_examples', 10000,
                            """Number of examples to run.""")
tf.app.flags.DEFINE_boolean('run_once', False,
"""Whether to run eval only once.""")

def eval_once(saver,summary_writer,top_k_op,summary_op):
    # 创建上下文管理器，定义会话sess
    with tf.Session() as sess:
        # 获取保存的模型，模型路径由FLAGS.checkpoint_dir定义
        ckpt=tf.train.get_checkpoint_state(FLAGS.checkpoint_dir)
        # 如果ckpt和ckpt.model_checkpoint_path非空
        if ckpt and ckpt.model_checkpoint_path:
            # 从chekpoint中恢复参数
            saver.restore(sess, ckpt.model_checkpoint_path)
            # 获取训练的总步数，模型文件的名称为'model.ckpt-总步数'
            global_step=ckpt.model_checkpoint_path.split('/')[-1].split('-')[-1]
        else:
        # 如果ckpt和ckpt.model_checkpoint_path为空，打印提示，退出函数
            print('No checkpoint file found')
            return
        # 开启一个多线程协调器，协调线程间的关系
        coord=tf.train.Coordinator()
        try:
            # 定义数组存储线程
            threads=[]
            # 所有队列管理器被默认加入图的tf.GraphKeys.QUEUE_RUNNERS集合中
            for qr in tf.get_collection(tf.GraphKeys.QUEUE_RUNNERS):
                # 队列创建线程来做入列操作，并将创建的线程存入threads数组
                threads.extend(qr.create_threads(sess=sess,coord=coord,daemon=True,start=True))
            # 总样本数除以每个批次的样本数量向上取整，获取总的批次数量也即是迭代次数
            num_iter=int(math.ceil(FLAGS.num_examples/FLAGS.batch_size))
            # 预测结果的真值数量初始化为0
            true_count=0
            # 迭代次数乘以每个批次的样本数量得到总的样本数量
            total_sample_count=num_iter*FLAGS.batch_size
            # 循环的步数初始化为0
            step=0
            while step

 
  代码下载地址 
  https://github.com/tensorflow/models/tree/master/tutorials/image/cifar10

Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
关于python版本与TensorFlow安装的版本问题 iiimharrygGc. python tensorflow 开发语言
实测在conda环境下，python3.12的版本无法安装TensorFlow2.14.0（截至2024.5.21）最新版本在python3.7版本下正常安装ps：上述安装均在anacondanavigator软件内安装
Vue + Django的人脸识别系统 DXSsssss python DRF tensorflow 人脸识别
最近在研究机器学习，刚好最近看了vue+Djangodrf的一些课程，学以致用，做了一个人脸识别系统。项目前端使用Vue框架，用到了elementui组件，写起来真是方便。比之前传统的dtl方便了太多。后端使用了drf，识别知识刚开始打算使用opencv+tensorflow,但是发现吧识别以后的结果返回到浏览器当中时使用opencv比较麻烦（主要是我太菜，想不到比较好的方法），因此最终使用了tf
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】小白也能懂的 TensorFlow 和 PyTorch GPU 配置教程 ShuQiHere tensorflow pytorch 人工智能
【ShuQiHere】在深度学习中，GPU的使用对于加速模型训练至关重要。然而，对于许多刚刚入门的小白来说，如何在TensorFlow和PyTorch中指定使用GPU进行训练可能会感到困惑。在本文中，我将详细介绍如何在这两个主流的深度学习框架中指定使用GPU进行训练，并确保每一个步骤都简单易懂，跟着我的步骤来，你也能轻松上手！1.安装所需库首先，确保你已经安装了TensorFlow或PyTorch
TensorFlow的基本概念以及使用场景张柏慈决策树
TensorFlow是一个机器学习平台，用于构建和训练机器学习模型。它使用图形表示计算任务，其中节点表示数学操作，边表示计算之间的数据流动。TensorFlow的主要特点包括：1.多平台支持：TensorFlow可以运行在多种硬件和操作系统上，包括CPU、GPU和移动设备。2.自动求导：TensorFlow可以自动计算模型参数的梯度，通过优化算法更新参数，以提高模型的准确性。3.分布式计算：Ten
基于VGG的猫狗识别卑微小鹿 tensorflow tensorflow
由于猫和狗的数据在这里，所以就做了一下分类的神经网络1、首先进行图像处理：importcsvimportglobimportosimportrandomos.environ['TF_CPP_MIN_LOG_LEVEL']='2'importtensorflowastffromtensorflowimportkerasfromtensorflow.kerasimportlayersimportnum
轻松升级：Ollama + OpenWebUI 安装与配置【AIStarter】 ai_xiaogui AI作画 AI软件人工智能 AI写作 AIStarter
Ollama是一个开源项目，用于构建和训练大规模语言模型，而OpenWebUI则提供了一个方便的前端界面来管理和监控这些模型。本文将指导你如何更新这两个工具，并顺利完成配置。准备工作确保你的系统已安装Git和Python环境。安装必要的依赖库，如TensorFlow或PyTorch等。更新步骤克隆项目：使用Git命令行工具克隆最新的Ollama和OpenWebUI仓库到本地。更新代码：确保你正在使
深度学习之基于Tensorflow卷积神经网络水果蔬菜分类识别系统 qq1744828575 python python plotly
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景与目标背景：在现代农业、智能零售等领域，自动化分类与识别技术对于提高效率、优化供应链管理具有重要意义。为了响应这一需求，本项目旨在构建一个基于深度学习技术的水果蔬菜分类识别系统。目标：构建一个准确率高、性能稳定的水果蔬菜分类识别模型，利用Tensorflow框架
ImportError: cannot import name ‘conv_utils‘ from ‘keras.utils‘ CheCacao keras 深度学习 python tensorflow tensorflow2 人工智能
将fromkeras.utilsimportconv_utils改为fromtensorflow.python.keras.utilsimportconv_utilsImportError:nomodulenamed'tensorflow.keras.engine将fromkeras.engine.topologyimportLayer改为fromtensorflow.python.keras.l
jupyter出错ImportError: cannot import name ‘np_utils‘ from ‘keras.utils‘ ，怎么解决？七月初七淮水竹亭～人工智能 python jupyter keras 深度学习
文章前言此篇文章主要是记录一下我遇到的问题以及我是如何解决的，希望下次遇到类似问题可以很快解决。此外，也希望能帮助到大家。遇到的问题出错：ImportError:cannotimportname'np_utils'from'keras.utils'，如图：如何解决首先我根据网上文章的一些提示，将fromkeras.utilsimportnp_utils换成了fromtensorflow.keras
tensorflow和python不兼容_tensorflow与numpy的版本兼容性问题的解决 weixin_39727934
在Python交互式窗口导入tensorflow出现了下面的错误：ox8免费资源网root@ubuntu:~#python3Python3.6.8(default,Oct72019,12:59:55)[GCC8.3.0]onlinuxType"help","copyright","credits"or"license"formoreinformation.>>>importtensorflowas
numpy python 兼容_tensorflow与numpy的版本兼容性问题 weixin_39761822 numpy python 兼容
在Python交互式窗口导入tensorflow出现了下面的错误：root@ubuntu:~#python3Python3.6.8(default,Oct72019,12:59:55)[GCC8.3.0]onlinuxType"help","copyright","credits"or"license"formoreinformation.>>>importtensorflowastf;/usr/
安装tensorflow2.5.0 发现 tensorflow 和 numba 两者对应Numpy版本冲突 GJK_ tensorflow numpy 人工智能
问题：python3.8安装tensorflow2.5.0发现tensorflow和numba两者对应Numpy版本冲突tensorflow-gpu2.5.0requiresnumpy~=1.19.2numba0.58.1requiresnumpy=1.22解决方法：将numba降低版本为0.53pipinstallnumba==0.53再将numpy版本改为1.19.2pipinstallnum
python3.7安装keras教程_python 3.7 安装 sklearn keras(tf.keras) weixin_39641103
#1sklearn一般方法网上有很多教程，不再赘述。注意顺序是numpy+mkl，然后scipy的环境，scipy，然后sklearn#2anocondaanaconda原始的环境已经自带了sklearn，这里说一下新建环境（比如创建了一个tensorflow的环境），activatetensorflow2.0，然后condainstallsklearn即可，会帮你把各种需要的库都安装。#kera
Python高层神经网络 API库之Keras使用详解 Rocky006 python keras 开发语言
概要随着深度学习在各个领域的广泛应用，许多开发者开始使用各种框架来构建和训练神经网络模型。Keras是一个高层神经网络API，使用Python编写，并能够运行在TensorFlow、CNTK和Theano之上。Keras旨在简化深度学习模型的构建过程，使得开发者能够更加专注于实验和研究。本文将详细介绍Keras库，包括其安装方法、主要特性、基本和高级功能，以及实际应用场景，帮助全面了解并掌握该库的
将本地已有的项目上传到新建的git仓库的方法 10676
将本地已有的一个非git项目上传到新建的git仓库的方法一共有两种。一、克隆+拷贝第一种方法比较简单，直接用把远程仓库拉到本地，然后再把自己本地的项目拷贝到仓库中去。然后push到远程仓库上去即可。此方法适用于本地项目不是一个git仓库的情况。1、首先克隆[email protected]:yuanmingchen/tensorflow_study.git2、然后复制自己项目的所有文件到
Python(PyTorch和TensorFlow)图像分割卷积网络导图(生物医学) 亚图跨际交叉知识 Python 生物医学脑肿瘤图像皮肤病变多模态医学图像多尺度特征生物医学腹部胰腺图像病灶边界气胸图像
要点语义分割图像三层分割椭圆图像脑肿瘤图像分割动物图像分割皮肤病变分割多模态医学图像多尺度特征生物医学肖像多类和医学分割通用图像分割模板腹部胰腺图像分割分类注意力网络病灶边界分割气胸图像分割Python生物医学图像卷积网络该网络由收缩路径和扩展路径组成，收缩路径是一种典型的卷积网络，由重复应用卷积组成，每个卷积后跟一个整流线性单元(ReLU)和一个最大池化操作。在收缩过程中，空间信息减少，而特征信
AttributeError: ‘tuple‘ object has no attribute ‘shape‘ 晓胡同学 keras 深度学习 tensorflow
AttributeError:‘tuple’objecthasnoattribute‘shape’在将keras代码改为tensorflow2代码的时候报了如下错误AttributeError:'tuple'objecthasnoattribute'shape'经过调查发现，损失函数写错了原来的是这样model.compile(loss=['binary_crossentropy'],optimi
Autoencoder chuange6363 人工智能 python
自编码器Autoencoder稀疏自编码器SparseAutoencoder降噪自编码器DenoisingAutoencoder堆叠自编码器StackedAutoencoder本博客是从梁斌博士的博客上面复制过来的，本人利用Tensorflow重新实现了博客中的代码深度学习有一个重要的概念叫autoencoder，这是个什么东西呢，本文通过一个例子来普及这个术语。简单来说autoencoder是一
OSError: libnccl.so.2: cannot open shared object file: No such file or directory 王小葱鸭 python
linux安装完torch或者tensorflow的gpu版本，安装没问题，但是import就有问题，报错OSError:libnccl.so.2:cannotopensharedobjectfile:Nosuchfileordirectory，是缺少nvidia的ncll，下面介绍解决方法：1安装ncll下载链接https://developer.nvidia.com/nccl/nccl-dow
深度学习框架人工智能操作系统训练&前向推理 PyTorch Tensorflow MindSpore caffe 张量加速引擎TBE 深度学习编译器多面体 polyhedral AI集群框架 EwenWanW 深度学习人工智能 pytorch 深度学习编译器
深度学习框架人工智能操作系统训练&前向推理深度学习框架发展到今天，目前在架构上大体已经基本上成熟并且逐渐趋同。无论是国外的Tensorflow、PyTorch，亦或是国内最近开源的MegEngine、MindSpore，目前基本上都是支持EagerMode和GraphMode两种模式。AI嵌入式框架OneFlow&清华计图Jittor&华为深度学习框架MindSpore&旷视深度学习框架MegEn
Tensorflow中Keras搭建神经网络六步法及参数详解 -- Tensorflow自学笔记12 青瓷看世界 tensorflow 笔记人工智能深度学习神经网络
一.tf.keras搭建神经网络六步法1.import相关模块如importtensorflowastf。2.指定输入网络的训练集和测试集如指定训练集的输入x_train和标签y_train，测试集的输入x_test和标签y_test。3.逐层搭建网络结构model=tf.keras.models.Sequential()。4.在model.compile()中配置训练方法选择训练时使用的优化器、
MacBook Air M1 使用 miniconda 安装python3.11.7 和 tensorflow2.16.1详细 - TensorFlow自学笔记1 青瓷看世界 tensorflow tensorflow 人工智能 mac python 深度学习
1m1mac安装xcode命令工具在Terminal终端执行以下代码：xcode-select--install2下载支持m1芯片arm64的miniconda在miniconda官网，找到下图中保护AppleM1的bash安装包，Miniconda—Anacondadocumentation3安装miniconda在Terminal执行下列代码：1）cd"miniconda下载目录"2）bash
机器学习框架巅峰对决：TensorFlow vs. PyTorch vs. Scikit-Learn实战分析 @sinner 技术选型机器学习 tensorflow pytorch scikit-learn
1.引言1.1机器学习框架的重要性在机器学习的黄金时代，框架的选择对于开发高效、可扩展的模型至关重要。合适的框架可以极大地提高开发效率，简化模型的构建和训练过程，并支持大规模的模型部署。因此，了解和选择最合适的机器学习框架对于研究人员和工程师来说是一个关键的步骤。1.2三大框架概览：TensorFlow、PyTorch、Scikit-Learn目前，最流行的机器学习框架主要有TensorFlow、
Tensorflow2.16中的Keras包含哪些层(layers)?层的功能及参数详细解释 -- TensorFlow自学笔记6 青瓷看世界 tensorflow tensorflow keras 人工智能
在Keras中，层（Layer）是构建神经网络的基本组件。Keras提供了多种类型的层，用于处理不同类型的输入数据和执行特定的数学操作。英文版可参考TensorFlow官方文档：Module:tf.keras.layers|TensorFlowv2.16.1一.层的分类‌1.基本网络层‌1.1.Dense层用于执行全连接操作；1.2.卷积层Conv1D、Conv2D、Conv3D层，用于执行一维、
Tensorflow2 如何扩展现有数据集(缩放、随机旋转、水平翻转、平移等)，从而提高模型的准确率 -- Tensorflow自学笔记14 青瓷看世界 tensorflow 人工智能 python
实际生活中的数据集，往往不是标准的数据，而是有倾斜角度、有旋转、有偏移的数据，为了提高数据集的真实性，提高模型预测的准确率，可以用ImageDataGenerator函数来扩展数据集importtensorflowastffromtensorflow.keras.preprocessing.imageimportImageDataGeneratorimage_gen_train=ImageData
机器学习100天-Day2503 Tensorboard 训练数据可视化（线性回归）我的昵称违规了
首页.jpg源代码来自莫烦python(https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/4-1-tensorboard1/)今日重点读懂教程中代码，手动重写一遍，在浏览器中获取到训练数据Tensorboard是一个神经网络可视化工具，通过使用本地服务器在浏览器上查看神经网络训练日志，生成相应的可是画图，帮助炼丹师
Python(TensorFlow)和Java及C++受激发射损耗导图亚图跨际 Python 交叉知识算法去噪预测算法聚焦荧光团伪影消除算法囊泡动力学自动化多尺度统计物距
要点神经网络监督去噪预测算法聚焦荧光团和检测模拟平台伪影消除算法性能优化方法自动化多尺度囊泡动力学成像生物研究多维分析统计物距粒子概率算法Python和MATLAB图像降噪算法消除噪声的一种方法是将原始图像与表示低通滤波器或平滑操作的掩模进行卷积。例如，高斯掩模包含由高斯函数确定的元素。这种卷积使每个像素的值与其相邻像素的值更加协调。一般来说，平滑滤波器将每个像素设置为其自身及其附近相邻像素的平均
中文车牌识别系统 `End-to-end-for-Chinese-Plate-Recognition` 教程皮静滢Annette
中文车牌识别系统End-to-end-for-Chinese-Plate-Recognition教程End-to-end-for-chinese-plate-recognition基于u-net，cv2以及cnn的中文车牌定位，矫正和端到端识别软件，其中unet和cv2用于车牌定位和矫正，cnn进行车牌识别，unet和cnn都是基于tensorflow的keras实现项目地址:https://gi
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

Tensorflow官网CIFAR-10数据分类教程代码详解

标题

概述

CIFAR-10数据介绍

代码详解

代码下载地址

你可能感兴趣的:(Tensorflow)