等一杯咖啡

TensorFlow1.x最佳实践：Dataset API+Keras Model+TF Train

前言

关于深度学习框架，主流的几个TensorFlow、PyTorch以及Keras都有所使用，由于在深度学习领域自己也只算个入门级选手，所以本文只从一个AI新手的角度去尝试分享一些使用框架编程的实践经验。至于标题最佳实践，那也纯粹有些哗众取宠之意，文章对于能够玩转各种框架API的大佬们，也许会贻笑大方。除此以外，本文相当于一个搬运工，并不讲解具体的使用细节，当然会推荐一些已经介绍的很好的文章，看完一定会有所收获。下面正式开始，希望能对大家有所帮助。

在三种框架的使用上，可能最难以上手使用的就是TensorFlow，毕竟在没有Eager Execution时，动态图的特性常常让人对网络调试摸不着头脑。Keras相对来说最容易上手，固定版式的代码，封装性极高，想要扩展对新手来说就有些难了。PyTorch在上手难易程度，扩展性方面都很棒，特别是 torch 张量可以即时看到，便于调试。

总的来说，如果想要从零到一的去写一个深度学习工程代码，我觉得PyTorch会相当的合适。但是我们往往是在别人的工作基础上进行改进，很多开源代码都是基于1.x版本的TensorFlow实现的，或者有些是在Keras基础上实现的，并非PyTorch，我们总不愿意去重新用PyTorch实现一遍，对于学术科研或许有些本末倒置了

我们的目的是快速的实现自己的想法，基于TensorFlow1.x版本的框架实现自己的idea，快速试错。深度学习任务代码的编写，着重解决：

数据集制作与读取；
网络模型的搭建，其中包含了自定义网络层等各种复杂操作；
训练模型的代码，其中也包括自定义损失函数，动态调整学习率等。

针对这三方面，分别有着对应极为适合的方式去实现。

实践方案

a. 数据读取

往往我们的数据集存储在磁盘是直接以 jpg 或者 png 图片的形式，可能几万几十万张不等，标签信息可能也是图片或者存储在 txt 文档中的数据等等。当然，如果将这些零散的数据整合成类似于 npz 或者 TFRecord 这种，也是一样的。对于从硬盘读取大数据量的训练数据，往往都是需要多线程不断加载进行的，内存大小受限，不可能一次性加载全部数据。

TensorFlow在Dataset API之前，大多都是使用 QueueRunner 去搞定这件事。有兴趣可以去研究，这里随便贴一篇文章。老实说，这样的API有些难用，编码复杂性高，容易出错，至少我在平时的编码中确实会遇到数据读取队列出错的问题。相反PyTorch的数据读取方式就显得非常简单，有面向对象编程的那种感觉。TensorFlow在1.3版本之后引入了全新的读取数据API，也就是Dataset API。总的来说，更加的简洁明了，编码难度降低了很多。同样，这里推荐一篇文章，TensorFlow全新的数据读取方式：Dataset API教程。着重可能需要关注磁盘大数据量的读取和对数据的处理。

贴一个我自己写的代码，用于读取磁盘30万张 jpg 图片和对应 txt 标签。

class XxxDataloader:

    def __init__(self, config):
        self.config = config
        self.mode = config.mode

        # 数据路径
        self.img_path = config.img_path
        self.image_names_path = config.image_names_path
        self.gt_file = config.gt_file

        # 图片数据
        self.img_raw_batch = None
        self.img_aug_batch = None
        # 标签数据
        self.gt_batch = None  # ground truth

        # ===========》开始处理 ===========》

        # 读取图像名称和标签，image_names存放的是全部训练数据的
        image_names, gt = self._read_img_and_gt(self.image_names_path, self.gt_file)

        # 创建dataset, dataset中的一个元素是(image_name,, gt)
        dataset = tf.data.Dataset.from_tensor_slices((image_names, pts1_coordinates, gt_h4ps))
        # 通过图片名读取图片数据,并对数据进行处理
        dataset = dataset.map(self._parse_function)
        # 此时dataset中的一个元素是(image_batch, label_batch)
        if config.shuffle:
            dataset = dataset.shuffle(config.buffersize)
        dataset = dataset.batch(config.batch_size).repeat(config.train_epoch)

        # 从头到尾读取一次的iterator
        iterator = dataset.make_one_shot_iterator()

        # 从iterator里取出一个样本
        self.img_raw_batch, self.img_aug_batch, self.gt_batch = iterator.get_next()

    def _parse_function(self, image_name, gt):
    	# 获取图片路径，图片所在路径名称都存在一个txt中
        image_path = tf.string_join([self.img_path, image_name])

        # 读取图片RGB三通道
        image = self._read_image(image_path, [self.img_h, self.img_w], channels=3)
       
        # 数据增强
        random_aug = tf.random_uniform([], 0, 1)
        image_aug = tf.cond(random_aug < self.config.aug_ratio, lambda: self._augment_image(image), lambda: image)

        # 归一化等其他操作
        ......

        return image, image_aug, gt

    def _read_img_and_gt(self, filenames_file, gt_file):
        """
        读取图像名称数据、起始坐标点和ground truth
        :param filenames_file: 保存数据名称文件
        :param gt_file: 标签
        :return: 图的名称、标签
        """
        ..........
        return img_array, gt_array

    def _read_image(self, image_path, out_size, channels=3):
        """
        读取图像，并且resize成指定大小
        :param image_path: 图片路径
        :param out_size: 输出尺寸
        :param channels:
        :return:
        """
        image = tf.image.decode_jpeg(tf.read_file(image_path), channels=channels)
        image = tf.cast(image, tf.float32)
        image = tf.image.resize_images(image, out_size, tf.image.ResizeMethod.AREA)
        return image

    def _augment_image(self, image, min_val=0, max_val=255):
        """
        数据增强
        :param image: 
        :return: 
        """
		image_aug = aug(image)
        return image_aug

代码着重讲究使用流程，可以自行修改定制。

b. Keras搭建模型

其实搭建模型这一块，各个框架都有非常方便的高层API，也都有各种张量操作函数。但是我们希望能各种自定义层，有时候希望某几层权重共享等等。如果使用TensorFlow原生API往往需要考虑各种 namescope，所以相对来说Keras更加适合搭建网络模型，还可以借助它的打印绘制网络结构方法，十分方便。关于搭建Keras模型，可以直接参考官方文档关于构建函数式和顺序式的模型部分内容。

这里也贴一个构建函数式模型的代码样例：

class XxxNet:

    def __init__(self, config):
        self.config = config
        self.model = self.build_model()

    def build_model(self):
        left_input = Input(shape=(self.config.patch_size, self.config.patch_size, 1), name='left_input')
        right_input = Input(shape=(self.config.patch_size, self.config.patch_size, 1), name='right_input')

        # concat
        stack_input = Concatenate(axis=3)([left_input, right_input])

        # block1
        conv1_1 = Conv2D(64, (3, 3), strides=(1, 1), padding='same', activation='relu')(stack_input)
        conv1_2 = Conv2D(64, (3, 3), strides=(1, 1), padding='same', activation='relu')(conv1_1)
        maxpooling1 = MaxPooling2D((2, 2), strides=(2, 2))(conv1_2)

        # block2
        conv2_1 = Conv2D(64, (3, 3), strides=(1, 1), padding='same', activation='relu')(maxpooling1)
        conv2_2 = Conv2D(64, (3, 3), strides=(1, 1), padding='same', activation='relu')(conv2_1)
        maxpooling2 = MaxPooling2D((2, 2), strides=(2, 2))(conv2_2)

        # block3
        conv3_1 = Conv2D(128, (3, 3), strides=(1, 1), padding='same', activation='relu')(maxpooling2)
        conv3_2 = Conv2D(128, (3, 3), strides=(1, 1), padding='same', activation='relu')(conv3_1)
        maxpooling3 = MaxPooling2D((2, 2), strides=(2, 2))(conv3_2)

        # block4
        conv4_1 = Conv2D(128, (3, 3), strides=(1, 1), padding='same', activation='relu')(maxpooling3)
        conv4_2 = Conv2D(128, (3, 3), strides=(1, 1), padding='same', activation='relu')(conv4_1)

        # dropout1
        if self.config.mode == "test":
            self.config.dropout_rate = 1.0
        dropout1 = Dropout(self.config.dropout_rate)(conv4_2)

        # flatten
        flatten = Flatten()(dropout1)

        # fc and dropout2
        fc1 = Dense(1024, activation='relu', kernel_initializer='random_uniform')(flatten)
        fc1_dropout = Dropout(self.config.dropout_rate)(fc1)

        fc2 = Dense(8, activation=None, kernel_initializer='random_uniform')(fc1_dropout)
        output = fc2

        model = Model([left_input, right_input], output)
        plot_model(model, to_file=os.path.join(self.config.model_img_dir, "_model.svg"), show_shapes=True)
        return model

c. TensorFlow API 训练

其实通过前面Dataset API+Keras模型的方式，我们已经完全可以编写Keras方式的训练代码，直接 model.fit() 等。如果有兴趣，可以参考：tensorflow的keras实现搭配dataset 之二。

但是，我们常常会遇到自定义损失函数，动态调整学习率的需求，诚然Keras也提供了对应的方式供我们扩展，但编码量并没有减少，反而有些失去了原本用Keras的方便性。我们不如直接使用TensorFlow原本的方式来训练模型，还可以随意的定义需要展示在Tensorboard中的量。

这里也贴出一份代码：

config = TrainConfig()  # 训练参数配置
dataloader = XxxDataloader(config)
train(config, dataloader, XxxNet(config))

def train(config, dataloader, network):
    gt_image = dataloader.img_gt_batch  # 标签
    pred_image = network.model(dataloader.img_batch)  # 预测
    l1_loss = tf.reduce_mean(tf.abs(pred_image - gt_image))  # metric
    dssim_loss = loss_mix_v3(gt_image, pred_image)  # 自定义损失
    
    op = tf.train.AdamOptimizer(learning_rate=config.learning_rate).minimize(dssim_loss)

    # 保存学习率／loss值至tensorboard
    with tf.device('/cpu:0'):
        with tf.name_scope('losses'):
            tf.summary.scalar('l1_loss', l1_loss)
            tf.summary.scalar('dssim_loss', dssim_loss)
        with tf.name_scope('images'):
            tf.summary.image('gt_image', gt_image, 1)
            tf.summary.image('pred_image', pred_image, 1)

    init = tf.global_variables_initializer()

    total_step = 0
    merged_summary_op = tf.summary.merge_all()

    with tf.Session() as sess:
        summary_writer = tf.summary.FileWriter(config.log_dir, sess.graph)
        
        sess.run(init)
        try:
            while True:
                total_step += 1
                _, l1_loss_output, dssim_loss_output = sess.run([op, l1_loss, dssim_loss])

                print("step: {:d}, l1_loss: {:.4f}, dssim_loss: {:.4f}".format(total_step, l1_loss_output, dssim_loss_output))

                if total_step % 100 == 0:
                    summary_str = sess.run(merged_summary_op)
                    summary_writer.add_summary(summary_str, total_step)

        except tf.errors.OutOfRangeError:
            print("end!")

Mnist样例

# coding-utf-8
from __future__ import absolute_import, division, print_function

import tensorflow as tf
from tensorflow.keras import Model, layers, Input
import numpy as np

# MNIST dataset parameters.
num_classes = 10  # total classes (0-9 digits).

# Training parameters.
learning_rate = 0.001
training_steps = 200
batch_size = 128
display_step = 10

# Network parameters.
conv1_filters = 32  # number of filters for 1st conv layer.
conv2_filters = 64  # number of filters for 2nd conv layer.
fc1_units = 1024  # number of neurons for 1st fully-connected layer.

# Prepare MNIST data.
from tensorflow.keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
# Convert to float32.
x_train, x_test = np.array(x_train, np.float32), np.array(x_test, np.float32)
x_train = np.reshape(x_train, [-1, 28, 28, 1])
x_test = np.reshape(x_test, [-1, 28, 28, 1])
# Normalize images value from [0, 255] to [0, 1].
x_train, x_test = x_train / 255., x_test / 255.

# Use tf.data API to shuffle and batch data.
train_data = tf.data.Dataset.from_tensor_slices((x_train, y_train))
train_data = train_data.repeat().shuffle(5000).batch(batch_size).prefetch(1)
iterator = train_data.make_one_shot_iterator()
batch_x, batch_y = iterator.get_next()

class ConvNetModel:
    def __init__(self):
        self.model = self.build_model()

    def build_model(self):
        input = Input(shape=(28, 28, 1))
        conv1 = layers.Conv2D(32, kernel_size=5, activation=tf.nn.relu)(input)
        maxpool1 = layers.MaxPool2D(2, strides=2)(conv1)
        conv2 = layers.Conv2D(64, kernel_size=3, activation=tf.nn.relu)(maxpool1)
        maxpool2 = layers.MaxPool2D(2, strides=2)(conv2)
        flatten = layers.Flatten()(maxpool2)
        fc1 = layers.Dense(1024)(flatten)
        dropout = layers.Dropout(rate=0.5)(fc1)
        out = layers.Dense(num_classes)(dropout)
        output = layers.Softmax()(out)
        model = Model(input, output)
        return model


# Cross-Entropy Loss.
# Note that this will apply 'softmax' to the logits.
def cross_entropy_loss(x, y):
    # Convert labels to int 64 for tf cross-entropy function.
    y = tf.cast(y, tf.int64)
    # Apply softmax to logits and compute cross-entropy.
    loss = tf.nn.sparse_softmax_cross_entropy_with_logits(labels=y, logits=x)
    # Average loss across the batch.
    return tf.reduce_mean(loss)


# Accuracy metric.
def accuracy(y_pred, y_true):
    # Predicted class is the index of highest score in prediction vector (i.e. argmax).
    correct_prediction = tf.equal(tf.argmax(y_pred, 1), tf.cast(y_true, tf.int64))
    return tf.reduce_mean(tf.cast(correct_prediction, tf.float32), axis=-1)


pred_x = ConvNetModel().model(batch_x)
loss = cross_entropy_loss(pred_x, batch_y)
acc = accuracy(pred_x, batch_y)
op = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(loss)

init = tf.global_variables_initializer()
total_step = 0

with tf.Session() as sess:
    sess.run(init)
    try:
        while True:
            total_step += 1
            _, loss_val, accu = sess.run([op, loss, acc])
            print("step: {:d}, loss: {:.4f}, accuracy: {:.4f}".format(total_step, loss_val, accu))
    except tf.errors.OutOfRangeError:
        print("end!")

运行结果：

step: 1, loss: 2.3023, accuracy: 0.0859
step: 2, loss: 2.2705, accuracy: 0.2344
step: 3, loss: 2.2220, accuracy: 0.2578
step: 4, loss: 2.1468, accuracy: 0.5312
step: 5, loss: 2.0973, accuracy: 0.4062
step: 6, loss: 2.0508, accuracy: 0.4375
step: 7, loss: 2.0289, accuracy: 0.4453
step: 8, loss: 1.9723, accuracy: 0.5000
step: 9, loss: 2.0346, accuracy: 0.4297
step: 10, loss: 2.0422, accuracy: 0.4297
step: 11, loss: 2.0012, accuracy: 0.4609
step: 12, loss: 1.9324, accuracy: 0.5391
step: 13, loss: 1.8626, accuracy: 0.6172
step: 14, loss: 1.7589, accuracy: 0.7031
step: 15, loss: 1.8898, accuracy: 0.5703
step: 16, loss: 1.8466, accuracy: 0.6172
step: 17, loss: 1.8487, accuracy: 0.6172
step: 18, loss: 1.8434, accuracy: 0.6172
step: 19, loss: 1.7937, accuracy: 0.6875
step: 20, loss: 1.8203, accuracy: 0.6406
step: 21, loss: 1.8235, accuracy: 0.6484
step: 22, loss: 1.7536, accuracy: 0.7266
step: 23, loss: 1.7713, accuracy: 0.6953
step: 24, loss: 1.7537, accuracy: 0.7109
step: 25, loss: 1.7089, accuracy: 0.7578
step: 26, loss: 1.7639, accuracy: 0.7344
step: 27, loss: 1.7464, accuracy: 0.7344
step: 28, loss: 1.6542, accuracy: 0.8125
step: 29, loss: 1.6519, accuracy: 0.8203
step: 30, loss: 1.6816, accuracy: 0.7891
step: 31, loss: 1.6821, accuracy: 0.7891
step: 32, loss: 1.6792, accuracy: 0.8047
step: 33, loss: 1.6346, accuracy: 0.8438
step: 34, loss: 1.6700, accuracy: 0.7969
step: 35, loss: 1.6359, accuracy: 0.8281
step: 36, loss: 1.6499, accuracy: 0.8281
step: 37, loss: 1.7028, accuracy: 0.7656
step: 38, loss: 1.6700, accuracy: 0.8203
step: 39, loss: 1.6087, accuracy: 0.8672
step: 40, loss: 1.6350, accuracy: 0.8359
step: 41, loss: 1.6506, accuracy: 0.8125
step: 42, loss: 1.5777, accuracy: 0.8906
step: 43, loss: 1.7081, accuracy: 0.7578
step: 44, loss: 1.6700, accuracy: 0.8047
step: 45, loss: 1.6723, accuracy: 0.7969
step: 46, loss: 1.6433, accuracy: 0.8281
step: 47, loss: 1.6298, accuracy: 0.8359
step: 48, loss: 1.6164, accuracy: 0.8516
step: 49, loss: 1.6247, accuracy: 0.8438
step: 50, loss: 1.6171, accuracy: 0.8516
step: 51, loss: 1.6380, accuracy: 0.8281
step: 52, loss: 1.6719, accuracy: 0.7969
step: 53, loss: 1.6347, accuracy: 0.8281
step: 54, loss: 1.6705, accuracy: 0.7969
step: 55, loss: 1.6123, accuracy: 0.8516
step: 56, loss: 1.6299, accuracy: 0.8438
step: 57, loss: 1.5959, accuracy: 0.8594
step: 58, loss: 1.6347, accuracy: 0.8281
step: 59, loss: 1.6353, accuracy: 0.8359
step: 60, loss: 1.6121, accuracy: 0.8516
step: 61, loss: 1.6430, accuracy: 0.8125
step: 62, loss: 1.5951, accuracy: 0.8750
step: 63, loss: 1.5636, accuracy: 0.8984
step: 64, loss: 1.5945, accuracy: 0.8672
step: 65, loss: 1.5843, accuracy: 0.8750
step: 66, loss: 1.5627, accuracy: 0.9141
step: 67, loss: 1.5937, accuracy: 0.8750
step: 68, loss: 1.5360, accuracy: 0.9297
step: 69, loss: 1.5525, accuracy: 0.9141
step: 70, loss: 1.5528, accuracy: 0.9062
step: 71, loss: 1.5281, accuracy: 0.9453
step: 72, loss: 1.5312, accuracy: 0.9375
step: 73, loss: 1.5468, accuracy: 0.9141
step: 74, loss: 1.5668, accuracy: 0.8984
step: 75, loss: 1.5466, accuracy: 0.9219
step: 76, loss: 1.5354, accuracy: 0.9297
step: 77, loss: 1.5417, accuracy: 0.9141
step: 78, loss: 1.5656, accuracy: 0.8984
step: 79, loss: 1.5551, accuracy: 0.9062
step: 80, loss: 1.5206, accuracy: 0.9609
step: 81, loss: 1.5277, accuracy: 0.9375
step: 82, loss: 1.5434, accuracy: 0.9219
step: 83, loss: 1.5292, accuracy: 0.9297
step: 84, loss: 1.5626, accuracy: 0.8984
step: 85, loss: 1.5683, accuracy: 0.8906
step: 86, loss: 1.5686, accuracy: 0.8984
step: 87, loss: 1.5540, accuracy: 0.8984
step: 88, loss: 1.5302, accuracy: 0.9453
step: 89, loss: 1.5269, accuracy: 0.9453
step: 90, loss: 1.5437, accuracy: 0.9141
step: 91, loss: 1.5567, accuracy: 0.9062
step: 92, loss: 1.5158, accuracy: 0.9453
step: 93, loss: 1.5019, accuracy: 0.9688
step: 94, loss: 1.5278, accuracy: 0.9453
step: 95, loss: 1.5304, accuracy: 0.9453
step: 96, loss: 1.5344, accuracy: 0.9297
step: 97, loss: 1.5245, accuracy: 0.9375
step: 98, loss: 1.5200, accuracy: 0.9453
step: 99, loss: 1.5154, accuracy: 0.9531
step: 100, loss: 1.5135, accuracy: 0.9453

问题汇总

动态学习率

Keras的训练测试模式

保存读取模型

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
深度学习：怎么看pth文件的参数奥利给少年深度学习人工智能
.pth文件是PyTorch模型的权重文件，它通常包含了训练好的模型的参数。要查看或使用这个文件，你可以按照以下步骤操作：1.确保你有模型的定义你需要有创建这个.pth文件时所用的模型的代码。这意味着你需要有模型的类定义和架构。2.加载模型权重使用PyTorch的load_state_dict方法来加载权重。这里是如何操作的：importtorchimporttorch.nnasnn#定义模型结构
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
如何有效的学习AI大模型？ Python程序员罗宾学习人工智能语言模型自然语言处理架构
学习AI大模型是一个系统性的过程，涉及到多个学科的知识。以下是一些建议，帮助你更有效地学习AI大模型：基础知识储备：数学基础：学习线性代数、概率论、统计学和微积分等，这些是理解机器学习算法的数学基础。编程技能：掌握至少一种编程语言，如Python，因为大多数AI模型都是用Python实现的。理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程牙牙要健康深度学习 onnx onnxruntime 深度学习 python 人工智能
【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程提示:博主取舍了很多大佬的博文并亲测有效,分享笔记邀大家共同学习讨论文章目录【深度学习】【OnnxRuntime】【Python】模型转化、环境搭建以及模型部署的详细教程前言模型转换--pytorch转onnxWindows平台搭建依赖环境onnxruntime调用onnx模型ONNXRuntime推理核
基于深度学习的多模态信息检索 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的多模态信息检索（MultimodalInformationRetrieval,MMIR）是指利用深度学习技术，从包含多种模态（如文本、图像、视频、音频等）的数据集中检索出满足用户查询意图的相关信息。这种方法不仅可以处理单一模态的数据，还可以在多种模态之间建立关联，从而更准确地满足用户需求。1.多模态信息检索的挑战异构数据表示：多模态数据通常具有不同的特征和表示形式（如文本的词嵌入与图
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s