深度学习笔记——深度学习框架TensorFlow(十)[Creating Estimators in tf.contrib.learn]

Creating Estimators in tf.contrib.learn

tf.contrib.learn框架通过其高级别的Estimator API可以轻松构建和训练机器学习模型。 Estimator提供可以实例化的类，以快速配置常见的模型类型，如回归和分类器：

LinearClassifier：构建线性分类模型
LinearRegressor：构建线性回归模型
DNNClassifier：构建神经网络分类模型
DNNRegressor：构建神经网络回归模型

但是，如果tf.contrib.learn的预定义模型类型中没有一个满足您的需求呢？您可能需要对模型配置进行更精细的控制，例如自定义用于优化的损耗功能的能力，或为每个神经网络层指定不同的激活功能。或者也许您正在实施排名或推荐系统，分类器和回归算法都不适合生成预测。

本教程将介绍如何使用tf.contrib.learn中提供的构建块来创建自己的Estimator，它将基于物理测量来预测宝石的年龄。您将学习如何执行以下操作：

实例化一个Estimator
构建一个自定义模型函数
使用tf.contrib.layers配置一个神经网络
从tf.contrib.losses中选择一个合适的损失函数
为你的模型定义一个训练操作
生成并返回预测

Prerequisites

本教程假设您已经知道tf.contrib.learn API基础知识，例如功能列和fit（）操作。如果您以前从未使用过tf.contrib.learn，或需要进行复习，则应首先查看以下教程：

tf.contrib.learn Quickstart: Quick introduction to training a neural network using tf.contrib.learn.
TensorFlow Linear Model Tutorial: Introduction to feature columns, and an overview on building a linear classifier in tf.contrib.learn.

An Abalone Age Predictor

可以通过其壳上的环数量来估计鲍鱼（海螺）的年龄。然而，因为这个任务需要在显微镜下切割，染色和观察外壳，所以需要找到可以预测年龄的其他测量。

鲍鱼数据集包含以下鲍鱼功能数据：

简略描述：
Length：鲍鱼长度
Diameter：鲍鱼直径
Height：鲍鱼高度
Whole Weight：整个鲍鱼的重量（克）
Shucket Weight：鲍鱼肉重量（克）
Viscera Weight：鲍鱼肠重（克），出血后
Shell Weight：干鲍鱼壳重量（克）

预测的标签是环的数量，作为鲍鱼年龄的代理。

数据下载：

abalone_train.csv：http://download.tensorflow.org/data/abalone_train.csv
abalone_test.csv：http://download.tensorflow.org/data/abalone_test.csv
abalone_predict：http://download.tensorflow.org/data/abalone_predict.csv
完整代码：https://github.com/tensorflow/tensorflow/blob/r0.12/tensorflow/examples/tutorials/estimators/abalone.py

Loading Abalone CSV Data into TensorFlow Datasets

要将abalone数据集导入到模型中，您需要下载并将CSV加载到TensorFlow数据集中。首先，添加一些标准的Python和TensorFlow导入：

import tempfile
import urllib
import numpy as np
import tensorflow as tf
tf.logging.set_verbosity(tf.logging.INFO)

然后定义标志以允许用户通过命令行可选地指定用于训练，测试和预测数据集的CSV文件（默认情况下，文件将从tensorflow.org下载），并启用日志记录：

flags = tf.app.flags
FLAGS = flags.FLAGS
flags.DEFINE_string(
    "train_data",
    "",
    "Path to the test data.")
flags.DEFINE_string(
    "test_data",
    "",
    "Path to the test data.")
tf.logging.set_verbosity(tf.logging.INFO)

然后定义一个函数来加载CSV（从命令行选项中指定的文件或从tensorflow.org下载的文件）：

def maybe_download():
  """Maybe downloads training data and returns train and test file names."""
  if FLAGS.train_data:
    train_file_name = FLAGS.train_data
  else:
    train_file = tempfile.NamedTemporaryFile(delete=False)
    urllib.urlretrieve("http://download.tensorflow.org/data/abalone_train.csv", train_file.name)
    train_file_name = train_file.name
    train_file.close()
    print("Training data is downloaded to %s" % train_file_name)

  if FLAGS.test_data:
    test_file = tempfile.NamedTemporaryFile(delete=False)
    urllib.urlretrieve("http://download.tensorflow.org/data/abalone_test.csv", test_file.name)
    test_file_name = test_file.name
    test_file.close()
    print("Test data is downloaded to %s" % test_file_name)

  if FLAGS.predict_data:
    predict_file_name = FLAGS.predict_data
  else:
    predict_file = tempfile.NamedTemporaryFile(delete=False)
    urllib.urlretrieve("http://download.tensorflow.org/data/abalone_predict.csv", predict_file.name)
    predict_file_name = predict_file.name
    predict_file.close()
    print("Prediction data is downloaded to %s" % predict_file_name)

  return train_file_name, test_file_name, predict_file_name

最后，创建main（）并将鲍鱼的CSV加载到Datasets中：

def main(unused_argv):
  # Load datasets
  abalone_train, abalone_test, abalone_predict = maybe_download()

  # Training examples
  training_set = tf.contrib.learn.datasets.base.load_csv_without_header(
      filename=abalone_train,
      target_dtype=np.int,
      features_dtype=np.float64)

  # Test examples
  test_set = tf.contrib.learn.datasets.base.load_csv_without_header(
      filename=abalone_test,
      target_dtype=np.int,
      features_dtype=np.float64)

  # Set of 7 examples for which to predict abalone ages
  prediction_set = tf.contrib.learn.datasets.base.load_csv_without_header(
      filename=abalone_predict,
      target_dtype=np.int,
      features_dtype=np.float64)

if __name__ == "__main__":
  tf.app.run()

Instantiating an Estimator

当使用tf.contrib.learn提供的类之一（如DNNClassifier）定义模型时，可以在构造函数中提供所有配置参数，例如：

my_nn = tf.contrib.learn.DNNClassifier(feature_columns = [age,height,weight],
                                       hidden_units=[10,10,10],
                                       activation_fn=tf.nn.relu,
                                       dropout=0.2,
                                       n_classes = 3,
                                       optimizer = "Adam")

您不需要编写任何进一步的代码来指示TensorFlow如何训练模型，计算损失或返回预测;该逻辑已经被包裹到DNNClassifier中。

相比之下，当您从头开始创建自己的Estimator时，构造函数只接受模型配置，model_fn和params两个高级参数：

nn = tf.contrib.learn.Estimator(
    model_fn = model_fn,
    params = model_params)

model_fn:一个包含所有上述逻辑以支持training，evaluation和prediction的函数对象。您负责实现该功能。下一节，构建model_fn包括详细创建模型函数。

params：将被传递到model_fn的超参数（例如，学习率，缺省值）的可选指令。

注意：就像tf.contrib.learn的预定义的回归和分类器一样，Estimator初始化器也接受一般的配置参数model_dir和config。

对于鲍鱼年龄预测值，该模型将接受一个超参数：学习率。定义LEARNING_RATE作为代码开头的常量（以黑体突出显示），紧跟在日志记录配置之后：

tf.logging.set_verbosity(tf.logging.INFO)
# Learning rate for the model
LEARNING_RATE = 0.001

注意：这里，LEARNING_RATE设置为0.001，但您可以根据需要调整此值，以在模型训练期间获得最佳效果。

然后，将以下代码添加到main（）中，该代码创建包含学习率的键值对model_params并实例化Estimator：

#Set model params
model_params = {"learning_rate":LEARNING_RATE}
nn = tf.contrib.learn.Estimator(
    model_fn = model_fn,params = model_params
)

Constructing the model_fn

Estimator API模型函数的基本框架如下所示：

def model_fn(features,targets,mode,params):
    #Logic to do the following:
    #1. Configure the model via TensorFlow operations
    #2. Define the loss function for training/evaluation
    #3. Define the training operation/optimizer
    #4. Generrate predictions
    return predictions,loss,train_op

model_fn必须接收三个参数：

features：一个包含特征的键值对，通过fit()，evaluate()或者predict()传递给模型
targets：一个能包含labels的Tensor，通过fit()，evaluate()或者predict()传递给模型，传递给predict()时则为空，因为这些值是模型应该判断的。
mode：下列ModeKeys字符串值之一指示model_fn被调用的上下文：
- tf.contrib.learn.ModeKeys.TRAIN：在train模式下调用model_fn，例如通过fit（）调用。
- tf.contrib.lean.ModeKeys.EVAL：在evaluation模式下调用model_fn，例如，通过evaluate（）调用。
- tf.contrib.learn.ModeKeys.INFER：在inference模式中调用了model_fn，例如，通过一个predict（）调用。

model_fn也可以接受包含用于训练的超参数的参数的params参数（如上面的框架所示）。

该功能的主体执行以下任务（在以下部分中详细描述）：

配置模型 - 在这里，对于鲍鱼预测器，这将是一个神经网络。
定义损失函数，用于计算模型的预测与目标值的匹配程度。
定义训练操作，指定优化算法以最小化由损失函数计算的损失值。

最后，根据运行model_fn的模式，它必须返回以下三个值中的一个或多个值：

predictions（在INFER和EVAL模式中需要）：将您选择的关键名称映射到包含模型预测的Tensors的dict，例如：

predictions = {"results":tensor_of_predictions}

    - 在INFER模式中，从model_fn返回的dict将由predict()返回，因此您可以按照要使用的格式构造它。
    - 在EVAL模式下，由度量函数使用dict来计算度量。 传递给evaluate（）的metrics参数的任何MetricSpec对象必须具有与预测中的相应预测的键名称相匹配的prediction_key。

loss（在EVAL和TRAIN模式下需要），包含标量损失值的Tensor：在所有输入示例中计算出模型损失函数的输出（在模型的定义损失的后面更深入地讨论）。这在TRAIN模式下用于错误处理和记录，并在EVAL模式中自动包含为度量。
train_op：仅在train mode下被使用，表示training的一步操作

Configuring a neural network with tf.contrib.layers

构建神经网络需要创建和连接输入层，隐藏层和输出层。

输入层是一系列节点（一个用于模型中的每个特征），将接受传递给features参数中的model_fn的feature数据。如果feature包含所有特征数据的n维Tensor（如果x和y数据集直接传递给fit（），evaluate（）和predict（）），则可以用作输入层。如如果features通过输入函数，包含了传递给模型的feature columns字典，你可以使用tf.contrib.layers的input_from_feature_columns()函数，将其转换为一个输入层的tensor。

input_layer = tf.contrib.layers.input_from_feature_columns(columns_to_tensors=features,feature_columns = [age,height,weight])

如上所示，input_from_feature_columns（）需要两个必需的参数：

columns_to_tensors：将模型的FeatureColumns映射到包含相应功能数据的Tensors。这正是传递给feature参数中的model_fn的。
feature_columns。上述示例中的model-age，height和weight中的所有FeatureColumn列表。

然后，神经网络的输入层必须经由对前一层的数据执行非线性变换的激活函数连接到一个或多个隐藏层。最后的隐藏层然后连接到输出层，模型中的最后一层。 tf.contrib.layers为构建完全连接的层提供了以下便利功能：

relu(inputs, num_outputs)，使用ReLu激活功能（tf.nn.relu）创建一个完全连接到上一层输入的num_outputs节点：

hidden_layer = tf.contrib.layers.relu(inputs = input_layer,num_outputs = 10)

relu6(inputs,num_outputs)，使用ReLu 6激活功能（tf.nn.relu6）创建一个完全连接到上一层hidden_layer的num_outputs节点的层次：

second_hidden_layer = tf.contrib.layers.relu6(inputs = hidden_layer,num_outputs=20)

linear(inputs, num_outputs)，创建一个完全连接到上一层second_hidden_layer的num_outputs节点，没有激活功能，只需一个线性转换：

output_layer = tf.contrib.layers.linear(inputs=second_hidden_layer,num_output=3)

所有这些功能都是更通用的full_connected()函数的partial，可用于使用其他激活功能添加完全连接的图层，例如：

output_layer = tf.contrib.layers.fully_connected(inputs = second_hidden_layer,
                                                num_outputs=10,
                                                activation_fn = tf.sigmoid)

上面的代码创建了神经网络层output_layer，它完全连接到具有sigmoid激活函数
tf.sigmoid
的second_hidden_layer。有关TensorFlow中可用的预定义激活函数的列表，请参阅API文档。

将它们放在一起，以下代码为鲍鱼预测器构建完整的神经网络，并捕获其预测：

def model_fn(features,targets,mode,params):
"""model function for estimator"""
#Connect the first hidden layer to input layer with relu activation
first_hidden_layer = tf.contrib.layers.relu(features,10)
#Connect the second hidden layer to first hidden layer with relu
second_hidden_layer = tf.contrib.layers.relu(first_hidden_layer,10)
#Connect the output layer to second hidden layer(no activation fn)
output_layer = tf.contrib.layers.linear(second_hidden_layer,1)
#Reshape output layer to 1-dim Tensor to return predictions
predictions = tf.reshape(output_layer,[-1])
predictions_dict = {"age",predictions}

在这里，由于您将通过x和y参数将abalone数据集直接传递给fit（），evaluate（）和predict（），所以输入层是feature Tensor传递给model_fn。网络包含两个隐藏层，每层有10个节点和一个ReLu激活功能。输出层不包含激活函数，并重新整形

Defining loss for the model

model_fn必须返回包含损失值的Tensor，它量化模型预测在训练和评估运行期间反映目标值的程度。 tf.contrib.losses模块提供了使用各种指标计算损失的便利功能，包括：

absolute_difference(predictions, targets)，使用absolute-differece formula绝对差分公式（也称为L1损失）计算损失。
log_loss(predictions,targets)，通过logistic loss forumula计算损失函数（通常应用在logistic regression中）
mean_squared_error(predictions, targets)，通过mean squared error使用均方误差（MSE;也称为L2损耗）。

以下示例使用mean_squared_error()为鲍鱼model_fn添加了损失定义：

def model_fn(features,targets,mode,params):
"""Model function for Estimator."""
#Connect the first hidden layer to input layer with relu activation
first_hidden_layer = tf.contrib.layers.relu(features,10)
#Connect the second hidden layer to first hidden layer with relu
second_hidden_layer = tf.contrib.layers.relu(first_hidden_layer.10)
#Connect the output layer to second hidden layer(no activation fn)
output_layer = tf.contrib.layers.linear(second_hidden_layer,1)
#Reshape output layer to 1-dim Tensor to return predictions
predictions = tf.reshape(output_layer,[-1])
predictions_dict = {"age",predictions}
#Calculate loss using mean squared error
loss = tf.contrib.losses.mean_squared_error(predictions,targets)

有关loss函数的完整列表，请参阅tf.contrib.loss的API文档，以及有关支持的参数和用法的更多详细信息。

Defining the training op for the model

training op定义了优化算法，TensorFlow在将模型拟合到训练数据时会使用的。通常在train时，目标是尽量减少损失。 tf.contrib.layers API提供了一个函数optimize_loss，该函数返回一个可以做到这一点的训练操作。 optimize_loss有四个必需的参数：

loss：这个loss值可以被model_fn计算出来（参见Defining Loss for the Model）
global_step：整数变量表示每个模型训练运行的递增步数计数器。可以通过get_global_step()函数轻松地在TensorFlow中创建/增加
learning_rate：训练时优化算法使用的学习率（也称为步长）超参数。
optimizer：训练期间使用的优化算法。优化器可以接受以下任何字符串值，表示tf.contrib.layers.optimizer中预定义的优化算法：
- SGD: 实现随机梯度下降算法（tf.GradientDescentOptimizer1）
- Adagrad：实现AdaGrad optimization algorithm(tf.train.AdagradOptimizer)
- Ftrl：实现FTRL-Proximal算法（tf.train.FtrlOptimizer）
- Momentum：实现随机梯度下降动量(tf.train.MomentumOptimizer)
- RMSProp：实现RMSprop算法(tf.train.RMSPropOptimizer)
  注意：optimize_loss函数支持额外的可选参数，以进一步配置优化器，例如实现衰减。有关更多信息，请参阅API文档。

以下代码使用在定义模型的损失中计算的损失值，传递给params中的函数的学习速率和SGD优化器来定义鲍鱼model_fn的训练操作。对于global_step，tf.contrib.framework中的方便函数get_global_step()负责生成一个整数变量：

train_op = tf.contrib.layers.optimize_loss(
                    loss = loss,
                    global_step = tf.contrib.framework.get_global_step(),
                    learning_rate=params["learning_rate"],
                    optimizer="SGD")

The complete abalone model_fn

这是鲍鱼年龄预测器的最终完整的model_fn。以下代码配置神经网络; 定义损失和训练操作; 并返回predictions_dict，loss和train_op：

def model_fn(features,targets,mode,params):
"""Model function for Estimator."""
#Connect the first hidden layer to input layer with relu activation
first_hidden_laye = tf.contrib.layers.relu(features,10)
#Connect the second hidden layer to first hidden layer with relu
second_hidden_layer = tf.contrib.layers.relu(first_hidden_layer,10)
#Connet the output layer to second hidden layer(no activation fn)
output_layer = tf.contrib.layers.linear(second_hidden_layer,1)
#Reshape output layer to 1-dim Tensor to return predictions
predictions = tf.reshape(output_layer,[-1])
predictions_dict = {"ages":predictions}
#Calculate loss using mean squared error
loss = tf.contrib.losses.mean_squared_error(predictions,targets)
train_op = tf.contrib.layers.optimize_loss(
        loss = loss,
        global_step = tf.contrib.framework.get_global_step(),
        learning_rate = params["learning_rate"],
        optimizer = "SGD")
return predictions_dict,loss,train_op

Running the Abalone Model

您已经为鲍鱼预测器实例化了一个Estimator，并在model_fn中定义了它的行为; 剩下的一切就是训练，评估和预测。

将以下代码添加到main（）的末尾以适应神经网络的训练数据并评估准确性：

#Fit
nn.fit(x=training_set.data,y=training_set.target,steps = 5000)
#Score accuracy
ev = nn.evaluate(x = test_set.data,y = test_set.target,steps = 1)
loss_score = ev["loss"]
print("Loss:%s"%loss_score)

接下来你会得到下面的输出：

...
INFO:tensorflow:loss = 4.86658, step = 4701
INFO:tensorflow:loss = 4.86191, step = 4801
INFO:tensorflow:loss = 4.85788, step = 4901
...
INFO:tensorflow:Saving evaluation summary for 5000 step: loss = 5.581
Loss: 5.581

报告的损失分数是在ABALONE_TEST数据集上运行时从model_fn返回的均方误差。

要预测ABALONE_PREDICT数据集的年龄，请将以下内容添加到main()：

#Print out predictions
predictions = nn.predict(x=prediction_set.data,as_iterable = True)
for i,p in enumerate(predictions):
    print("Prediction %s: %s"%(i+1,p["ages"]))

在这里，predict（）函数将结果作为一个迭代返回预测。 for循环枚举并打印出结果。重新运行代码，您应该看到类似于以下内容的输出：

Prediction 1: 4.92229
Prediction 2: 10.3225
Prediction 3: 7.384
Prediction 4: 10.6264
Prediction 5: 11.0862
Prediction 6: 9.39239
Prediction 7: 11.1289

Additional Resources

恭喜！您已经从头开始成功构建了一个tf.contrib.learn Estimator。有关构建估计器的其他参考资料，请参阅API文档的以下部分：

Estimators
Layers
Losses
Optimization

阿里巴巴DIN模型原理与Python实现 eso1983 python 开发语言算法推荐算法
阿里巴巴的DeepInterestNetwork(DIN)是一种用于点击率预测（CTR）的深度学习模型，特别针对电商场景中用户兴趣多样化和动态变化的特性设计。其核心思想是通过注意力机制动态捕捉用户历史行为中与当前候选商品相关的兴趣。1.DIN模型原理1.核心问题传统推荐模型（如Embedding+MLP）将用户历史行为视为固定长度的向量，忽略了用户兴趣的多样性。例如，用户历史行为中可能包含多个互不
月之暗面改进并开源了 Muon 优化算法，对行业有哪些影响？互联网之路. 知识点开源算法
互联网各领域资料分享专区(不定期更新)：Sheet正文月之暗面团队改进并开源的Muon优化算法在深度学习和大模型训练领域引发了广泛关注，其核心创新在于显著降低算力需求（相比AdamW减少48%的FLOPs）并提升训练效率，同时通过开源推动技术生态的共建。1.显著降低大模型训练成本，推动技术普惠算力需求锐减：Muon通过引入权重衰减和一致的RMS更新，解决了原始Muon在大规模训练中的稳定性问题，使
Spring Boot 动态配置数据源全解析 ♢.＊ spring boot 后端 java
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！引言在企业级应用开发中，单一数据源往往
深入解析：如何编写 Mapper 文件 ♢.＊ oracle 数据库 mybatis
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在软件开发尤其是涉及数据库交互的项目中
Spring Boot 中 @Transactional 注解全面解析 ♢.＊ spring boot 数据库 sql
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！引言在企业级应用开发中，数据的一致性和
深度学习模型优化与医疗诊断应用突破智能计算研究中心其他
内容概要近年来，深度学习技术的迭代演进正在重塑医疗诊断领域的实践范式。随着PyTorch与TensorFlow等开源框架的持续优化，模型开发效率显著提升，为医疗场景下的复杂数据处理提供了技术基座。当前研究聚焦于迁移学习与模型压缩算法的协同创新，通过复用预训练模型的泛化能力与降低计算负载，有效解决了医疗数据样本稀缺与硬件资源受限的痛点问题。与此同时，自适应学习机制通过动态调整网络参数更新策略，在病理
阿里云服务器的作用腾云服务器阿里云服务器云计算
使用阿里云服务器能做什么？大家都知道可以用来搭建网站、数据库、机器学习、Python爬虫、大数据分析等应用，阿里云服务器网来详细说下使用阿里云服务器常见的玩法以及企业或个人用户常见的使用场景：玩转阿里云服务器使用阿里云服务器最常见的应用就是用来搭建网站，例如个人博客、企业网站等；除了搭建网站还可以利用阿里云GPU服务器搭建机器学习和深度学习等AI应用；使用阿里云大数据类型云服务器做数据分析；利用云
阿里云人工智能与机器学习 HaoHao_010 阿里云云服务器云计算服务器
阿里云的人工智能（AI）与机器学习（ML）服务为企业提供了全面的AI解决方案，帮助用户在多个行业实现数据智能化，提升决策效率，推动业务创新。阿里云通过先进的技术和丰富的工具，支持用户开发、部署和管理AI应用。以下是阿里云在人工智能和机器学习方面的主要产品与服务：1.云上机器学习平台—PaaS服务PAI(PlatformforAI)PAI是阿里云推出的人工智能平台，提供一系列机器学习与深度学习工具和
AI探索笔记：浅谈人工智能算法分类安意诚Matrix 机器学习笔记人工智能笔记
人工智能算法分类这是一张经典的图片，基本概况了人工智能算法的现状。这张图片通过三个同心圆展示了人工智能、机器学习和深度学习之间的包含关系，其中人工智能是最广泛的范畴，机器学习是其子集，专注于数据驱动的算法改进，而深度学习则是机器学习中利用多层神经网络进行学习的特定方法。但是随着时代的发展，这张图片表达得也不是太全面了。我更喜欢把人工智能算法做如下的分类：传统机器学习算法-线性回归、逻辑回归、支持向
VQ-Diffusion 深度解析与实战指南晏灵昀Odette
VQ-Diffusion深度解析与实战指南VQ-Diffusion项目地址:https://gitcode.com/gh_mirrors/vqd/VQ-Diffusion1.项目介绍VQ-Diffusion是一个用于文本到图像合成的深度学习模型，基于矢量量化变分自编码器（VQ-VAE）和去噪扩散概率模型（DenoisingDiffusionProbabilisticModel）。该模型通过将DDP
【模块】AKConv卷积模块 dearr__ 扒网络模块深度学习人工智能
论文《AKConv:ConvolutionalKernelwithArbitrarySampledShapesandArbitraryNumberofParameters》1、作用AKConv旨在解决深度学习中标准卷积操作的两个固有限制：限定在局部窗口内，限制了从其他位置捕获信息的能力；卷积核固定大小，限制了对不同目标形状和大小的适应能力。这种新方法允许卷积核具有任意参数和采样形状，提供了一种灵活
DCMNet一种用于目标检测的轻量级骨干结构模型详解及代码复现清风AI 深度学习算法详解及代码复现深度学习机器学习计算机视觉人工智能算法目标检测
模型背景在深度学习技术快速发展的背景下，目标检测领域取得了显著进展。早期的手工特征提取方法如Viola-Jones和HOG逐渐被卷积神经网络（CNN）取代，其中AlexNet在2012年的ILSVRC比赛中表现突出，推动了CNN在计算机视觉中的广泛应用。然而，这些早期模型在精度和效率方面仍存在不足，尤其是在处理复杂场景和小目标时表现不佳。这为DCMNet等新型轻量化目标检测模型的出现提供了契机，旨
注意力机制（Attention Mechanism）详细分类与介绍 Jason_Orton 分类数据挖掘人工智能
注意力机制（AttentionMechanism）是近年来在深度学习中非常流行的一种技术，特别是在自然语言处理（NLP）、计算机视觉等任务中，具有显著的效果。它的核心思想是模仿人类在处理信息时的注意力分配方式，根据不同部分的重要性给予不同的关注程度。1.注意力机制的背景与动机在传统的深度学习模型（如RNN、CNN等）中，信息处理通常是按照固定的规则和结构进行的，模型对输入的各个部分给予相同的关注。
图神经网络：拓扑数据分析的新时代 Jason_Orton 神经网络数据分析人工智能
随着图数据的广泛应用，图神经网络（GraphNeuralNetwork,GNN）作为一种强大的深度学习工具，逐渐成为机器学习领域中的一颗新星。图数据在许多现实世界问题中无处不在，诸如社交网络、交通网络、分子结构、推荐系统等都可以被建模为图结构。图神经网络通过直接处理图结构数据，能够更好地捕捉节点之间的关系信息，从而在众多任务中展现出了优异的性能。本文将深入探讨图神经网络的基本原理、常见的算法、应用
智算中心的核心硬件是什么？ Imagination官方博客
本文来源：游方AI智算中心，作为人工智能时代的关键基础设施，其核心硬件的构成与性能直接影响着智能计算的效率与质量。以下是对智算中心核心硬件的详细阐述：一、AI芯片AI芯片是专门为加速人工智能计算而设计的硬件，能够与各种AI算法协同工作，满足对算力的极高需求。当前主流的AI加速计算芯片包括：1、GPU（图形处理器）GPU是智算中心的算力担当，其强大的并行计算能力使其在深度学习领域大放异彩。GPU芯片
AI之DeepSeek james二次元 AI 人工智能 AI DeepSeek
DeepSeek是一个开源的基于深度学习的搜索引擎，用于在大规模数据中进行高效的内容检索和相似度搜索。它利用深度学习技术，特别是嵌入（embedding）技术，以改进传统搜索引擎中基于关键词的匹配方式，能够对复杂的查询和内容进行更精确和智能的理解。DeepSeek主要侧重于基于语义的搜索，通过将数据（例如文本、图像、音频等）转换为向量表示，来实现更为精准的相似度搜索。它的应用场景包括但不限于自然语
[AI] [ComfyUI]理解ComyUI的基本原理及其图像生成技术技术小甜甜 AI探索者人工智能 AI作画
ComyUI作为一种图像生成框架，其背后的核心技术基于潜在空间的概念，并通过各种深度学习模块实现高效的图像生成与本地部署。本文将详细探讨ComyUI的基本原理，涵盖其在图像生成中的关键概念，包括潜在空间、VAE模块、噪声处理以及CLIP编码器节点的作用。1.潜在空间的存在与生成效率什么是潜在空间？潜在空间（LatentSpace）是指数据压缩后的低维空间。在图像生成中，潜在空间的引入极大地提高了生
深度学习重要论文阅读笔记 ResNet （2025.2.26）北岛寒沫逐界星辰2025 计算机科研深度学习论文阅读笔记
文章目录问题背景数据预处理神经网络模型模型性能知识点积累英语单词积累问题背景随着神经网络变得更深（层数变多），模型的训练过程也会变得更加困难。当神经网络的深度增加，就会出现梯度消失和梯度下降现象，妨碍模型的收敛。不过，这种情况可以通过归一化的模型初始化和中间的归一化层基本解决。但是，尽管在增加了归一化技术的情况下很深的神经网络可以收敛，又出现了另外一个问题，即随着模型深度的增加，模型的准确率反而下
大模型最新面试题系列：深度学习基础（二）人肉推土机大模型最新面试题集锦大全 AI编程人工智能 pytorch python 面试
21.解释模型容量与过拟合的关系，如何在理论上平衡两者？模型容量与过拟合的关系模型容量指的是模型能够学习的复杂模式的能力，通常与模型的参数数量、网络结构的复杂度等相关。过拟合是指模型在训练数据上表现很好，但在未见过的测试数据上表现不佳。当模型容量较低时，模型可能无法学习到数据中的复杂模式，导致欠拟合，即在训练集和测试集上的表现都较差。随着模型容量的增加，模型能够学习到更复杂的模式，在训练集上的表现
深度学习-自学手册谁用了尧哥这个昵称 AI 深度学习
人工智能机器学习神经网络前馈神经网络：没有回路的反馈神经网络：有回路的DNN深度神经网络CNN卷积神经网络RNN循环神经网络LSTM是RNN的一种，长短期记忆网络自然语言处理神经网络神经元-分类器Hebb学习方法，随机–类似SGD一篇神经网络入门BP反向传播，表示很复杂的函数/空间分布从最后一层往前调整参数，反复循环该操作y=a(wx+b)x输入y输出a激活函
53、深度学习-自学之路-自己搭建深度学习框架-14、使用自己的架构搭建一个通过学习模仿莎士比亚风格的2000次的文章。并且在关键层配有详细解释。小宇爱深度学习-自学之路深度学习人工智能神经网络自然语言处理 rnn
importnumpyasnpclassTensor(object):def__init__(self,data,autograd=False,creators=None,creation_op=None,id=None):self.data=np.array(data)self.autograd=autogradself.grad=Noneif(idisNone):self.id=np.rand
自然语言处理（Natural Language Processing, NLP）的主要应用及核心技术彬彬侠自然语言处理 NLP 自然语言处理
自然语言处理（NLP）是人工智能（AI）的一个重要分支，旨在让计算机能够理解、生成和处理人类语言。NLP在多个领域有着广泛的应用，并结合了多种先进的技术，包括机器学习（ML）、深度学习（DL）、统计模型以及规则方法。1.自然语言处理的主要应用1.1机器翻译（MachineTranslation,MT）应用场景：在线翻译：GoogleTranslate、DeepL、BaiduTranslate。跨语
DeepSeek 高阶应用技术详解（4） Evaporator Core #DeepSeek快速入门 DeepSeek进阶开发与应用 deepseek
1.引言在前三篇中，我们探讨了DeepSeek的基础功能、分布式训练、模型优化、模型解释性、超参数优化以及AutoML的应用。本篇将深入探讨DeepSeek在时间序列分析、图神经网络（GNN）和推荐系统中的应用。这些领域是深度学习的前沿方向，具有广泛的实际应用价值。2.DeepSeek在时间序列分析中的应用2.1时间序列分析简介时间序列分析是处理时间相关数据的重要技术，广泛应用于金融、气象、医疗等
用PyTorch玩转数据：从整理到“看图说话开心快乐幸福一家人 pytorch 人工智能 python
最近在实验室鼓捣深度学习项目，发现PyTorch的数据处理流程简直像搭乐高——每个模块都精准卡位。今天就把这套"厨房级"工具链拆解给大家看看，连我这种手残党都能轻松上手。01数据收纳术：你的专属AI管家想象你有一堆杂乱照片需要整理。PyTorch的Dataset类就像智能相册，只要定义好__getitem__（怎么找照片）和__len__（总共有多少张），它就能瞬间把你的数据码得整整齐齐。而Dat
模式识别课程设计：人脸识别背景与问题引入之问题描述 XLYcmy 模式识别网络安全人工智能课程设计模式识别人脸识别 PCA LLM
1.2问题描述通过之前的背景介绍可以知道人脸识别技术作为计算机视觉和模式识别领域的重要研究方向，已广泛应用于身份验证、安全监控、智能家居等多个领域。随着计算机硬件性能的不断提升和深度学习技术的成熟，人脸识别的精度和应用场景不断扩展。本研究设计了一种基于主成分分析（PCA）[7]和K-L变换的人脸识别系统，利用ORL人脸数据库作为数据源，对输入的人脸图像进行识别，并输出与其特征最相似的人脸。该系统的
深度学习模型大小与模型推理速度的探讨 ICUD 深度学习人工智能 python
**昨天看到了非常好的两篇文章想在此记录和保存，由于模型的实时推理包含很多方面的因素，因而也庆幸能有机会看到这样的文章。**参考大佬：https://zhuanlan.zhihu.com/p/411522457
用 PyTorch/TensorFlow 搭建简单全连接神经网络 gs80140 AI pytorch tensorflow 神经网络
目录用PyTorch/TensorFlow搭建简单全连接神经网络网络结构概述1.使用PyTorch构建网络2.使用TensorFlow构建网络总结用PyTorch/TensorFlow搭建简单全连接神经网络在本篇博客中，我们将介绍如何使用两大深度学习框架——PyTorch和TensorFlow，构建一个简单的全连接神经网络。该网络包含输入层、一个隐藏层和输出层，适合初学者理解神经网络的基本构建模块
Cassini_Network-Aware Job Schedulingin Machine Learning Clusters 一只积极向上的小咸鱼机器学习人工智能
这篇论文介绍了CASSINI，一种用于机器学习（ML）集群的网络感知作业调度器。研究背景背景介绍:这篇文章的研究背景是深度学习数据集和模型规模的不断增长，对高效GPU集群的需求日益增加。分布式机器学习训练工作负载的通信开销占据了训练迭代时间的很大一部分，而现有的ML调度器往往忽略了ML训练作业的通信模式。研究问题:该问题的研究目标是开发一种简单而有效的方法，能够在网络链路中高效地放置多个ML作业，
50、深度学习-自学之路-自己搭建深度学习框架-11、添加RNN递归神经网络层为了浮现RNN的神经网络使用框架。小宇爱深度学习-自学之路深度学习人工智能自然语言处理神经网络 rnn
importnumpyasnpclassTensor(object):def__init__(self,data,autograd=False,creators=None,creation_op=None,id=None):self.data=np.array(data)self.autograd=autogradself.grad=Noneif(idisNone):self.id=np.rand
52、深度学习-自学之路-自己搭建深度学习框架-13、对话预测功能，使用我们自己建的架构重写RNN预测网络,程序的详细解读。小宇爱深度学习-自学之路深度学习人工智能神经网络自然语言处理 rnn
importnumpyasnpclassTensor(object):def__init__(self,data,autograd=False,creators=None,creation_op=None,id=None):self.data=np.array(data)self.autograd=autogradself.grad=Noneif(idisNone):self.id=np.rand
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$