weixin_39618121

batch normalization的原理和作用_【推荐算法】Deep & Cross Network模型原理和实践...

1 算法背景

Deep & Cross Network是谷歌和斯坦福大学在2017年提出的用于Ad Click Prediction的模型，主要用在广告点击率预估方面，应用于推荐系统排序阶段。Deep & Cross Network(简称DCN)，顾名思义应该是包含两大块，Cross和Deep两个部分，依然还是围绕特征组合表示来做文章。

针对CTR任务中的特征组合问题，传统方法主要通过FM、FFM等算法针对低阶特征组合进行建模，没有考虑到高阶特征对于CTR任务的贡献。那么如何来挖掘出有效的高阶特征组合呢？我们很自然的想法，通过多层的神经网络去解决。2017年华为提出了DeepFM模型，同时训练FM模型和DNN模型，并将FM的隐向量作为DNN的输入，最后将两者并行处理，笔者在【推荐算法】DeepFM模型原理与实践一文中，对此作了详细的介绍，结合笔者的思考给出了基于tf2.0的实现。本文介绍的Deep & Cross Network模型也是为了实现更高阶的特征组合，但是它在特征输入后的Embedding层以及特征交互模块与DeepFM有所不同。

2 模型结构

batch normalization的原理和作用_【推荐算法】Deep & Cross Network模型原理和实践..._第1张图片

Deep & Cross Network模型结构

DCN模型结构比较简单，以一个嵌入和堆叠层(embedding and stacking layer)开始，接着并列连一个cross network和一个deep network，接着通过一个combination layer将两个network的输出进行组合。

2.1 嵌入(Embedding)和堆叠层(stacking)

这一层就是将离散特征embedding之后再flatten，然后与数值类型的特征合并在一起作为整个模型的输入，输入表示如下：

网上大部分文章在这一层的实现方式是：

输入层有三个输入：离散特征Index、离散特征onehot、连续数值型特征
对离散特征Index使用Embedding(n, em_dim)，获取所有特征的向量表示。[batch_size, n_cate_features, emb_dim]
将onehot特征[batch_size, n_cate_features]reshape为[batch_size, n_cate_features, 1]，然后与前面的embedding相乘得到当前这一组特征的embedding[batch_size, n_cate_features, emb_dim]
将当前这一组特征的embedding[batch_size, n_cate_features, emb_dim]flatten为[batch_size, n_cate_features*emb_dim]
将上述离散特征embedding与数值类型的特征[batch_size, n_numeric_features]concate起来作为整个模型的输入[batch_size, n_cate_features + n_numeric_features]

笔者对这一层的实现方式做了一点简化，听我慢慢道来。

什么是Embedding？

Embedding操作其实就是用一个矩阵和one-hot之后的输入相乘，也可以看成是一次查询(lookup)。这个Embedding矩阵跟网络中的其他参数是一样的，是需要随着网络一起学习的。

既然如此，咱们显式地初始化一个embedding矩阵，用自定义层实现即可，省去了离散特征Index的构造。分为四步：

第一步：初始化embedding矩阵

self.kernel = self.add_weight(name='cate_em_vecs',
                                      shape=(1, input_shape[1] * self.emb_dim),
                                      initializer='glorot_uniform',
                                      trainable=True)

等等，为啥kernel是一个[1, n_cate_features * emb_dim]的矩阵？难道不应该是[n_cate_features, emb_dim]么？因为迟早要和数值型输入concate，直接定义成一行的，免得reshape.

第二步：使用repeat_elements(x, rep=self.emb_dim, axis=1)将onehot型输入在第1维复制em_dim倍

x = K.repeat_elements(x, rep=self.emb_dim, axis=1)

第三步：将前两步的矩阵按元素相乘得到离散特征的embedding，[batch_size, n_cate_features*emb_dim]

第四步：将上述离散特征embedding与数值类型的特征[batch_size, n_numeric_features]concate起来作为整个模型的输入[batch_size, n_cate_features + n_numeric_features]

总体看起来，简洁了一丢丢。

2.2 交叉网络(Cross Network)

交叉网络的核心思想是以有效的方式应用显式特征交叉。交叉网络由交叉层组成，每个层具有以下公式：

其中:

是第和第层cross layers的输出；
是第层layer的weight和bias参数。注意这里是一个只有一列的矩阵

在完成一个特征交叉后，每个cross layer会将它的输入加回去，这里借鉴了残差网络的思想。相当于是在拟合该层输出和上一层输出的残差。

batch normalization的原理和作用_【推荐算法】Deep & Cross Network模型原理和实践..._第2张图片

可以看到，交叉网络的特殊结构使特征组合的阶数随着交叉层深度的增加而增大。相对于输入来说，一个层的cross network的cross feature的阶数为。如果用表示交叉层数，表示输入的维度，那么整个cross network的参数个数为：

从上式可以发现，复杂度是输入维度的线性函数。所以相比于deep network，cross network引入的复杂度微不足道。论文中表示，Cross Network之所以能够高效的学习组合特征，就是因为x0 * xT的秩为1，使得我们不用计算并存储整个的矩阵就可以得到所有的cross terms。

但是，正是因为cross network的参数比较少导致它的表达能力受限，为了捕捉高度非线性的相互作用，DCN并行的引入了Deep Network。

根据论文中的计算公式，笔者实现了一个crossLayer，代码如下：

class CrossLayer(keras.layers.Layer):
def __init__(self, **kwargs):
        self.cross_dense = keras.layers.Dense(1, use_bias=True)
        super(CrossLayer, self).__init__(**kwargs)

def call(self, inp, **kwargs):
        x0, xl = inp
if (K.ndim(x0) <= 2):
            x0 = x0[..., tf.newaxis]
if (K.ndim(xl) <= 2):
            xl = xl[..., tf.newaxis]
# [batch_size, n_features, 1] -> [batch_size, n_features, n_features]
        x0l = tf.matmul(x0, xl, transpose_b=True)
        out = self.cross_dense(x0l) + xl
        out = tf.reshape(out, (-1, out.shape[1]))
return out

def compute_output_shape(self, input_shape):
return (input_shape[0][0], input_shape[0][1])

主要分为4步：

将输入和reshape为[batch_size, n_features, 1]
计算，这一步使得特征形成了交互，示意图如下：
计算，这里其实就是相当于对进行一次Dense，再加上
将输出由[batch_size, n_features, 1]reshape为[batch_size, n_features]

2.3 Deep Network

这里就是朴实无华的多层Dense了，输入就是嵌入(Embedding)和堆叠层(stacking)的输出，这里就不多介绍了。

2.4 模型输出

最后将Cross和Deep两个部分的结果拼接起来加一层逻辑回归就是最终的模型输出：

self.concate_out = keras.layers.Concatenate(axis=-1, name="concate_out")
self.com_dense = keras.layers.Dense(1, activation="sigmoid")

self.combine_out = self.concate_out([xl, y_deep])
self.combine_out = self.com_dense(self.combine_out)
self.model = keras.Model([self.cate_inp, self.numeric_inp], self.combine_out)
self.model.compile(loss=keras.losses.binary_crossentropy,
                           optimizer="adam",
                           metrics=[keras.metrics.binary_accuracy, keras.metrics.Recall()])

2.5 模型整体结构和代码

dcn.py

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import backend as K


class CateEmbedding(keras.layers.Layer):
def __init__(self, emb_dim, **kwargs):
        self.emb_dim = emb_dim
        super(CateEmbedding, self).__init__(**kwargs)

def build(self, input_shape):
        self.kernel = self.add_weight(name='cate_em_vecs',
                                      shape=(1, input_shape[1] * self.emb_dim),
                                      initializer='glorot_uniform',
                                      trainable=True)

def call(self, x, **kwargs):
        x = K.repeat_elements(x, rep=self.emb_dim, axis=1)
return x * self.kernel

def compute_output_shape(self, input_shape):
return (input_shape[0], input_shape[1] * self.emb_dim)


class CrossLayer(keras.layers.Layer):
def __init__(self, **kwargs):
        self.cross_dense = keras.layers.Dense(1, use_bias=True)
        super(CrossLayer, self).__init__(**kwargs)

def call(self, inp, **kwargs):
        x0, xl = inp
if (K.ndim(x0) <= 2):
            x0 = x0[..., tf.newaxis]
if (K.ndim(xl) <= 2):
            xl = xl[..., tf.newaxis]
# [batch_size, n_features, 1] -> [batch_size, n_features, n_features]
        x0l = tf.matmul(x0, xl, transpose_b=True)
        out = self.cross_dense(x0l) + xl
        out = tf.reshape(out, (-1, out.shape[1]))
return out

def compute_output_shape(self, input_shape):
return (input_shape[0][0], input_shape[0][1])


class DeepCrossNetwork:
def __init__(self, n_cate_features, n_numeric_features, emb_dim, num_cross_layers, dnn_units=[8, 8, 8], rate=.2):
        self.cate_inp = keras.Input(shape=(n_cate_features,), name="cate_inp")
        self.numeric_inp = keras.Input(shape=(n_numeric_features,), name="numeric_inp")
        self.cate_emb_layer = CateEmbedding(emb_dim, name="cate_emb")
        self.concate_inp = keras.layers.Concatenate(axis=-1, name="concate_inp")
        self.cross_layers = [CrossLayer(name="cross_{}".format(i)) for i in range(num_cross_layers)]
# self.reshape = keras.layers.Reshape((n_cate_features + n_numeric_features,))
        self.dnn_layers = [keras.layers.Dense(units, activation="relu") for units in dnn_units]
        self.rate = rate
        self.concate_out = keras.layers.Concatenate(axis=-1, name="concate_out")
        self.com_dense = keras.layers.Dense(1, activation="sigmoid")

def build(self):
# (batch_size, n_cate_features) -> (batch_size, n_cate_features * emb_dim)
        cate_emb = self.cate_emb_layer(self.cate_inp)
# (batch_size, n_cate_features * emb_dim + n_numeric_featrues)
        inp = self.concate_inp([cate_emb, self.numeric_inp])
        xl = inp
for layer in self.cross_layers:
            xl = layer([inp, xl])
        y_deep = keras.layers.Dropout(self.rate)(inp)
for layer in self.dnn_layers:
            y_deep = layer(y_deep)
            y_deep = keras.layers.Dropout(self.rate)(y_deep)
        self.combine_out = self.concate_out([xl, y_deep])
        self.combine_out = self.com_dense(self.combine_out)
        self.model = keras.Model([self.cate_inp, self.numeric_inp], self.combine_out)
        self.model.compile(loss=keras.losses.binary_crossentropy,
                           optimizer="adam",
                           metrics=[keras.metrics.binary_accuracy, keras.metrics.Recall()])

结构图如下：

keras.utils.plot_model(dcn.model, "dcn.png", show_layer_names=True, show_shapes=True)

batch normalization的原理和作用_【推荐算法】Deep & Cross Network模型原理和实践..._第3张图片

dcn

3 案例实践：基于DCN预估电信用户流失

3.1 导入库

import tensorflow as tf
import tensorflow.keras.backend as K
from tensorflow import keras
import numpy as np
import pandas as pd
from dcn import DeepCrossNetwork

# 设置GPU显存动态增长
gpus = tf.config.experimental.list_physical_devices(device_type="GPU")
for gpu in gpus:
     tf.config.experimental.set_memory_growth(gpu, True)

3.2 输入数据处理

# 单值离散特征
single_discrete = ['gender', 'SeniorCitizen', 'Partner', 'Dependents', 'PhoneService', 'PaperlessBilling']
# 多值离散特征
multi_discrete = ['MultipleLines', 'InternetService', 'OnlineSecurity', 'OnlineBackup', 'DeviceProtection',
'TechSupport', 'StreamingTV', 'StreamingMovies', 'Contract', 'PaymentMethod']
# 连续数值特征
continuous = ["tenure", "MonthlyCharges", "TotalCharges"]

# 连续数值特征处理
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
data[continuous] = scaler.fit_transform(data[continuous])

multi_discrete_data = pd.get_dummies(data[multi_discrete], columns=multi_discrete)
data = pd.concat([data, multi_discrete_data], axis=1)
features = single_discrete + list(multi_discrete_data.columns) + continuous

# 划分训练集测试集
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(data[features], data["Churn"], 
                                                    test_size=.1, 
                                                    random_state=10, shuffle=True)

# 切分离散输入和连续数值型输入
X_train_discreete = X_train[single_discrete + list(multi_discrete_data.columns)]
X_train_continuous = X_train[continuous]
X_test_discreete = X_test[single_discrete + list(multi_discrete_data.columns)]
X_test_continuous = X_test[continuous]

# 洗牌、划分batch，转为可输入模型tensor，注意这里是多输入的模型，可用如下方式打包输入数据
train_dataset1 = tf.data.Dataset.from_tensor_slices((X_train_discreete.values, X_train_continuous.values))
train_dataset2 = tf.data.Dataset.from_tensor_slices(y_train.values)
train_dataset = tf.data.Dataset.zip((train_dataset1, train_dataset2)).shuffle(len(X_train)).batch(32)
test_dataset1 = tf.data.Dataset.from_tensor_slices((X_test_discreete.values, X_test_continuous.values))
test_dataset2 = tf.data.Dataset.from_tensor_slices(y_test.values)
test_dataset = tf.data.Dataset.zip((test_dataset1, test_dataset2)).batch(32)

3.3 建立模型

dcnal = DeepCrossNetwork(n_cate_features=37, 
                         n_numeric_features=3, 
                         emb_dim=8, 
                         num_cross_layers=2)
dcnal.build()
dcnal.model.summary()

#output:
Model: "model"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
==================================================================================================
cate_inp (InputLayer)           [(None, 37)]         0                                            
__________________________________________________________________________________________________
cate_emb (CateEmbedding)        (None, 296)          296         cate_inp[0][0]                   
__________________________________________________________________________________________________
numeric_inp (InputLayer)        [(None, 3)]          0                                            
__________________________________________________________________________________________________
concate_inp (Concatenate)       (None, 299)          0           cate_emb[0][0]                   
                                                                 numeric_inp[0][0]                
__________________________________________________________________________________________________
dropout (Dropout)               (None, 299)          0           concate_inp[0][0]                
__________________________________________________________________________________________________
dense_2 (Dense)                 (None, 8)            2400        dropout[0][0]                    
__________________________________________________________________________________________________
dropout_1 (Dropout)             (None, 8)            0           dense_2[0][0]                    
__________________________________________________________________________________________________
dense_3 (Dense)                 (None, 8)            72          dropout_1[0][0]                  
__________________________________________________________________________________________________
dropout_2 (Dropout)             (None, 8)            0           dense_3[0][0]                    
__________________________________________________________________________________________________
cross_0 (CrossLayer)            (None, 299)          300         concate_inp[0][0]                
                                                                 concate_inp[0][0]                
__________________________________________________________________________________________________
dense_4 (Dense)                 (None, 8)            72          dropout_2[0][0]                  
__________________________________________________________________________________________________
cross_1 (CrossLayer)            (None, 299)          300         concate_inp[0][0]                
                                                                 cross_0[0][0]                    
__________________________________________________________________________________________________
dropout_3 (Dropout)             (None, 8)            0           dense_4[0][0]                    
__________________________________________________________________________________________________
concate_out (Concatenate)       (None, 307)          0           cross_1[0][0]                    
                                                                 dropout_3[0][0]                  
__________________________________________________________________________________________________
dense_5 (Dense)                 (None, 1)            308         concate_out[0][0]                
==================================================================================================
Total params: 3,748
Trainable params: 3,748
Non-trainable params: 0

模型总共包含3748个待训练参数，训练集大小才6000，有点少。

dcnal.model.fit(train_dataset, epochs=20)

#output:
Train for 199 steps
Epoch 1/20
199/199 [==============================] - 3s 16ms/step - loss: 0.4868 - binary_accuracy: 0.7706 - recall: 0.3749
Epoch 2/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4233 - binary_accuracy: 0.7987 - recall: 0.5287
Epoch 3/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4196 - binary_accuracy: 0.8021 - recall: 0.5251
Epoch 4/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4170 - binary_accuracy: 0.8023 - recall: 0.5386
Epoch 5/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4153 - binary_accuracy: 0.8029 - recall: 0.5409
Epoch 6/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4176 - binary_accuracy: 0.8021 - recall: 0.5333
Epoch 7/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4150 - binary_accuracy: 0.8045 - recall: 0.5374
Epoch 8/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4172 - binary_accuracy: 0.8044 - recall: 0.5374
Epoch 9/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4163 - binary_accuracy: 0.8033 - recall: 0.5363 1s - loss: 0.4207 - bina
Epoch 10/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4152 - binary_accuracy: 0.8050 - recall: 0.5310
Epoch 11/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4154 - binary_accuracy: 0.8033 - recall: 0.5357
Epoch 12/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4147 - binary_accuracy: 0.8034 - recall: 0.5281
Epoch 13/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4144 - binary_accuracy: 0.8044 - recall: 0.5404
Epoch 14/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4176 - binary_accuracy: 0.8025 - recall: 0.5292
Epoch 15/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4149 - binary_accuracy: 0.8039 - recall: 0.5363
Epoch 16/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4144 - binary_accuracy: 0.8048 - recall: 0.5339
Epoch 17/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4166 - binary_accuracy: 0.8037 - recall: 0.5316
Epoch 18/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4176 - binary_accuracy: 0.8040 - recall: 0.5281
Epoch 19/20
199/199 [==============================] - 2s 12ms/step - loss: 0.4129 - binary_accuracy: 0.8042 - recall: 0.5322 0s - loss: 0.4188 - binary_a
Epoch 20/20
199/199 [==============================] - 3s 13ms/step - loss: 0.4130 - binary_accuracy: 0.8055 - recall: 0.5409

最终准确率在81%左右，召回率差不多54%，和DeepFM差不多，这里就不介绍调参工作了。

3.4 模型评估

loss, acc, recall = dcnal.model.evaluate(test_dataset)
loss, acc, recall

#output:
23/23 [==============================] - 0s 12ms/step - loss: 0.3805 - binary_accuracy: 0.8156 - recall: 0.4214
(0.3805022394972975, 0.81560284, 0.42138365)

验证集上准确率为80.3%，和训练集差不多，召回率为42.1%，有点过拟合了。

图片中的上采样，下采样和通道融合(up-sample, down-sample, channel confusion) 迪三 #图像处理_PyTorch 计算机视觉深度学习人工智能
前言以conv2d为例（即图片），Pytorch中输入的数据格式为tensor，格式为:[N,C,W,H,W]第一维N.代表图片个数，类似一个batch里面有N张图片第二维C.代表通道数，在模型中输入如果为彩色，常用RGB三色图，那么就是3维，即C=3。如果是黑白的，即灰度图，那么只有一个通道，即C=1第三维H.代表图片的高度，H的数量是图片像素的列数第四维W.代表图片的宽度，W的数量是图片像素的
如何从大型语言模型(LLM)流式响应 aehrutktrjk 语言模型 microsoft ajax python
引言随着大型语言模型(LLM)的不断发展,我们不仅能够获得高质量的文本生成结果,还可以实时观察模型生成文本的过程。流式响应允许我们以一种更加交互和动态的方式与LLM进行交互,这在某些应用场景中非常有用。在本文中,我们将探讨如何从LLM流式获取响应。基础知识在开始之前,我们需要了解一些基础概念。所有的LLM都实现了Runnable接口,该接口提供了一些默认实现的标准方法,如invoke、batch、
‌seq_len 不等于 hidden_size 难道不会报错吗，他们是一会事情吗 zhangfeng1133 python 人工智能开发语言 pytorch
seq_len与hidden_size在RNN中代表不同概念，不等不会报错‌。‌seq_len‌：序列长度，表示在处理数据时，每个批次（batch）中序列的长度。RNN网络会按照seq_len指定的长度进行循环计算‌1。‌hidden_size‌：隐藏层中隐藏神经元的个数，也是输出向量的长度。它决定了RNN网络中隐藏层的状态向量的维度‌12。在RNN的训练过程中，seq_len和hidden_si
Python实现梯度下降法闲人编程 python python 开发语言梯度下降算法优化
博客：Python实现梯度下降法目录引言什么是梯度下降法？梯度下降法的应用场景梯度下降法的基本思想梯度下降法的原理梯度的定义学习率的选择损失函数与优化问题梯度下降法的收敛条件Python实现梯度下降法面向对象的设计思路代码实现示例与解释梯度下降法应用实例：线性回归场景描述算法实现结果分析与可视化梯度下降法的改进版本随机梯度下降（SGD）小批量梯度下降（Mini-batchGradientDesce
‘float‘ object cannot be interpreted as an integer 多欢喜  深度学习进阶课程 error
今天写代码的时候遇到了新的问题：'float'objectcannotbeinterpretedasaninteger代码出错地方：forminibatch_indexinrange(num_training_batches):找到num_traininng_batches:num_training_batches=size(training_data)/mini_batch_size理论上感觉没
Unity3D GPUDriven渲染详解 Thomas_YXQ 开发语言 Unity3D 架构游戏 Unity
前言Unity3D中的GPUDriven渲染技术是一种通过最大化GPU的利用，减少CPU负担，从而提高渲染效率和帧率的方法。其核心思想是将更多的渲染任务转移到GPU上，充分利用现代图形硬件（显卡）的性能。以下是该技术的几个关键组件和它们的作用：对惹，这里有一个游戏开发交流小组，大家可以点击进来一起交流一下开发经验呀！1.BatchRendererGroup(BRG)BRG是Unity中用于批处理渲
华为eNSP常用命令整合-视图种类-划分vlan S+叮当猫华为网络智能路由器
视图种类和切换：三种视图①用户视图---默认状态下为用户视图，快捷键ctrl+z切换为用户视图②系统视图---[主机名]命令system-view进入系统视图，使用快捷键ctrl+z从系统视图切换回用户视图③接口视图---[主机名-接口名]在系统视图下，输入接口号，进入接口视图第一部分：划分vlan1.创建vlan：vlanbatch23---创建两个vlan，vlan1和vlan2（不要创建名字
获取视频长度 AI算法网奇 python基础 python 开发语言
fromdecordimportVideoReadersys.path.insert(0,'/home/model-server/dev/data_platform/processors')fromaestheticimportget_aesthetic_model,get_aesthetic_score_batch_queuefrommytools.utilsimportprint_with_t
ssm——整合，前端页面设计，分页 2401_86367399 面试辅导大厂内推前端 java 开发语言
empMapper.updateEmpById(m);}//用于批量的插入数据@TestpublicvoidinsertDeptByBATCH(){DeptMapperOCM=sqlSession.getMapper(DeptMapper.class);for(inti=0;iindex.jsp页面发送出查询信息列表的请求->EmpController来接受请求，然后查询出员工数据->跳转到lis
一维数组 list 呢，怎么转换成 (批次句子长度特征值 )三维向量 python pytorch lstm 编程人工智能 zhangfeng1133 python pytorch 人工智能数据挖掘
一、介绍对于一维数组，如果你想将其转换成适合深度学习模型（如LSTM）输入的格式，你需要考虑将其扩展为三维张量。这通常涉及到批次大小（batchsize）、序列长度（sequencelength）和特征数量（numberoffeatures）的维度。以下是如何将一维数组转换为这种格式的步骤：###1.确定维度-**批次大小（BatchSize）**：这是你一次处理的样本数量。-**序列长度（Seq
pytorch矩阵乘法 weixin_45694975 pytorch 深度学习神经网络
一、torch.bmminput1shape:(batch_size,seq1_len,emb_dim)input2shape:(batch_size,emb_dim,seq2_len)outputshape:(batch_size,seq1_len,seq2_len)注意：torch.bmm只适合三维tensor做矩阵运算特别地，torch.bmm支持tenso广播运算input1shape:(
【Python机器学习】循环神经网络（RNN）——传递数据并训练 zhangbin_237 Python机器学习机器学习 python rnn 人工智能开发语言深度学习神经网络
与其他Keras模型一样，我们需要向.fit()方法传递数据，并告诉它我们希望训练多少个训练周期（epoch）：model.fit(X_train,y_train,batch_size=batch_size,epochs=epochs,validation_data=(X_test,y_test))因为个人小电脑内存不足，所以吧maxlen参数改成了100重新运行。保存模型：model_struc
李沐55_循环神经网络RNN简洁实现——自学笔记 Rrrrrr900 rnn 深度学习神经网络 pytorch 循环神经网络 python 李沐
读取《时间机器》数据集!pipinstalld2l!pipinstall--upgraded2l==0.17.5#d2l需要更新importtorchfromtorchimportnnfromtorch.nnimportfunctionalasFfromd2limporttorchasd2lbatch_size,num_steps=32,35train_iter,vocab=d2l.load_da
Pytorch维度转换操作：view，reshape，permute，flatten函数详解 ghx3110 深度学习笔记 pytorch 维度转换操作
引言Pytorch中常见的维度转换函数有view,reshape,permute,flatten。本文将详细介绍这几个函数的作用与使用方式，并给出了具体的代码示例，希望能够帮助大家。常见的维度有四维：比如（batch,channel,height,width）；三维：比如（b,n,c）；二维：比如（h,w）。下面介绍如何使用上述函数进行维度之间的转换。1.view函数作用tensor.view()
pytorch计算网络参数量和Flops Mr_Lowbee PyTorch pytorch 深度学习人工智能
fromtorchsummaryimportsummarysummary(net,input_size=(3,256,256),batch_size=-1)输出的参数是除以一百万（/1000000）M，fromfvcore.nnimportFlopCountAnalysisinputs=torch.randn(1,3,256,256).cuda()flop_counter=FlopCountAna
linux多个sh 同时执行命令,sh, 批量执行Linux命令一颗橙子君 linux多个sh 同时执行命令
step1:创建一个sh批处理命令文件#vim/etc/batch_ssh/install_redis.shstep2：给当前用户，能够执行sh脚本权限#chmodinstall_redis.sh777step3:编写要批量执行的命令，read表示等待前端用户输入，sleep表示等待时间单位为秒。echo'\nbegintoinstall01plugin\n';yuminstallcpp-y;ec
比较Spark与Flink 傲雪凌霜，松柏长青大数据后端 spark flink 大数据
ApacheSpark和ApacheFlink都是目前非常流行的大数据处理引擎，但它们在架构、处理模式、应用场景等方面有一些显著的区别。下面是二者的对比：1.处理模式Spark:主要支持批处理（BatchProcessing），也能通过SparkStreaming处理流式数据，但SparkStreaming本质上是通过微批（micro-batching）的方式处理流数据，延迟相对较高。SparkS
大模型多机多卡脚本实例 - 增量预训练 -accelerate和deepspeed命令多机多卡训练有什么不同 AI生成曾小健大模型/增量预训练CPT 深度学习 python 机器学习
第一步，同步权重ls-l/data/xxx/gpu008/MoeRemake/train/etuning/LLaMA-Factory2/models/xxx-Base-10B-200k-Llama第二步，同步环境：./scp_batch.sh"/data/xxx/miniconda3/envs/etuning4/""/data/vayu/miniconda3/envs/etuning4/"gpu0
SQL进阶技巧：截止当前批次前的批次量与订单量 | 移动窗口问题莫叫石榴姐数字化建设通关指南 #SQL进阶实战技巧 sql 数据库大数据数学建模 hive 数据仓库数据分析
目录0场景描述1数据准备2问题分析3小结0场景描述表A有如下字段，userid(用户ID),batchid(批次ID),orderid(订单ID),createtime(创建时间),同一个用户ID下有多个批次,同一个批次下有多个订单ID,相同批次ID的创建时间是相同的，创建时间精确到了秒。统计，截止对应批次ID的时间点前，该用户下有多少个批次ID，有多少个订单ID，输出的字段应该为用户ID批次ID
【已解决】Halcon错误代码4104 聪明不喝牛奶深度学习 Halcon+CSharp halcon 深度学习
问题描述在运行的时候发现报错4104，如下图所示解决从字面上理解就是超出了计算机的内存空间了，那么着手解决的话就需要把没次训练的张数减少一些即可。去相对应的修改batch_size即可。结果如下图所示，正常在使用GPU训练。搞定，手工~
Java一分钟之-Spring Batch：批量处理框架 Jimaks 后端 java spring batch
在企业级应用开发中，批量数据处理是一项常见且关键的任务，它涉及到大规模数据的导入、导出、转换等操作。SpringBatch，作为Spring家族的一员，专为此类需求设计，提供了一套强大且灵活的批处理框架。本文旨在深入浅出地介绍SpringBatch的基础、常见问题、易错点及其规避策略，并配以实用的代码示例，帮助开发者高效利用这一工具。SpringBatch简介SpringBatch旨在简化批量处理
Python请求数据,r = response.json(),提取字段报TypeError: list indices must be integers or slices, not str[已解决] qq_41845402 python json 开发语言
#encoding:utf-8r={"atomicElapsed":74,"data":{"pageCount":0,"pageData":[{"batchLock":0,"batchNo":"882211080000016","companyCode":"CRV","createTime":"2022-11-0818:44:11","crowdWorkerID":""}]},"hystrixEl
Kafka高性能揭秘 —— sequence IO、PageCache、SendFile的应用详解大数据学习与分享 Kafka kafka 大数据 java
大家都知道Kafka是将数据存储于磁盘的，而磁盘读写性能往往很差，但Kafka官方测试其数据读写速率能达到600M/s，那么为什么Kafka性能会这么高呢？首先producer往broker发送消息时，采用batch的方式即批量而非一条一条的发送，这种方式可以有效降低网络IO的请求次数，提升性能。此外这些批次消息会"暂存"在缓冲池中，避免频繁的GC问题。批量发送的消息可以进行压缩并且传输的时候可以
EFUtilities批量处理威威当爸了 SQL 前端服务器 javascript
nutgetEFUtilities批量插入 EFBatchOperation.For(con,con.SnPrints).InsertAll(snprintList);插量更新 using(Database.EF.Contextcon=newDatabase.EF.Context()) { varcc=con.SnPrints.Where(o=>o.Ser
自动安装第三方库python,python第三方库自动安装脚本杏仁菌子自动安装第三方库python
#python第三方库自动安装脚本，需要在cmd中运行此脚本#BatchInstall.pyimportoslibs={"numpy","matplotlib","pillow","sklearn","requests",\"jieba","beautifulsoup4","wheel","networkx","sympy",\"pyinstaller","django","flask","wer
YOLOv8模型参数详解 AdaCoding YOLOv8改进系列 YOLO 目标检测
YOLOv8模型参数详解task：任务类型，通常为detect（检测）。mode：模式，train表示训练模式。model：模型配置文件的路径，指定了YOLOv8模型的结构。data：数据集配置文件的路径，包含了训练集和验证集的信息。epochs：训练的轮数。patience：早期停止的耐心值，表示在没有进一步改进后多少轮后停止训练。batch：批处理大小，即每次前向和后向传播使用的样本数。img
十个常见的 Python 脚本 (详细介绍 + 代码举例) 途途途途 python spring 前端
1.批量重命名文件介绍:该脚本用于批量重命名指定目录下的文件，例如将所有".txt"文件重命名为".md"文件。import osdef batch_rename(directory, old_ext, new_ext): """批量重命名文件扩展名。 Args: directory: 要处理的目录路径。 old_ext: 要替换的旧扩展名。 new_ext: 要替换的新扩展名。
深度学习100问51:什么是mini-batch 不断持续学习ing 自然语言处理机器学习人工智能
嘿，你知道吗？在机器学习的奇妙世界里，有个超厉害的家伙叫mini-batch，它就像是一个小魔法包。想象一下，你有一个超级大的宝箱，里面装满了各种宝贝数据。但如果一下子把整个宝箱抬起来去训练模型，那可就太累啦，而且可能还会把电脑累趴下。这时候，mini-batch就闪亮登场啦！它从大宝箱里挑出一小部分宝贝，组成一个小魔法包。这个小魔法包有啥用呢？首先呀，它让计算变得轻松多啦！就好比你不用一次性搬起
语义分割训练精度计算南太湖小蚂蚁人工智能深度学习人工智能
语义分割训练的output结果一般是[batch_size,num_classes,width,height]这样的形式，而label的结果一般是[batch_size,width,height]，类似如下形状，outputs：[4,6,480,320]，而真值label：[4,480,320]。由于维度不同，无法直接比较，所以这两者要比较就要采取一点方法。output里面每个类型都有一个值，要取
DBUtils 框架的中batch批处理使用 qq_35866738
一、DBUtils框架的使用1、使用dbutils做增删改查，批处理以及大文本操作2、使用DBUtils框架管理事务。（模拟银行转账）二、使用JDBC操作多个表1、一对多（部门与员工）2、多对多（学生和老师学生与课程）3、一对一（人和身份证）三、关于Oracle数据对于二进制数据的存取（面试题）一、DBUitls框架的使用/***使用dbutils做增删改查批处理大文本操作*@author吕鹏**
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb