datamonday

LSTM 08：超详细LSTM调参指南

本文代码运行环境：

cudatoolkit = 10.1.243
cudnn = 7.6.5
tensorflow-gpu = 2.1.0
keras-gpu = 2.3.1

LSTM 01：理解LSTM网络及训练方法
LSTM 02：如何为LSTM准备数据
LSTM 03：如何使用Keras编写LSTM
LSTM 04：4种序列预测模型及Keras实现
LSTM 05：Keras实现多层LSTM进行序列预测
LSTM 06：Keras实现CNN-LSTM模型
LSTM 07：Keras实现Encoder-Decoder LSTM
LSTM 08：超详细LSTM调参指南

文章目录

相关文章
8. 如何诊断和调整LSTM
- 8.1 可靠地评估LSTM模型
- - 8.1.1 初学者易犯的错误
  - 8.1.2 评估模型性能
  - 8.1.3 评估随机模型的技巧
  - 8.1.4 神经网络有多不稳定？
  - 8.1.5 评估重复多少次？
- 8.2 诊断欠拟合和过拟合
- - 8.2.1 Keras中的实现
  - 8.2.2 Diagnostic Plots
  - 8.2.3 欠拟合
  - 8.2.4 较好拟合
  - 8.2.5 过拟合
  - 8.2.6 多次运行
- 8.3 调试问题方法
- - 8.3.1 数值缩放
  - 8.3.2 编码
  - 8.3.3 平稳性
  - 8.3.4 输入序列长度
  - 8.3.5 序列模型类型
- 8.4 调试模型架构
- - 8.4.1 架构（Architecture）
  - 8.4.2 记忆单元（Memory Cells）
  - 8.4.3 隐藏层（Hidden Layers）
  - 8.4.4 权重初始化（Weight Initialization）
  - 8.4.5 激活函数（Activation Functions）
- 8.5 调试学习行为
- - 8.5.1 优化算法（Optimization Algorithm）
  - 8.5.2 学习率（Learning Rate）
  - 8.5.3 批次大小（Batch Size）
  - 8.5.4 正则化（Regularization）
- 8.5.5 适时停止训练
- 8.6 拓展阅读

8. 如何诊断和调整LSTM

本文讨论了如何调整LSTM超参数。主要内容包括以下三部分：

如何对LSTM模型进行可靠的评估。
如何使用学习曲线诊断LSTM模型。
如何调整LSTM模型的问题框架，结构和学习行为。

8.1 可靠地评估LSTM模型

本小节，讨论了在不可见数据上对LSTM模型的进行可靠估计的过程。

8.1.1 初学者易犯的错误

一般流程是：训练模型适使其拟合 fit() 训练数据，在测试集上评估 evaluate() 模型，然后打印模型性能。也有使用 k-fold交叉验证（k-fold cross-validation）来评估模型，然后打印模型的技能。这都是初学者常犯的错误。

以上两种方法看起来是对的，但细想其实不然。有很关键的一点不得不注意：深度学习模型是随机的。诸如LSTM之类的人工神经网络在拟合数据集时有随机性，例如随机初始化权重和随机梯度下降期间每个epoch的数据都会随机打乱（shuffle）。这意味着每次将相同的模型拟合到相同的数据时，它可能会给出不同的预测，进而具有不同的总体表现。

8.1.2 评估模型性能

如果数据有限，需要通过评估找出性能最好的模型（调整超参数，使模型性能最好）。

将数据分成两部分，第一部分用来拟合模型或特定的模型配置，并使用拟合好的模型对第二部分进行预测，然后评估这些预测的性能。这被称为train-test split，模型的性能可以通过在新数据上的预测表现判断（泛化性能）。下面是拆分训练集测试集评估模型的伪代码：

train, test = random_split(data)
model = fit(train.X, train.y)
predictions = model.predict(test.X)
skill = compare(test.y, predictions)

如果数据集比较大或模型训练非常慢，那么训练集测试集分割是一个很好的方法，但是由于数据的随机性（导致模型引入方差），模型的性能得分会很高。这意味着同一模型对不同数据的拟合将给出不同的模型性能得分。如果计算资源充足，可以使用k-fold交叉验证。但在深度学习中使用大型数据集以及模型训练速度较慢，这通常是不太可行的。

8.1.3 评估随机模型的技巧

随机模型，如深层神经网络，增加了随机性操作（如随机初始化权重和随机梯度下降）。这种额外的随机性使模型在学习时具有更大的灵活性，但会使模型不太稳定（例如，在相同的数据上训练相同的模型会产生不同的结果）。这与在不同数据上训练同一模型时给出不同结果的模型方差不同。

为了得到一个可靠（鲁棒）的模型性能估计，必须考虑并且控制这个额外的方差来源。**一种可靠的方法是多次重复评估随机模型的实验。**可以参考如下伪代码：

scores = list()
for i in repeats:
	train, test = random_split(data)
	model = fit(train.X, train.y)
	predictions = model.predict(test.X)
	skill = compare(test.y, predictions)
	scores.append(skill)
final_skill = mean(scores)

8.1.4 神经网络有多不稳定？

这取决于模型要解决的问题、网络及其配置。可以使用多次（几十，几百或上千次）对同一数据计算同一模型，并且只改变随机数生成器，然后评估技能得分的平均值和标准差。标准差（分数与平均分的平均距离）能反映出模型有多不稳定。

8.1.5 评估重复多少次？

几十，几百或上千次不等，取决于时间和计算机资源的限制，随着次数增多，误差也在下降（比如标准差）。更严谨的做法是首先研究重复次数对估计模型性能的影响，以及标准差的计算（平均估计性能与实际总体平均值的差异有多大）。

8.2 诊断欠拟合和过拟合

本小节，讨论了如何通过绘制学习曲线图来诊断过拟合和欠拟合。

8.2.1 Keras中的实现

训练开始后，可以通过查看模型的性能来了解模型的许多行为。LSTM模型通过调用fit()函数进行训练。此函数返回一个名为.history的变量，该变量包含了在编译模型期间的损失，准确率。这些信息会在每个epoch训练结束之后打印。

如果fit方法中设置了validation_data=(testX, testy)参数，那么.history 返回一个有四个键值对的字典，包括训练集上的准确率'accuracy'，损失'loss'；验证集上的准确率'accuracy'，损失'val_loss'，相应的值是各项指标单值的列表。比如，训练5个epoch的返回值：

...
history = model.fit(trainX, trainy, 
                      epochs=epochs, 
                      batch_size=batch_size, 
                      verbose=verbose, 
                      validation_data=(testX, testy),
                      callbacks=[summary])
print("history.history:{}".format(history.history))

#输出：
history.history:{'loss': [0.6198216109203176, 0.22001621517898987, 0.14948655201184996, 0.12273854326955383, 0.12327274605550756], 
		'accuracy': [0.74428725, 0.91920567, 0.9428727, 0.953346, 0.95048964], 
		'val_loss': [0.5575803409279667, 0.4091062663836594, 0.39247380317769337, 0.3639399050404692, 0.3881000212997623], 
		'val_accuracy': [0.8187988, 0.8649474, 0.89650494, 0.8975229, 0.8982016]}

注意：在TensorFlow 1.x版本为后端的Keras中，model.fit() 返回的字典中的键为’acc’，‘loss’，‘val_acc’，‘val_loss’。在绘制图像的时候注意！

针对训练集验证集的划分，Keras还允许指定一个单独的验证数据集，同时拟合模型，该模型也可以使用相同的损失和度量进行评估。这可以通过在fit()中设置validation_split参数来完成，该参数使用部分训练数据作为验证数据集（用介于0.0和1.0之间数表示验证集比例）。

...
history = model.fit(X, Y, epochs=100, validation_split=0.33)

如果数据集已经将训练集和验证集划分，则可以通过设置validation data参数传递X和y数据集的元组来完成。例如在HAR分类任务中，valX表示数据，valY表示分类标签（0，类别数-1）。

history = model.fit(X, Y, epochs=100, validation_data=(valX, valY))

8.2.2 Diagnostic Plots

LSTM模型的训练日志可用于诊断模型的行为。可以使用Matplotlib库打印模型的性能。例如，可以按如下方式绘制训练损失与测试损失：

import matplotlib.pyplot as plt
...
history = model.fit(X, Y, epochs=100, validation_data=(valX, valY))
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('model train vs validation loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train','validation'], loc='upper right')
plt.show()

创建和查看这些图可以帮助了解可能要尝试的新配置，以便从模型中获得更好的性能。

8.2.3 欠拟合

欠拟合模型在训练数据集上表现良好，而在测试数据集上表现较差（泛化能力不好）。这可以从训练损失低于验证损失的图中诊断出来，并且验证损失有一个趋势，表明有可能进一步改进。下面提供了一个未完全拟合的LSTM模型的示例。

from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
import matplotlib.pyplot as plt
from numpy import array
# return training data
def get_train():
    seq = [[0.0, 0.1], [0.1, 0.2], [0.2, 0.3], [0.3, 0.4], [0.4, 0.5]]
    seq = array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((len(X), 1, 1))
    return X, y

# return validation data
def get_val():
    seq = [[0.5, 0.6], [0.6, 0.7], [0.7, 0.8], [0.8, 0.9], [0.9, 1.0]]
    seq = array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((len(X), 1, 1))
    return X, y

# define model
model = Sequential()
model.add(LSTM(10, input_shape=(1,1)))
model.add(Dense(1, activation='linear'))

# compile model
model.compile(loss='mse', optimizer='adam')

# fit model
X,y = get_train()
valX, valY = get_val()
history = model.fit(X, y, epochs=100, validation_data=(valX, valY), shuffle=False)

# plot train and validation loss
plt.figure(figsize=(8,8),dpi=200)
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('model train vs validation loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train','validation'], loc='upper right')
plt.show()

运行此示输出欠拟合模型特征的训练和验证损失。在这种情况下，可以增加训练epoch来提高性能。

或者，如果在训练集上的性能优于验证集并且训练和验证损失已趋于平稳，则模型可能不适合。下面是memory cell不足的不合适模型的示例。

运行此示例显示了显示未配置的欠适合模型的特征。在这种情况下，可以通过增加模型的容量（例如隐藏层中的内存单元数或隐藏层数）来提高性能。

两个示例脚本的对比：

训练和验证损失对比

8.2.4 较好拟合

运行该示例显示训练和验证损失。理想情况下，希望看到这样的模型性能，尽管在处理拥有大量数据的挑战性问题时，这可能是不可能的。

from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
import matplotlib.pyplot as plt
from numpy import array
# return training data
def get_train():
    seq = [[0.0, 0.1], [0.1, 0.2], [0.2, 0.3], [0.3, 0.4], [0.4, 0.5]]
    seq = array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((5, 1, 1))
    return X, y

# return validation data
def get_val():
    seq = [[0.5, 0.6], [0.6, 0.7], [0.7, 0.8], [0.8, 0.9], [0.9, 1.0]]
    seq = array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((len(X), 1, 1))
    return X, y

# define model
model = Sequential()
model.add(LSTM(10, input_shape=(1,1)))
model.add(Dense(1, activation='linear'))

# compile model
model.compile(loss='mse', optimizer='adam')

# fit model
X,y = get_train()
valX, valY = get_val()
history = model.fit(X, y, epochs=800, validation_data=(valX, valY), shuffle=False)

# plot train and validation loss
plt.figure(figsize=(8,8),dpi=200)
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('model train vs validation loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train','validation'], loc='upper right')
plt.show()

8.2.5 过拟合

过拟合模型是指训练集的性能良好并持续改善，而验证集的性能提高到一定程度后开始下降的模型。这可从曲线图中诊断出来，在该曲线图中，训练损失向下倾斜，验证损失向下倾斜，到达一个拐点，然后又开始向上倾斜。下面的示例演示了一个过拟合的LSTM模型。

from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
import matplotlib.pyplot as plt
from numpy import array
# return training data
def get_train():
    seq = [[0.0, 0.1], [0.1, 0.2], [0.2, 0.3], [0.3, 0.4], [0.4, 0.5]]
    seq = array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((5, 1, 1))
    return X, y

# return validation data
def get_val():
    seq = [[0.5, 0.6], [0.6, 0.7], [0.7, 0.8], [0.8, 0.9], [0.9, 1.0]]
    seq = array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((len(X), 1, 1))
    return X, y

# define model
model = Sequential()
model.add(LSTM(10, input_shape=(1,1)))
model.add(Dense(1, activation='linear'))

# compile model
model.compile(loss='mse', optimizer='adam')

# fit model
X,y = get_train()
valX, valY = get_val()
history = model.fit(X, y, epochs=1200, validation_data=(valX, valY), shuffle=False)

# plot train and validation loss
plt.figure(figsize=(8,8),dpi=200)
plt.plot(history.history['loss'][500:])
plt.plot(history.history['val_loss'][500:])
plt.title('model train vs validation loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train','validation'], loc='upper right')
plt.show()

运行此示例将显示过拟合模型的验证丢失中的特征拐点。这可能是训练轮数（epoch）过多导致的。在这种情况下，模型训练可以在拐点处停止。或者，增加训练实例的数量。

正好拟合与过拟合对比

8.2.6 多次运行

LSTM是随机的，这意味着每次运行都会得到不同的诊断图。可以多次重复诊断运行（例如5、10或30）。然后，可以绘制每次运行的训练和验证跟踪，以便对模型随时间变化的行为提供更可靠的概念。在绘制每次运行的列车轨迹和验证损失之前，下面的示例多次运行同一个实验。

图中，在5次训练过程中，欠拟合趋势仍然存在，这可能是需要增加训练轮数的一个更有力的理由。

8.3 调试问题方法

本节概述了在调整序列预测问题时要考虑的最大因素。

8.3.1 数值缩放

评估不同数据值缩放方案对模型性能的影响。记住更新第一个隐藏层和/或输出层上的激活函数，以处理作为输入提供或作为输出预测的值的范围。一些方案包括：

Normalize values.（归一化）
Standardize values.（标准化）

8.3.2 编码

评估不同值编码对模型性能的影响。标签序列，如字符或单词，通常是整数编码和one-hot编码。这是目前处理序列预测问题的常用的方法。编码方案包括：

Real-value encoding.
Integer encoding.
One hot encoding.

8.3.3 平稳性

当处理实值序列（如时间序列）时，要考虑使序列保持平稳。

移除趋势（Remove Trends）：如果序列包含均值的方差（例如趋势），则可以使用差异。
移除季节性（Remove Seasonality）：如果序列包含周期性周期（例如季节性），则可以使用季节性调整。-
移除方差（Remove Variance）：如果序列包含递增或递减方差，则可以使用对数或Box-Cox变换。

8.3.4 输入序列长度

输入序列长度的选择由要解决的问题决定，评估使用不同输入序列长度对模型性能的影响。当更新权值时，输入序列的长度也会影响通过时间的反向传播来估计误差梯度。它可以影响模型学习的速度和学习的内容。

8.3.5 序列模型类型

对于给定的序列预测问题，有4种主要的序列模型类型：

One-to-one
One-to-many
Many-to-one
Many-to-many
Keras 都支持以上序列模型。使用每个序列模型类型为问题设置框架，并评估模型性能，以帮助为需要解决的问题选择框架。

8.4 调试模型架构

本节概述了在调整LSTM模型的结构时影响比较大的方面。

8.4.1 架构（Architecture）

有许多LSTM架构可供选择。有些体系结构适合于某些序列预测问题，尽管大多数体系结构具有足够的灵活性，可以适应您的序列预测问题，但仍要测试您对架构适用性的假设。

8.4.2 记忆单元（Memory Cells）

对于给定的序列预测问题或LSTM体系结构，我们无法知道最佳记忆单元数。必须在LSTM隐藏层中测试一组不同的存储单元，以查看最有效的方法。

Try grid searching the numb er of memory cells by 100s, 10s, or finer.
Try using numbers of cells quoted in research papers.
Try randomly searching the number of cells between 1 and 1000.

常用的存储单元数如100或1000，可能是一时兴起选的。下面的例子，网格搜索第一个隐藏的LSTM层中具有少量重复（5）的存储单元1、5或10的数量。可以用这个例子作为自己实验的模板。

from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# return training data
def get_train():
    seq = [[0.0, 0.1], [0.1, 0.2], [0.2, 0.3], [0.3, 0.4], [0.4, 0.5]]
    seq = np.array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((5, 1, 1))
    return X, y

# return validation data
def get_val():
    seq = [[0.5, 0.6], [0.6, 0.7], [0.7, 0.8], [0.8, 0.9], [0.9, 1.0]]
    seq = np.array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((len(X), 1, 1))
    return X, y

# fit an LSTM model
def fit_model(n_cells):
    # define model
    model = Sequential()
    model.add(LSTM(n_cells, input_shape=(1,1)))
    model.add(Dense(1, activation='linear'))
    
    # compile model
    model.compile(loss='mse', optimizer='adam')
    
    # fit model
    X,y = get_train()
    history = model.fit(X, y, epochs=500, shuffle=False, verbose=0)
    # evaluate model
    valX, valY = get_val()
    loss = model.evaluate(valX, valY, verbose=0)
    return loss

# define scope of search
params = [1, 5, 10]
n_repeats = 5

# grid search parameter values
scores = pd.DataFrame()
for value in params:
    # repeat each experiment multiple times
    loss_values = list()
    for i in range(n_repeats):
        loss = fit_model(value)
        loss_values.append(loss)
        print('>%d/%d param=%f, loss=%f'% (i+1, n_repeats, value, loss))
    # store results for this parameter
    scores[str(value)] = loss_values
    # summary statistics of results
print(scores.describe())
# box and whisker plot of results
fig = plt.figure(dpi=200)
scores.boxplot(ax = plt.gca())
plt.show()

运行该示例将打印每次迭代的搜索进度。最后显示每个memory cell 数的结果摘要统计信息。

>1/5 param=1.000000, loss=0.187934
>2/5 param=1.000000, loss=0.169736
>3/5 param=1.000000, loss=0.294507
>4/5 param=1.000000, loss=0.105454
>5/5 param=1.000000, loss=0.220867
>1/5 param=5.000000, loss=0.056324
>2/5 param=5.000000, loss=0.103125
>3/5 param=5.000000, loss=0.051873
>4/5 param=5.000000, loss=0.100868
>5/5 param=5.000000, loss=0.070574
>1/5 param=10.000000, loss=0.023056
>2/5 param=10.000000, loss=0.006242
>3/5 param=10.000000, loss=0.041770
>4/5 param=10.000000, loss=0.067101
>5/5 param=10.000000, loss=0.006736
              1         5        10
count  5.000000  5.000000  5.000000
mean   0.195700  0.076553  0.028981
std    0.069417  0.024245  0.025806
min    0.105454  0.051873  0.006242
25%    0.169736  0.056324  0.006736
50%    0.187934  0.070574  0.023056
75%    0.220867  0.100868  0.041770
max    0.294507  0.103125  0.067101

箱形图输出：

箱形图（Box-plot)又称为盒须图、盒式图或箱线图，是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用，常见于品质管理。它主要用于反映原始数据分布的特征，还可以进行多组数据分布特征的比较。箱线图的绘制方法是：先找出一组数据的上边缘、下边缘、中位数和两个四分位数；然后，连接两个四分位数画出箱体；再将上边缘和下边缘与箱体相连接，中位数在箱体中间。

主要包含六个数据节点，将一组数据从大到小排列，分别计算出他的上边缘，上四分位数Q3，中位数，下四分位数Q1，下边缘，还有一个异常值。

8.4.3 隐藏层（Hidden Layers）

与存储单元的数量一样，对于给定的序列预测问题或LSTM体系结构，我们无法知道LSTM隐藏层的最佳数量。当有很多数据的时候，深度越深往往更好。

尝试网格搜索的层数和记忆单元。
尝试使用在研究论文中引用的堆叠LSTM层的模式。
尝试随机地搜索层和记忆细胞的数量。

8.4.4 权重初始化（Weight Initialization）

默认情况下，Keras LSTM层使用glorot_uniform权重初始化。一般而言，这种权重初始化效果很好，但是在LSTM中使用普通类型的权重初始化非常成功。评估不同权重初始化方案对模型性能的影响。Keras提供了一个很好的权重初始化方案列表：

random uniform
random normal
glorot uniform
glorot normal

8.4.5 激活函数（Activation Functions）

激活函数（从技术上讲是传递函数，它传递神经元的加权激活）通常由输入或输出层的框架和比例固定。例如，LSTM对输入使用sigmoid激活函数，因此输入的比例通常为0-1。序列预测问题的分类或回归性质决定了在输出层中使用的激活函数的类型。可以尝试其他的激活函数：

sigmoid
tanh
relu

此外，堆叠的LSTM中的所有LSTM层是否需要使用相同的激活函数。在实践中，很少看到模型比使用Sigmoid做得更好，但是这一假设应该得到证实。

8.5 调试学习行为

8.5.1 优化算法（Optimization Algorithm）

梯度下降的一个很好的默认实现是Adam算法。这是因为它结合了AdaGrad和RMSProp方法的最佳属性，自动为模型中的每个参数（权重）使用自定义学习率。此外，在Keras中实施Adam会对每个配置参数使用最佳初始值。也可以尝试其他优化算法：

Adam
RMSprop
Adagrad

8.5.2 学习率（Learning Rate）

学习速率控制在每个批次结束时根据估计的梯度更新权重的量。这会对模型学习问题的速度或效果之间的权衡产生很大影响。考虑使用经典的随机梯度下降（SGD）优化器，探索不同的学习速率和动量值（momentum values）。不仅仅是搜索值，还可以评估改变学习率的效果。

网格搜索学习率（例如0.1、0.001、0.0001）。
尝试学习速度随时代数而衰减（例如通过callback）。
尝试用学习率越来越低的训练来更新拟合模型。

学习率与迭代次数（epoch，训练样本的轮数）紧密相关。一般来说，学习率越小（例如0.0001），所需的训练时间就越多。这是一个线性关系，反过来也是正确的，在较大的学习率（例如0.1）需要较少的训练时间。

8.5.3 批次大小（Batch Size）

批量大小是模型权重更新之间的样本数。一个好的默认批量大小是32个样本。

[batch_size]通常选择在1到几百之间，例如，[batch_size]=32是一个很好的默认值，大于10的值利用了矩阵-矩阵乘积比矩阵向量-乘积运算更快的原理。— Practical Recommendations For Gradient-based Training Of Deep Architectures, 2012.

序列预测问题的数据量和帧结构可能影响批量大小的选择。可以尝试一些替代配置：

尝试设计随机梯度下降（SGD）的批量大小为1。
批量大小n，其中n是批量梯度下降的样本数。
使用网格搜索，尝试将batch_size从2更新到256。

较大的批量通常会导致模型更快的收敛，但可能会导致最终权重集的不太理想。批处理大小为1（随机梯度下降），在每个样本之后进行更新，通常会导致学习过程波动很大。下面是用少量重复（5）对批大小1、2和3进行网格搜索的一个小示例。可以用这个例子作为自己实验的模板。

from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# return training data
def get_train():
    seq = [[0.0, 0.1], [0.1, 0.2], [0.2, 0.3], [0.3, 0.4], [0.4, 0.5]]
    seq = np.array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((5, 1, 1))
    return X, y

# return validation data
def get_val():
    seq = [[0.5, 0.6], [0.6, 0.7], [0.7, 0.8], [0.8, 0.9], [0.9, 1.0]]
    seq = np.array(seq)
    X, y = seq[:, 0], seq[:, 1]
    X = X.reshape((len(X), 1, 1))
    return X, y

# fit an LSTM model
def fit_model(n_batch):
    # define model
    model = Sequential()
    model.add(LSTM(10, input_shape=(1,1)))
    model.add(Dense(1, activation='linear'))
    
    # compile model
    model.compile(loss='mse', optimizer='adam')
    
    # fit model
    X,y = get_train()
    history = model.fit(X, y, epochs=500, shuffle=False, verbose=0, batch_size=n_batch)
    # evaluate model
    valX, valY = get_val()
    loss = model.evaluate(valX, valY, verbose=0)
    return loss

# define scope of search
params = [1, 2, 3]
n_repeats = 5

# grid search parameter values
scores = pd.DataFrame()
for value in params:
    # repeat each experiment multiple times
    loss_values = list()
    for i in range(n_repeats):
        loss = fit_model(value)
        loss_values.append(loss)
        print('>%d/%d param=%f, loss=%f'% (i+1, n_repeats, value, loss))
    # store results for this parameter
    scores[str(value)] = loss_values
    # summary statistics of results
print(scores.describe())
# box and whisker plot of results
fig = plt.figure(dpi=200)
scores.boxplot(ax = plt.gca())
plt.show()

运行该示例将打印每次迭代的搜索进度。最后显示每个配置的结果摘要统计信息。

>1/5 param=1.000000, loss=0.001113
>2/5 param=1.000000, loss=0.003881
>3/5 param=1.000000, loss=0.001901
>4/5 param=1.000000, loss=0.001382
>5/5 param=1.000000, loss=0.001783
>1/5 param=2.000000, loss=0.000973
>2/5 param=2.000000, loss=0.000061
>3/5 param=2.000000, loss=0.001475
>4/5 param=2.000000, loss=0.000625
>5/5 param=2.000000, loss=0.001681
>1/5 param=3.000000, loss=0.002114
>2/5 param=3.000000, loss=0.001060
>3/5 param=3.000000, loss=0.000025
>4/5 param=3.000000, loss=0.004496
>5/5 param=3.000000, loss=0.001244
              1         2         3
count  5.000000  5.000000  5.000000
mean   0.002012  0.000963  0.001788
std    0.001091  0.000653  0.001686
min    0.001113  0.000061  0.000025
25%    0.001382  0.000625  0.001060
50%    0.001783  0.000973  0.001244
75%    0.001901  0.001475  0.002114
max    0.003881  0.001681  0.004496

创建最终结果的方框图，以比较每个不同配置的模型分布。

8.5.4 正则化（Regularization）

LSTMs在一些序列预测问题上可以快速收敛甚至过拟合。为了解决这个问题，可以使用正则化方法。辍学者在训练过程中随机跳过神经元，迫使层中的其他神经元选择剩余部分。它既简单又实用，使用两个不同参数可以在LSTM层上设置0.0（no dropout）到1.0（complete dropout）之间的dropout参数：

dropout: dropout applied on input connections.
recurrent_dropout: dropout applied to recurrent connections.

如：

model.add(LSTM(..., dropout=0.4))

LSTMs还支持其他形式的正则化，例如权重正则化减小网络权重的大小。同样，可以在LSTM层设置这些参数：

bias_regular izer: regularization on the bias weights.
kernel_regularizer: regularization on the input weights.
recurrent_regularizer: regularization on the recurrent weights.

与dropout情况下的百分比不同，可以使用正则化类，如LI、L2或L1L2正则化。建议使用L1L2并使用介于0和1之间的值，这些值还允许模拟LI和L2方法。例如：

L1L2(0.0, 0.0), e.g. baseline or no regularization
L1L2(0.01, 0.0), e.g. L1.
L1L2(0.0, 0.01), e.g. L2.
L1L2(0.01, 0.01), e.g. L1L2 also called elastic net.

model.add(LSTM(..., kernel_regularizer=L1L2(0.01, 0.01)))

在实践中，在输入使用Dropout和权重正则化，可以得到性能更好的模型。

8.5.5 适时停止训练

训练阶段的数量调整可能非常耗时。另一种方法是配置大量的训练时段。然后设置检查点检查模型在训练和验证数据集上的性能，如果看起来模型开始过度学习，则停止训练。因此，适时停止是一种抑制过度拟合的规则化方法。

你可以提前在凯拉斯停留，提前回叫。它要求您指定一些配置参数，例如要监视的度量（例如val丢失）、在其上未观察到监视度量改进的时段数（例如100）。在训练模型时，会向 fit() 函数提供回调列表。例如EarlyStopping()方法：

keras.callbacks.callbacks.EarlyStopping(monitor='val_loss', min_delta=0, patience=0, verbose=0, mode='auto', baseline=None, restore_best_weights=False)

功能：当监视的变量停止改善时，停止训练。

参数：

monitor：要监视的变量。
min_delta：监视变量中符合改进的最小变化，即小于min_delta的绝对变化，将不视为任何改进。
patience：产生受监控变量但没有改善的时期数，之后将停止训练。如果验证频率（model.fit(validation_freq=5)）大于1 ，则可能不会为每个时期产生验证变量。
verbose：详细模式。
model：{自动，最小，最大}之一。在min模式下，当监视的变量停止减少时，训练将停止；在max 模式下，当监视的变量停止增加时，它将停止；在auto 模式下，将根据监视变量的名称自动推断出方向。
baseline：要达到的监视变量的基线值。如果模型没有显示出超过基线的改善，培训将停止。
restore_best_weights：是否从时期以受监视变量的最佳值恢复模型权重。如果为False，则使用在训练的最后一步获得的模型权重。

实例：

from keras.callbacks import EarlyStopping
es = EarlyStopping(monitor= 'val_loss', min_delta=100)
model.fit(..., callbacks=[es])

8.6 拓展阅读

Empirical Methods for Artificial Intelligence, 1995.
http://amzn.to/2tjlD4B
Practical recommendations for gradient-based training of deep architectures, 2012.
https://arxiv.org/abs/1206.5533
Recurrent Neural Network Regularization, 2014.
https://arxiv.org/abs/1409.2329

参考：Jason Brownlee《long-short-term-memory-networks-with-python》chapter 12

你可能感兴趣的:(时间序列分析（Time,Series）,LSTM,keras,调参)

Leetcode 3604. Minimum Time to Reach Destination in Directed Graph Espresso Macchiato leetcode笔记 leetcode 3604 leetcode medium leetcode双周赛160 BFS 广度优先遍历最优路径
Leetcode3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路2.代码实现题目链接：3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路这一题思路上就是一个广度优先遍历，我们不断考察当前时间点以及位置的情况下，下一个点可行的位置，然后考察最近的时间点能够到达的位置，遍历全部可能
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
el-timeline时间线（Plus）左边图标改为自定义图片顾尘眠 javascript 前端 vue.js
（目前图片有点小，还需要自己去调整下大概样式，比较懒，就放了个大概样子）时间线左侧正常根据文档内容，是填写的icon，但通过icon属性还有另外一个类型，component，可以搭配h函数写一组img元素，实现将图标改为本地图片{{activity.content}}import{h}from'vue'constactivities=[{content:'Eventstart',timestamp
低温冷启动 & 高温热启动 hahaha6016 fpga开发
低温冷启动1.在低温下，晶体管的阈值电压可能升高，导致时序路径变慢，从而可能引起建立时间（setuptime）违规。另外，也可能出现保持时间（holdtime）违规，因为低温下信号传播速度可能变快（但通常低温下延迟增加，所以建立时间问题更常见）。2.droppinglogiccore意味着在低温下某个逻辑核心（可能是一个特定的模块或IP核）无法正常启动或工作，导致功能失效3.cellname，这通
远程登录docker执行shell报错input is not a terminal问题
背景最近要远程去k8sdocker里面获取信息，于是，写了一个如下的命令，执行完之后，报错了。ssh192.168.100.2sudocrictlexec-itxxx.docker/usr/bin/lscpu--online--extended错误信息如下：time=“2025-07-11T21:00:39+08:00”level=fatalmsg=“execingcommandincontain
解决Linux绑定失败地址已使用(端口被占用)的问题誰能久伴不乏 linux 服务器网络
文章目录解决`bindfailed:Addressalreadyinuse`问题一、问题原因1.**端口已经被其他程序占用**2.**端口处于`TIME_WAIT`状态**3.**未正确关闭套接字**二、如何排查和解决问题1.**确认端口是否被占用**2.**查找并杀掉占用端口的进程**3.**等待端口释放（`TIME_WAIT`状态）**4.**强制重用端口**（仅限开发环境）5.**使用其他端
JavaScript知识归纳——面试题 Dream_Lee_1997 JavaScript js面试题
JavaScript面试题总结JavaScript知识点1、JavaScript中settimeout与setinteval两个函数的区别？2、编写JavaScript脚本生成1-6之间的整数？3、在JavaScript脚本中，isNaN的作用是什么？4、JavaScript中获取某个元素有哪几种方式？5、Ajax的优缺点都有什么？6、简述一下Ajax的工作原理。7、JavaScript中的数据类
【解决Qt报warning: ‘setAxisX‘ is deprecated遇到的问题】
解决Qt报warning:‘setAxisX‘isdeprecated遇到的问题背景：移植老代码时，报如题警告。老代码：m_input_chart->setAxisY(axisY,input_series);然后修改为：m_input_chart->addAxis(axisY,Qt::AlignLeft);input_series->attachAxis(axisY);运行之后没有警告了，但是坐标
Python Code Acceleration（Python代码加速）李伯爵的指间沙 Python
对于Python的代码执行效率较低的问题，参考博客：https://developer.51cto.com/art/201809/583695.htm进行相应的测试。参考代码如下：fromnumbaimportjitimporttimedeffoo(x,y):tt=time.time()s=0foriinrange(x,y):s+=iprint('Timeused:{}sec'.format(ti
LLaMA 学习笔记 AI算法网奇深度学习基础人工智能深度学习
目录LLaMA模型结构：模型微调手册：推理示例：指定位置加载模型测试ok：模型下载：llama-stack下载modelscope下载LLaMA优化技术RMSNormSwiGLU激活函数旋转位置编码（RoPE）LLaMA模型结构：llama3结构详解-CSDN博客模型微调手册：大模型微调LLaMA详细指南（准备环境、数据、配置微调参数+微调过程）_llama微调-CSDN博客显存占用：FP16/B
java与sql的日期类型常用教程讲解许昌第一深情 java后端学习数据库 java 开发语言
日期类：sqlDatejava：LocalDate具体时间类：sqlDateTimejavaLocalDateTime常用函数：LocalDateTime.time()；//获取当前时间LocalDatedate=LocalDate.of(年,月,日);//用于创建一个特定的日期对象
jmeter的时间戳函数使用 flower_1111 代码 jmeter jmeter
原文：https://blog.csdn.net/jocleyn/article/details/834144331、__time：获取时间戳、格式化时间（1）、${__time(yyyy-MM-ddHH:mm:ss:SSS,time)}：格式化生成时间格式2018-10-2611:08:23:635（2）、${__time(,)}：默认该公式精确到毫秒级别，13位数1527822855323（3
Jmeter内置时间函数使用山河绘 jmeter
__time：获取时间戳、格式化时间${__time(,)}：获取当前时间戳(当前时间的毫秒数)，默认精确到毫秒级别，13位数，如：1650356704900${__time(/1000,)}：获取当前时间的秒数，精确到秒级别，10位数，如：1650356723${__time(yyyy-MM-dd,)}：获取当前日期，如：2022-04-19${__time(yyyy-MM-ddHH:mm:ss
oracle+循环插入sql,SQL server，Oracle循环插入百万数据伍亦勤 oracle+循环插入sql
SQLserver，Oracle循环插入百万数据SQLserver，Oracle循环插入百万数据压测时常需要往数据库插入大量数据，下面是我往两个数据库插入数据时用的脚本declare@maxSumint,@lidnvarchar(64),--'lid'为表id@cidint,@useridnvarchar(64),@oper_timenvarchar(26),@oper_typenvarchar(
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【网络】Linux 内核优化实战 - net.ipv4.tcp_fin_timeout Linux性能优化原理和实战网络 linux tcp/ip
目录1.TCP连接关闭过程与FIN_WAIT_2状态2.参数作用3.参数取值与影响4.使用场景与建议5.相关参数6.如何配置该参数临时生效（重启后失效）：永久生效（需重启或重载配置）：7.性能优化建议8.监控与故障排查net.ipv4.tcp_fin_timeout是Linux内核中的一个TCP参数，用于控制TCP连接在FIN_WAIT_2状态下的超时时间。以下是对该参数的详细解析：1.TCP连接
Pandas 学习教程 _pass_ Data-Alaysis pandas 信息可视化
目录定义基本操作一维数组操作二维数组操作数据选择过滤数据处理数据清洗数据转换数据分析排序分组聚合数据透视表高级操作合并数据时间序列处理自定义函数调用数据可视化集成数据导出和导入大数据分块处理定义全称：'paneldata'and'pythondataanalysis'Analy:Series(一维数据)、DataFrame(二维数据)主要应用：数据清洗：处理缺失数据、重复数据等数据转换：改变数据的
保存或更新支付方式知还215 mybatis-plus填充
由于保存和更新的时候前端不会传入is_deleted,create_time,update_time这三个字段，需要我们手动传入，但每张表手动输入会很繁琐，为了简化该操作可以用以下操作进行声明：is_delete=0表示该表未删除则·我们可以在建表的时候对该字段设置默认值为0·通过可视化工具手动设置对于create_time与update_time可以使用mybatis-plus的自动填充功能(在
Go从入门到精通（1）-安装与运行环境
Go从入门到精通（1）安装与运行环境文章目录Go从入门到精通（1）平台与架构gccgo编译器文件扩展名与包（package）：Go环境变量go安装在linux上安装在mac安装在windows安装Go运行时（runtime）编辑器、集成开发环境与其它工具构建并运行Go程序参考文档平台与架构Go语言开发团队开发了适用于以下操作系统的编译器：LinuxFreeBSD（windows）MacOSX（也称
Java 与 MySQL 性能优化：MySQL连接池参数优化与性能提升程序员岳彬 Java 与 MySQL 性能优化 mysql 数据库性能优化服务器后端 java
文章目录引言一、连接池的基本概念与作用二、关键连接参数详解2.1max_connections2.2wait_timeout2.3interactive_timeout2.4connect_timeout2.5thread_cache_size三、连接池参数不合理导致的性能问题3.1连接耗尽3.2响应变慢3.3连接失效3.4资源浪费四、连接池参数优化方法与策略4.1max_connections的
动态时间规整（Dynamic Time Warping，DTW）介绍 EmorZhong 机器学习人工智能深度学习数据结构算法
在时序数据分析中，动态时间规整（DynamicTimeWarping，DTW）是一种经典的用于度量两个时间序列相似度的算法。它的核心价值在于解决了传统距离度量（如欧氏距离）在处理时间序列时的局限性——尤其是当序列存在时间错位（如节奏快慢不同）或长度差异时，仍能准确捕捉它们的“形状相似性”。一、为什么需要DTW？传统的距离度量（如欧氏距离）要求两个时间序列必须长度相同且时间点严格对齐。但实际场景中，
动态时间规整（Dynamic Time Warping，DTW）补充案例 EmorZhong python 人工智能机器学习算法动态规划
DTW的边界条件是确保累积距离矩阵计算“有起点、有规则”的基础，它规定了矩阵中第一行和第一列的累积距离如何计算（因为这两行/列是路径的“起点边缘”，没有“上一步”的全部选择）。下面结合具体场景和例子展开说明：为什么需要边界条件？累积距离矩阵(D[i][j])的核心递归公式是：[D[i][j]=\text{dist}[i][j]+\min\left(D[i-1][j],\D[i][j-1],\D[i
C#灵魂解剖图：从变量囚徒到架构主宰的7层蜕变！洁辉 c#架构开发语言
一、基础语法核心1.数据类型与变量//值类型intage=30;//整型doublepi=3.14159;//双精度浮点decimalprice=99.95m;//精确小数boolisActive=true;//布尔值DateTimenow=DateTime.Now;//日期时间//引用类型stringname="JohnDoe";//字符串int[]scores={90,85,95};//数组o
【论文复现】Taylor算法用于TOA（到达时间）的三维标签位置解算，360个标签、12个基站的环境作为验证，附MATLAB例程 MATLAB卡尔曼论文复现算法 matlab 开发语言
本文给出论文《基于Taylor-Chan算法的改进UWB室内三维定位方法》中的Taylor算法来解算TOA的复现程序（MATLAB）。使用论文中给定的12个锚点/360个测试的标签用来测试算法性能文章目录运行结果程序介绍核心功能概述结果输出应用场景MATLAB源代码运行结果误差输出：程序介绍本程序基于Taylor迭代算法，实现了对三维空间内360个目标点的TOA（TimeofArrival）定位解
异步技术：Web 性能优化的核心引擎 weixin_47233946 编程前端性能优化
异步技术：Web性能优化的核心引擎引言：当「等待」成为性能瓶颈当用户访问一个传统同步加载的新闻门户网站时，主线程在解析到时突然停止渲染，页面停留在白屏状态长达2秒——这正是GoogleLighthouse性能检测中常见的"BlockingTime"警告。这种阻塞式加载方式正是现代Web性能优化需要解决的痛点。一、异步的本质与技术演进1.1从同步到异步的范式转换同步加载如同单行道依次通行的汽车，每个
React 中使用 ECharts 报错 "series not exists"
问题现象在React项目中使用ECharts时，控制台报错：seriesnotexists.Legenddatashouldbesamewithseriesnameordataname但已确认legend.data与series.name完全匹配，代码逻辑看似正确。问题根源未正确注册ECharts图表组件。自ECharts5起，官方采用按需引入（tree-shaking）的模块化设计，需显式注册图
UI自动化测试 - POM设计模式什么鬼昵称 selenium 自动化设计模式
一、介绍基于selenium的ui自动化测试核心上只要定位到元素，对元素执行相应的操作即可。例如下面的脚本代码：打开Chrome浏览器，在百度页面搜索自动化测试：fromseleniumimportwebdriverimporttimedriver=webdriver.chrome()driver.implicitly_wait(30)#打开浏览器，百度driver.get("http://www
双击重复请求的方法北北~Simple vue2 vue
1、限制点击次数2、vue中可以自定义一个属性指令preventReClick.js中定义：importVuefrom'vue'Vue.directive('preventReClick',{inserted:(el,binding)=>{el.addEventListener('click',()=>{if(!el.disabled){el.disabled=truesetTimeout(()=
queryWapper的时间类型比较方法 Coder-thinking 数据库数据库 mybatis
QueryWrapper是MyBatis-Plus中的一个非常实用的工具类，它可以帮助我们构建更加灵活的查询条件。在QueryWrapper中，我们可以使用各种比较操作符来进行时间比较。以下是一些常用的时间比较操作：等于（eq）：queryWrapper.eq("create_time","2021-08-01");不等于（ne）：queryWrapper.ne("create_time","20
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后