GitChat技术杂谈

GitChat · 人工智能 | 如何零基础用 Keras 快速搭建实用深度学习模型

GitChat 作者：谢梁
原文：如何零基础用 Keras 快速搭建实用深度学习模型
关注微信公众号：GitChat 技术杂谈，一本正经的讲技术

【不要错过文末活动】

前言

在这篇小文章中，我们将简要讨论如何使用KERAS这个现在最新的深度学习框架来构造实用的深度学习模型。

深度学习是目前最热门的高级分析技术之一，在很多方面表现出了超越传统机器学习方法的有效性。但是在常用的TensorFlow，CNTK，Theano等计算环境中实现不同的深度学习模型仍然需要耗费很多时间来编写程序。KERAS的出现提供了一个高度抽象的环境来搭建深度学习模型，特别是其简单易用，跟网络结构一一对应的特点使得其迅速在数据科学家这个使用人群中流行起来。

什么是KERAS

KEARS是Google工程师François Chollet为主创人员，基于Python开发和维护的一个抽象的神经网络建模环境，提供了一系列的API供用户调用构造自己的深度学习网络。KERAS的出发点就是为用户提供一个能够快速实现模型的手段，从而缩短建模迭代的时间，加快模型试验的频率。用KERAS开发者的话说，就是要做好的科研必须尽可能地缩短从想法到实现结果的时间。在业界工作中这也是成功的关键要素之一。

相比较于常见的深度学习环境，比如TensorFlow，CNTK，Theano，Caffe等，KERAS有以下几个不同：

设计初衷就是方便以模块化地方式快速构造深度学习模型的原型。
可以很方便地在CPU和GPU之间切换。
KERAS本身只是描述模型的环境，其计算平台目前依赖于TensorFlow，CNTK和Theano这三种，以后会拓展到其他流行的计算平台上，比如mxNet等。
KERAS的拓展性既可以通过自定义KERAS里的激活函数或者损失函数等能自定义的部分进行，也可以通过引用对应的计算平台的自定义部分进行，具有一定的灵活性。

跟这些流行的计算平台一样，KERAS也支持常见的深度学习模型，比如卷积神经网络，循环神经网络以及二者的组合等。

使用KERAS构造深度神经网络有一系列相对固定的步骤：

首先要将原始数据处理成KERAS的API能够接受的格式，一般是一个张量的形式，通常在维度上表示为（批量数，[单一样本对应张量的维度]）。这里[单一样本对应张量的维度] 是一个通用的说法，对应于不同类型的模型，数据有不同的要求。

通常，如果是一个简单的全链接模型，则单一样本对应张量的维度就是特征个数；
如果是一维的时间序列数据，并要用循环神经网络模型训练的话，则单一样本对应张量的维度是时间步和每个时间步对应的回看序列长度；

如果输入数据是图像，并使用卷积神经网络模型进行训练，则单一样本张量对应图像的高，宽和色彩频道三个维度。但是如果是使用全连接模型训练图像数据，则单一样本对应张量是该图像扁化（Flatten）以后的向量长度，其为高，宽和色彩频道各个维度数量的乘积。一般卷积神经网络最靠近输出层的那层都设置一个全连接层，因此也需要扁化输入张量。
其次要构造需要的深度学习模型。这一步又分为以下两个步骤：

选择模型的类型。KERAS里定义了两大类模型1）序列模型(Sequential)； 2）通用模型(Model)。
序列模型指的是深度模型每一层之间都是前后序列关系，如下图所示：

Figure 1。MLP是一个典型的序列模型，图片来源

可以看到从左到右，输入层到隐含层到输出层每一层之间都是前后依次相连的简单关系。这个简单的网络结构可以用三句KERAS命令实现：
```
model=Sequential()
model.add(Dense(5, input_shape=(4,), activation=’sigmoid’))
model.add(Dense(1, activation=’sigmoid’))
```
而通用模型则是对应更广义的模型，具备更大的灵活性。上面提到的序列模型也可以用通用模型来表达，这个我们在后一节详解。

当然通用模型更能用来描述层与层之间有较复杂关系的情况，比如非相邻的层之间进行连接，或者多个神经网络的合并等。比如我们可以使用通用模型进行矩阵分解：
```
user_in = Input(shape=(1,), dtype='int64', name='user_in')
u = Embedding(n_users, n_factors, input_length=1)(user_in)
movie_in = Input(shape=(1,), dtype='int64', name='movie_in')
v = Embedding(n_movies, n_factors, input_length=1)(movie_in)
x = merge([u, v], mode='dot')
x = Flatten()(x)
model = Model([user_in, movie_in], x)
model.compile(Adam(0.001), loss='mse')
```
这里构造了一个基于矩阵分解的推荐系统的一个深度学习模型，其对应的网络结构如下图所示：

Figure 2。矩阵分解的深度学习模型

细化模型的结构。其实上面已经展示了模型结构细化之后的情况。一般来说，确定了模型类型以后，其结构不外乎每层的类型是什么，是全连接层还是卷积层还是放弃（Dropout）层；每层的其他参数是什么，比如如果需要指定激活函数，那么使用什么样的激活函数，如果是卷积层，那么需要多少过滤器，每个过滤器的大小是怎样的？等等这些都可以通过设定不同的参数进行细化。
然后对模型进行编译，编译完成以后可以查看模型的基本信息，特别是参数的数量；
最后带入数据对模型进行拟合。一般来讲，如果数据是静态的张量数据，通过使用fit方法。如果数据特别大，可是使用可迭代的data generator对象，并使用fit_generator方法来拟合。

KERAS和深度学习模型的对应关系

KERAS既然是开发出来快速构造深度学习模型的工具，那么它的API和深度学习模型的要素都有很强的对应关系。

正如上面所说，目前的深度学习模型都可以纳入序列模型或者通用模型的，那么我们用图示的方式来表示这个对应关系，方便读者理解。这里网络图为了方便与按行排列的代码对应，对每一层都进行了标注。

下图展示的是一个典型的全连接序列模型：

Figure 3。全连接序列模型，修改自博客

这个序列模型可以使用如下的KERAS命令快速搭建：

Model = Sequential()
Model.add(Dense(10, activation=’sigmoid’, 
                   input_shape=(8, ))           【隐含层1+输入层】
Model.add(Dense(8, activation=’relu’))          【隐含层2】
Model.add(Dense(10, activation=’relu’))         【隐含层3】
Model.add(Dense(5, activation=’softmax’))       【输出层】

上面的序列模型也可以用通用模型的API描述的结果，其与图中的网络结构有更强的对应关系：

x = Input(shape=(8,))                        【输入层】
b = Dense(10, activation=’sigmoid’)(x)       【隐含层1】
c = Dense(8, activation=’relu’)(b)           【隐含层2】
d = Dense(10, activation=’relu’)(c )         【隐含层3】
out = Dense(5, activation=’softmax’)(d)      【输出层】
model = Model(inputs=x, outputs=out)

上面也举了另外的比较复杂的例子。在后面的具体案例中，我们也会强调网络结构和对应的KERAS命令，使读者能建立起较强的联系。

使用KERAS构造深度推荐系统

推荐系统是机器学习最广泛的应用领域之一，大家熟悉的亚马逊、迪士尼、谷歌、Netflix 等公司都在网页上有其推荐系统的界面，帮助用户更快、更方便地从海量信息中找到有价值的信息。比如亚马逊（www.amazon.com）会给你推荐书、音乐等，迪士尼（video.disney.com）给你推荐最喜欢的卡通人物和迪士尼电影，谷歌搜索更不用说了， Google Play、 Youtube 等也有自己的推荐引擎、推荐视频和应用等。下面是我登陆亚马逊之后的一个推荐页面，可见我之前应该是购买了咖啡机，所以会有相关的产品推荐出来。

Figure 4。亚马逊的推荐页面局部

推荐系统的最终目的是从百万甚至上亿内容或者商品中把有用的东西高效地显示给用户，这样可以为用户节省很多自行查询的时间，也可以提示用户可能忽略的内容或商品，使用户更有黏性，更愿意花时间待在网站上，从而使商家可以从内容或者商品中赚取更多的利润，即使流量本身也会使商家从广告中受益。

传统上，推荐系统是基于矩阵分解的协同过滤算法，前面也展示了这样的一个简单模型。下面我们着重介绍深度学习推荐系统。这个模型除了能将用户和可选产品联系起来意外，还能将其他辅助数据，比如用户年龄，地区，上网设备以及各种产品属性，联系起来。这里通过嵌入（Embedding）这种技术将不同的信息串在一起作为输入层，再继续搭建不同的神经网络模型，最后一层用预测评分作为输出层。虽然这里的数据只有用户编码和电影产品编码，但是这样的结构可以拓展到包含其他相关数据。下图展示了这样的一个深度模型的结构示意图：

Figure 5。深度模型

有了这个示意图，我们就可以很方便地用KERAS依次构造。这里我们假设已经将用户和电影产品做了按照One Hot编码形式组织好了。

首先用嵌入层对用户和电影进行嵌入映射：

k = 128
model1 = Sequential()
model1.add(Embedding(n_users + 1, k, input_length = 1))
model1.add(Reshape((k,)))
model2 = Sequential()
model2.add(Embedding(n_movies + 1, k, input_length = 1))
model2.add(Reshape((k,)))

这里的k是映射到的空间的维度。在一般的业务系统中我们可能有上百万的用户和产品，经过嵌入映射到128维的实数域上以后显著地降低了整个系统的维度和大小。

以上几句命令实现了上图从最低下到“用户嵌入”和“电影嵌入”这一阶段的编程。

其次，我们需要用第三个神经网络把前面的两个嵌入网络映射所得到的向量叠加在一起：

model = Sequential()
model.add(Merge([model1, model2], mode = 'concat'))

至此完成了到第一个粗箭头的网络构造。两个网络已经合并为一个网络。

下面的命令依次完成“隐含层128”和“隐含层32”的构造：

model.add(Dropout(0.2))
model.add(Dense(k, activation = 'relu'))
model.add(Dropout(0.5))
model.add(Dense(int(k/4), activation = 'relu'))
model.add(Dropout(0.5))

下面继续构造“隐含层8”：

model.add(Dense(int(k/16), activation = 'relu'))
model.add(Dropout(0.5))

隐含层构造完毕之后，需要构造输出层。因为是预测连续变量评分，最后一层直接上线性变化：


model.add(Dense(1, activation = 'linear'))

至此，模型构造完毕，可以编译了：

model.compile(loss = 'mse', optimizer = "adam")

这里使用了均方差（MSE）作为损失函数，并使用了ADAM优化算法。

下面，为了能训练模型，需要将数据构造为[users, movies]的形式：

users = ratings['user_id'].values
movies = ratings['movie_id'].values
X_train = [users, movies]

最后训练模型：

model.fit(X_train, y_train, batch_size = 100, epochs = 50)

使用movielens的用户观看电影评分数据进行训练和验证，我们发现这个模型的误差在0.8226左右，大约一个评分等级不到。即使这样一个简单的模型，效果还是比较好的。如果进一步优化结构，或者引入其他信息，误差还可以进一步降低。

使用KERAS构造图像识别系统

图像识别是深度学习最典型的应用之一。关于深度学习的图像识别可以追溯很长的历史，其中最具有代表性的例子是手写字体识别和图片识别。手写字体识别主要是用机器正确区别手写体数字 0~9。银行支票上的手写体识别技术就是基于这个技术。图片识别的代表作就是 ImageNet。这个比赛需要团队识别图片中的动物或者物体，把它们正确地分到一千个类别中的其中一个。

图像识别有很多种技术可以实现，目前最主流的技术是深度神经网络，其中尤以卷积神经网络（CNN）最为出名。卷积神经网络（见图1）是一种自动化特征提取的机器学习模型。从数学的角度看，任何一张图片都可以对应到 224 × 224 × 3 或者 32 × 32 × 3 等三维向量，这取决于像素。我们的目标是把这个三维向量（又被称为张量）映射到 N个类别中的一类。神经网络就是建立了这样一个映射关系，或者称为函数。它通过建立网状结构，辅以矩阵的加、乘等运算，最后输出每个图像属于每个类别的概率，并且取概率最高的作为我们的决策依据。下面是一个典型的序列卷积神经网络模型的结构：

Figure 6。卷积神经网络结构。来源于CNTK教程

上面这个网络依次展示了卷积网络模型的主要要素：

输入层的图像；
卷积操作；
激活函数的应用；
池化操作；
将数据展平（Flatten），为输出到全连接层做准备；
全连接层准备输出；
softmax应用于分类问题的全连接层作为输出层。

下面详细介绍一下在KERAS中如何对应地进行编程处理。

首先，这是一个序列模型，因此先要声明一个序列模型的对象：

    model=Sequential()

卷积是应用一个局部的过滤器到原始数据的过程，比如下图就展示了一个3x3的过滤器应用在一个7x7的图像上过程。假设在当前步，这个过滤器的权重经过学习得到如图所示的权重结果，在当前步继续进行卷积操作就是将这个3x3的过滤器从左上角每次要么向右要么向下移动一格，和对应的图像局部的3x3的区域进行依元素点乘求和得到卷积的结果。因为依次移动，到最边上的时候过滤器会超出图像的边界，一般会将这些对应的卷积结果删除，从而卷积后的张量维度会少于原始图像。比如这个例子中原图为7x7，使用一个3x3的过滤器卷积之后最后两列和两行进行卷积的时候会使过滤器超过边界，因此最后的卷积结果是一个5x5的图像。这里可以使用多个过滤器，每个过滤器应用一次，每次应用产生的卷积结果构成隐含层的一层。比如采用16个过滤器，如果不删除边界的过滤结果，则得到新的[7x7x16]的张量。

Figure 7．卷积演示，来源于CNTK教程

在KERAS里，对于图像这种二维数据，一般使用Conv2D这个二维卷积层。Conv2D有几个必备的参数：

首先指定过滤器数量 filters，是一个整数；
第二是要指定二维过滤器的大小，比如(3,3)；
第三要指定步长，即延某轴移动的时候是依次移动一个像素还是多个像素，默认为1；
第四要指定补齐策略padding，即是否要将在边界的卷积结果去掉。如果值为”same”，则不去掉，卷积结果和输入图像有同样的高和宽；如果值为”valid”，则不会处理过滤器会超出边界的像素。
最后，如果卷积层是第一层，那么还需要指明输入数据的维度input\_shape。因为一般用TensorFlow或者CNTK做后台，输入数据要求是channel_last，因此输入的原始维度为[样本量，高，宽，频道]，那么这里的维度只需要去掉样本量即可，即为[高，宽，频道数]，一般用X.shape[1:]即可得到。

对于上面的例子，KERAS里的典型写法是：

model.add(Conv2D(filters=16, kernel_size=(3, 3),
                  strides=1, padding=”valid”, 
                  input_shape=xtrain.shape[1:]))

再次要添加激活层引入激活函数，通常是一个非线性的函数。激活函数既可以通过在Conv2D里面指定activation=参数引入，也可以通过单独添加Activation层引入。卷积神经网络常用的激活函数是Rectified Linear Unit，简称relu。该函数其实就是max(0, x)，在层次较深的网络中比以前常用的取值区间在（0，1）或者（-1， 1）之间的sigmoid类激活函数效果好，因为不存在梯度消失的问题。

如果是通过参数，则上面的代码改写为：

model.add(Conv2D(filters=16, kernel\_size=(3, 3),
                 strides=1, padding=”valid”, 
                 activation=’relu’)

如果通过添加激活层引入，则在上面的代码后添加：

model.add(Activation(‘relu’))

然后进行的池化操作是在卷积神经网络中对图像特征的一种处理，通常在卷积操作和激活函数之后进行。池化操作是将原有输入按照一定大小切分成互不交叉的局部区域，目的是为了计算特征在局部的充分统计量，从而降低总体的特征数量，防止过度拟合和减少计算量。下图展示了最大池化方法的应用。在一个6x6的图像上应用3x3的池化操作，将原输入矩阵切割为不相交叉的2x2区域，每个区域的取值是对应原输入局部的最大值。

Figure 8。最大池化操作

对应于图像的最大池化层通过MaxPooling2D，KERAS也支持平均池化层，区别在于取对应局部的平均值作为池化后结果，方法为AveragePooling2D。对应上面的例子，KERAS的命令如下：

model.add(MaxPooling2D(pool_size=(3, 3))

为了输出到全连接层，先要对数据进行展平（Flatten）。这是因为全连接层只处理包含样本数在内一共二维的数据，要求第一维是样本数，第二维是所有特征的个数。因此对于一个包含2000个样本，每个样本是28x28x3的小图像的数据，展平之后是一个2000x2352的矩阵，其中2352是28,28,3的乘积。在KERAS里进行展平非常简单，在上面的MaxPooling2D层之后添model.add(Flatten())即可，KERAS能自己分析出输入和输出的维度。
在前面这些处理之后，但是在输出之前，通常会添加一个或者多个全连接层进一步处理数据。全连接层可以通过Dense指出，指明输出神经元个数和激活函数即可：

model.add(Dense(1000, activation=’relu’))

最后使用一个全连接层作为输出层，同样要求使用softmax激活函数，并使用跟输出类别同样多的神经元个数。比如识别0—9十个数字，那么就应该写作：

model.add(Dense(10, activation=’relu’))

把所有步骤组合到一起，我们就可以将图6显示的一个卷积神经网络模型相应地写为KERAS代码了：

model=Sequential()
model.add(Conv2D(filters=32, kernel_size=(3, 3), 
          padding="same", 
          input_shape=X_train.shape[1:], 
          activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(filters=64, kernel_size=(3, 3), padding="valid"))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))

是不是很简单？

要训练这个模型非常简单。我们先编译这个模型并显示其关键信息：

model.compile(loss='categorical_crossentropy', optimizer='adagrad', metrics=['accuracy'])
model.summary()

Figure 9。模型信息

我们看到这个模型一共有421642个参数，大多来自于倒数第二层的全连接层。

拟合这个模型也很简单：

model.fit(X_train, y_train, 
          epochs=20, verbose=1, 
          batch_size=10, 
          validation_data = (X_test, y_test))

这里使用最标准的fit方法。其中指定几个核心参数：

训练用特征数据X_train，
训练用结果数据y_train，
迭代次数epochs，
批量大小用batch_size指定，
verbose表示显示训练过程的信息，如果值为0不显示任何中间信息，如果为1显示按批量拟合的进度，如果为2则显示拟合结果信息。
另外读者还可以指定验证数据集，用validation_data这个参数表示，其包含一个tuple，第一个元素是验证用特征数据，第二个是验证用结果数据。

下面我们使用这个模型训练识别0-9这十个数字，使用著名的MNIST数据。不过在训练之前还需要提及对数据的处理：

首先将数据重塑为[样本数，高，宽，色彩通道数]的格式。这个可以通过numpy.reshape方法来实现。因为keras自带的MNIST数据已经是numpy的多维矩阵，并且是单色的，因此色彩通道数为1，因此数据重塑可以用下面的命令实现。读者可自行重塑验证用数据。

X_train = X_train.reshape(X_train.shape[0], 
                          X_train.shape[1], 
                          X_train.shape[2], 1).astype(float)

其次，需要将数据的取值压缩到[0， 1]之间。这有利于拟合时用的随机梯度递降算法的稳定和收敛。这可以使用X_train /= 255.0 来实现。
最后要将结果数据变为One Hot Code形式。KERAS提供了一个非常方便的方法to_categorical来实现这个功能：

y_train = keras.utils.to_categorical(y_train, len(set(y_train)))

下图的结果显示即使是这个非常简单的模型，其在验证数据上的预测准确率都是非常高的，达到了99.14%。

Figure 10。简单卷积模型在MNIST数据上的拟合结果。

使用KERAS可以非常方便的构造自己的卷积神经网络，对于比较复杂的情况，也可以使用已经训练好的一些常见的高效模型，比如VGG16，Xception 等做迁移训练来拟合自己的数据。

Figure 11． VGG16结构，来源于：

https://www.cs.toronto.edu/~frossard/post/vgg16/

上图是著名的VGG16模型的结构。根据刚才的学习结果，读者可以很快地模仿这个结构搭建自己的类似模型，但是KERAS在application库里已经提供了现成训练好的VGG16模型供读者读入使用。读者可以引用这个模型，将顶层去掉用自己的数据重新训练，但是底层的参数借用VGG16已经训练好的权重。这就是迁移学习的思路，可以大大降低需要训练的参数数量，加快新模型的开发。这里使用了通用模型以便在现有的VGG16模型上进行修改：

model_vgg = VGG16(include_top = False, 
                  weights = 'imagenet', 
                  input_shape =(224,224,3))
model = Flatten(name = 'flatten')(model_vgg.output)
model = Dense(10, activation = 'softmax')(model)
model_vgg_mnist = Model(model_vgg.input, model, 
                        name = 'vgg16')

这里首先引用VGG16模型，但是通过参数include_top=False指定迁移除顶层以外的其余网络结构到自己的模型中。Weights=’imagenet’表示借用的权重是用ImageNet数据训练出来的额。

其次，通过函数方法在修改过的VGG16模型上构造一个新的扁平层用来连接新构造的全连接层，这个全连接层跟前面的模型没有区别。最后把修改过的VGG16模型和新的顶层叠加起来并赋予新的名字vgg16。这样就得到了一个基于VGG16的新模型。

使用KERAS构造时间序列预测模型

时间序列是在商业数据或者工程数据中经常出现的一种数据形式，是以时间为次序排列，用来描述和计量一系列过程或者行为的数据的统称。比如每天商店的收入流水或者某个工厂每小时的产品产出都是时间序列数据。一般研究的时间序列数据有两种类型。最常见的是跟踪单一的计量数据随时间变化的情况，即每个时间点上收集的数据是一个一维变量，这种是最常见的，通常的时间序列默认就是这种数据，也是本章研究的对象。另外一种时间序列数据是多个对象或者多个维度的计量数据随时间变化的情况，即每个时间点上收集的数据是一个多维变量，这种一般也被称为纵向数据（Longitudinal Data），但是不属于这里介绍的对象。

在这里我们介绍如何搭建一个LSTM深度学习模型来对在汉口测量的长江每月流量数据进行预测建模。该数据来源于DataMarket 的时间序列数据库，由澳大利亚莫纳什大学的统计学教授Rob Hyndman 创建，收集了数十个公开的时间序列数据集。

汉口长江月流量数据包含从 1865 年 1 月到 1978 年 12 月在汉口记录的长江每月的流量，总计 1368 个数据点。计量单位未知。

Figure 12。长江月度流量时间序列

在一般的时间序列建模中，都需要检验数据的平稳性，因为传统时间序列建模都是建立在平稳数据的假设之上。这个数据具备非常强的年度周期性。使用传统的统计技术建模的时候都需要侦测周期性，并消除之，对消除周期性之后的数据运用ARIMA模型建模。

Figure 13。长江月度流量局部和移动平滑结果

我们可以通过周期图谱法（Periodogram）来得到主要的周期幅度。在Python中可以使用scipy.signal.periodogram来得到周期图谱。在这里我们不是使用原始数据，而是使用原始数据的自相关函数的周期图谱来计算主要周期，这样可以抵消噪音的影响。对读入pandas DataFrame的原始数据ts运行下面的程序我们可以得到如下的周期图谱和计算得到的主要周期长度。

import statsmodels.api as sm
from statsmodels.tsa.stattools import acf
from scipy import signal
import peakutils as peak
acf_x, acf_ci = acf(ts, alpha=0.05, nlags=36)
fs=1
f, Pxx_den = signal.periodogram(acf_x, fs)
index = peak.indexes(Pxx_den)
cycle=(1/f[index[0]]).astype(int)
fig = plt.figure()
ax0 = fig.add_subplot(111)
plt.vlines(f, 0, Pxx_den)
plt.plot(f, Pxx_den, marker='o', linestyle='none', color='red')
plt.title("Identified Cycle of %i" % (cycle))
plt.xlabel('frequency [Hz]')
plt.ylabel('PSD [V**2/Hz]')
plt.show()
print( index, f, Pxx_den)

Figure 14。周期图谱

很明显有一个周期为 12 个月的季节性。虽然考虑到这个数据的本质是长江水文资料， 12 个月的周期是非常自然的预期，但是这个方法展示了对 ACF 序列运用周期图法（periodogram）找季节性周期的可靠性。在传统方法里，这里需要通过取间隔为12 的差分来消除周期性，得到一个尽可能平稳的时间序列，进而采用ARIMA模型建模。在Python里，单周期的时间序列数据，知道周期的长度以后可以直接使用季节性ARIMA模型（SARIMA）来训练。

但是在使用循环神经网络模型的时候我们不用考虑这些情况，可以直接使用长短记忆模型。此外，在使用LSTM这种序列模型的时候在使用LSTM对这种单一时间序列进行建模的时候，一般通过一下步骤：

将数据标准化为[0，1]区间。
按照LSTM的要求，将输入数据组织为[样本数，时间步，特征变量数]的三位格式来组织。
定义一个LSTM深度学习模型，通常为一个序列模型对象，逐层添加LSTM层或者其他层，最后通过一个全连接层输出到输出层。
最后对需要的时间段进行预测。

首先对数据进行标准化，我们使用sklearn包里的MinMaxScaler函数：

scaler = MinMaxScaler(feature_range=(0, 1))
trainstd = scaler.fit_transform(train.values.astype(float).reshape(-1, 1))
teststd = scaler.transform(test.values.astype(float).reshap

其次，我们将训练数据和测试数据组织成需要的格式，这个格式与我们将要建立的LSTM模型有关。这里我们对每个输入构造一个LSTM神经元，一个60个输入单元，每一个对应一个时间步。这60个单元的输出会作为一个全连接层的输入，这个全连接层直接产生下K个连续时间步的输出预测。作为防止过度拟合的正则化手段，我们在LSTM层和全连接层之间加了一个Dropout层。这个Dropout层在训练的时候会随机放弃一部分权重的更新，但是在进行预测的时候所有权重都会被用到。

Figure 15。LSTM网络结构（修改自CNTK Tutorial）

对于这样的网络结构，我们需要如下的一个函数来定义我们的数据，即将数据组织成为[批量数，时间步数，滞后特征数]的形式。这个可以通过如下的函数来实现：

def create_dataset(dataset, timestep=1, look_back=1, look_ahead=1):
    from statsmodels.tsa.tsatools import lagmat
    import numpy as np
    ds = dataset.reshape(-1, 1)    
    dataX = lagmat(dataset, 
                   maxlag=timestep*look_back, 
                   trim="both", original='ex')
    dataY = lagmat(dataset[(timestep*look_back):], 
                  maxlag=look_ahead, 
                  trim="backward", original='ex')
    dataX = dataX.reshape(dataX.shape[0], 
                          timestep, look_back)[:-(look_ahead-1)]
    return np.array(dataX), np.array(dataY[:-(look_ahead-1)])

执行下面的命令就可以生成所需数据：

lookback=1
lookahead=24
timestep=60
trainX, trainY = create_dataset(trainstd, 
                        timestep=timestep, 
                        look_back=lookback,  look_ahead=lookahead)
trainX, trainY = trainX.astype('float32'), trainY.astype('float32')
truthX, truthY = create_dataset(truthstd, 
                        timestep=timestep, 
                        look_back=lookback, look_ahead=lookahead)

有了如图15的网络图以后，就可以开始定义我们的LSTM深度学习模型。

batch_size=100
model = Sequential()
model.add(LSTM(48, batch_size=batch_size, \
input_shape=(timestep, lookback), kernel_initializer='he_uniform'))
model.add(Dropout(0.15))
model.add(Dense(lookahead))
model.compile(loss='mean_squared_error', optimizer='adam')

调用fit方法就可以快速的训练这个模型。我们指定迭代20次，小批量数为100）：

model.fit(trainX, trainY, epochs=20, batch_size=batch_size, verbose=1)

下图展示了拟合过程的信息：

Figure 16。LSTM拟合过程信息

那么这个模型的拟合效果如何呢？

Figure 17。LSTM拟合结果

我们看到拟合效果还不错。平均绝对误差百分比（MAPE）只有25%不到，比用传统的SARIMA模型效果要好点。其次，LSTM模型一次输出未来24个时间点的预测值，使用起来比用SARIMA迭代预测方便很多。另外需要指出的是我们也可以直接在模型中指定损失函数为MAPE，这样更好优化衡量指标。

小结

在这篇短文中，我们介绍了一个目前正在流行起来的深度学习建模环境KERAS。这个建模环境相对于传统的计算环境，比如CNTK，TensorFlow，Theano等具有抽象性高，易用性好的特点，同时又依托于这几种计算环境，具有一定的可拓展性，非常适合于从事深度学习的实践者使用。

我们看到使用KERAS可以非常直观地描述神经网络结构，几乎可以达到所见即所得的情况。我们在文中还分别介绍了三种流行的应用领域，分别是：

深度推荐模型，运用嵌入技术可以将不同类型的信息有机结合在一起构造一个深度神经网络推荐系统。
图像识别模型，运用多层卷积神经网络对图像进行切割分析，得到一个精度很好的手写数字分类器。同样的技术和模型可以直接移植到其他物体识别数据上，比如CIFAR10等。我们也介绍了运用已经训练好的现成模型进行迁移学习的手段，减少拟合的参数量，在保持一定精度的情况下提高训练速度。
简单时间序列预测模型，运用长短记忆（LSTM）神经网络模型来有效预测具备一定周期性的时间序列模型。一个非常简单的单层LSTM模型既可以达到定制的SARIMA模型的预测精度。

如果读者对如何安装KERAS这个软件以及KERAS应用于其他领域感兴趣，可以阅读由电子工业出版社出版的《KERAS快速上手：基于Python的深度学习》一书：

实录：《谢梁：用 Keras 搭建实用深度学习模型实战解析》

彩蛋重磅 Chat 分享：《如何在三年内快速成长为一名技术专家》

分享人：
方腾飞并发编程网创始人，支付宝架构师
Chat简介：
工作前三年是职业生涯中成长最快的几年，在这段时间里你会充满激情，做事专注，也容易养成良好的习惯。
在我们公司有些同学在前三年中就快速成为某一个领域的技术专家，有些同学也可能止步不前。本场Chat和大家一起探讨下如何在三年内快速成长为一名技术专家。
学习方法：
掌握良好的学习心态掌握系统化的学习方法
知识如何内化成能力
实战技巧：
你需要学会的编码习惯如何在普通项目中提高自己的能力
在业务团队做
引用文字开发如何成长

想要免费参与本场 Chat ？很简单，公众号后台回复「技术专家」

你可能感兴趣的:(人工智能)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
解锁企业潜能，Vatee万腾平台引领智能新纪元自媒体经济说其他
在数字化转型的浪潮中，企业正站在一个前所未有的十字路口，面对着前所未有的机遇与挑战。解锁企业内在潜能，实现跨越式发展，已成为众多企业的共同追求。而Vatee万腾平台，作为智能科技的先锋，正以其强大的智能赋能能力，引领企业步入一个全新的智能纪元。Vatee万腾平台，是一个集成了人工智能、大数据、云计算等前沿技术的综合性智能服务平台。它不仅仅是一个技术工具，更是企业转型升级的加速器，能够深入企业运营的
LiteBee Wing测评：走进中小学课堂，合适的编程无人机非常重要！ song_bcbd
“国务院在《新一代人工智能发展规划》中明确，要广泛开展人工智能科普活动，实施全民智能教育项目，要在中小学阶段设置人工智能相关课程，逐步推广编程教育，鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广，而且要进行人工智能竞赛。”作为从事创客教育多年的老师，感谢在这个大环境，让学生能够了解人工智能，接触到前沿科技，同时也鼓励更多学生学习编程，因为没有学编程，可能就会像现在的我们后悔以前没有学习好
释放“AI+”新质生产力，深算院如何“把大数据变小”？ YashanDB YashanDB 国产数据库数据库数据库大数据
近期，南都·湾财社推出《新质·中国造》栏目，深入千行百业，遍访湾区企业，解锁湾区新质生产力，共探高质量发展之道。本期对话深圳计算科学研究院YashanDB首席技术官陈志标，探讨国产数据库如何实现创新突围，抢抓数字经济时代的新机遇。以下是专访内容：如何应对AI时代所面临的算力挑战？南都·湾财社：数据、算力和算法是发展人工智能的三要素，深算院做了怎样的前瞻性布局？陈志标：今年，政府工作报告中首次提及开
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen