Aminokk

带你掌握Kaggle数字识别比赛:从翻译Kernels开始

kaggle数字识别比赛介绍：

基于MINST数据集上训练的Kaggle入门项目Digit Recognizer的处理方案，参考比赛地址链接
kaggle数字识别比赛(识别率99.37%)代码github带数据集可参考 github地址链接
注明：kaggle数字识别比赛(识别率99.37%)代码来自项目Kernels，作者Peter Grenholm使用keras实现CNN网络，源代码请参照源代码地址

kaggle数字识别比赛(识别率99.37%)代码翻译：

## Convolutional Neural Networks
如果您想将机器学习应用于图像识别，那么卷积神经网络（CNN）就是您的选择。在过去的几年里，它一直在席卷竞争对手，但也许它的第一次重大成功发生在90年代后期，当时Yann LeCun使用它以99.5％的准确度解决了MNIST。我将向您展示如何在Keras中完成它，这是一个用户友好的python神经网络库。

这里的许多其他笔记本使用简单的全连接网络（无卷积）来实现96-97％，这对该数据集来说效果不佳。相比之下，我将在这里向您展示的几乎是最先进的。在内核中（<20分钟训练），我们将达到99％，但如果你一夜之间训练（或使用GPU），你应该达到99.5。如果你在几次运行中进行模型的融合，你应该接近99.77％的最佳公布准确度。 （忽略排行榜上的100％结果;它们是通过重复提交来学习测试集而创建的）
开始：

如果您还没有Keras，可以通过conda或pip轻松安装。它依赖于tensorflow或theano，所以你应该先安装这些。 Keras已在内核和亚马逊深度学习AMI上提供。

#导入numpy包后续进行数据处理
import numpy as np # linear algebra

#导入matplotlib包后续进行画图
import matplotlib.pyplot as plt

#内嵌画图，使图像显示在该页面内
%matplotlib inline

#导入train_test_split包划分数据集为训练集，验证集
from sklearn.model_selection import train_test_split

#导入confusion_matrix(混淆矩阵)，查看真实值被正确或者错误预测的个数
from sklearn.metrics import confusion_matrix

#one-hot编码，采用独热码编码，直观来说就是有多少个状态就有多少比特，而且只有一个比特为1，其他全为0的一种码制，构造稀疏矩阵，解决分类值表示的问题对模型产生的负面影响
from keras.utils.np_utils import to_categorical # convert to one-hot-encoding

#导入顺序Sequential模型，后续可直接在Sequential上构建神经网络
from keras.models import Sequential

#Dense：全连接层；Dropout正则化数据；Flatten压平数据连接全连接层，Conv2D卷积层卷积计算，BatchNormalization数据规范化输出数据的均值接近0，其标准差接近1
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPool2D, BatchNormalization

#导入优化器Adam，基于一阶梯度的随机目标函数优化算法
from keras.optimizers import Adam

#导入ImageDataGenerator图像增广技术来扩充我们的数据集
from keras.preprocessing.image import ImageDataGenerator

#导入LearningRateScheduler动态修改学习率的回调函数
from keras.callbacks import LearningRateScheduler

Using TensorFlow backend.

#根据自己所下载数据设置对应的路径
train_file = "/home/lqm/下载/kaggle/digit_data/digit-recognizer/train.csv"
test_file = "/home/lqm/下载/kaggle/digit_data/digit-recognizer/test.csv"
output_file = "/home/lqm/kaggle_result/submission.csv"

导入数据

与往常一样，我们将数据拆分为训练集和验证集，以便我们可以评估模型的性能。

#numpy导入数据，np.loadtxt
#loadtxt(fname, dtype=, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)
#fname要读取的文件、文件名、或生成器。
#dtype数据类型，默认float。
#comments注释。
#delimiter分隔符，默认是空格。
#skiprows跳过前几行读取，默认是0，必须是int整型。
#usecols：要读取哪些列，0是第一列。例如，usecols = （1,4,5）将提取第2，第5和第6列。默认读取所有列。
#unpack如果为True，将分列读取
raw_data = np.loadtxt(train_file, skiprows=1, dtype='int', delimiter=',')

raw_data

array([[1, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       [1, 0, 0, ..., 0, 0, 0],
       ..., 
       [7, 0, 0, ..., 0, 0, 0],
       [6, 0, 0, ..., 0, 0, 0],
       [9, 0, 0, ..., 0, 0, 0]])

#raw_data[:,1:]表示第一横轴（第0行）的全部数与第一横轴（第0行）第1个数到全部数两两对应组成数组索引，然后取该索引值再组成新的array
#raw_data[:,1:]这里根据数据结构去掉标签得到训练集
raw_data[:,1:]

array([[0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       ..., 
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0]])

#raw_data[:,0]表示第一横轴（第0行）的全部数与数字1两两对应组成数组索引，然后取该索引值再组成新的数组
#raw_data[:,0]这里根据数据结构只取标签
raw_data[:,0]

array([1, 0, 1, ..., 7, 6, 9])

#划分数据集为训练集和验证集
#train_test_split(train_data,train_target,test_size=0.3, random_state=0)
#train_data：被划分的样本特征集
#train_target：被划分的样本标签
#test_size：如果是浮点数，在0-1之间，表示验证集样本占比；如果是整数的话就是样本的数量
#random_state：是随机数的种子,使每次产生的随机数一样
x_train, x_val, y_train, y_val = train_test_split(raw_data[:,1:], raw_data[:,0], test_size=0.1)

每个数据点由784个值组成。完全连接的网络只是将所有这些值视为相同，但CNN将其视为28x28平方。这两个图解释了差异：很容易理解为什么CNN可以获得更好的结果。

#subplots:子图显示，fig, ax = subplots(nrows, ncols，figsize）
#fig代表整个图像，ax代表坐标轴和画的图
#nrows，ncols：子图的行列数
#figsize：显示图形大小
fig, ax = plt.subplots(2, 1, figsize=(12,6))
ax[0].plot(x_train[0])
#设置标题
ax[0].set_title('784x1 data')
#图形显示x_train数据
ax[1].imshow(x_train[0].reshape(28,28), cmap='gray')
#设置标题
ax[1].set_title('28x28 data')


我们现在以这种方式重塑所有数据。对于图片通道来说，Keras最终想要一个额外的维度。如果这是RGB图像，则会有3个通道，但由于MNIST是灰度级，它只使用一个。

# Reshape image in 3 dimensions (height = 28px, width = 28px , canal = 1) （重塑三维图像）
#784个输入，转成28 * 28 + 颜色通道
#-1表示自动计算行数并填充
#注意keras的颜色通道表示在最后一个参数(跟其他框架不同)
x_train = x_train.reshape(-1, 28, 28, 1)
x_val = x_val.reshape(-1, 28, 28, 1)

可以在原始数据上训练网络，像素值为0到255.但是，如果我们使用标准的权重初始化方法，0和1之间的数据应该使网络收敛更快。

#正则化数据，使矩阵内的数据规约到0到1之间，减少计算量，提升模型训练效率
x_train = x_train.astype("float32")/255.
x_val = x_val.astype("float32")/255.

标签以0到9之间的整数给出。我们需要将它们转换为单热编码，即10x1数组，其中1和9为0：s，1的位置显示值。请参阅示例，1的位置显示上图中数字的正确值。

#to_categorical(data,num_classes)：one-hot编码(独热码编码)，在对应的标签置1，其余的全部为0,num_classes表示多少个标签
y_train = to_categorical(y_train)
y_val = to_categorical(y_val)
#例如：2  −>−>  [0,0,1,0,0,0,0,0,0,0]
#example:
print(y_train[0])

[ 0.  0.  0.  0.  0.  0.  1.  0.  0.  0.]

训练模型

Keras提供了两种不同的网络定义方式。我们将使用Sequential API，您可以从输入开始一次添加一个图层。

最重要的部分是卷积层Conv2D。在这里，他们有16-32个滤波器，每个滤波器使用九个权重将像素转换为自身及其八个邻居的加权平均值。由于在整个图像上使用相同的九个权重，因此网络将获取在任何地方都有用的功能。由于它只有九个权重，我们可以将许多卷积层叠加在一起，而不会耗尽内存/时间。

MaxPooling图层只查看四个相邻像素并选取最大值。这将图像的大小减小了一半，并且通过组合卷积和池化层，网络能够组合其特征以学习图像的更多全局特征。最后，我们使用两个完全连接（密集）层中的功能。

批量标准化是一种技术手段，可以加快培训速度。 Dropout是一种正则化方法，其中该层随机地将每个训练样本的一部分权重替换为零。这迫使网络以分布式方式学习特征，而不是依赖于特定权重，因此改善了泛化。 'relu’是激活函数x - > max（x，0）。

#定义顺序模型Sequential，Sequential是多个网络层的线性堆叠
#通常是由以下几层构成：数据输入层(Input)，卷积层(Convolutional)，池化层(Pooling)，全连接层(Dense)，数据输出层(Output)
model = Sequential()

#filters：整数，输出空间的维度（即卷积中滤波器的输出数量），滤波器做卷积计算用的，卷积计算的过程也正是图形匹配的过程。
#kernel_size：一个整数，或者单个整数表示的元组或列表，指明1D卷积窗口的长度（即卷积滤波器窗口大小）。
#activation：激活函数，relu激活函数是指让负数输出为0，正数原样输出。
#传递一个input_shape的关键字参数给第一层，input_shape是一个tuple类型的数据，其中也可以填入None，如果填入None则表示此位置可能是任何正整数。数据的batch大小不应包含在其中
#这里input_shape = (28, 28, 1)指28*28矩阵输入，1为颜色通道，灰色图则为1，rgb图则为3。
model.add(Conv2D(filters = 16, kernel_size = (3, 3), activation='relu',
                 input_shape = (28, 28, 1)))


#BatchNormalization：规范化，该层在每个批次上将前一层的激活值重新规范化，即使得其输出数据的均值接近0，其标准差接近1
#作用：（1）加速收敛（2）控制过拟合，可以少用或不用Dropout和正则（3）降低网络对初始化权重不敏感（4）允许使用较大的学习率
model.add(BatchNormalization())

model.add(Conv2D(filters = 16, kernel_size = (3, 3), activation='relu'))
model.add(BatchNormalization())


#MaxPooling图层只查看四个相邻像素并选取最大值。这将图像的大小减小了一半
#strides设置查看窗口大小，即在相邻的几个像素中做处理
model.add(MaxPool2D(strides=(2,2)))


#Dropout：正则化层，随机地将每个训练样本的一部分权重替换为零，简单一点说在前向传播的时候，让某个神经元的激活值以一定的概率p停止。下面补充Dropout工作原理
#作用：1.降低模型复杂度，增强模型的泛化能力，防止过拟合。2.降低了运算量。
model.add(Dropout(0.25))


model.add(Conv2D(filters = 32, kernel_size = (3, 3), activation='relu'))
model.add(BatchNormalization())
model.add(Conv2D(filters = 32, kernel_size = (3, 3), activation='relu'))
model.add(BatchNormalization())

model.add(MaxPool2D(strides=(2,2)))
model.add(Dropout(0.25))

#Flatten层用来将输入“压平”，即把多维的输入一维化，常用在从卷积层到(Convolution)全连接层(Dense)的过渡。
#也就是说，Convolution卷积层之后是无法直接连接Dense全连接层的，需要把Convolution层的数据压平（Flatten）。
model.add(Flatten())
#Dense(512)表示output的shape为(*,32)
model.add(Dense(512, activation='relu'))

model.add(Dropout(0.25))
model.add(Dense(1024, activation='relu'))
model.add(Dropout(0.5))

#Dense(10)表示output的shape为(*,10)，也就0-9的10个数字标签。
model.add(Dense(10, activation='softmax'))

Dropout工作原理：

（1）首先随机（临时）删掉网络中一半的隐藏神经元，输入输出神经元保持不变。

（2）然后把输入x通过修改后的网络前向传播，然后把得到的损失结果通过修改的网络反向传播。一小批训练样本执行完这个过程后，在没有被删除的神经元上按照随机梯度下降法更新对应的参数（w，b）。

（3）然后继续重复这一过程：恢复被删掉的神经元（此时被删除的神经元保持原样，而没有被删除的神经元已经有所更新）
从隐藏层神经元中随机选择一个一半大小的子集临时删除掉（备份被删除神经元的参数）。
对一小批训练样本，先前向传播然后反向传播损失并根据随机梯度下降法更新参数（w，b）（没有被删除的那一部分参数得到更新，删除的神经元参数保持被删除前的结果）。

另一个改进泛化的重要方法是增强。这意味着通过随机扰动图像来生成更多训练数据。如果以正确的方式完成，它可以强制网络只学习翻译不变的功能。如果你在数百个时期训练这个模型，增强肯定会提高你的表现。在内核中，我们只会查看每个图像4-5次，因此差异较小。我们使用Keras函数进行扩充。

#图像增广技术扩充数据集
#zoom_range参数可以调整图片在长或宽的方向进行放大，这个参数可以是一个数或者是一个list。当给出一个数时，图片同时在长宽两个方向进行同等程度的放缩操作；当给出一个list时，则代表[width_zoom_range, height_zoom_range]，即分别对长宽进行不同程度的放缩。而参数大于0小于1时，执行的是放大操作，当参数大于1时，执行的是缩小操作
#width_shift_range是水平位置平移 。height_shift_range竖直位置平移。
#其参数可以是[0, 1]的浮点数，也可以大于1，但最好不要大于1，超出原图范围的区域大多效果不好，其最大平移距离为图片长或宽的尺寸乘以参数，同样平移距离并不固定为最大平移距离，平移距离在 [0, 最大平移距离] 区间内。
#rotation range的作用是用户指定旋转角度范围，其参数只需指定一个整数即可，可在 [0, 指定角度] 范围内进行随机角度旋转。
datagen = ImageDataGenerator(zoom_range = 0.1,
                            height_shift_range = 0.1,
                            width_shift_range = 0.1,
                            rotation_range = 10)

在培训开始之前，您需要编译模型。作为我们的损失函数，我们在Keras中使用了一个名为’'categorical_crossentropy’的logloss。度量标准仅用于评估。作为优化器，我们可以使用正常的随机梯度下降（SGD），但Adam更快。

#API:model.compile(optimizer = '...', loss = '...', metrics = )
#优化器optimizer：该参数可指定为已预定义的优化器名，如rmsprop、adagrad，或一个Optimizer类的对象
#损失函数loss：该参数为模型试图最小化的目标函数，它可为预定义的损失函数名，如categorical_crossentropy、mse，也可以为一个损失函数。
#指标列表metrics：对分类问题，我们一般将该列表设置为metrics=[‘accuracy’]。指标可以是一个预定义指标的名字,也可以是一个用户定制的函数.指标函数应该返回单个张量,或一个完成metric_name - > metric_value映射的字典.

model.compile(loss='categorical_crossentropy', optimizer = Adam(lr=1e-4), metrics=["accuracy"])

我们以较小的学习率训练一次以确保收敛。然后我们加快速度，只是为了将每个时期的学习率降低10％。 Keras有这个功能：

#LearningRateScheduler动态修改学习率的回调函数，用于动态设置学习率，这里调用lambda函数
annealer = LearningRateScheduler(lambda x: 1e-3 * 0.9 ** x)

我们将在训练期间使用非常小的验证集来节省内核中的时间。

#fit_generator模型的训练
#datagen.flow加载训练数据
# batch_size=None, #每经过多少个sample更新一次权重，defult 32
# epochs=1, #训练的轮数epochs
# verbose=1, #0为不在标准输出流输出日志信息，1为输出进度条记录，2为每个epoch输出一行记录
# validation_data=None, #验证集
# steps_per_epoch=None, #将一个epoch分为多少个steps，也就是划分一个batch_size多大，比如steps_per_epoch=10，则就是将训练集分为10份，不能和batch_size共同使用
# validation_steps=None, #当steps_per_epoch被启用的时候才有用，验证集的batch_size
# callbacks=None,#list，list中的元素为keras.callbacks.Callback对象，在训练过程中会调用list中的回调函数

hist = model.fit_generator(datagen.flow(x_train, y_train, batch_size=16),
                           steps_per_epoch=500,
                           epochs=50, #Increase this when not on Kaggle kernel
                           verbose=2,  #1 for ETA, 0 for silent
                           validation_data=(x_val[:400,:], y_val[:400,:]), #For speed
                           callbacks=[annealer])
#训练集的正确率和误差：acc，loss
#验证集正确率和误差：val_acc，val_loss

Epoch 1/50
19s - loss: 0.8891 - acc: 0.7170 - val_loss: 0.1739 - val_acc: 0.9525
Epoch 2/50
22s - loss: 0.3416 - acc: 0.8949 - val_loss: 0.1262 - val_acc: 0.9575
Epoch 3/50
19s - loss: 0.2551 - acc: 0.9240 - val_loss: 0.0788 - val_acc: 0.9775
Epoch 4/50
18s - loss: 0.2034 - acc: 0.9389 - val_loss: 0.0651 - val_acc: 0.9800
Epoch 5/50
19s - loss: 0.2015 - acc: 0.9444 - val_loss: 0.0608 - val_acc: 0.9850
Epoch 6/50
18s - loss: 0.1627 - acc: 0.9482 - val_loss: 0.0489 - val_acc: 0.9825
Epoch 7/50
18s - loss: 0.1719 - acc: 0.9504 - val_loss: 0.0460 - val_acc: 0.9875
Epoch 8/50
19s - loss: 0.1444 - acc: 0.9594 - val_loss: 0.0219 - val_acc: 0.9900
Epoch 9/50
18s - loss: 0.1345 - acc: 0.9597 - val_loss: 0.0192 - val_acc: 0.9925
Epoch 10/50
18s - loss: 0.1215 - acc: 0.9639 - val_loss: 0.0409 - val_acc: 0.9875
Epoch 11/50
18s - loss: 0.1235 - acc: 0.9666 - val_loss: 0.0127 - val_acc: 0.9975
Epoch 12/50
20s - loss: 0.1090 - acc: 0.9674 - val_loss: 0.0134 - val_acc: 0.9950
Epoch 13/50
20s - loss: 0.1072 - acc: 0.9695 - val_loss: 0.0102 - val_acc: 0.9975
Epoch 14/50
18s - loss: 0.1208 - acc: 0.9675 - val_loss: 0.0098 - val_acc: 0.9975
Epoch 15/50
18s - loss: 0.0954 - acc: 0.9720 - val_loss: 0.0085 - val_acc: 0.9975
Epoch 16/50
19s - loss: 0.0858 - acc: 0.9730 - val_loss: 0.0120 - val_acc: 0.9975
Epoch 17/50
20s - loss: 0.0851 - acc: 0.9753 - val_loss: 0.0089 - val_acc: 0.9975
Epoch 18/50
18s - loss: 0.0978 - acc: 0.9711 - val_loss: 0.0092 - val_acc: 1.0000
Epoch 19/50
18s - loss: 0.0881 - acc: 0.9752 - val_loss: 0.0106 - val_acc: 0.9975
Epoch 20/50
18s - loss: 0.0770 - acc: 0.9761 - val_loss: 0.0066 - val_acc: 1.0000
Epoch 21/50
18s - loss: 0.0755 - acc: 0.9790 - val_loss: 0.0073 - val_acc: 0.9975
Epoch 22/50
20s - loss: 0.0774 - acc: 0.9796 - val_loss: 0.0094 - val_acc: 0.9975
Epoch 23/50
18s - loss: 0.0805 - acc: 0.9766 - val_loss: 0.0048 - val_acc: 1.0000
Epoch 24/50
18s - loss: 0.0795 - acc: 0.9774 - val_loss: 0.0066 - val_acc: 1.0000
Epoch 25/50
18s - loss: 0.0806 - acc: 0.9770 - val_loss: 0.0048 - val_acc: 1.0000
Epoch 26/50
18s - loss: 0.0716 - acc: 0.9779 - val_loss: 0.0040 - val_acc: 1.0000
Epoch 27/50
19s - loss: 0.0636 - acc: 0.9808 - val_loss: 0.0039 - val_acc: 1.0000
Epoch 28/50
19s - loss: 0.0800 - acc: 0.9759 - val_loss: 0.0036 - val_acc: 1.0000
Epoch 29/50
18s - loss: 0.0678 - acc: 0.9797 - val_loss: 0.0030 - val_acc: 1.0000
Epoch 30/50
18s - loss: 0.0780 - acc: 0.9776 - val_loss: 0.0029 - val_acc: 1.0000
Epoch 31/50
19s - loss: 0.0749 - acc: 0.9779 - val_loss: 0.0030 - val_acc: 1.0000
Epoch 32/50
19s - loss: 0.0640 - acc: 0.9809 - val_loss: 0.0033 - val_acc: 1.0000
Epoch 33/50
19s - loss: 0.0653 - acc: 0.9808 - val_loss: 0.0031 - val_acc: 1.0000
Epoch 34/50
17s - loss: 0.0638 - acc: 0.9807 - val_loss: 0.0034 - val_acc: 1.0000
Epoch 35/50
19s - loss: 0.0588 - acc: 0.9836 - val_loss: 0.0035 - val_acc: 1.0000
Epoch 36/50
19s - loss: 0.0696 - acc: 0.9782 - val_loss: 0.0036 - val_acc: 1.0000
Epoch 37/50
18s - loss: 0.0583 - acc: 0.9816 - val_loss: 0.0035 - val_acc: 1.0000
Epoch 38/50
19s - loss: 0.0567 - acc: 0.9821 - val_loss: 0.0031 - val_acc: 1.0000
Epoch 39/50
18s - loss: 0.0663 - acc: 0.9808 - val_loss: 0.0030 - val_acc: 1.0000
Epoch 40/50
17s - loss: 0.0634 - acc: 0.9814 - val_loss: 0.0029 - val_acc: 1.0000
Epoch 41/50
17s - loss: 0.0515 - acc: 0.9838 - val_loss: 0.0026 - val_acc: 1.0000
Epoch 42/50
18s - loss: 0.0743 - acc: 0.9786 - val_loss: 0.0028 - val_acc: 1.0000
Epoch 43/50
18s - loss: 0.0593 - acc: 0.9813 - val_loss: 0.0027 - val_acc: 1.0000
Epoch 44/50
20s - loss: 0.0657 - acc: 0.9800 - val_loss: 0.0028 - val_acc: 1.0000
Epoch 45/50
16s - loss: 0.0651 - acc: 0.9819 - val_loss: 0.0028 - val_acc: 1.0000
Epoch 46/50
17s - loss: 0.0542 - acc: 0.9821 - val_loss: 0.0028 - val_acc: 1.0000
Epoch 47/50
19s - loss: 0.0593 - acc: 0.9824 - val_loss: 0.0029 - val_acc: 1.0000
Epoch 48/50
19s - loss: 0.0708 - acc: 0.9790 - val_loss: 0.0028 - val_acc: 1.0000
Epoch 49/50
19s - loss: 0.0564 - acc: 0.9828 - val_loss: 0.0028 - val_acc: 1.0000
Epoch 50/50
20s - loss: 0.0567 - acc: 0.9817 - val_loss: 0.0027 - val_acc: 1.0000

评估

我们在训练期间仅使用了验证集的子集来节省时间。现在让我们检查整个验证集的性能。

#evaluate：模型评估，返回损失函数和指定的精确指标
#evaluate(self, x, y, batch_size=32, verbose=1, sample_weight=None)
#x_val：数据
#y_val：标签
#batch_size：整数，指定进行梯度下降时每个batch包含的样本数。训练时一个batch的样本会被计算一次梯度下降，使目标函数优化一步
#verbose：日志显示，0为不在标准输出流输出日志信息，1为输出进度条记录，2为每个epoch输出一行记录
#sample_weight：权值的numpy array，用于在训练时调整损失函数（仅用于训练）。可以传递一个1D的与样本等长的向量用于对样本进行1对1的加权，或者在面对时序数据时，传递一个的形式为（samples，sequence_length）的矩阵来为每个时间步上的样本赋不同的权
final_loss, final_acc = model.evaluate(x_val, y_val, verbose=0)
#修改输出格式
print("Final loss: {0:.4f}, final accuracy: {1:.4f}".format(final_loss, final_acc))

Final loss: 0.0233, final accuracy: 0.9945

#hist.history包含val_loss,val_acc,loss,acc
#训练集的正确率和误差：acc，loss
#验证集正确率和误差：val_acc，val_loss
plt.plot(hist.history['loss'], color='b')
plt.plot(hist.history['val_loss'], color='r')
plt.show()
plt.plot(hist.history['acc'], color='b')
plt.plot(hist.history['val_acc'], color='r')
plt.show()

#模型的预测：predict(x, batch_size=None, verbose=0, steps=None, callbacks=None)
#x：输入数据，作为Numpy数组（如果模型有多个输入，则为Numpy数组列表）。
#batch_size：整数，指定进行梯度下降时每个batch包含的样本数。训练时一个batch的样本会被计算一次梯度下降，使目标函数优化一步
#verbose：日志显示，0为不在标准输出流输出日志信息，1为输出进度条记录，2为每个epoch输出一行记录
#step：在宣布预测轮次结束之前的步骤总数（样本批次）
# callbacks=None,#list，list中的元素为keras.callbacks.Callback对象，在训练过程中会调用list中的回调函数
y_hat = model.predict(x_val)

#numpy.argmax(a, axis=None, out=None)，返回沿轴axis最大值的索引。
#a：数据
#axis = 1表示沿横轴，axis = 0表示沿纵轴
#返回取得最大值的索引
y_pred = np.argmax(y_hat, axis=1)
y_true = np.argmax(y_val, axis=1)

#confusion_matrix(混淆矩阵)：查看真实值被正确或者错误预测的个数，对角线表示0到9被正确预测的个数
cm = confusion_matrix(y_true, y_pred)
print(cm)

[[391   0   0   0   0   1   0   0   0   0]
 [  0 478   0   0   0   0   0   1   0   0]
 [  0   0 409   1   0   0   0   4   0   0]
 [  0   0   0 416   0   0   0   0   1   0]
 [  0   0   0   0 391   0   1   1   0   1]
 [  0   0   0   0   0 378   1   0   1   0]
 [  1   0   1   0   0   1 436   0   1   0]
 [  0   0   0   0   0   0   0 455   0   0]
 [  0   0   0   0   1   0   1   0 395   0]
 [  0   0   0   0   2   0   0   2   0 428]]

考虑到目前为止最少的训练，也不算太糟糕。事实上，我们只通过训练数据大约五次。通过适当的培训，我们应该获得非常好的结果

正如您所看到的，可以调整相当多的参数（层数，过滤器数量，Dropout参数，学习速率，增强设置）。这通常是通过反复试验完成的，没有简单的捷径。

除非您使用极高的学习率，否则获得融合不应成为问题。然而，很容易创建一个过度拟合的网络，在训练集上获得完美的结果，并且在验证数据上的结果非常差。如果发生这种情况，您可以尝试增加Dropout参数，增加扩充，或者可能提前停止训练。如果您想要提高准确度，请尝试添加另外两个图层，或者增加过滤器的数量。

提交结果

要轻松进入排行榜的上半部分，只需按照以下步骤操作，转到内核的输出，然后提交“submission.csv”

#参考上述数据导入
mnist_testset = np.loadtxt(test_file, skiprows=1, dtype='int', delimiter=',')
x_test = mnist_testset.astype("float32")
x_test = x_test.reshape(-1, 28, 28, 1)/255.

#参考上述数据预测
y_hat = model.predict(x_test, batch_size=64)

y_hat由类概率组成（对应于训练标签的单热编码）。我现在选择概率最高的类别

y_pred = np.argmax(y_hat,axis=1)

#将预测值写入文件保存
with open(output_file, 'w') as f :
    f.write('ImageId,Label\n')
    for i in range(len(y_pred)) :
        f.write("".join([str(i+1),',',str(y_pred[i]),'\n']))

从这个笔记本提交通常会给你一个99％左右的结果，一些随机性取决于权重初始化和测试/训练数据分割。我通过平均超过5次良好跑步达到了99.3％，如果你一夜之间训练，你可以获得更高的成绩。

如果你已成功走到这一步，你现在可以为各种图像识别问题创建类似的CNN。祝好运！
在学习过程中有些知识掌握不够，有问题欢迎指出。

你可能感兴趣的:(kaggle比赛整理)

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
勇士赢了，我把掌声给了骑士复角度的生活
今天，不参加高考，只看NBA总决赛第三场的较量。这么说有点得罪高考生了，不过我没有当他们面秀，也没有跑到考点外面得瑟，所以我内心毫无波澜。毫无疑问，考场里不乏骑士和勇士球迷，在紧张作答语文考卷同时还心系着球队，不过我希望今天的比赛不会让你们有所分心，毕竟高考不会像比赛录像那样可以再来。今天，好像起来赶考一样，我起得很早，然而事实是睡不着，挺郁闷的，又不是我高考，我紧张什么？九点我并没有准时打开浏览
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
2022-08-28 蔚蓝一片晴
初三暑假培训收获点滴从8月25至8月27日三天两晚的培训结束了，回到家中，该静下心来整理一下触动心灵的收获，成为成长的积淀。1.在优秀团队中快速成长与提升，做一名反思成长型教师一名专业型教师的教学指导包括了教学原理知识、案例知识、策略知识。面对教学中的遇到的有趣的情形、问题会去研究其理，寻找更好的教法学法对策。从新手到成熟型教师，再走向专业型教师，需要的是觉醒与反思，多进行案例研究，从案例中观察、
2020-8-19晨间日记：看过的电影盐大虾
今天是周三起床：6点半就寝：11点天气：晴心情：正常纪念日：周三任务清单今日完成的任务，最重要的三件事：1.整理写过的文档2.电影《电灯泡》3.这就是街舞第三季第五期改进：早睡早起习惯养成：早睡早起，看书周目标·完成进度两篇文章学习·信息·阅读电影艺术发展史相关教材健康·饮食·锻炼吃了挺多零食，还喝了果粒橙，还是得少吃，多锻炼，不然会慢慢死掉的。人际·家人·朋友淡定交流，不放在心上。工作·思考专心
好习惯和坏习惯炫舞阳光
好习惯和坏习惯文/炫舞阳光生活中有很多细节，可以体现出一个人的习惯。好的习惯让人保持清晰的头脑，坏的习惯常常让人丢东忘西，头脑混沌。生活中，我喜欢整理东西。厨房里，锅碗瓢盆各样东西我习惯各就其位。案板、勺子、铲子和刀具我习惯性的挂起来。大大小小的碗和盘子，我习惯性的立在收纳柜里。每次轮到我在家做饭时，我习惯于一边使用，一边收拾和擦拭归位。做好饭时，台面干干净净。我想把这种习惯影响和传递给家人。然而
python批量读取tiff文件_Python Pillow批量转换tif格式到jpg weixin_39557797
最近因为想要整下网站的壁纸，从网站下载了别人整理好的合集压缩包，解压之后，却发现里面的文件都是tif的，tif格式网站和电脑都不认的，根本不能作壁纸。这时候，就需要转换图片格式了，首先我找了几款转换格式的软件，发现效果都不好，要不是不支持tif格式，要不就是转换出来的图片糊的不行。最终，还是决定用Python的Pillow库来写一个脚本，完成这个任务。下面是整个的小脚本----importosim
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
更改npm镜像源为淘宝镜像骆小骆基于node.js
npm常用指令后缀*最近复习了一下node.js整理了一下跟node.js相关的指令后缀*--save、-S参数意思是把模块的版本信息保存到dependencies（生产环境依赖）中，即你的package.json文件的dependencies字段中；–--save-dev、-D参数意思是把模块版本信息保存到devDependencies（开发环境依赖）中，即你的package.json文件的de
2022-07-06学会放手杨晓玲乐平市第十一小学
2022年7月5日星期一晴今天结束了国培培训，上午收拾好物品，带着孩子整理心情，带着憧憬去到孩子新的学校，因为从小我有意培养孩子自己整理自己内务，孩子很认真的把自己要用的都整理好，不用的都另外装好，这一点孩子的能力还是挺强的。把自己的行李按学校提出的要求认真的整理好，我们便出发了。我们早早的来到学校，时间还早，便让她到阿姨那休息了一会儿，每去到一个新的地方，能迅速的安顿下来，这是非常好的。时间很快
抱怨很廉价，别做空想家 Fang2023
今天在整理浏览器收藏夹的时候，看到一个很多年前保存的一个网页，上面是一支央视公益广告的视频，《我创故我在》。思绪一下子回到了好几年前。还记得第一次无意中在电视上看到这支广告，喜悦之情溢于言表。抱怨很廉价，别做空想家，这句歌词尤其喜欢。听着歌曲，仿佛那时候的潮气蓬勃、意气风发，又回来了，即使此时感到疲惫。【公益】央视公益广告歌曲《我创故我在》_腾讯视频
好运来是露漫漫呀
4月9日下午17.45分晴此时学校里广播站放着激情热烈的歌曲——《好运来》。“好运来，祝你好运来……”第一瞬间，我想到了他们是放这首歌是为补考的同学招来好运气的。然后我思绪飞扬，飘到了高中考试前同学放这首歌来抚平心态。飘到了高考前整理班级课桌时，学校喇叭里大大咧咧放着《好运来》……疲惫的我会心一笑。飘到了上学期考细解实验试卷时的那个中午青春小胖放这首歌来招好运，祈祷考的都会…………关于《好运来》的
思考成长丁昆朋
这篇文章是加紧赶出来“应付”日更，一方面不想要再晚睡了；另一方面不想失去日更达人的称号，只能坐下来匆忙写下一点文字。既然标题是成长，先来总结一下这段时间的收获：1、整理箱子站着可以看电脑，坐着反而是一种享受，减少了坐着腰酸背痛的现象；2、使用讯飞输入法大大增加自己的输出量；3、Anaconda+“pythontutor.com"+Google算是简单入门python；4、英语的阅读文章能力、听力提
改变从每一刻震震一点儿飞飞
每天要做的事情很多，思考的时间太少，整理的不够，所以，每天过的很快，但过的太单薄了，不知道进步在哪里？今天的意义在哪里？这问题到底出在哪里呢？哪里都很乱，时间可能还是被浪费了！要做的事情咬咬牙也就做了，想到看到就做到，是不是就会简单很多！立刻做，去试一试！
LeetCode github集合，附CMU大神整理笔记 Wesley@ LeetCode github
GithubLeetCode集合本人所有做过的题目都写在一个java项目中，同步到github中了，算是见证自己的进步。github目前同步的题目是2020-09-17日之后写的题。之前写过的题会陆续跟新到github中。目前大概400个题目Github项目链接：https://github.com/sunliancheng/leetcode_github附上一份优秀的教材整合：这是卡内基梅隆(C
靠谱的海淘APP大全可以海淘的软件有哪些氧惠评测
96KaiFa为您整理了可以海淘的软件有哪些，分别有海淘、ZOZO日本海淘、海淘铺、美芽海淘、海淘1号海外购、高乐高海淘、海淘美瞳、海淘返利网、海淘拼单、豌豆公主海淘，下面一起来看靠谱的海淘APP大全吧！购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多
2022-11-25 疫情卷土而来快乐微笑每一天
原计划本周因比赛休息两天半，结果一个阳性患者疫情转变了所有，轮休课表换掉，继续周五上课；比赛顺延，假期顺延，相对应确诊病例所在区域封闭。这疫情何时是一个尽头，谁也无法知晓，唯有进出带好口罩，保护自己，方能战胜疫情。疫情无情，人间温暖，期待疫情早日过去，大地重返平安和谐。
小学科学课堂管理规培有感 31c6a3d23d4e
今天进行了这学期的第一次新教师规培，又是干货满满的一次学习，两位有经验的老教师分享了自己很多年来有关科学教学的经验。苏老师的语言风趣幽默，通过他的课堂管理规则，懂得了语言的艺术。艳姐分享的培养小助手，对我的帮助很多，小组长，（做记录、整理材料、管理卫生）。既培养了学生，又减轻老师的工作量，还有评价表，学起来学起来！
正念内观练习20220622 蓝空静云
夏一、善念&感谢女儿一边说想明天放学后去看看要去北京手术的闺蜜，又一边念叨明天闺蜜要出发，家里得收拾行李什么的，是不是去了会添乱，真是个心思细腻又善解人意的姑娘。上周表姐回了趟老家，妈妈托给捎回来一些鹅蛋、鸡蛋还有自己腌的咸鸭蛋，拿回来一直放在楼下，今天拿上来收拾整理放入冰箱保鲜慢慢吃。妈妈家不养家畜，这些都是邻居们自家养的送给妈妈，妈妈又特意捎给女儿，妈妈总说自家养的比外面卖的好，好的总是会留给
DVBS 卫星波段设置晨春计 TV Android TV android
目录背景DVBS介绍LNB(LowNoiseBlock)LNBC(LowNoiseBlockController)Tuner接收频率范围卫星波段范围卫星波段降频Ku波段降频C波段降频码流机和DVBS菜单设置背景不经常使用DVBS频率设置，容易忘记，整理如下。DVBS介绍在DVBS/S2信号通过同轴线进入电视/机顶盒的同时，LNBC会通过同轴线向外输出0/22K，13V/18V等信号，以控制LNB的
Ubuntu常用命令整理十里染林
ubuntu16.04server开启ssh:使用x-shell连接主机，发现22端口没有打开，开启ssh服务：安装openssh-serversudoapt-getinstallopenssh-server检查安装是否成功sudops-e|grepssh开启ssh服务sudoservicesshstartUbuntu开启/关闭防火墙:开启防火墙sudoufwenable关闭防火墙sudoufwd
关于日更的思考暖益
日更也有10天了，习惯还在养成的过程中，遇到一些问题。日更确实让我觉得有一些成长和思考，感觉也非常棒。但是最近日更遇到一些问题，一个是内容，一个是时间。【日更内容】想要写的内容其实很多，但是需要整理思路，花更多的时间思考，才能提高输出文章的质量。日更内容可通过得到的听书，日常的电影，或者学习获取。记得之前看过的《暗时间》，其中有一个方法就很适合用在此处，往头脑中放一个问题，有事没事拿出来思考或者找
2021-10-03 虫虫新生111
今天放假的第3天感觉过得好快，总体来说数学做了25道题，里边有几道题还是弄得不清楚，仍然不懂怎么做，不过整体感觉思路比去年要清晰很多，因为有去年的基础，今年还是比较轻松一些。逻辑做了有几道题，6题，错2，有些概念总的是模糊不清，还是要反复的再整理一下概念，以及回头看一下讲的基础知识，把基础的公式弄懂才可以。现在困了睡觉，明天早点起床。
稍微落后的人更容易被激励成长有杕之杜
今日纯分享。图片发自App沃顿商学院市场营销学教授乔纳·伯杰在接受《哈佛商业评论》采访时，介绍了他的一项研究。伯杰教授告诉参加实验的人，他们在跟隔壁房间的另一个人比赛打字速度，获胜的人有金钱奖励。一轮比赛之后，伯杰给了这些人不同的反馈，有的人被告知远远落后竞争对手，有的人被告知稍稍落后，还有的人被告知不相上下或者略微领先。结果只有那些被告知“稍微落后”的人，在第二轮中速度明显提高，而且总体来说，这
新媒体运营小白，有哪些书籍可以推荐？ y耳朵
为了转行运营，我曾花了3个月的时间，看了不下百本书，可以说市面上大部分跟运营有关的书籍，我都看过了，因此关于书的推荐也有一些自己的小见解。看书不一定要多，但一定要****精，我根据豆瓣评分、推荐热度和自己的转行经历，挑出了13本值得运营小白看的书，收藏好这份书单，不需要你浪费时间去找书了。先看下统计好的书单：整理不易，看完记得点个赞哦！感谢你的支持。入门篇：1.《运营之光》（豆瓣评分：8.0)推荐
世界十大名牌皮鞋都适合什么性格的人？我信了你滴鞋
前面介绍了《世界公认的五大名鞋，穿过三个以上都是不一般的人》，大概讲了5大名鞋品牌的故事，受到广大读者的关注和讨论，因此在原来的基础上重新整理了世界十大知名皮鞋品牌及特点，揭开他们神秘的面纱，看看到底是哪些人在穿这些鞋子？他们为什么能被公认为是世界排名靠前的品牌？能进入十大名皮鞋的，制造的手工工艺已相近，不同的是品牌设计理念与鞋材选用。正因为每个品牌不同的设计理念，制造出不一样的美丽的产品，适合不
三角洲行动内测资格怎么获得三角洲行动内测服怎么进入会飞滴鱼儿
手游内测资格怎么获得？这是每款新游戏开放内测的时候，玩家问的最多的一个问题，其实现在大多数游戏在上线之前官方都会开启几轮的内测测试，每轮测试之后，官方会收集全部运行过程中的数据，来进行优化和改进，至此这也是每款游戏的定律，但是有一个问题的就是，不管哪款游戏，开启测试的时候，名额都是有限的，经常都有很多玩家想要测试资格，却无论怎么也不会获得，本期小编就来给大家整理几个方法，让大家抢先一步！游戏内测资
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http