javastart

Spark MLlib Deep Learning Neural Net(深度学习-神经网络)1.2

[原]Spark MLlib Deep Learning Neural Net(深度学习-神经网络)1.2

2015-5-28阅读62 评论0

Spark MLlib Deep Learning Neural Net(深度学习-神经网络)1.2

http://blog.csdn.net/sunbow0

第一章Neural Net(神经网络)

2基础及源码解析

2.1 Neural Net神经网络基础知识

2.1.1 神经网络

基础知识参照：

http://deeplearning.stanford.edu/wiki/index.php/%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C

2.1.2 反向传导算法

基础知识参照：

http://deeplearning.stanford.edu/wiki/index.php/%E5%8F%8D%E5%90%91%E4%BC%A0%E5%AF%BC%E7%AE%97%E6%B3%95

2.1.3 Denoise Autoencoder

当采用无监督的方法分层预训练深度网络的权值时，为了学习到较鲁棒的特征，可以在网络的可视层（即数据的输入层）引入随机噪声，这种方法称为Denoise Autoencoder(简称dAE)，具体加入的方法就是把训练样例中的一些数据调整变为0，inputZeroMaskedFraction表示了调整的比例

这部分请参见《Extracting and Composing Robust Features with Denoising Autoencoders》这篇论文。参照：

http://wenku.baidu.com/link?url=lhFEf7N3n2ZG2K-mfWsts2on9gN5K-KkrMuuNvHU2COdehkDv9vxVsw-F23e5Yiww_38kWYB56hskLXwVp0_9c7DLw7XZX_w8NoNXfxtoIm

2.1.4 Dropout

训练神经网络模型时，如果训练样本较少，为了防止模型过拟合，Dropout可以作为一种trikc供选择。Dropout是hintion最近2年提出的，源于其文章Improving neural networks by preventing co-adaptation of feature detectors.中文大意为：通过阻止特征检测器的共同作用来提高神经网络的性能。

　Dropout是指在模型训练时随机让网络某些隐含层节点的权重不工作，不工作的那些节点可以暂时认为不是网络结构的一部分，但是它的权重得保留下来（只是暂时不更新而已），因为下次样本输入时它可能又得工作了。参照：

http://wenku.baidu.com/link?url=WpsRjVTrMIhCNqDSDnzm8M6nz2Q7AoNhpnY2XxM9SFYkGni8t94JOgsZUCbSuccOnO8mJyGx67RGLjPr8D9aoxhyOUkYtvfitU9ilaQ-Rqm

2.1.5 Sparsity Penalty

对神经网络每层节点的sparsity计算，对没达到sparsitytarget的参数的惩罚系数的节点进行惩罚。

2.2 Deep Learning NN源码解析

2.2.1 NN代码结构

NN源码主要包括：NeuralNet，NeuralNetModel两个类，源码结构如下：

NeuralNet结构：

NeuralNetModel结构：

2.2.2 NN训练过程

2.2.3 NeuralNet解析

(1)NNLabel

/**

* label：目标矩阵

*nna：神经网络每层节点的输出值,a(0),a(1),a(2)

* error：输出层与目标值的误差矩阵

caseclass NNLabel(label: BDM[Double],nna: ArrayBuffer[BDM[Double]],error: BDM[Double])extends Serializable

NNLabel：自定义数据类型，存储样本数据，格式：目标值，输出值，误差。

(2) NNConfig

/**

*配置参数

caseclassNNConfig(

size: Array[Int],

layer: Int,

activation_function: String,

learningRate: Double,

momentum: Double,

scaling_learningRate: Double,

weightPenaltyL2: Double,

nonSparsityPenalty: Double,

sparsityTarget: Double,

inputZeroMaskedFraction: Double,

dropoutFraction: Double,

testing: Double,

output_function: String)extends Serializable

NNConfig：定义参数配置，存储配置信息。参数说明：

size:神经网络结构

layer:神经网络层数

activation_function:隐含层函数

learningRate:学习率

momentum: Momentum因子

scaling_learningRate:学习迭代因子

weightPenaltyL2:正则化L2因子

nonSparsityPenalty:权重稀疏度惩罚因子

sparsityTarget:权重稀疏度目标值

inputZeroMaskedFraction:权重加入噪声因子

dropoutFraction: Dropout因子

testing: testing

(3) InitialWeight

初始化权重

/**

* 初始化权重

* 初始化为一个很小的、接近零的随机值

def InitialWeight(size: Array[Int]): Array[BDM[Double]] = {

// 初始化权重参数

// weights and weight momentum

// nn.W{i - 1} = (rand(nn.size(i), nn.size(i - 1)+1) - 0.5) * 2 * 4 * sqrt(6 / (nn.size(i) + nn.size(i - 1)));

valn = size.length

valnn_W = ArrayBuffer[BDM[Double]]()

for (i <-1 ton - 1) {

vald1 = BDM.rand(size(i), size(i - 1) + 1)

d1 :-= 0.5

valf1 =2 *4 * sqrt(6.0 / (size(i) + size(i -1)))

vald2 =d1 :*f1

//val d3 = new DenseMatrix(d2.rows, d2.cols, d2.data, d2.isTranspose)

//val d4 = Matrices.dense(d2.rows, d2.cols, d2.data)

nn_W += d2

}

nn_W.toArray

}

(4) InitialWeightV

初始化权重vW

/**

* 初始化权重vW

* 初始化为0

def InitialWeightV(size: Array[Int]): Array[BDM[Double]] = {

// 初始化权重参数

// weights and weight momentum

// nn.vW{i - 1} = zeros(size(nn.W{i - 1}));

valn = size.length

valnn_vW = ArrayBuffer[BDM[Double]]()

for (i <-1 ton - 1) {

vald1 = BDM.zeros[Double](size(i), size(i - 1) + 1)

nn_vW += d1

}

nn_vW.toArray

}

(5) InitialActiveP

初始神经网络激活度

/**

* 初始每一层的平均激活度

* 初始化为0

def InitialActiveP(size: Array[Int]): Array[BDM[Double]] = {

// 初始每一层的平均激活度

// average activations (for use with sparsity)

// nn.p{i} = zeros(1, nn.size(i));

valn = size.length

valnn_p = ArrayBuffer[BDM[Double]]()

nn_p += BDM.zeros[Double](1,1)

for (i <-1 ton - 1) {

vald1 = BDM.zeros[Double](1, size(i))

nn_p += d1

}

nn_p.toArray

}

(6) AddNoise

样本数据增加随机噪声

/**

* 增加随机噪声

* 若随机值>=Fraction，值不变，否则改为0

def AddNoise(rdd: RDD[(BDM[Double], BDM[Double])], Fraction: Double): RDD[(BDM[Double], BDM[Double])] = {

valaddNoise = rdd.map { f =>

valfeatures = f._2

vala = BDM.rand[Double](features.rows,features.cols)

vala1 =a :>= Fraction

vald1 =a1.data.map { f =>if (f ==true)1.0else0.0 }

vala2 =new BDM(features.rows,features.cols,d1)

valfeatures2 =features :*a2

(f._1, features2)

}

addNoise

}

(7) DropoutWeight

神经网络权重随机休眠。

/**

* 随机让网络某些隐含层节点的权重不工作

* 若随机值>=Fraction，矩阵值不变，否则改为0

def DropoutWeight(matrix: BDM[Double], Fraction: Double): Array[BDM[Double]] = {

valaa = BDM.rand[Double](matrix.rows, matrix.cols)

valaa1 =aa :> Fraction

vald1 =aa1.data.map { f =>if (f ==true)1.0else0.0 }

valaa2 =new BDM(matrix.rows: Int, matrix.cols: Int,d1: Array[Double])

valmatrix2 = matrix :*aa2

Array(aa2, matrix2)

}

(8) NNff

神经网络进行前向传播，从输入层->隐含层->输出层，计算每一层每一个节点的输出值，其中输入值为样本数据。输入参数：

batch_xy2：样本数据

bc_config：神经网络配置参数

bc_nn_W：神经网络当前权重参数

输出参数：

RDD[(NNLabel, Array[BDM[Double]])]，格式为(NNLabel(label, nn_a, error), dropOutMask)。

/**

* nnff是进行前向传播

* 计算神经网络中的每个节点的输出值;

def NNff(

batch_xy2: RDD[(BDM[Double], BDM[Double])],

bc_config: org.apache.spark.broadcast.Broadcast[NNConfig],

bc_nn_W: org.apache.spark.broadcast.Broadcast[Array[BDM[Double]]]): RDD[(NNLabel, Array[BDM[Double]])] = {

// 第1层:a(1)=[1 x]

// 增加偏置项b

valtrain_data1 = batch_xy2.map { f =>

vallable = f._1

valfeatures = f._2

valnna = ArrayBuffer[BDM[Double]]()

valBm1 =new BDM(features.rows,1, Array.fill(features.rows *1)(1.0))

valfeatures2 = BDM.horzcat(Bm1,features)

valerror = BDM.zeros[Double](lable.rows,lable.cols)

nna += features2

NNLabel(lable, nna, error)

}

valtrain_data2 =train_data1.map { f =>

valnn_a = f.nna

valdropOutMask = ArrayBuffer[BDM[Double]]()

dropOutMask += new BDM[Double](1,1, Array(0.0))

for (j <-1 to bc_config.value.layer -2) {

// 计算每层输出

// Calculate the unit's outputs (including the bias term)

// nn.a{i} = sigm(nn.a{i - 1} * nn.W{i - 1}')

// nn.a{i} = tanh_opt(nn.a{i - 1} * nn.W{i - 1}');

valA1 =nn_a(j -1)

valW1 = bc_nn_W.value(j -1)

valaw1 =A1 *W1.t

valnnai1 = bc_config.value.activation_functionmatch {

case"sigm" =>

valaw2 = NeuralNet.sigm(aw1)

aw2

case"tanh_opt" =>

valaw2 = NeuralNet.tanh_opt(aw1)

//val aw2 = Btanh(aw1 * (2.0 / 3.0)) * 1.7159

aw2

}

// dropout计算

// Dropout是指在模型训练时随机让网络某些隐含层节点的权重不工作，不工作的那些节点可以暂时认为不是网络结构的一部分

// 但是它的权重得保留下来（只是暂时不更新而已），因为下次样本输入时它可能又得工作了

// 参照 http://www.cnblogs.com/tornadomeet/p/3258122.html

valdropoutai =if (bc_config.value.dropoutFraction >0) {

if (bc_config.value.testing ==1) {

valnnai2 =nnai1 * (1.0 - bc_config.value.dropoutFraction)

Array(new BDM[Double](1,1, Array(0.0)),nnai2)

} else {

NeuralNet.DropoutWeight(nnai1, bc_config.value.dropoutFraction)

}

} else {

valnnai2 =nnai1

Array(new BDM[Double](1,1, Array(0.0)),nnai2)

}

valnnai2 =dropoutai(1)

dropOutMask += dropoutai(0)

// Add the bias term

// 增加偏置项b

// nn.a{i} = [ones(m,1) nn.a{i}];

valBm1 = BDM.ones[Double](nnai2.rows,1)

valnnai3 = BDM.horzcat(Bm1,nnai2)

nn_a += nnai3

}

(NNLabel(f.label, nn_a, f.error),dropOutMask.toArray)

}

// 输出层计算

valtrain_data3 =train_data2.map { f =>

valnn_a = f._1.nna

// nn.a{n} = sigm(nn.a{n - 1} * nn.W{n - 1}');

// nn.a{n} = nn.a{n - 1} * nn.W{n - 1}';

valAn1 =nn_a(bc_config.value.layer -2)

valWn1 = bc_nn_W.value(bc_config.value.layer -2)

valawn1 =An1 *Wn1.t

valnnan1 = bc_config.value.output_functionmatch {

case"sigm" =>

valawn2 = NeuralNet.sigm(awn1)

//val awn2 = 1.0 / (Bexp(awn1 * (-1.0)) + 1.0)

awn2

case"linear" =>

valawn2 =awn1

awn2

}

nn_a += nnan1

(NNLabel(f._1.label,nn_a, f._1.error), f._2)

}

// error and loss

// 输出误差计算

// nn.e = y - nn.a{n};

// val nn_e = batch_y - nnan

valtrain_data4 =train_data3.map { f =>

valbatch_y = f._1.label

valnnan = f._1.nna(bc_config.value.layer - 1)

valerror = (batch_y -nnan)

(NNLabel(f._1.label, f._1.nna,error), f._2)

}

train_data4

}

(9) ActiveP

通过神经网络进行前向传播，计算每一层每一个节点的输出值，计算每个节点的平均值，也即节点的稀疏度。输入参数：

train_nnff：NNff的输出数据

bc_config：神经网络配置参数

nn_p_old：更新前数据

输出参数：

Array[BDM[Double]]，输出节点的平均值。

/**

* sparsity计算，网络稀疏度

* 计算每个节点的平均值

def ActiveP(

train_nnff: RDD[(NNLabel, Array[BDM[Double]])],

bc_config: org.apache.spark.broadcast.Broadcast[NNConfig],

nn_p_old: Array[BDM[Double]]): Array[BDM[Double]] = {

valnn_p = ArrayBuffer[BDM[Double]]()

nn_p += BDM.zeros[Double](1,1)

// calculate running exponential activations for use with sparsity

// sparsity计算，计算sparsity，nonSparsityPenalty是对没达到sparsitytarget的参数的惩罚系数

for (i <-1 to bc_config.value.layer -1) {

valpi1 = train_nnff.map(f => f._1.nna(i))

valinitpi = BDM.zeros[Double](1, bc_config.value.size(i))

val (piSum,miniBatchSize) =pi1.treeAggregate((initpi,0L))(

seqOp = (c, v) => {

// c: (nnasum, count), v: (nna)

valnna1 = c._1

valnna2 = v

valnnasum =nna1 +nna2

(nnasum, c._2 +1)

combOp = (c1, c2) => {

// c: (nnasum, count)

valnna1 = c1._1

valnna2 = c2._1

valnnasum =nna1 +nna2

(nnasum, c1._2 + c2._2)

})

valpiAvg =piSum /miniBatchSize.toDouble

valoldpi = nn_p_old(i)

valnewpi = (piAvg *0.01) + (oldpi *0.09)

nn_p += newpi

}

nn_p.toArray

}

(10) NNbp

神经网络进行后向传播，输出层->隐含层->输入层，计算每个节点的偏导数，也即误差反向传播。输入参数：

train_nnff：NNff输出值

bc_config：神经网络配置参数

bc_nn_W：神经网络当前权重参数

bc_nn_p：节点稀疏度

输出参数：

Array[BDM[Double]]，每层节点的偏导数。

/**

* NNbp是后向传播

* 计算权重的平均偏导数

def NNbp(

train_nnff: RDD[(NNLabel, Array[BDM[Double]])],

bc_config: org.apache.spark.broadcast.Broadcast[NNConfig],

bc_nn_W: org.apache.spark.broadcast.Broadcast[Array[BDM[Double]]],

bc_nn_p: org.apache.spark.broadcast.Broadcast[Array[BDM[Double]]]): Array[BDM[Double]] = {

// 第n层偏导数：d(n)=-(y-a(n))*f'(z)，sigmoid函数f'(z)表达式:f'(z)=f(z)*[1-f(z)]

// sigm: d{n} = - nn.e .* (nn.a{n} .* (1 - nn.a{n}));

// {'softmax','linear'}: d{n} = - nn.e;

valtrain_data5 = train_nnff.map { f =>

valnn_a = f._1.nna

valerror = f._1.error

valdn = ArrayBuffer[BDM[Double]]()

valnndn = bc_config.value.output_functionmatch {

case"sigm" =>

valfz =nn_a(bc_config.value.layer -1)

(error * (-1.0)) :* (fz :* (1.0 - fz))

case"linear" =>

error * (-1.0)

}

dn += nndn

(f._1, f._2,dn)

}

// 第n-1至第2层导数：d(n)=-(w(n)*d(n+1))*f'(z)

valtrain_data6 =train_data5.map { f =>

// 假设 f(z)是sigmoid函数 f(z)=1/[1+e^(-z)]，f'(z)表达式，f'(z)=f(z)*[1-f(z)]

// 假设 f(z) tanh f(z)=1.7159*tanh(2/3.*A)，f'(z)表达式，f'(z)=1.7159 * 2/3 * (1 - 1/(1.7159)^2 * f(z).^2)

valnn_a = f._1.nna

valdi = f._3

valdropout = f._2

for (i <-bc_config.value.layer -2 to 1) {

// f'(z)表达式

valnnd_act = bc_config.value.activation_functionmatch {

case"sigm" =>

vald_act =nn_a(i) :* (1.0 - nn_a(i))

d_act

case"tanh_opt" =>

valfz2 = (1.0 - ((nn_a(i) :* nn_a(i)) * (1.0 / (1.7159 *1.7159))))

vald_act =fz2 * (1.7159 * (2.0 /3.0))

d_act

}

// 稀疏度惩罚误差计算:-(t/p)+(1-t)/(1-p)

// sparsityError = [zeros(size(nn.a{i},1),1) nn.nonSparsityPenalty * (-nn.sparsityTarget ./ pi + (1 - nn.sparsityTarget) ./ (1 - pi))];

valsparsityError =if (bc_config.value.nonSparsityPenalty >0) {

valnn_pi1 = bc_nn_p.value(i)

valnn_pi2 = (bc_config.value.sparsityTarget /nn_pi1) * (-1.0) + (1.0 - bc_config.value.sparsityTarget) / (1.0 -nn_pi1)

valBm1 =new BDM(nn_pi2.rows,1, Array.fill(nn_pi2.rows *1)(1.0))

valsparsity = BDM.horzcat(Bm1,nn_pi2 * bc_config.value.nonSparsityPenalty)

sparsity

} else {

valnn_pi1 = bc_nn_p.value(i)

valsparsity = BDM.zeros[Double](nn_pi1.rows,nn_pi1.cols +1)

sparsity

}

// 导数：d(n)=-( w(n)*d(n+1)+ sparsityError )*f'(z)

// d{i} = (d{i + 1} * nn.W{i} + sparsityError) .* d_act;

valW1 = bc_nn_W.value(i)

valnndi1 =if (i +1 == bc_config.value.layer -1) {

//in this case in d{n} there is not the bias term to be removed

valdi1 =di(i -1)

valdi2 = (di1 *W1 + sparsityError) :*nnd_act

di2

} else {

// in this case in d{i} the bias term has to be removed

valdi1 =di(i -1)(::,1 to -1)

valdi2 = (di1 *W1 + sparsityError) :*nnd_act

di2

}

// dropoutFraction

valnndi2 =if (bc_config.value.dropoutFraction >0) {

valdropouti1 =dropout(i)

valBm1 =new BDM(nndi1.rows: Int,1: Int, Array.fill(nndi1.rows *1)(1.0))

valdropouti2 = BDM.horzcat(Bm1,dropouti1)

nndi1 :* dropouti2

} elsenndi1

di += nndi2

}

di += BDM.zeros(1,1)

// 计算最终需要的偏导数值：dw(n)=(1/m)∑d(n+1)*a(n)

// nn.dW{i} = (d{i + 1}' * nn.a{i}) / size(d{i + 1}, 1);

valdw = ArrayBuffer[BDM[Double]]()

for (i <-0 to bc_config.value.layer -2) {

valnndW =if (i +1 == bc_config.value.layer -1) {

(di(bc_config.value.layer -2 -i).t) *nn_a(i)

} else {

(di(bc_config.value.layer -2 -i)(::,1 to -1)).t *nn_a(i)

}

dw += nndW

}

(f._1, di,dw)

}

valtrain_data7 =train_data6.map(f => f._3)

// Sample a subset (fraction miniBatchFraction) of the total data

// compute and sum up the subgradients on this subset (this is one map-reduce)

valinitgrad = ArrayBuffer[BDM[Double]]()

for (i <-0 to bc_config.value.layer -2) {

valinit1 =if (i +1 == bc_config.value.layer -1) {

BDM.zeros[Double](bc_config.value.size(i +1), bc_config.value.size(i) +1)

} else {

BDM.zeros[Double](bc_config.value.size(i +1), bc_config.value.size(i) +1)

}

initgrad += init1

}

val (gradientSum,miniBatchSize) =train_data7.treeAggregate((initgrad,0L))(

seqOp = (c, v) => {

// c: (grad, count), v: (grad)

valgrad1 = c._1

valgrad2 = v

valsumgrad = ArrayBuffer[BDM[Double]]()

for (i <-0 to bc_config.value.layer -2) {

valBm1 =grad1(i)

valBm2 =grad2(i)

valBmsum =Bm1 +Bm2

sumgrad += Bmsum

}

(sumgrad, c._2 +1)

combOp = (c1, c2) => {

// c: (grad, count)

valgrad1 = c1._1

valgrad2 = c2._1

valsumgrad = ArrayBuffer[BDM[Double]]()

for (i <-0 to bc_config.value.layer -2) {

valBm1 =grad1(i)

valBm2 =grad2(i)

valBmsum =Bm1 +Bm2

sumgrad += Bmsum

}

(sumgrad, c1._2 + c2._2)

})

// 求平均值

valgradientAvg = ArrayBuffer[BDM[Double]]()

for (i <-0 to bc_config.value.layer -2) {

valBm1 =gradientSum(i)

valBmavg =Bm1 :/miniBatchSize.toDouble

gradientAvg += Bmavg

}

gradientAvg.toArray

}

(11) NNapplygrads

根据神经网络进行后向传播，计算得出的偏导数，进行权重的更新。输入参数：

train_nnbp：NNbp输出值

bc_config：神经网络配置参数

bc_nn_W：神经网络当前权重参数

bc_nn_vW：神经网络当前vW权重参数

输出参数：

Array[Array[BDM[Double]]]，更新后权重。

/**

* NNapplygrads是权重更新

* 权重更新

def NNapplygrads(

train_nnbp: Array[BDM[Double]],

bc_config: org.apache.spark.broadcast.Broadcast[NNConfig],

bc_nn_W: org.apache.spark.broadcast.Broadcast[Array[BDM[Double]]],

bc_nn_vW: org.apache.spark.broadcast.Broadcast[Array[BDM[Double]]]): Array[Array[BDM[Double]]] = {

// nn = nnapplygrads(nn) returns an neural network structure with updated

// weights and biases

// 更新权重参数：w=w-α*[dw + λw]

valW_a = ArrayBuffer[BDM[Double]]()

valvW_a = ArrayBuffer[BDM[Double]]()

for (i <-0 to bc_config.value.layer -2) {

valnndwi =if (bc_config.value.weightPenaltyL2 >0) {

valdwi = train_nnbp(i)

valzeros = BDM.zeros[Double](dwi.rows,1)

vall2 = BDM.horzcat(zeros,dwi(::,1 to -1))

valdwi2 =dwi + (l2 * bc_config.value.weightPenaltyL2)

dwi2

} else {

valdwi = train_nnbp(i)

dwi

}

valnndwi2 =nndwi :* bc_config.value.learningRate

valnndwi3 =if (bc_config.value.momentum >0) {

valvwi = bc_nn_vW.value(i)

valdw3 =nndwi2 + (vwi * bc_config.value.momentum)

dw3

} else {

nndwi2

}

// nn.W{i} = nn.W{i} - dW;

W_a += (bc_nn_W.value(i) -nndwi3)

// nn.vW{i} = nn.momentum*nn.vW{i} + dW;

valnnvwi1 =if (bc_config.value.momentum >0) {

valvwi = bc_nn_vW.value(i)

valvw3 =nndwi2 + (vwi * bc_config.value.momentum)

vw3

} else {

bc_nn_vW.value(i)

}

vW_a += nnvwi1

}

Array(W_a.toArray, vW_a.toArray)

}

(12) NNeval

对样本进行前向传播计算输出层，并计算误差。

/**

* nneval是进行前向传播并计算输出误差

* 计算神经网络中的每个节点的输出值，并计算平均误差;

def NNeval(

batch_xy: RDD[(BDM[Double], BDM[Double])],

bc_config: org.apache.spark.broadcast.Broadcast[NNConfig],

bc_nn_W: org.apache.spark.broadcast.Broadcast[Array[BDM[Double]]]): Double = {

// NNff是进行前向传播

// nn = nnff(nn, batch_x, batch_y);

valtrain_nnff = NeuralNet.NNff(batch_xy, bc_config, bc_nn_W)

// error and loss

// 输出误差计算

valloss1 =train_nnff.map(f => f._1.error)

val (loss2,counte) =loss1.treeAggregate((0.0,0L))(

seqOp = (c, v) => {

// c: (e, count), v: (m)

vale1 = c._1

vale2 = (v :* v).sum

valesum =e1 +e2

(esum, c._2 +1)

combOp = (c1, c2) => {

// c: (e, count)

vale1 = c1._1

vale2 = c2._1

valesum =e1 +e2

(esum, c1._2 + c2._2)

})

valLoss =loss2 /counte.toDouble

Loss * 0.5

}

(13) Nntrain

神经网络运行，训练参数。

/**

* 运行神经网络算法.

def NNtrain(train_d: RDD[(BDM[Double], BDM[Double])], opts: Array[Double]): NeuralNetModel = {

valsc = train_d.sparkContext

varinitStartTime = System.currentTimeMillis()

varinitEndTime = System.currentTimeMillis()

// 参数配置广播配置

varnnconfig = NNConfig(size,layer,activation_function,learningRate,momentum,scaling_learningRate,

weightPenaltyL2, nonSparsityPenalty, sparsityTarget, inputZeroMaskedFraction,dropoutFraction,testing,

output_function)

// 初始化权重

varnn_W = NeuralNet.InitialWeight(size)

varnn_vW = NeuralNet.InitialWeightV(size)

// 初始化每层的平均激活度nn.p

// average activations (for use with sparsity)

varnn_p = NeuralNet.InitialActiveP(size)

// 样本数据划分：训练数据、交叉检验数据

valvalidation = opts(2)

valsplitW1 = Array(1.0 -validation,validation)

valtrain_split1 = train_d.randomSplit(splitW1, System.nanoTime())

valtrain_t =train_split1(0)

valtrain_v =train_split1(1)

// m:训练样本的数量

valm =train_t.count

// batchsize是做batch gradient时候的大小

// 计算batch的数量

valbatchsize = opts(0).toInt

valnumepochs = opts(1).toInt

valnumbatches = (m /batchsize).toInt

varL = Array.fill(numepochs *numbatches.toInt)(0.0)

varn =0

varloss_train_e = Array.fill(numepochs)(0.0)

varloss_val_e = Array.fill(numepochs)(0.0)

// numepochs是循环的次数

for (i <-1 tonumepochs) {

initStartTime = System.currentTimeMillis()

valsplitW2 = Array.fill(numbatches)(1.0 / numbatches)

// 根据分组权重，随机划分每组样本数据

valbc_config =sc.broadcast(nnconfig)

for (l <-1 tonumbatches) {

// 权重

valbc_nn_W =sc.broadcast(nn_W)

valbc_nn_vW =sc.broadcast(nn_vW)

// 样本划分

valtrain_split2 =train_t.randomSplit(splitW2, System.nanoTime())

valbatch_xy1 =train_split2(l -1)

// val train_split3 = train_t.filter { f => (f._1 >=batchsize * (l - 1) + 1) && (f._1 <=batchsize * (l)) }

// val batch_xy1 = train_split3.map(f => (f._2, f._3))

// Add noise to input (for use in denoising autoencoder)

// 加入noise，这是denoisingautoencoder需要使用到的部分

// 这部分请参见《Extracting and Composing Robust Features withDenoising Autoencoders》这篇论文

// 具体加入的方法就是把训练样例中的一些数据调整变为0，inputZeroMaskedFraction表示了调整的比例

//val randNoise = NeuralNet.RandMatrix(batch_x.numRows.toInt, batch_x.numCols.toInt, inputZeroMaskedFraction)

valbatch_xy2 =if (bc_config.value.inputZeroMaskedFraction != 0) {

NeuralNet.AddNoise(batch_xy1,bc_config.value.inputZeroMaskedFraction)

} elsebatch_xy1

// NNff是进行前向传播

// nn = nnff(nn, batch_x, batch_y);

valtrain_nnff = NeuralNet.NNff(batch_xy2,bc_config,bc_nn_W)

// sparsity计算，计算每层节点的平均稀疏度

nn_p = NeuralNet.ActiveP(train_nnff,bc_config,nn_p)

valbc_nn_p =sc.broadcast(nn_p)

// NNbp是后向传播

// nn = nnbp(nn);

valtrain_nnbp = NeuralNet.NNbp(train_nnff,bc_config,bc_nn_W,bc_nn_p)

// nn = NNapplygrads(nn) returns an neural network structure with updated

// weights and biases

// 更新权重参数：w=w-α*[dw + λw]

valtrain_nnapplygrads = NeuralNet.NNapplygrads(train_nnbp,bc_config,bc_nn_W,bc_nn_vW)

nn_W = train_nnapplygrads(0)

nn_vW = train_nnapplygrads(1)

// error and loss

// 输出误差计算

valloss1 =train_nnff.map(f => f._1.error)

val (loss2,counte) =loss1.treeAggregate((0.0,0L))(

seqOp = (c, v) => {

// c: (e, count), v: (m)

vale1 = c._1

vale2 = (v :* v).sum

valesum =e1 + e2

(esum, c._2 +1)

combOp = (c1, c2) => {

// c: (e, count)

vale1 = c1._1

vale2 = c2._1

valesum =e1 + e2

(esum, c1._2 + c2._2)

})

valLoss =loss2 /counte.toDouble

L(n) =Loss *0.5

n = n +1

}

// 计算本次迭代的训练误差及交叉检验误差

// Full-batch train mse

valevalconfig = NNConfig(size,layer,activation_function,learningRate,momentum,scaling_learningRate,

weightPenaltyL2, nonSparsityPenalty, sparsityTarget, inputZeroMaskedFraction,dropoutFraction,1.0,

output_function)

loss_train_e(i -1) = NeuralNet.NNeval(train_t,sc.broadcast(evalconfig),sc.broadcast(nn_W))

if (validation >0)loss_val_e(i -1) = NeuralNet.NNeval(train_v,sc.broadcast(evalconfig),sc.broadcast(nn_W))

// 更新学习因子

// nn.learningRate = nn.learningRate * nn.scaling_learningRate;

nnconfig = NNConfig(size,layer,activation_function,nnconfig.learningRate *nnconfig.scaling_learningRate,momentum,scaling_learningRate,

weightPenaltyL2, nonSparsityPenalty, sparsityTarget, inputZeroMaskedFraction,dropoutFraction,testing,

output_function)

initEndTime = System.currentTimeMillis()

// 打印输出结果

printf("epoch: numepochs = %d , Took = %d seconds; Full-batch train mse = %f, val mse = %f.\n",i, scala.math.ceil((initEndTime -initStartTime).toDouble /1000).toLong,loss_train_e(i -1), loss_val_e(i -1))

}

valconfigok = NNConfig(size,layer,activation_function,learningRate,momentum,scaling_learningRate,

weightPenaltyL2, nonSparsityPenalty, sparsityTarget, inputZeroMaskedFraction,dropoutFraction,1.0,

output_function)

new NeuralNetModel(configok,nn_W)

}

2.2.4 NeuralNetModel解析

(1) PredictNNLabel

PredictNNLabel：自定义数据类型，存储样本预测数据，格式：实际值，预测值，误差。

/**

* label：目标矩阵

* features：特征矩阵

* predict_label：预测矩阵

* error：误差

caseclass PredictNNLabel(label: BDM[Double], features: BDM[Double],predict_label: BDM[Double],error: BDM[Double])extends Serializable

(2) predict

对样本数据进行预测。

/**

* 返回预测结果

* 返回格式：(label, feature, predict_label, error)

def predict(dataMatrix: RDD[(BDM[Double], BDM[Double])]): RDD[PredictNNLabel] = {

valsc = dataMatrix.sparkContext

valbc_nn_W =sc.broadcast(weights)

valbc_config =sc.broadcast(config)

// NNff是进行前向传播

// nn = nnff(nn, batch_x, batch_y);

valtrain_nnff = NeuralNet.NNff(dataMatrix,bc_config,bc_nn_W)

valpredict =train_nnff.map { f =>

vallabel = f._1.label

valerror = f._1.error

valnnan = f._1.nna(bc_config.value.layer - 1)

valnna1 = f._1.nna(0)(::,1 to -1)

PredictNNLabel(label,nna1,nnan,error)

}

predict

}

(2) Loss

对预测数据计算误差。

/**

* 计算输出误差

* 平均误差;

def Loss(predict: RDD[PredictNNLabel]): Double = {

valpredict1 = predict.map(f => f.error)

// error and loss

// 输出误差计算

valloss1 =predict1

val (loss2,counte) =loss1.treeAggregate((0.0,0L))(

seqOp = (c, v) => {

// c: (e, count), v: (m)

vale1 = c._1

vale2 = (v :* v).sum

valesum =e1 +e2

(esum, c._2 +1)

combOp = (c1, c2) => {

// c: (e, count)

vale1 = c1._1

vale2 = c2._1

valesum =e1 +e2

(esum, c1._2 + c2._2)

})

valLoss =loss2 /counte.toDouble

Loss * 0.5

}

转载请注明出处：

http://blog.csdn.net/sunbow0

你可能感兴趣的:(Spark MLlib Deep Learning Neural Net(深度学习-神经网络)1.2)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
Git常用命令－修改远程仓库地址猿大师 Linux Java git java
查看远程仓库地址gitremote-v返回结果originhttps://git.coding.net/＊＊＊＊＊.git(fetch)originhttps://git.coding.net/＊＊＊＊＊.git(push)修改远程仓库地址gitremoteset-urloriginhttps://git.coding.net/＊＊＊＊＊.git先删除后增加远程仓库地址gitremotermori
Rust基础知识 GRKF15 rust 开发语言后端
1.Rust语言简介1.1基础语法变量声明：let关键字用于声明变量，可以指定或不指定类型，如leta=10;和letmutc=30i32;。函数定义：使用fn关键字定义函数，并指定参数类型及返回类型，如fnadd(i:i32,j:i32)->i32{i+j}。控制流：包括if、else等，控制语句后需要使用;来结束语句。1.2数据类型整数类型：i8、i16、i32、i64、i128，以及无符号的
【无标题】达瓦达瓦 JhonKI 考研
博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
上图为是否色发 JhonKI 考研
博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
143234234123432 JhonKI 考研
博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
xilinx vivado PULLMODE 设置思路坚持每天写程序 fpga开发
1.xilinx引脚分类XilinxIO的分类：以XC7A100TFGG484为例，其引脚分类如下：1.UserIO(用户IO)：用户使用的普通IO1.1专用(Dedicated)IO：命名为IO_LXXY_#、IO_XX_#的引脚，有固定的特定用途，多为底层特定功能的直接实现，如差分对信号、关键控制信号等，不能随意变更。1.2多功能(Multi-Function)IO：命名为IO_LXXY_ZZ
你可能遗漏的一些C#/.NET/.NET Core知识点追逐时光者 C#.NET DotNetGuide编程指南 c#.net .netcore microsoft
前言在这个快速发展的技术世界中，时常会有一些重要的知识点、信息或细节被忽略或遗漏。《C#/.NET/.NETCore拾遗补漏》专栏我们将探讨一些可能被忽略或遗漏的重要知识点、信息或细节，以帮助大家更全面地了解这些技术栈的特性和发展方向。拾遗补漏GitHub开源地址https://github.com/YSGStudyHards/DotNetGuide/blob/main/docs/DotNet/D
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
简单说说关于shell中zsh和bash的选择秋刀prince MacOS 小猿们的开发日常 bash
希望文章能给到你启发和灵感～如果觉得文章对你有帮助的话，点赞+关注+收藏支持一下博主吧～阅读指南开篇说明一、基础环境说明1.1硬件环境1.2软件环境二、什么是shell、bash、zsh?2.1bash2.2zsh三、选择Bash还是Zsh？四、一些常见问题开篇说明本篇主要简单说明一下，shell中bash和zsh的区别和选择；我们经常会把这两个搞混，不知道什么时候用哪一个，以及怎么使用；一、基础
SpringCloudAlibaba—Sentinel(限流) 菜鸟爪哇
前言：自己在学习过程的记录，借鉴别人文章，记录自己实现的步骤。借鉴文章：https://blog.csdn.net/u014494148/article/details/105484410Sentinel介绍Sentinel诞生于阿里巴巴，其主要目标是流量控制和服务熔断。Sentinel是通过限制并发线程的数量（即信号隔离）来减少不稳定资源的影响，而不是使用线程池，省去了线程切换的性能开销。当资源
光盘文件系统 (iso9660) 格式解析穷人小水滴光盘文件系统 iso9660 deno GNU/Linux javascript
越简单的系统,越可靠,越不容易出问题.光盘文件系统(iso9660)十分简单,只需不到200行代码,即可实现定位读取其中的文件.参考资料:https://wiki.osdev.org/ISO_9660相关文章:《光盘防水嘛?DVD+R刻录光盘泡水实验》https://blog.csdn.net/secext2022/article/details/140583910《光驱的内部结构及日常使用》ht
科幻游戏《外卖员模拟器》主要地理环境设定 (1) 穷人小水滴游戏科幻设计
游戏名称:《外卖员模拟器》(英文名称:waimai_se)作者:穷人小水滴本故事纯属虚构,如有雷同实属巧合.故事发生在一个(架空)平行宇宙的地球,21世纪(超低空科幻流派).相关文章:https://blog.csdn.net/secext2022/article/details/141790630目录1星球整体地理设定2巨蛇国主要设定3海蛇市主要设定3.1主要地标建筑3.2交通3.3能源(电力)
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
react-intl——react国际化使用方案苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
国际化介绍i18n：internationalization国家化简称，首字母+首尾字母间隔的字母个数+尾字母，类似的还有k8s(Kubernetes)React-intl是React中最受欢迎的库。使用步骤安装#usenpmnpminstallreact-intl-D#useyarn项目入口文件配置//index.tsximportReactfrom"react";importReactDOMf
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
C++ lambda闭包消除类成员变量 barbyQAQ c++c++java 算法
原文链接：https://blog.csdn.net/qq_51470638/article/details/142151502一、背景在面向对象编程时，常常要添加类成员变量。然而类成员一旦多了之后，也会带来干扰。拿到一个类，一看成员变量好几十个，就问你怕不怕？二、解决思路可以借助函数式编程思想，来消除一些不必要的类成员变量。三、实例举个例子：classClassA{public:...intfu
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
Vue( ElementUI入门、vue-cli安装) m0_l5z elementui vue.js
一.ElementUI入门目录：1.ElementUI入门1.1ElementUI简介1.2Vue+ElementUI安装1.3开发示例2.搭建nodejs环境2.1nodejs介绍2.2npm是什么2.3nodejs环境搭建2.3.1下载2.3.2解压2.3.3配置环境变量2.3.4配置npm全局模块路径和cache默认安装位置2.3.5修改npm镜像提高下载速度2.3.6验证安装结果3.运行n
4 大低成本娱乐方式: 小说, 音乐, 视频, 电子游戏穷人小水滴娱乐音视频低成本小说游戏
穷人如何获得快乐?小说,音乐,视频,游戏,本文简单盘点一下这4大低成本(安全)娱乐方式.这里是穷人小水滴,专注于穷人友好型低成本技术.(本文为58号作品.)目录1娱乐方式1.1小说(网络小说)1.2音乐1.3视频(b站)1.4游戏(电子游戏/计算机软件)2低成本:一只手机即可3总结与展望1娱乐方式这几种,也可以说是艺术的具体形式.更专业的说,(娱乐)是劳动力再生产的重要组成部分.使人放松,获得快乐
【树一线性代数】005入门 Owlet_woodBird 算法
Index本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376分析实现总结本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376已知非空二叉树T的结点值均为正整数，采用顺序存储方式保存，数据结构定义如下:t
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&