Vickyiiiiii

EM算法实验内容及图片分类任务

EM算法实验内容

一、基本原理

简介

EM算法又称期望最大化算法，是一种迭代算法，是在概率模型中寻找参数极大似然估计的算法，其中概率模型依赖于无法观测的隐含变量。它主要用于从含有隐含变量的数据中计算极大似然估计。是解决存在隐含变量优化问题的有效方法。

简单推导

1. JENSEN不等式

设 $f$ 是定义域为实数的函数，如果对于所有的实数 $x$ ， $f ” (x) \geq 0$ ，那么 $f$ 是凸函数。

Jensen不等式表述如下：
$E (f (X)) \geq f (E (X))$

特别地，如果 $f$ 是严格凸函数，那么 $E (f (X)) = f (E (X))$ 当且仅当，也就是说 $X$ 是常量。

2. EM算法
（1）完整数据：

观测数据：观测到的随机变量 $X$ 样本
$X=(x_1,...,x_n)$
隐含变量：未观测到的随机变量 $Z$ 的值
$Z=(z_1,...z_n)$
完整数据：包含观测到的随机变量 $X$ 和隐含变量 $Z$ 的数据： $Y = (X, Z)$
$Y=((x_1,z_1),...(x_n,z_n))$

给定的训练样本是 $x_1,x_2,...,x_n$ ，样例间独立，我们想找到每个样例隐含的类别 $z$ ，能使得 $p (x, z)$ 最大。 $p (x, z)$ 的最大似然估计如下：

EM算法的思想是不断建立 $l$ 的下界（E-step），然后优化下界（M-step）。

对于每一个样例 $i$ ，让 $Q_i$ 表示该样例隐含变量 $z$ 的某种分布， $Q i$ 满足

$ΣzQ_i(z)=1,Qi(z)≥0$

得到

这里运用JENSEN不等式，将(3)看成是 $\theta$ 的函数， $\theta$ 又是模型里的参数，上述过程看成是对 $l(\theta)$ 求下界的过程，所以(3)是参数 $\theta$ 的对数似然函数的下界。

等式成立的条件为：

$c$ 为常数，不依赖于 $z^i$ 。对此式子做进一步推导，我们知道 $ΣzQ_i(z^i)=1$
则

$Σ_zp(x^i,z^i;θ)=c$

推出下式

3. 算法步骤

E-step：固定 $\theta$ 后，选择隐含变量 $z^i$ 的概率分布
在给定 $Q_i(z^i)$ 后，根据求极大似然估计量的过程，去极大化 $l(\theta)$ 的下界，得到新的参数 $\theta$

二、问题实例

问题

假设有两枚硬币 A、B，以相同的概率随机选择一个硬币，进行如下的抛硬币实验：共做 5 次实验，每次实验独立的抛十次，结果如图中 a 所示，例如某次实验产生了 H、T、T、T、H、H、T、H、T、H，H 代表正面朝上。假设试验数据记录员可能是实习生，业务不一定熟悉，造成如下图的 a 和 b 两种情况：

a 表示实习生记录了详细的试验数据，我们可以观测到试验数据中每次选择的是 A 还是 B
b 表示实习生忘了记录每次试验选择的是 A 还是 B，我们无法观测实验数据中选择的硬币是哪个

问题求解

1.情况 a

此时清楚的知道抛出的是A还是B，在样本基数很大的情况，可以直接将频率作为概率
$\theta_A=24/(24+6)=0.8$
$\theta_B=9/(9+11)=0.45$

2. 情况b

已知：硬币正面朝上次数
未知：是A硬币还是B硬币

为了得到较为准确的 $\theta_A$ 和 $\theta_B$ ，我们使用EM算法，这里假定运算目标的初始值为

E-step
以第一轮抛硬币为例，可以看到5次朝上5次朝下
如果丢的是硬币A，则丢到正面的概率为
$P_A=C^5 _{10}*(\theta_A)^5*(1-\theta_A)^{10-5}$
如果丢的是硬币B，则丢到正面的概率为
$P_B=C^5 _{10}*(\theta_B)^5*(1-\theta_B)^{10-5}$
则在第一轮掷硬币时，该硬币为A的概率为 $P_A/(P_A+P_B)=0.45$
该硬币为B的概率为
$P_B/(p_A+p_B) = 0.55$

M-step
此时实际发生正面向上的次数是5，所以这次硬币A正面向上的期望为
$5 * 0.45 = 2.2 H$
同理A反面朝上的概率为
$5 * 0.45 = 2.2 T$

其他轮的运算同理

所有轮运算完，将结果分别对应相加，求出新 $\theta$ 值，即

重复E-step和M-step，直至算法收敛到一定精度，结束算法
得到

python实现

已知EM算法是由多次迭代至收敛，所以代码可以分为两个部分。

第一个部分为单次迭代的处理，包括求解二项分布概率质量函数，计算本次抛出硬币分别为A、B的概率，分别计算硬币A、B新的正面朝上的概率。
第二个部分为循环部分，在没有满足设置的收敛条件下，不断进行第一部分的处理，直至达到条件得出结果。

1. 录入数据集

# 硬币投掷结果观测序列
observations = np.array([[1, 0, 0, 0, 1, 1, 0, 1, 0, 1],
                         [1, 1, 1, 1, 0, 1, 1, 1, 1, 1],
                         [1, 0, 1, 1, 1, 1, 1, 0, 1, 1],
                         [1, 0, 1, 0, 0, 0, 1, 1, 0, 0],
                         [0, 1, 1, 1, 0, 1, 1, 1, 0, 1]])

2. 单次迭代em_single

这里传入两个数据结构
priors:[theta_A,theta_B]存储了硬币A正面朝上的概率和硬币B正面朝上的概率，在迭代完以后要对其进行更新
observations:[m X n matrix]是一个m*n的矩阵，即前面录入的数据集
函数内部数据结构
counts = {"A":{"H":0,"T":0},"B":{"H":0,"T":0}} 存储AB硬币统计正反面次数,H正面，T反面
theta_A = priors[0]硬币A 正面朝上的概率
theta_B = priors[1]硬币B正面朝上的概率

E-step

分别求解硬币A、B的二项分布概率质量函数

#二项分布概率质量函数
     contribution_A = stats.binom.pmf(num_heads,len_observation,theta_A)
     contribution_B = stats.binom.pmf(num_heads,len_observation,theta_B)

num_heads为硬币正面朝上的次数
len_observation为这一轮抛硬币的总次数
theta_A/B为达成目标正面朝上的概率
即求抛掷硬币len_observation次（正面概率为theta_A/B），正面朝上num_heads次的概率

求解抛出硬币分别是A、B的概率

     #抛出硬币是A的概率
     weight_A = contribution_A / (contribution_A + contribution_B)
     #抛出硬币是B的概率
     weight_B = contribution_B / (contribution_A + contribution_B)

更新在当前参数下A、B硬币的正反面次数

     counts['A']['H'] += weight_A * num_heads
     counts['A']['T'] += weight_A * num_tails
     counts['B']['H'] += weight_B * num_heads
     counts['B']['T'] += weight_B * num_tails

M-step
分别计算新的A、B正面朝上的概率，并返回

   new_theta_A = counts['A']['H'] / (counts['A']['H'] + counts['A']['T'])
   new_theta_B = counts['B']['H'] / (counts['B']['H'] + counts['B']['T'])
   return [new_theta_A,new_theta_B]

3. 循环多次em

传入参数

"""
EM算法
:param observation: 观测数据
:param prior: 模型初值
:param tol: 迭代结束阈值
:param iterations: 最大迭代次数
:return: 局部最优的模型参数
"""

传入A、B正面朝上的初始概率，在循环中单次迭代（本题中初始概率分别为0.6和0.5）

[prob_A,prob_B],iteration = em(observations,[0.6,0.5])

4. 运行结果

图片分类任务

图像分类的任务，就是对于一个给定的图像，预测它属于的那个分类标签（或者给出属于一系列不同标签的可能性）。图像是3维数组，数组元素是取值范围从0到255的整数。数组的尺寸是宽度x高度x3，其中这个3代表的是红、绿和蓝3个颜色通道。

图片分类流程

目标：已有固定的分类标签集合，然后对于输入的图像，从分类标签集合中找出一个分类标签，最后把分类标签分配给该输入图像。
输入：输入是包含N个图像的集合，每个图像的标签是K种分类标签中的一种。这个集合称为训练集。
学习：这一步的任务是使用训练集来学习每个类到底长什么样。一般该步骤叫做训练分类器或者学习一个模型。
评价：让分类器来预测它未曾见过的图像的分类标签，并以此来评价分类器的质量。我们会把分类器预测的标签和图像真正的分类标签对比。毫无疑问，分类器预测的分类标签和图像真正的分类标签如果一致，那就是好事，这样的情况越多越好。

图像分类数据集：CIFAR-10

这个数据集包含了60000张32X32的小图像。每张图像都有10种分类标签中的一种。这60000张图像被分为包含50000张图像的训练集和包含10000张图像的测试集。

在运用数据集时要注意的问题：
决不能使用测试集来进行调优，只能使用训练集来调优超参数。测试数据集只使用一次，即在训练完成后评价最终的模型时使用。

调优思路：从训练集中取出一部分数据用来调优，我们称之为验证集（validation set）。

把训练集分成训练集和验证集。使用验证集来对所有超参数调优。最后只在测试集上跑一次并报告结果。

以CIFAR-10为例，我们可以用49000个图像作为训练集，用1000个图像作为验证集。验证集其实就是作为假的测试集来调优。

一、KNN实现

Nearest Neighbor图像分类思想
拿测试图片和训练集中每一张图片去比较，然后将它认为最相似的那个训练集图片的标签赋给这张测试图片。
比较方法
在本例中，就是比较32x32x3的像素块。最简单的方法就是逐个像素比较，最后将差异值全部加起来。即将两张图片先转化为两个向量 $I_1$ 和 $I_2$ ，然后计算他们的L1距离

这里的求和是针对所有的像素。下面是整个比较流程的图例：
L1方法

以图片中的一个颜色通道为例来进行说明。两张图片使用L1距离来进行比较。逐个像素求差值，然后将所有差值加起来得到一个数值。如果两张图片一模一样，那么L1距离为0，但是如果两张图片很是不同，那L1值将会非常大。

L2方法
计算两个向量间的欧式距离

L1和L2比较
L2比L1更加不能容忍向量的差异。也就是说，相对于1个巨大的差异，L2距离更倾向于接受多个中等程度的差异。L1和L2都是在p-norm常用的特殊形式。
KNN分类器
KNN图像分类思想
与其只找最相近的那1个图片的标签，我们找最相似的k个图片的标签，然后让他们针对测试图片进行投票，最后把票数最高的标签作为对测试图片的预测。所以当k=1的时候，k-Nearest Neighbor分类器就是Nearest Neighbor分类器。
k值的选择——交叉验证
在训练集数量较小的时候（因此验证集的数量更小），我们使用交叉验证的方法。
将训练集平均分成5份，其中4份用来训练，1份用来验证。然后我们循环着取其中4份来训练，其中1份来验证，最后取所有5次验证结果的平均值作为算法验证结果。然后对不同k值的平均表现画线连接。

k取准确率峰值的时候，算法表现最好。本例中，当k=10的时算法表现最好。如果我们将训练集分成更多份数，直线一般会更加平滑（噪音更少）
代码实现

data_utils载入数据集

def load_CIFAR_batch(filename):
  """ load single batch of cifar """

def load_CIFAR10(ROOT):
  """ load all of cifar """

testKNN训练和测试
载入数据集的调用

plt.rcParams['figure.figsize'] = (10.0, 8.0) # set default size of plots
plt.rcParams['image.interpolation'] = 'nearest'
plt.rcParams['image.cmap'] = 'gray'

X_train, y_train, X_test, y_test = load_CIFAR10('../datasets')

# As a sanity check, we print out the size of the training and test data.
print('Training data shape: ', X_train.shape)
print('Training labels shape: ', y_train.shape)
print('Test data shape: ', X_test.shape)
print('Test labels shape: ', y_test.shape)

显示数据集的一部分信息

# Visualize some examples from the dataset.
# We show a few examples of training images from each class.
classes = ['plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']
num_classes = len(classes)
samples_per_class = 7
for y, cls in enumerate(classes):
    idxs = np.flatnonzero(y_train == y)
    idxs = np.random.choice(idxs, samples_per_class, replace=False)
    for i, idx in enumerate(idxs):
        plt_idx = i * num_classes + y + 1
        plt.subplot(samples_per_class, num_classes, plt_idx)
        plt.imshow(X_train[idx].astype('uint8'))
        plt.axis('off')
        if i == 0:
            plt.title(cls)
plt.show()

截取部分样本数据，以提高本作业的执行效率

num_training = 5000
mask = range(num_training)
X_train = X_train[mask]
y_train = y_train[mask]

num_test = 500
mask = range(num_test)
X_test = X_test[mask]
y_test = y_test[mask]

进行训练
这里对k=1和k=5时训练测试，得到如下结果

测试三种距离计算法的效率
得到如下结果

交叉验证

num_folds = 5
k_choices = [1, 3, 5, 8, 10, 12, 15, 20, 50, 100]

X_train_folds = []
y_train_folds = []

交叉验证实际上是将数据的训练集进行拆分，分成多个组，构成多个训练和测试集，来筛选较好的超参数

数据划分

X_train_folds = np.array_split(X_train, num_folds);
y_train_folds = np.array_split(y_train, num_folds)

找到最佳k值
代码略

算法实现
代码用类封装

train训练分类器。对于KNN算法，此处只需要存储训练数据即可。
predict基于该分类器，预测测试数据的标签分类。

compute_distances_two_loops,compute_distances_one_loop,compute_distances_no_loops分别是用来实现需要预测的数据集 X 和原始记录的训练集 self.X_train之间的距离关系，并通过 predict_labels进行KNN预测

compute_distances_two_loops
两层循环计算L2距离
compute_distances_one_loop
一层循环计算L2距离，增加axis = 1指定方向
compute_distances_no_loops
无循环计算L2距离
数学推导
我们记测试集矩阵为 $P$ , 大小为 $M \times D$ , 训练集矩阵为 $C$ 大小为 $N \times D$
$P_i$ 是 $P$ 的第 $i$ 行，同理 $C_j$ 是 $C$ 的第 $j$ 行：

计算一下 $P_i$ 和 $C_j$ 之间的距离

推广得结果矩阵的每行元素为：

继而，结果矩阵为：
predict_labels
根据计算得到的距离关系，挑选 K 个数据组成选民，进行党派选举

KNN运行结果

可以看出k=10时最佳，准确率大约为28%

k-Nearest Neighbor分类器的优劣

优点
思路清晰，易于理解，实现简单；
算法的训练不需要花时间，因为其训练过程只是将训练集数据存储起来。
缺点
测试要花费大量时间计算，因为每个测试图像需要和所有存储的训练图像进行比较。

二、SVM分类

SVM基本思想

简单来说，支持向量机SVM就是在特征空间中找到一条最佳的分类超平面，能够让正、负样本距离该超平面的间隔（margin）最大化。
尽量让所有样本距离分类超平面越远越好。

线性分类与得分函数

在线性分类器算法中，输入为x，输出为y，令权重系数为W，常数项系数为b。我们定义得分函数s为：
$s = W x + b$
这是线性分类器的一般形式，得分函数s所属类别值越大，表示预测该类别的概率越大。

以图像识别为例，共有3个类别「cat，dog，ship」。令输入x的特征维度为4「即包含4个像素值」，W的维度是3x4，b的维度是3x1。在W和b确定后，得到各个类别的得分函数s为：

由上图可知，因为总有3个类别，得分函数s是3x1的向量。其中，cat score=-96.8，dog score=437.9，ship score=61.95。从s的值来说，dog score最高，cat score最低，则预测为狗的概率更大一些。而该图片真实标签是一只猫，显然，从得分函数s上来看，该线性分类器的预测结果是错误的。

通常为了简化计算，我们直接将W和b整合成一个矩阵，同时将x额外增加一个全为1的维度。这样，得分函数s的表达式得到了简化：

示例图如下：

优化策略与损失函数

正确类别对应的得分函数s应该比其它类别的得分函数s大一个阈值 $Δ$ ：

定义SVM的损失函数：

即

其中， $y_i$ 表示正确的类别， $j$ 表示错误类别。从 $L i$ 的表达式可以看出，只有当 $s_{y_i}$ 比 $s_j$ 大超过阈值 $Δ$ 时， $L_i$ 才为零，否则 $L_i$ 大于零。这种策略类似于距离最大化策略。

这类损失函数的表达式一般称作合页损失函数「Hinge Loss Function」：

显然，只有当 $s_j−s_{y_i}+Δ<0$ 时，损失函数才为零。
这种合页损失函数的优点是体现了SVM距离最大化的思想；而且，损失函数大于零时，是线性函数，便于梯度下降算法求导。

对于超参数阈值 $Δ$ ，一般设置 $Δ = 1$ 。因为，权重系数W是可伸缩的，直接影响着得分函数s的大小。所以说， $Δ = 1$ 或 $Δ = 10$ ，实际上没有差别，对W的伸缩完全可以抵消掉 $Δ$ 的数值影响。因此，通常把 $Δ$ 设置为1即可。此时的损失函数为：

SVM中，为了防止模型过拟合，可以使用正则化「Regularization」方法。例如使用L2正则化：

引入正则化项之后的损失函数为：

其中，N是训练样本个数， $λ$ 是正则化参数，可调。一般来说， $λ$ 越大，对权重W的惩罚越大； $λ$ 越小，对权重W的惩罚越小。 $λ$ 实际上是权衡损失函数第一项和第二项之间的关系：

$λ$ 越大，对W的惩罚更大，牺牲正负样本之间的间隔，可能造成欠拟合「underfit」；
$λ$ 越小，得到的正负样本间隔更大，但是W数值会变大，可能造成过拟合「overfit」。

实际应用中，可通过交叉验证，选择合适的正则化参数 $λ$ 。

程序实现

用SVM类封装

计算loss和gredients

def svm_cost_function(self, X, y, reg, delta):
        """ cal loss

        :param X: A numpy array of shape (N, D)
        :param y: A numpy array of shape (N, )
        :param reg: regularization strength
        :param delta: margin
        :return: loss, gred
        """
        num_train = X.shape[0]

        scores = X.dot(self.W.T)  # N * C
        correct_class_scores = scores[range(num_train), y]
        margins = scores - correct_class_scores[:, np.newaxis] + delta
        margins = np.maximum(0, margins)
        # do not ignore it, because 'y - y + delta' > 0, we should reset it to zeros
        margins[range(num_train), y] = 0

        loss = np.sum(margins) / num_train + 0.5 * reg * np.sum(self.W * self.W)

        # cal gred [for every example, when margin > 0, correct lable's W should -X, and wrong lable's W should +X]
        ground_true = np.zeros(margins.shape)  # N * C
        ground_true[margins > 0] = 1
        sum_margins = np.sum(ground_true, axis=1)
        ground_true[range(num_train), y] -= sum_margins

        gred = ground_true.T.dot(X) / num_train + reg * self.W

        return loss, gred

实现神经网络的训练，用到上面的svm_cost_function函数，采用Stochastic Gradient Descent，即每次迭代不用全部的训练集作为训练而是抽取部分样本，进行多次迭代

def train(self, X, y, reg, delta, learning_rate, batch_num, num_iter, output):
        """ train SVM

        :param X: A numpy array of shape (N, D)
        :param y: A numpy array of shape (N, )
        :param reg: A numpy array of shape (N, )
        :param delta: margin
        :param learning_rate: gradient descent rate
        :param batch_num: training examples to use at each step in Mini-batch gradient descent
        :param num_iter: number of steps to take when optimizing
        :return: loss_history
        """
        num_train = X.shape[0]
        num_dim = X.shape[1]
        num_classes = np.max(y) + 1  # y takes values 0...K-1

        if self.W is None:
            # lazily initialize W
            self.W = 0.001 * np.random.randn(num_classes, num_dim)

        # train
        loss_history = []
        for i in range(num_iter):
            # Mini-batch
            sample_index = np.random.choice(num_train, batch_num, replace=False)
            X_batch = X[sample_index, :]
            y_batch = y[sample_index]

            loss, gred = self.svm_cost_function(X_batch, y_batch, reg, delta)
            loss_history.append(loss)
            self.W -= learning_rate * gred

            if output and  i % 100 == 0:
                    print('Iteration %d / %d: loss %f' % (i, num_iter, loss))

        return loss_history

返回loss_history

使用这个网络模型的训练权重来预测数据

def predict(self, X):
        """ predict

        :param X: A numpy array of shape (N, D)
        :return: y_pred (A numpy array of shape (N, ))
        """
        ...
        return y_pred

运行过程
对数据集的处理这里不做赘述
main函数调用以下函数来完成测试

if __name__ == '__main__':
    # 对数据进行预处理，得到训练集，测试集，验证集
    X_train, y_train, X_test, y_test, X_val, y_val = pre_dataset()
    # 通过验证集自动化确定参数 learning_rate和reg
    best_parameter = auto_get_parameter(X_train, y_train, X_val, y_val)
    # 通过参数和训练集构建SVM模型
    svm = get_svm_model(best_parameter, X_train, y_train)
    # 用测试集预测准确率
    y_pred = svm.predict(X_test)
    print('Accuracy achieved during cross-validation: %f' % (np.mean(y_pred == y_test)))

运行结果

交叉验证，可看到loss_history，寻找最适合的超参数

…

…

输入一个超参数，可预测准确率

可以看到与KNN相比，准确率有了较大的提升

三、两层神经网络

线性模型具有局限性

两层神经网络基本步骤

1、反向求导

2、数据预处理

一般采用减均值，若特征间数据的范围差距很大，则考虑除以均方差进行归一化。一般不需要PCA降维和白化操作

切记先切分数据集、验证集、测试集，之后再进行预处理

3、初始化
权重初始化

w = np.random.randn(n) * np.sqrt(2/n) 
#后续再卷积神经网络中测试`

偏置初始化b = 0

多层网络间正则化程度一般取相同，可采用L2正则化和随机失活

4、检查解析梯度

使用少量数据点加快检查速度，检查时先将正则化为0，避免正则化过大掩盖了数据损失部分，之后可以加上正则化进行检查，检查时记得关闭随机失活等不确定性。

5、合理性检查

可进行小参数初始化，检查期望值与实际值的差距；提高正则化强度，观察损失函数变化；对小数据集上对数据进行过拟合，看是否可以达到0损失函数值，如果不行，则模型算法有误。

6、观察学习过程中的重要数值的变化

损失函数值(每epoch周期的变化情况)，验证集与测试集的正确率（不应差距过大，也不可以完全贴合），权重更新比例（dw/w）一般为1e-3，否则修改步长。

7、采用SGD

8、使用交叉验证来获取最佳超参数，参数范围建议采用随机搜索（比较宽的范围训练后训练比较窄的范围）

实现

搭建神经网络简化结构如图，对Cifar-10数据集进行分类

前向传播
假设有m个输入样例，并且每个输入样例有n个输入特征，则 $X$ 为n行m列矩阵。对于每一个隐藏单元，都对应于一个列向量w和b，因此 $W 1$ 为n行4列的矩阵， $B 1$ 为列向量(长为4)。
则 $Z 1 = n p . d o t (W 1 . T, X) + B 1$ 为4行m列的矩阵， $Y1_hat=sigmod(Z1)$ 表示隐藏单元的输入值。接下来就变成以 $Y1_hat$ 作为输入的单个神经单元。 $Z2 = np.dot(w2.T, Y1_hat) + b2$ , $y2_hat = sigmod(z2)$ 即为最终输出值

反向传播
根据基于神经网络的二分类问题中定义的损失函数，这里给出单个样例的各个参数的偏导公式推导。
第二层反向过程：

第一层反向过程：

参数初始化

def __init__(self, input_size, hidden_size, num_classes, std=1e-4):
        """
        Weights are initialized to small random values and biases are initialized to zero.
        """
        self.parameters = {}
        self.parameters['W1'] = std * np.random.randn(hidden_size, input_size)
        self.parameters['b1'] = np.zeros(hidden_size)
        self.parameters['W2'] = std * np.random.randn(num_classes, hidden_size)
        self.parameters['b2'] = np.zeros(num_classes)

计算loss以及gradient

def loss(self, X, y, reg):
        """
        计算两层全连接神经网络的loss和gradients
        输入：
        X: N * D 
        y: N * 1
        reg : 正则化强度

        返回：
        如果y是None,返回维数为(N,C)的分数矩阵
        如果y 不是None ,则返回一个元组：
        - loss : float 类型，数据损失和正则化损失
        - grads : 一个字典类型，存储W1，W2，b1,b2的梯度
        """
         # Unpack variables from the params dictionary
        ...

        # Compute the forward pass
        Relu = lambda x: np.maximum(0, x)
        z1 = X.dot(W1.T) + b1  # N * H
        a1 = Relu(z1)
        z2 = a1.dot(W2.T) + b2  # N * C 
        scores = z2 

         # If the targets are not given then jump out, we're done
        ...
        
        # Compute the loss
        exp_scores = np.exp(scores - np.max(scores, axis=1, keepdims=True))
        pro_scores = exp_scores / np.sum(exp_scores, axis=1, keepdims=True)
        ground_true = np.zeros(scores.shape)
        ground_true[range(num_examples), y] = 1
        loss = -np.sum(ground_true * np.log(pro_scores)) / num_examples + 0.5 * reg * (np.sum(W1 * W1) + np.sum(W2 * W2))

        # Backward pass: compute gradients
        grads = {}
        # Compute the gradient of z2 (scores)
        dz2 = -(ground_true - pro_scores) / num_examples  # N * C 
        # Backprop into W2, b2 and a1
        dW2 = dz2.T.dot(a1)  # C * H 
        db2 = np.sum(dz2, axis=0)  # 1 * C 
        da1 = dz2.dot(W2)  # N * H
        # Backprop into z1
        ...
        # Backprop into W1, b1
        ...

        # add the regularization
        ...

        return loss, grads

实现神经网络的训练

def train(self, X, y, X_val, y_val, reg, learning_rate, 
                learning_rate_decay, iterations_per_lr_annealing, 
                num_epoches, batch_size, verbose):
        
        
        num_examples = X.shape[0]
        # Use SGD to optimize the parameters in self.model
        loss_history = []
        train_acc_history = []
        val_acc_history = []
        iterations_per_epoch = max(num_examples / batch_size, 1)
        num_iters = int(num_epoches * iterations_per_epoch)

        for i in range(num_iters):
            # mini batch
            sample_index = np.random.choice(num_examples, batch_size, replace=True)
            X_batch = X[sample_index, :]
            y_batch = y[sample_index]
            
            # Compute loss and gradients using the current minibatch
            loss, grads = self.loss(X_batch, y_batch, reg)
            loss_history.append(loss)

             # Use the gradients in the grads dictionary to update
            self.parameters['W1'] -= learning_rate * grads['W1']
            self.parameters['b1'] -= learning_rate * grads['b1']
            self.parameters['W2'] -= learning_rate * grads['W2']
            self.parameters['b2'] -= learning_rate * grads['b2']

            if verbose and i % 100 == 0:
                print('iteration %d / %d: loss %f' % (i, num_iters, loss))

             # Every epoch, check train and val accuracy and decay learning rate.
            if i % iterations_per_epoch == 0:
                train_acc_history.append(np.mean(self.predict(X_batch) == y_batch))
                val_acc_history.append(np.mean(self.predict(X_val) == y_val))
            
            if i % iterations_per_lr_annealing == 0:
                # Decay learning rate
                learning_rate *= learning_rate_decay

        return {
            'loss_history': loss_history,
            'train_acc_history': train_acc_history,
            'val_acc_history': val_acc_history
        }

神经网络的预测

def predict(self, X):
         """
        使用这个网络模型的训练权重来预测数据
        输入：
        - X : （N，D）
        返回：
        - y_pred : (N, )
        """
        # Compute the forward pass
        Relu = lambda x: np.maximum(0, x)
        z1 = X.dot(self.parameters['W1'].T) + self.parameters['b1']
        a1 = Relu(z1)
        z2 = a1.dot(self.parameters['W2'].T) + self.parameters['b2']
        score = z2

        y_pred = np.argmax(score, axis=1)
        return y_pred

加载Cifar-10数据集进行图片的分类

if __name__ == '__main__':
    X_train, y_train, X_test, y_test, X_val, y_val = pre_dataset('cifar-10-batches-py')
    best_net = auto_get_parameters(X_train, y_train, X_val, y_val)
    test_acc = np.mean(best_net.predict(X_test) == y_test)
    print('Test accuracy: {}'.format(test_acc))

运行结果

交叉验证


…

可以看到准确率为50%左右

张瑜函中山大学人工智能作业

你可能感兴趣的:(EM算法实验内容及图片分类任务)

2021-7-30晨间日记江湖微冷
离家倒计时启动起床：6.00就寝：22.30天气：晴好下午阵雨心情：抑郁纪念日：离家倒计时任务清单昨日完成的任务，最重要的三件事：1.与亲人聚餐2.与家人谈心3.取回资格证改进：少吃少说话习惯养成：继续坚持运动月目标·完成进度挑战月100公里完成
利用Axure的动态面板和中继器完成下拉框选择功能 Dannyoung 学习之路 Axure 动态面板中继器
这是在练习Axure时找到的一个案例，自己根据博主的说明一步步操作后发现不能实现对应的效果，幸好博主提供了源文件，通过对源文件的拆解，最终实现了下拉框选项的功能。这里采用的Axure版本这里就在博主提供的基础上进行说明。新建Axure文件后，第一步是新增一个动态面板，设置一下样式，主要是设置控件的大小和显示方式，为了更好地操作，自动调整为内容尺寸前面的勾可以在完成所有功能以后去勾选上。第二步，在前
C语言：冒泡排序的注意事项及具体实现 z_鑫 c语言算法数据结构开发语言
一、注意事项1、函数声明为：voidbubble_sort(void*base,size_tnum,size_twidth,int(*cmp)(constvoid*e1,constvoid*e2));2、base指向所要排序的数组3、num为数组的元素个数4、width为一个元素占多少个字节的空间5、cmp为函数指针，指向用来进行比较的函数6、每趟排序都会把当前未排序部分的最大值移到正确的位置二、
2021年11季13周总结，节前忙碌大熊律师
这是连续7日上班的一周，为了迎接泼水节，晚上开会两次布置检查任务抄写2本笔记本，写了很多材料，辛苦忙碌乘以倍数。一、职业发展认真开庭一件，认真开会，认真解决问题，认真写材料，认真解决纠纷，认真扫墓，本周很认真的解决问题，认真报案公安局派出所去了7个多小时，认真搞定一切困难。二、运动健康体重忽高忽低，不够自律。睡眠一塌糊涂，打卡失败到家。呼吸不行，继续整理。锻炼次数不够，只做到4次，散步到是丰富多彩
小学数学知识记忆的六大技巧海韵互联
记忆是知识的仓库，学过的知识记得牢，积累的知识就丰富，而丰富知识的积累将为创造型人才的培养奠定坚实的基础。如何才能提高学生记忆数学知识的效果呢？下面为大家介绍六种技巧，具体内容如下：一、归类归类记忆法就是根据识记材料的性质、特征及其内在联系，进行归纳分类，以便帮助学生记忆大量的知识。比如，学完计量单位后，可以把学过的所有内容归纳为五类：长度单位；面积单位；体积和容积单位；重量单位；时间单位。这样归
超级无敌详细的Mysql数据库笔记（基础篇版）当大哥爱上学习 mysql 数据库笔记
注：本篇笔记根据黑马程序员MySQL数据库入门到精通的内容所创建，适合复习和结合该视频学习使用。一.基础1.关系型数据库(RDBMS)概念:建立在关系模型基础上，由多张相互连接的二维表组成的数据库。特点:使用表存储数据，格式统一，便于维护使用SQL语言操作，标准统一，使用方便。2.SQLSQL通用语法SQL语句可以单行或多行书写，以分号结尾.SQL语句可以使用空格/缩进来增强语句的可读性。MySQ
12月14日碎碎念林一鸣
对于碎碎念，我很惭愧，往往写这种文章意味着我强行完成任务，只能依靠这种题材来完成007的任务，这也意味着过去的一周，过得其实很凌乱。过去的一周，有很开心地与龙飞雪的会面，以及重新与自己所带的学生在异地的会面，这是很感恩的事情。我其实被包围在恩海之中，有关心爱护我的师长，有健康的父母，有爱我的妻子以及即将出生的孩子，更重要的是我有真实智慧可以依靠。但为什么我还是如此焦虑呢？因为知恩，却没有报恩我一直
11.学无止境萌柳青青
人生就像是坐过山车，跌跌宕宕，起起伏伏。有时候，心情平静如水；有时候，如坚石拍打浪花！好好学习天天向上这是一场经历，也是一个过程。生活如此，学习亦是如此！在不断地试错中，终于找到适合自己的学习方法及有效资源。突然发现，当你一旦决定开始做一件事并付诸于行动时，你会发现，原以为的一切问题都不是问题。忘了有多久，没有这样的一个学习冲劲了。我享受着争分夺秒与时间赛跑的日子，我享受着这种全身心投入学习的感觉
【开发环境搭建】Macbook M1搭建Java开发环境 weixin_44329069 java 开发语言
JDK安装与配置下载并安装JDK：ARM64DMG安装包下载链接：JDK21forMac(ARM64)。双击下载的DMG文件，按照提示安装JDK。配置环境变量：打开终端，使用vim编辑.bash_profile文件：vim~/.bash_profile在文件中添加以下内容来设置JAVA_HOME：exportJAVA_HOME=/Library/Java/JavaVirtualMachines/j
Java中四种常用的数组复制的方法copyOf(),arraycop()，clone（）和copyOfRange()的使用与区别方九九 java知识点总结 java
所谓复制数组，是指将一个数组中的元素在另一个数组中进行复制。本文主要介绍关于Java里面的数组复制（拷贝）的几种方式和用法。在Java中实现数组复制分别有以下4种方法：1.Arrays类的copyOf()方法2.Arrays类的copyOfRange()方法3.System类的arraycopy()方法4.Object类的clone()方法下面来详细介绍这4种方法的使用。使用copyOf()方法和
linux 操作系统下的compress命令介绍和使用案例 lisanmengmeng linux 命令工具 linux 运维服务器
linux操作系统下的compress命令介绍和使用案例compress命令是Linux系统中用于文件压缩的一个工具，主要使用Lempel-Ziv-Welch(LZW)算法进行数据压缩。压缩后，文件的扩展名将变为“.Z”。虽然compress命令在历史上有其重要性，但在现代Linux系统中，它已经被更高效的压缩工具如gzip和bzip2所取代使用方法基本语法bashcompress[选项][文件名
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
分享欲的重要性玺晴
不管是亲情、友情还是爱情，我觉得分享欲还是蛮重要的，当你开始对一个人逐渐没有了分享的欲望，其实也意味着你们的关系正在逐渐疏远，或许是已经疏远了。毕业后呢，W和N是我联系最多的两个人，我们几乎每天都会聊天，聊的内容并不是什么大事，都是一些琐碎的事情，或是一些情绪化的东西。例如，W去面试的时候被放鸽子了，她提前到了那家公司，却被通知已经不招人了，于是呢，她向我吐槽这家公司，为了面试她化了妆，坐了差不多
在职四战考研3day MM加油女孩
今日已完成考研任务：与教务处老师联系，学习怎么正确使用书籍；看333教育综合大纲；日总结：下午下班后与教务处老师联系，老师跟我讲了资料的正确使用方式，心里也有了大概的思路——根据老师提供的教材，我第一轮需要用到的资料就是一本通+网课，书籍只作为辅助对象，倘若网课里的内容听懂了，老师说书籍就可以不看了。第二轮复习：就是网课+自己构建思维导图，并尝试做333教育综合的主观题；第三轮复习：背诵客观题起码
MySQL聚合统计铁蛋Q mysql 数据库
【数据库】MySQL聚合统计王笃笃-CSDN博客https://blog.csdn.net/wangduduniubi?type=blog显示平均工资低于2000的部门和它的平均工资mysql>selectdeptno,avg(sal)deptavgfromempgroupbydeptno;+--------+-------------+|deptno|deptavg|+--------+----
2021.12.22 064ba3be82cb
会籍部姓名：【高亮】日期：12月22日当月任务：5.5w当日预约业绩：0当日轮排业绩：0当日新购卡量：0当日续费卡量：当月已完成总业绩：4712当月新购总数：2当月续费总数：当月总单量：2今日使用代金劵：0月使用代金劵：0次日预约量：0今天晚班，下午打了打过期的老会员，有点小收获，加了几个微信，月底了争取突破一下，有个好业绩
雨中哭泣的孤儿院彭淞2024
雨中哭泣的孤儿院云啊，是这世上最欢乐与无忧的，它们从来不从羡慕过谁，在天上飘着，笑着，看上了猎豹的花纹，就变成猎豹，看上了小鸟的翅膀，就变成小鸟，看上了蝴蝶的美貌，就变成蝴蝶。开心时，在天上欢乐的笑，伤心时，在天上大声的哭，闲时，在天上俯瞰万物，累时在天上躺着游览世界。云躺在床上，她的脑海里老是回想着今天白昼时，她所看过的一本叫做《云》的书里的内容，她是多么希望她就是一朵云，哪怕是拥有它的十分之一
拟古（疯女歌）不知道取啥名啊
河西之穗玉，若桂之其乎。新着华裳兮，藏身临行途。君意知何以，妾心当何误？郎兮郎兮莫回首，使妾恐见郎前哭。十步一探首，百里唤郎妇。河西之水急，奔腾归不复。寄郎万重信，还妾无家书。朝望征人悬日回，夕起相思鸡啼魂。一日兮复千日。忽闻河西之水声，疑君子兮之归乎？（第一次尝试写乐府诗，我也不知道是不是这样的。内容我就不多说了。）
学单片机怎么在3-5个月内找到工作？无际单片机编程单片机嵌入式开发物联网 stm32 c语言
每个初学者，都如履薄冰，10几年前，我自学单片机时，也一样。想通过学习，找一份体面点的工作，又害怕辛辛苦苦学出来，找不到工作。好在，当初执行力，还算可以，自学java没成功，后面自学单片机，成功入行了。转眼间，毕业到现在有13年了，马上也到了奔4的年纪。这13年一直在跟单片机打交道，打过工，创过业，对行业，对企业，都有一定的认知，坚持看完这篇内容，相信能帮你少走几个月弯路。有些老铁，加了我很久，时
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
Python OS模块操作文件小丫头呀 #Python随笔 python
在Python中，可以使用os模块主要对文件进行重命名，删除等一些操作以下为os模块常用的方法示例:重命名操作importosos.rename('Test.txt','Test_重命名.txt')#参数1：要重命名的源文件#参数2：对源文件要重新命名的名称删除文件importosos.remove('Test_重命名.txt')#参数为要删除的源文件名称，如果该文件不存在则抛出异常创建空文件夹i
湖南的这个地方，让你感受最正宗的端午节韶山非遗博览园
赛龙舟，吃粽子，还有凤凰特色的抢鸭子……今年的端午，照样热闹，各地节日气息浓厚。那么端午假期刚过，你们是怎么度过的呢?可能不同的地方习俗不太一样，如果你想感受最正宗的端午节，那就来汨罗江畔吧。农历五月初五的端午节，是中国三大传统节日之一。汨罗江畔端午节习俗涵盖了屈原文化、龙舟文化、节庆文化等多重内容，与一条名江(汨罗江)、一位名人(屈原)、一座古祠(屈子祠)紧紧连为一体，并衍生出一项与祭屈相关的龙
淘宝618什么时候开始的?淘宝618购物要注意什么? 氧惠爱高省
淘宝618是一年一度的年中大促销活动，很多电商平台都会在这个时候搞商品打折活动，为消费者带来一波福利，那淘宝618什么时候开始的?下面来我们就来给大家讲解一下这方面的内容。京东密令红包：最爱领红包828红包多多148购物、汽车加油、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友
springboot与日志最后的夏t
日志1、日志框架小张；开发一个大型系统；1、System.out.println("")；将关键数据打印在控制台；去掉？写在一个文件？2、框架来记录系统的一些运行时信息；日志框架；zhanglogging.jar；3、高大上的几个功能？异步模式？自动归档？xxxx？zhanglogging-good.jar？4、将以前框架卸下来？换上新的框架，重新修改之前相关的API；zhanglogging-p
新零售SaaS架构：客户管理系统的应用架构设计公众号-架构师汤师爷 SaaS架构零售架构系统架构后端 java
客户管理系统的应用架构设计应用层定义了软件系统的应用功能，负责接收用户的请求，协调领域层能力来执行任务，并将结果返回给用户，功能模块包括：客户管理：核心功能模块，负责收集和更新客户信息，包括个人资料、联系方式、消费习惯、会员卡、归属信息（比如销售或顾问）和备注。这个模块是CRM系统的基础，支撑其他模块的运作，提供详细的客户信息，帮助企业更好的理解和服务客户。客户标签：通过对客户进行标签化管理，实现
测试用例设计方法胖球的铲屎官测试用例
一、什么是测试用例？测试用例主要是测试人员整理的一组文档，具体记录软件功能测试的输入和预期输出，描述测试场景。二、测试用例包含哪些内容包括用例编号、测试模块，用例名称、前置条件、优先级、测试步骤、预期结果，实际结果，执行人，测试时间，备注。三、测试用例设计方法可以从以下4个大方面去考虑：1、功能功能可以从黑盒测试和白盒测试考虑；1-1黑盒测试从黑盒测试看，可以用等价类划分法，边界值分析，错误推测，
simulink风光火储一次调频，风机,simulink二次调频AGC风电风机储能电动汽车水电火电二次调频科研_研学社 matlab
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、一次调频及风光火储应用二、二次调频（AGC）及多能源协调2运行结果3参考文献4Simulink仿真实现⛳️赠与读者‍做科研，涉及到一个深在的思想系统，需要科研者逻辑缜密，踏实认真，但是不能只是努力，很多时候借力比努力更重要，然后还要有仰望星空的创
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
document获取元素的方法小成语 js 平时 js
js学习总结----DOM获取元素的方法（8个）DOM:documentobjectmodel文档对象模型DOM就是描述整个html页面中节点关系的图谱，可以如下图理解在DOM中，提供了很多的获取元素的方法和之间关系的属性以及操作这些元素的方法。1、获取页面中元素的方法1）、document.getElementById('元素的ID')在整个文档中，通过元素的ID获取到这个元素对象(获取的是一个
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$