Twilight Sparkle.

【机器学习笔记14】softmax多分类模型【下篇】从零开始自己实现softmax多分类器（含具体代码与示例数据集）

文章目录

推荐阅读
前言
关于代码
第一部分
- Softmax分类器相关公式与步骤
- - 相关公式
  - 梯度下降步骤
- 数据集获取
- 从零开始实现softmax多分类器
- - 导入数据
  - 初始框架
  - step1:将label向量化
  - step2:根据训练集初始化模型参数
  - step3:对特征进行加权组合
  - step4:softmax激活函数
  - step5:计算交叉熵损失函数
  - step6：单轮模型参数迭代
  - step7：梯度下降，整合模型训练模块代码
  - step8：完成预测模块
- 使用自己实现的softmax多分类器完成鸢尾花多分类
第二部分
- 使用skrean中的softmax（其实是逻辑回归）
- 结果对比

前言

在阅读本文之前，请确保已经对Softmax多分类器的原理、相关公式推导、具体流程有一定了解。本文将不再具体介绍这些内容，若对这些内容还不了解，请先阅读本文的前置文章。

本文为softmax多分类器下篇，共分为两个部分：

第一部分： 对softmax分类器具体代码实现，并将鸢尾花数据集作为示例，进行模型训练和预测。

第二部分： 使用sklrean实现softmax分类器，并与自己实现的softmax分类器作结果对比。（但好像sklrean只有逻辑回归的包，但是达到了多分类的效果，所以一般说sklrean里的softmax就是逻辑回归）

关于代码

关于本文代码实现的一些说明：

本篇文章涉及的部分已经在本系列以前的文章中具体介绍并实现过模块例如：训练集测试集拆分、Z-score标准化、测试结果评估等将不再手动实现。

另外，因为没有找到合适的参考文章，所以这是一次在没有任何参考，仅通过个人理解和公式推导的前提下实现的代码。如果有不足的地方还请指出。

第一部分

在该部分，将会对softmax分类器进行具体实现，并完成鸢尾花多分类示例。

Softmax分类器相关公式与步骤

回顾上篇文章我们总结的softmax相关公式与步骤。

梯度下降步骤

给定训练集X，训练集X共分为K类:

随机初始化模型未知参数 $\theta$ ，本篇文章中为随机初始化权重向量 $w_k,b_k,k=1,2,...,K-1$ 。其中， $w_k$ 为向量， $b_k$ 为标量。
梯度下降算法迭代更新模型参数直至收敛，每一轮具体流程如下：
1. 先通过正向传播求得本轮训练样本预测值。
2. 反向传播更新模型参数：
$\begin{split} & w_k = w_k - a\frac{\partial J}{\partial w_k} = w_k-a\frac{1}{N}\sum_{i=0}^{N-1}(a_k-y_k)x,\quad k = 0,1,...,K-1 \\ & b_k = b_k -a\frac{\partial J}{\partial b_k} = b_k-a\frac{1}{N}\sum_{i=0}^{N-1}(a_k-y_k),\quad k = 0,1,...,K-1 \end{split}$

注意：上述公式省去了上标i，上标i表示这是第i个样本。

数据集获取

鸢尾花数据集的两种获取方式:

sklrean自带鸢尾花数据集，不需要额外下载。
鸢尾花数据集下载地址：Iris Species | Kaggle

我专门查看了两个数据集，没有区别。

从零开始实现softmax多分类器

为了使代码更便于调用，层次更加清晰，本次将会以面向对象的形式实现模型。（之前好几次都是直接写的函数）如果觉得分开写的太乱，可以看最后给出的组合起来的完整代码。

导入数据

为了便于编写代码过程中对各模块作测试，这里先导入鸢尾花数据集，我采用第一种导入数据集的方法。

import numpy as np
from sklearn import datasets

if __name__ == '__main__':
    iris = datasets.load_iris() # 导入鸢尾花数据集
    dataSet = iris.data # 特征集
    target = iris.target # label集

初始框架

先把softmax类的框架搭出来，之后的函数一个个加进来。

class SoftmaxModel:

    def __init__(self,random_state = None):
        """
        初始化模型
        :param random_state: 指定随机种子，默认为None
        """
        self.__random_state = random_state
        self.__theta = None # 模型参数

step1:将label向量化

根据上一篇的推导，我们在进行softmax分类时，需要先将 $y = c_k$ 的形式换成 $(0, .., 1, ..., 0)$ 的形式。

    def __labelTransform(self,Y,classes):
        """
        将label向量化
        :param Y: label集合
        :param classes: 共有多少类
        :return: 向量化后的label集
        """
        vec_Y = []
        for y in Y:
            vec_label = np.zeros(classes)
            vec_label[y] = 1
            vec_Y.append(vec_label)
        return vec_Y

测试：

只截取了部分。可以看到label成功变成了我们需要的。

step2:根据训练集初始化模型参数

这部分需要写的比较杂，不好单独抽成函数，所以大部分细节就在代码说。另外，如有疑问的地方，请配合上一篇文章一起阅读。

初始化W：维度为（K，M）。一共有K个 $w_k$ (K为类别数)，每一个 $w_k$ 都是向量，维度与单个样本 $x$ 相同。
初始化时B一共有K个，每一个 $b_k$ 都是标量。

import numpy as np
from sklearn import datasets

class SoftmaxModel:

    def __init__(self,random_state = None):
        """
        初始化模型
        :param random_state: 指定随机种子，默认为None
        """
        self.__random_state = random_state
        self.__theta = None # 模型参数

    def __labelTransform(self,Y,classes):
        """
        将label向量化
        :param Y: label集合
        :param classes: 共有多少类
        :return: 向量化后的label集
        """
        vec_Y = []
        for y in Y:
            vec_label = list(np.zeros(classes))
            vec_label[y] = 1
            vec_Y.append(vec_label)
        vec_Y = np.array(vec_Y)
        return vec_Y

    def __init_theta(self,classes,feature_nums,random_state):
        """
        初始化模型参数
        :param classes: 一共有多少类，即K
        :param feature_nums: 样本特征数目
        :param random_state: 随机种子
        :return: 模型参数
        """
        theta = {}
        np.random.seed(random_state)
        theta['W'] = np.random.randn(classes,feature_nums) # 关于randn的用法请自行查找
        theta['B'] = np.random.randn(classes)
        return theta



    def train(self,X,Y,classes = None,learning_rate = 1e-3,num_iters = 100):
        """
        训练softmax模型，此时采用的批量梯度下降算法。
        :param X: 样本集
        :param Y: 标签集，请确保类别标号从0开始
        :param classes: 共有多少个类别，如果为None，则会根据Y自动调整
        :param learning_rate: 学习率，默认0.001
        :param num_iters: 最大迭代次数，默认100次
        :return:
        """

        # 设置模型类别数
        if classes == None:
            self.__classes = np.max(Y) + 1
        else:
            self.__classes = classes
        # 将label向量化
        Y = self.__labelTransform(Y,self.__classes)
        # 根据样本调整W的维度，并进行初始化
        sample_nums,feature_nums = X.shape # 行为样本个数，列为特征数
        # 初始化参数
        if self.__theta is None:
            self.__theta = self.__init_theta(self.__classes,feature_nums,self.__random_state)
        for k in range(self.__classes):
            print(f"w_{k} is {self.__theta['W'][k]},b_{k} is {self.__theta['B'][k]}")

if __name__ == '__main__':
    iris = datasets.load_iris() # 导入鸢尾花数据集
    dataSet = iris.data # 特征集
    target = iris.target # label集
    # print(dataSet)
    model = SoftmaxModel(random_state=10)
    model.train(dataSet,target,learning_rate = 1e-3,num_iters = 100)

输出：

step3:对特征进行加权组合

公式：
$z_k = w_k^Tx+b_k = (\sum_{i=1}^Mw_{k,i}x_i)+b_k$
函数变量说明：

X：样本集，维度为(N，M)，代表N个样本，每个样本M个特征。
W：权值，维度为（K，M）。
B：维度为（1，K）。
Z：维度为（N，K），第i行代表由第i个样本线性组合输出的 $z$ 。

矩阵乘法：
$A(N,M)\cdot B(M,K) = C(N,K)$
所以 $X\cdot W^T$ 即可得没有加B的Z。

矩阵加法，两个尺寸一样的才可以加。所以需要把B按行复制N次，得到B（N，K），然后与Z相加即可。

    def __linear_combination(self,X,theta):
        """
        对样本特征进行线性加权组合
        :param X: 特征集
        :param theta: 模型参数
        :return: Z,加权后的输出
        """
        Z = np.dot(X,theta['W'].T)+np.tile(theta['B'],(X.shape[0],1))
        return Z

step4:softmax激活函数

下一步应该是对Z进行softmax激活，得到每一个后验概率 $P(y=c_k|x,\theta)$ 。（后验概率就是所谓的预测概率）

公式：
$softmax(z_k) = a_k = \frac{e^{z_k}}{\sum_{i=1}^Ke^{z_i}},~~~~k = 0,1,...,K-1$
函数变量说明：

A：维度（N，K），第i行代表第i个样本对应的后验概率分布 $a^i$ ,第k列对应该样本对第k类的后验概率 $a_k$ 。
Z：维度（N，K），上一步已经说过Z的含义。

要想从Z求到A,根据公式，要先对整个矩阵Z求 $e x pZ = e x p (Z)$ ,然后分母为expZ按行求和，分子为expZ[i,k]。

    def __cal_softmax(self,Z):
        """
        通过softmax激活，计算后验概率
        :param Z: 隐藏层输出
        :return: A,后验概率矩阵
        """
        expZ = np.exp(Z)
        A = np.zeros_like(expZ)
        denominator = np.sum(expZ,axis=1) # 计算分母
        N = expZ.shape[0]
        for i in range(N):
            A[i] = expZ[i]/denominator[i]
        return A

我们可以检测一下后验概率计算的对不对，因为一个样本对应的后验分布之和为1，那么有多少样本，所有后验概率之和就应该是多少：

聪明的小伙伴已经想到了，到这一步就完成了正向传播。现在只需要知道模型参数，我们就可以对某个未知分类的样本作预测。

step5:计算交叉熵损失函数

其实这一步在训练时用不到，不过既然有公式还是实现了吧，然后来对刚才我们计算的后验概率求一个代价函数。

注：代价函数为损失函数求平均。

公式：
$\begin{split} & L(\hat y,y) = -\sum_{k=1}^Ky_kloga_k \\ & J = \frac{1}{N}\sum_{i=0}^{N-1}L(\hat y,y) = -\frac{1}{N}\sum_{i=0}^{N-1}\sum_{k=1}^Ky_kloga_k \end{split}$
函数变量说明：

A和Y都是维度为（N，K）的矩阵，也就是说只需要一一对应求出 $-y^i_kloga^i_k$ ,然后对整个矩阵求和，然后取相反数，最后除N就行了。

一般log都是以2为底。

现在先测试一下我们需要的函数：

A = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
B = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
C = -np.log2(np.array([[2,4,6],[2,4,8]]))
print(np.multiply(A,B))
print(C)

ok,没问题。现在实现该部分的代码：

    def cal_Costfunction(self,A,Y):
        """
        计算代价函数
        :param A: 后验概率矩阵（预测概率矩阵）
        :param Y: 真实label矩阵
        :return: 代价
        """
        J = -np.sum(np.multiply(Y,np.log2(A)))
        J /= Y.shape[0]
        return J

step6：单轮模型参数迭代

每一轮参数迭代公式：
$\begin{split} & w_k = w_k - a\frac{\partial J}{\partial w_k} = w_k-a\frac{1}{N}\sum_{i=0}^{N-1}(a_k-y_k)x,\quad k = 0,1,...,K-1 \\ & b_k = b_k -a\frac{\partial J}{\partial b_k} = b_k-a\frac{1}{N}\sum_{i=0}^{N-1}(a_k-y_k),\quad k = 0,1,...,K-1 \end{split}$
函数变量说明：

$\alpha$ ：超参数，这个就不多说了，我们需要手动调整。
A：维度（N，K），含义与之前一样，后验概率矩阵。
Y：维度（N，K），含义与之前一样，真实label矩阵。
X：维度（N，M）。N个样本，一个样本M个特征。
W：维度（K，M），权值矩阵。K对应 $z_k$ ，M对应 $x$ 的特征。
B：维度（1，K），标量。K对应 $z_k$ 。

这一步想矩阵化运算有点绕，所以我得分三步说明：

1.只看单个样本 $x$ :
$w_k = w_k-\alpha(a_k-y_k)x$

$w_k$ ：维度（1，M）
$a_k-y_k$ ：标量
$x$ :维度（1,M）

所以只看一个样本时，为 $a_k-y_k$ （标量）去乘x里每一个特征，然后再乘学习率。

2.拓展到N个样本X的平均 $w_k$ ：
$w_k = w_k-\alpha\frac{1}{N}(A_k-Y_k)^TX$
现在 $A_k-Y_k$ 维度应该是 $(N, 1)$ 。也就是每个类别对应的那一列的预测值与真实值相减。然后将其倒置变成 $(1, N)$ 去乘 $X (N, M)$ ,就可以得到 $(1, M)$ 维度,不过这时求得的是所有样本对应的 $w_k$ 之和，所以还要对 $(1, M)$ 除个N，才是 $w_k$ 的均值。

3.拓展到W
$W-a\frac{1}{N}(A-Y)^TX$
在草稿本上自己算一下，应该可以想明白为什么求和符号消失了。

同理，
$B-a\frac{1}{N}\sum_{axis=0}(A-Y)$
$a x i s = 0$ 代表对列求和。

    def __gradient_iteration(self,W,B,X,Y,A,learning_rate):
        """
        一轮梯度迭代
        :param W: W
        :param B: B
        :param X: X
        :param Y: Y
        :param A: A
        :param learning_rate: 学习率
        :return: 更新后的W,B
        """
        A_Y = A-Y
        W = W-(learning_rate/X.shape[0])*np.dot(A_Y.T,X)
        B = B-(learning_rate/X.shape[0])*np.sum(A_Y,axis=0)
        return W,B

step7：梯度下降，整合模型训练模块代码

线性代数给我推麻了，哎。不过最后好歹还是推出来了。

截止目前，训练过程的代码已经可以进行整合了，我们来测试一下效果：

import numpy as np
from sklearn import datasets

class SoftmaxModel:

    def __init__(self,random_state = None):
        """
        初始化模型
        :param random_state: 指定随机种子，默认为None
        """
        self.__random_state = random_state
        self.__theta = None # 模型参数

    def __labelTransform(self,Y,classes):
        """
        将label向量化
        :param Y: label集合
        :param classes: 共有多少类
        :return: 向量化后的label集
        """
        vec_Y = []
        for y in Y:
            vec_label = list(np.zeros(classes))
            vec_label[y] = 1
            vec_Y.append(vec_label)
        vec_Y = np.array(vec_Y)
        return vec_Y

    def __init_theta(self,classes,feature_nums,random_state):
        """
        初始化模型参数
        :param classes: 一共有多少类，即K
        :param feature_nums: 样本特征数目
        :param random_state: 随机种子
        :return: 模型参数
        """
        theta = {}
        np.random.seed(random_state)
        theta['W'] = np.random.randn(classes,feature_nums) # 关于randn的用法请自行查找
        theta['B'] = np.random.randn(classes)
        return theta

    def __linear_combination(self,X,theta):
        """
        对样本特征进行线性加权组合
        :param X: 特征集
        :param theta: 模型参数
        :return: Z,加权后的输出
        """
        Z = np.dot(X,theta['W'].T)+np.tile(theta['B'],(X.shape[0],1))
        return Z

    def __cal_softmax(self,Z):
        """
        通过softmax激活，计算后验概率
        :param Z: 隐藏层输出
        :return: A,后验概率矩阵
        """
        expZ = np.exp(Z)
        A = np.zeros_like(expZ)
        denominator = np.sum(expZ,axis=1) # 计算分母
        N = expZ.shape[0]
        for i in range(N):
            A[i] = expZ[i]/denominator[i]
        return A

    def cal_Costfunction(self,A,Y):
        """
        计算代价函数
        :param A: 后验概率矩阵（预测概率矩阵）
        :param Y: 真实label矩阵
        :return: 代价
        """
        J = -np.sum(np.multiply(Y,np.log2(A)))
        J /= Y.shape[0]
        return J

    def __gradient_iteration(self,W,B,X,Y,A,learning_rate):
        """
        一轮梯度迭代
        :param W: W
        :param B: B
        :param X: X
        :param Y: Y
        :param A: A
        :param learning_rate: 学习率
        :return: 更新后的W,B
        """
        A_Y = A-Y
        W = W-(learning_rate/X.shape[0])*np.dot(A_Y.T,X)
        B = B-(learning_rate/X.shape[0])*np.sum(A_Y,axis=0)
        return W,B

    def train(self,X,Y,classes = None,learning_rate = 0.001,num_iters = 100):
        """
        训练softmax模型，此时采用的批量梯度下降算法。
        :param X: 样本集
        :param Y: 标签集，请确保类别标号从0开始
        :param classes: 共有多少个类别，如果为None，则会根据Y自动调整
        :param learning_rate: 学习率，默认0.001
        :param num_iters: 最大迭代次数，默认100次
        :return:
        """

        # 1.设置模型类别数
        if classes == None:
            self.__classes = np.max(Y) + 1
        else:
            self.__classes = classes
        # 2.将label向量化
        Y = self.__labelTransform(Y,self.__classes)
        # 3.根据样本调整W的维度，并进行初始化
        sample_nums,feature_nums = X.shape # 行为样本个数，列为特征数
        if self.__theta is None:
            self.__theta = self.__init_theta(self.__classes,feature_nums,self.__random_state)

        # 梯度下降更新参数
        for i in range(num_iters):
            # 4.对样本特征集线性加权组合
            Z = self.__linear_combination(X, self.__theta)
            # 5.通过softmax激活函数，计算后验概率矩阵
            A = self.__cal_softmax(Z)
            self.__theta['W'],self.__theta['B'] = self.__gradient_iteration(self.__theta['W'],self.__theta['B'],X,Y,A,learning_rate)
            print(f"第{i+1}次迭代后的代价:{self.cal_Costfunction(A,Y)}")



if __name__ == '__main__':
    iris = datasets.load_iris() # 导入鸢尾花数据集
    dataSet = iris.data # 特征集
    target = iris.target # label集
    # print(dataSet)
    model = SoftmaxModel(random_state=10)
    model.train(dataSet,target,learning_rate = 0.5,num_iters = 1000)

前几次代价跳的比较厉害，这是学习率设置的原因。小了吧又下降的太慢了。这是我从很多学习率里选的一个比较合适的。看这情况后面还是收敛了。

step8：完成预测模块

这个部分就简单了，正向传播之后多加一个判断就行了：谁的概率最大选谁。

哦对，注意，预测完毕后返回的 $Y_{predict}$ 应该是没有进行label向量化的状态。即如果 $y_{pre} = c_k$ ，那么 $y_{pre}$ 的值应该是 $k - 1$ 而不是一个向量。

    def getTheta(self):
        """
        获取训练好的模型参数，方便下次不用重新训练
        :return: theta,模型参数
        """
        return self.__theta

    def predict(self,X,theta = None):
        """
        对指定样本集进行预测
        :param X: 需要进行预测的样本
        :param theta: 方便不用每一次都训练，所以也可以直接传模型参数，默认为None
        :return: 预测结果
        """
        if theta is None:
            theta = self.__theta
        Z = self.__linear_combination(X,theta)
        A = self.__cal_softmax(Z)
        y_predict = np.argmax(A,axis=1)
        return y_predict

OK,到此最基本的softmax分类器就实现了，这是整个类的代码：

import numpy as np
class SoftmaxModel:

    def __init__(self,random_state = None):
        """
        初始化模型
        :param random_state: 指定随机种子，默认为None
        """
        self.__random_state = random_state
        self.__theta = None # 模型参数

    def __labelTransform(self,Y,classes):
        """
        将label向量化
        :param Y: label集合
        :param classes: 共有多少类
        :return: 向量化后的label集
        """
        vec_Y = []
        for y in Y:
            vec_label = list(np.zeros(classes))
            vec_label[y] = 1
            vec_Y.append(vec_label)
        vec_Y = np.array(vec_Y)
        return vec_Y

    def __init_theta(self,classes,feature_nums,random_state):
        """
        初始化模型参数
        :param classes: 一共有多少类，即K
        :param feature_nums: 样本特征数目
        :param random_state: 随机种子
        :return: 模型参数
        """
        theta = {}
        np.random.seed(random_state)
        theta['W'] = np.random.randn(classes,feature_nums) # 关于randn的用法请自行查找
        theta['B'] = np.random.randn(classes)
        return theta

    def __linear_combination(self,X,theta):
        """
        对样本特征进行线性加权组合
        :param X: 特征集
        :param theta: 模型参数
        :return: Z,加权后的输出
        """
        Z = np.dot(X,theta['W'].T)+np.tile(theta['B'],(X.shape[0],1))
        return Z

    def __cal_softmax(self,Z):
        """
        通过softmax激活，计算后验概率
        :param Z: 隐藏层输出
        :return: A,后验概率矩阵
        """
        expZ = np.exp(Z)
        A = np.zeros_like(expZ)
        denominator = np.sum(expZ,axis=1) # 计算分母
        N = expZ.shape[0]
        for i in range(N):
            A[i] = expZ[i]/denominator[i]
        return A

    def cal_Costfunction(self,A,Y):
        """
        计算代价函数
        :param A: 后验概率矩阵（预测概率矩阵）
        :param Y: 真实label矩阵
        :return: 代价
        """
        J = -np.sum(np.multiply(Y,np.log2(A)))
        J /= Y.shape[0]
        return J

    def __gradient_iteration(self,W,B,X,Y,A,learning_rate):
        """
        一轮梯度迭代
        :param W: W
        :param B: B
        :param X: X
        :param Y: Y
        :param A: A
        :param learning_rate: 学习率
        :return: 更新后的W,B
        """
        A_Y = A-Y
        W = W-(learning_rate/X.shape[0])*np.dot(A_Y.T,X)
        B = B-(learning_rate/X.shape[0])*np.sum(A_Y,axis=0)
        return W,B

    def train(self,X,Y,classes = None,learning_rate = 0.001,num_iters = 100):
        """
        训练softmax模型，此时采用的批量梯度下降算法。
        :param X: 样本集
        :param Y: 标签集，请确保类别标号从0开始
        :param classes: 共有多少个类别，如果为None，则会根据Y自动调整
        :param learning_rate: 学习率，默认0.001
        :param num_iters: 最大迭代次数，默认100次
        :return:
        """

        # 1.设置模型类别数
        if classes == None:
            self.__classes = np.max(Y) + 1
        else:
            self.__classes = classes
        # 2.将label向量化
        Y = self.__labelTransform(Y,self.__classes)
        # 3.根据样本调整W的维度，并进行初始化
        sample_nums,feature_nums = X.shape # 行为样本个数，列为特征数
        if self.__theta is None:
            self.__theta = self.__init_theta(self.__classes,feature_nums,self.__random_state)
        print("初始参数:")
        for k in range(self.__classes):
            print(f"w{k}:{self.__theta['W'][k]},b{k}:{self.__theta['B'][k]}")

        # 梯度下降更新参数
        for i in range(num_iters):
            # 4.对样本特征集线性加权组合
            Z = self.__linear_combination(X, self.__theta)
            # 5.通过softmax激活函数，计算后验概率矩阵
            A = self.__cal_softmax(Z)
            self.__theta['W'],self.__theta['B'] = self.__gradient_iteration(self.__theta['W'],self.__theta['B'],X,Y,A,learning_rate)
            # print(f"第{i+1}次迭代后的代价:{self.cal_Costfunction(A,Y)}")
        print("结果参数:")
        for k in range(self.__classes):
            print(f"w{k}:{self.__theta['W'][k]},b{k}:{self.__theta['B'][k]}")

    def getTheta(self):
        """
        获取训练好的模型参数，方便下次不用重新训练
        :return: theta,模型参数
        """
        return self.__theta

    def predict(self,X,theta = None):
        """
        对指定样本集进行预测
        :param X: 需要进行预测的样本
        :param theta: 方便不用每一次都训练，所以也可以直接传模型参数，默认为None
        :return: 预测结果
        """
        if theta is None:
            theta = self.__theta
        Z = self.__linear_combination(X,theta)
        A = self.__cal_softmax(Z)
        y_predict = np.argmax(A,axis=1)
        return y_predict

使用自己实现的softmax多分类器完成鸢尾花多分类

这部分的内容就不多解释了，还是老套路：

分割训练集和测试集（这次选择7：3）
对训练集Z-score标准化，并用训练集标准化时计算的参数去标准化测试集（可别一起丢进去标准化）
训练集丢进去训练，训练结束把测试集丢进去测试
对测试集的测试结果进行评估

from sklearn.metrics import classification_report # 结果评估
from sklearn.model_selection import train_test_split # 拆分数据集
from sklearn.preprocessing import StandardScaler # 数据标准化
if __name__ == '__main__':
    random_state = 10
    iris = datasets.load_iris() # 导入鸢尾花数据集
    dataSet = iris.data # 特征集
    target = iris.target # label集-

    # 拆分训练集和测试集
    X_train, X_test, y_train, y_test = train_test_split(dataSet, target, train_size=0.7, random_state=random_state)
    # 使用sklearn进行Z-score标准化
    scaler = StandardScaler()
    X_train = scaler.fit_transform(X_train)  # 标准化训练集X
    # 标准化测试集x,只有训练集才fit_transform，测试集是transform
    X_test = scaler.transform(X_test)

    # 创建模型
    model = SoftmaxModel(random_state=random_state)
    model.train(X_train,y_train,learning_rate = 0.5,num_iters = 100)
    # 预测
    y_predict =  model.predict(X_test)

    class_names = ['第一类', '第二类', '第三类']
    print(classification_report(y_test, y_predict, target_names=class_names))

评估结果：

至少通过评估结果来看，自己实现的softmax模型没什么奇怪的问题。不过可能在一些细节上还有很多改进空间。

第二部分

使用skrean中的softmax（其实是逻辑回归）

怪，我发现sklearn里没有softmax，只有逻辑回归的包，但是它那个逻辑回归的包又可以作多分类。因为原本的逻辑回归只能作二分类，所以我觉得它实现的逻辑回归可能就是softmax。因此调用的是LogisticRegression。

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report # 结果评估
from sklearn.preprocessing import StandardScaler # 数据标准化
from sklearn.linear_model import LogisticRegression

if __name__ == '__main__':
    random_state = 10
    iris = datasets.load_iris() # 导入鸢尾花数据集
    dataSet = iris.data # 特征集
    target = iris.target # label集

    # 拆分训练集和测试集
    X_train, X_test, y_train, y_test = train_test_split(dataSet, target, train_size=0.7, random_state=random_state)
    # 使用sklearn进行Z-score标准化
    scaler = StandardScaler()
    X_train = scaler.fit_transform(X_train)  # 标准化训练集X
    # 标准化测试集x,只有训练集才fit_transform，测试集是transform
    X_test = scaler.transform(X_test)

    model = LogisticRegression()
    model.fit(X_train, y_train)
    y_predict = model.predict(X_test)

    class_names = ['第一类', '第二类', '第三类']
    print(classification_report(y_test, y_predict, target_names=class_names))

结果对比

看到这个结果，虽然我知道是数据集太小的原因，但我内心十分不服，于是把自己实现的分类器的迭代次数改成了1000，再跑了一次。

自己实现的分类器迭代次数改成迭代1000次后：

不得不说，这个数据集实在太小了，只有150个，分出来测试集才45个样本，所以预测结果才会这么好。

你可能感兴趣的:(机器学习,分类算法,机器学习,分类,算法)

【Python】已解决：WARNING: pip is configured with locations that require TLS/SSL, however the ssl module i 屿小夏 python pip ssl
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
《鸿蒙Next应用商店：人工智能开启智能推荐与运营新时代》人工智能深度学习
在科技飞速发展的当下，鸿蒙Next系统的出现为操作系统领域带来了新的变革与机遇，而人工智能技术的融入更是让其应用商店的智能化推荐和运营迈向了一个全新的高度。用户画像精准构建在鸿蒙Next系统中，应用商店可以借助系统强大的权限管理和数据收集能力，全方位收集用户的多维度数据。通过对用户在应用商店内的浏览历史、下载记录、搜索关键词，以及在其他鸿蒙应用中的使用行为等多源数据进行汇总和分析，利用人工智能算法
机器学习特征重要性之feature_importances_属性与permutation_importance方法一叶_障目机器学习 python 数据挖掘
一、feature_importances_属性在机器学习中，分类和回归算法的feature_importances_属性用于衡量每个特征对模型预测的重要性。这个属性通常在基于树的算法中使用，通过feature_importances_属性，您可以了解哪些特征对模型的预测最为重要，从而可以进行特征选择或特征工程，以提高模型的性能和解释性。1、决策树1.1.sklearn.tree.Decision
C语言 qsort 详解 Communist19 c语言开发语言
qsort1.定义：qsort,基于快速排序(QuickSort)算法的一个库函数,可以将一串整型类型、浮点类型、字符串类型、结构体类型等的数据进行排序。比冒泡排序，选择法排序好用，且速度更快。2.语法：具体语法如下：qsort(arr,sizeof(arr)/sizeof(arr[0]),sizeof(int),cmp)形参1：arr:需排序数组的首个元素的地址(切记不能用arr[0],arr[
遗传算法神罗天征666 c++整理算法
遗传算法（GA）一、什么是遗传算法？遗传算法（GeneticAlgorithm，GA）是一类模仿生物进化过程的搜索启发式算法。它们是由约翰·霍兰德（JohnHolland）在20世纪70年代初提出的。遗传算法通过自然遗传机制（如选择、交叉、变异等）的模拟，对问题的潜在解进行进化，以期找到或逼近最优解。基本原理是类比达尔文进化论—“物竞天择，适者生存”其实很好理解，学过生物的都知道达尔文进化论的大概
机器学习-期末测试难以触及的高度机器学习 python 人工智能
机器学习-期末测试线性回归1.代码展示#coding=UTF-8#拆分训练集和测试集importmatplotlib.pyplotaspltfromsklearn.model_selectionimporttrain_test_split#是线性回归类是sklearn写好的根据梯度下降法fromsklearn.linear_modelimportLinearRegressionimportpand
机器学习的介绍 2201_75874206 机器学习人工智能
目录1.机器学习的定义2.机器学习的原理3.机器学习的方法4.机器学习的分类5.机器学习的评估6.机器学习的应用场景7.机器学习与人工智能的关系结论机器学习在自然语言处理中的最新应用和技术是什么？如何评估机器学习模型的性能，除了交叉验证、MSE和RMSE外，还有哪些其他重要的指标？在金融风险管理中，机器学习如何帮助预测市场趋势和信用风险？市场趋势预测信用风险评估机器学习与人工智能之间的关系在未来发
Kaggle欺诈检测：使用生成对抗网络（GAN）解决正负样本极度不平衡问题 Loving_enjoy 论文深度学习计算机视觉人工智能
###Kaggle欺诈检测：使用生成对抗网络（GAN）解决正负样本极度不平衡问题####引言在金融领域中，欺诈检测是一项至关重要的任务。然而，欺诈交易数据往往呈现出正负样本极度不平衡的特点，这给机器学习模型的训练带来了挑战。传统的分类算法在面对这种不平衡数据时，往往会导致模型对多数类（正常交易）过拟合，而对少数类（欺诈交易）的识别能力较差。为了解决这个问题，生成对抗网络（GAN）提供了一种有效的手
隐语课程隐语架构概览学习笔记皓月雪学习笔记
隐语架构包含：产品层、算法层、计算层、资源层和硬件层隐语产品：定位：通过可视化产品，降低终端用户的体验和演示成本。通过模块化API降低技术集成商的研发成本。人群画像：作为隐语的直观入口，隐语保护计算从业者均应该关注产品：SecretPad：轻量化安装、快速验证POC、可定制集成；多部署形态：中心模式、P2P模式全栈产品：MPC、TEE、SCQLSecretNote：Notebook形式、交互式建模
PSO粒子群优化算法无人机路径规划九亿AI算法优化工作室& 算法神经网络 matlab python 人工智能
PSO算法源于对鸟群觅食行为的模拟，将每个粒子视为搜索空间中的一个潜在解。在无人机路径规划中，粒子的位置可表示无人机在空间中的路径点坐标等信息，速度则表示路径的变化趋势等。代码获取方式1：私信博主代码获取方式2利用同等价值的matlab代码兑换博主的matlab代码先提供matlab代码运行效果图给博主评估其价值，可以的话，就可以进行兑换。
【虚拟化】系统虚拟化的主要功能和分类 TrustZone_ 虚拟化
1.3系统虚拟化的主要功能和分类系统虚拟化向下管理硬件资源，向上提供硬件抽象。本节主要介绍系统虚拟化的基本功能（包括CPU、内存和I/O虚拟化），并根据Hypervisor与物理资源和操作系统交互方式的不同，介绍了两种基本的虚拟化分类。然后简要介绍三种虚拟化的实现方式，从而帮助读者在整体上了解虚拟化不同实现方式对功能和性能的影响。1.3.1虚拟化基本功能系统虚拟化架构如图1-4所示（以经典的“一虚
一文读懂：无监督学习与有监督学习的区别与应用码上飞扬学习
在机器学习的世界里，无监督学习和有监督学习是两个最为常见且重要的概念。理解这两者的区别和应用场景，不仅有助于我们选择合适的算法和模型，还能帮助我们更好地解决实际问题。那么，什么是无监督学习和有监督学习呢？本文将带你详细了解这两种学习方式的定义、区别以及典型应用。目录无监督学习是什么？有监督学习是什么？无监督学习与有监督学习的主要区别无监督学习的典型应用有监督学习的典型应用如何选择合适的学习方法？1
Spark Livy 指南及livy部署访问实践 house.zhang 大数据-Spark 大数据
背景：ApacheSpark是一个比较流行的大数据框架、广泛运用于数据处理、数据分析、机器学习中，它提供了两种方式进行数据处理，一是交互式处理：比如用户使用spark-shell，编写交互式代码编译成spark作业提交到集群上去执行；二是批处理，通过spark-submit提交打包好的spark应用jar到集群中进行执行。这两种运行方式都需要安装spark客户端配置好yarn集群信息，并打通集群网
迅为RK3562开发板专为3562编写10大分类2900+页文档 mucheni rk3562 3562
iTOP-3562开发板采用瑞芯微RK3562处理器，内部集成了四核A53+MaliG52架构，主频2GHZ，内置1TOPSNPU算力，RK809动态调频。支持OpenGLES1.1/2.0/3.2、0penCL2.0、Vulkan1.1内嵌高性能2D加速硬件。内置独立NPU,算力达1TOPS,可用于轻量级人工智能应用。支持几乎全格式的H.264解码，支持1080p@60fps的解码，支持4K@3
【网络协议】【http】【https】TLS解决了HTTP存在的问题-加密通信+摘要，数字签名+CA证书钟离墨笺网络协议网络协议 http https
【网络协议】【http】【https】TLS解决了HTTP存在的问题-加密通信+摘要数字签名+CA证书ps:TLS前期发送的密码套件里面主要就是约定：密钥交换算法，签名算法，对称加密算法，摘要算法1加密通信一般选择非对称加密交换密钥对称加密进行后续通信解决了信息泄露问题1.1密钥交换算法（非对称加密）RAS，ECDHE公钥加密私钥解密的方式RAS通过三个随机数（客户端随机数+服务端随机数+客户端随
用TensorFlow.NET搭建一个全连接神经网络 chiyong7717 人工智能 c#python
在本文中，我们将学习如何在C＃中构建神经网络模型计算图。与线性分类器相比，神经网络的关键优势在于它可以分离不可线性分离的数据。我们将实现此模型来对MNIST数据集的手写数字图像进行分类。我们要构建的神经网络的结构如下。MNIST数据的手写数字图像有10个类（从0到9）。该网络具有2个隐藏层：第一层具有200个隐藏单元（神经元），第二层具有10个神经元（称为分类器层）。让我们一步一步地用代码来实现：
C#遇见TensorFlow.NET：开启机器学习的全新时代墨夶 C#学习资料1 机器学习 c#tensorflow
在当今快速发展的科技世界里，机器学习（MachineLearning,ML）已经成为推动创新的重要力量。从个性化推荐系统到自动驾驶汽车，ML的应用无处不在。对于那些习惯于使用C#进行开发的程序员来说，将机器学习集成到他们的项目中似乎是一项具有挑战性的任务。但随着TensorFlow.NET的出现，这一切变得不再困难。今天，我们将一起探索如何利用这一强大的工具，在熟悉的.NET环境中轻松构建、训练和
JAVA程序员工作常用英语金士曼 JavaSE java 排序算法算法
基础单词部分ABCarray数组accessible可存取的area面积audio音频addition加法action行动arithmetic算法adjustment调整actual真实的argument参量ascent提升already已经AWT(AbstractWindowToolkit)抽象窗口工具API(ApplicationProgrammingInterface)应用程序接口byte字
计算机考试电子邮件怎么回复,计算机基础知识电子邮件使用技巧集锦(二) csp1223 计算机考试电子邮件怎么回复
计算机基础知识电子邮件使用技巧集锦(二)分类：计算机等级|更新时间：2013-01-07|来源：转载11、用ISP邮箱提高发信速度现在免费电子邮件大都支持SMTP和POP3协议，故在设置服务帐号时“工具”→“选项”→“邮件服务器”中的“发送邮件服务器SMTP”和“接受邮件服务器POP3”均填相同的服务器，如海南建恒电子邮局都填“www.88998.com”，但在使用中发现用此服务器发送邮件速度较慢
机器视觉算法与边缘计算：打造移动终端上的智能“慧眼” matlab_python22 计算机视觉
机器视觉算法与边缘计算：打造移动终端上的智能“慧眼”边缘计算的背景数据量激增与实时性需求：随着物联网的快速发展，大量智能设备接入网络，产生的数据量呈爆发式增长。传统云计算模式在处理这些海量实时数据时，面临延迟高、带宽压力大等问题，无法满足如自动驾驶、远程医疗等对实时性要求极高的应用场景的需求。云计算的局限性：云计算虽然提供了强大的计算和存储能力，但在数据传输过程中存在时间延迟，且数据集中存储在云端
Python 数据结构与算法学习 X天地不仁数据结构学习
2022年秋季，笔者初次接触数据结构与算法，当时只觉得书上写的内容晦涩难懂，加之自己的怠惰，很难理解所讲解的内容。所幸，期末的考核因为疫情放开，延迟到了2023年的春季开学，并且试卷的难度很低，60来分，混了个及格。1、什么是数据结构官方定义:并没有…民间定义:“数据结构是数据对象，以及存在于该对象的实例和组成实例的数据元素之间的各种联系。这些联系可以通过定义相关的函数来给出。”---《数据结构、
NLP 中文拼写检测纠正论文 Automatic-Corpus-Generation 代码后端java
拼写纠正系列NLP中文拼写检测实现思路NLP中文拼写检测纠正算法整理NLP英文拼写算法，如果提升100W倍的性能？NLP中文拼写检测纠正Paperjava实现中英文拼写检查和错误纠正？可我只会写CRUD啊！一个提升英文单词拼写检测性能1000倍的算法？单词拼写纠正-03-leetcodeedit-distance72.力扣编辑距离NLP开源项目nlp-hanzi-similar汉字相似度word-
v0.24.0 新特性支持标签分类，内置实现多种策略后端java
开源项目敏感词核心https://github.com/houbb/sensitive-word敏感词控台https://github.com/houbb/sensitive-word-admin版本特性大家好，我是老马。敏感词标签分类一直是大家比较想要的一个功能特性，v0.24.0了开始内置支持标签分类，同时实现了多种策略。快速开始maven引入com.github.houbbsensitive
图论DFS：黑红树 Python_enjoy C++洛谷题解每周更新栏目深度优先图论算法
我的个人主页{\large\mathsf{{\color{Red}我的个人主页}}}我的个人主页往{\color{Red}{\Huge往}}往期{\color{Green}{\Huge期}}期文{\color{Blue}{\Huge文}}文章{\color{Orange}{\Huge章}}章DFS算法：记忆化搜索DFS算法：全排列问题DFS算法：洛谷B3625迷宫寻路此系列更新频繁，求各位读者点赞
【拒绝算法PUA】3065. 超过阈值的最少操作数 I BigDark的笔记 #LEETCODE #每日一题算法
系列文章目录【拒绝算法PUA】0x00-位运算【拒绝算法PUA】0x01-区间比较技巧【拒绝算法PUA】0x02-区间合并技巧【拒绝算法PUA】0x03-LeetCode排序类型刷题【拒绝算法PUA】LeetCode每日一题系列刷题汇总-2025年持续刷新中C++刷题技巧总结：[温习C/C++]0x04刷题基础编码技巧文章目录系列文章目录LeetCode3065.超过阈值的最少操作数I链接题目解题
人工智能：人形机器人的开发需求会创造哪些热门的就业岗位？ InnoLink_1024 机器学习 AGI 人工智能人工智能机器人 ai
人形机器人的开发需求会创造以下热门的就业岗位：研发设计类机械结构工程师：负责设计人形机器人的机械本体结构，包括关节、骨架、外壳等，需要对机械原理、力学知识有深入理解，熟悉使用CAD、SolidWorks等设计软件。电子电气工程师：设计和开发人形机器人的电子电路系统，包括传感器电路、控制电路、电源电路等，需要掌握电子技术、电路设计、PCB绘制等技能。算法工程师：运动控制算法工程师：负责移动机器人运动
用java 实现 Add Two Numbers 两数相加（LeetCode算法）用心去追梦算法 java leetcode
LeetCode上的“AddTwoNumbers”问题要求我们实现一个函数，该函数接收两个非空链表作为输入，每个链表表示一个非负整数的逆序表示（即个位在链表头），链表中的每个节点包含一个数字（0-9）。任务是将这两个数相加，并以同样的链表格式返回和。下面是用Java实现这个算法的方法：classListNode{intval;ListNodenext;ListNode(intx){val=x;}}
【数据结构】—— 顺序表的实现与优化：空间管理与增容策略酷酷的崽798 数据结构数据结构 c语言
文章目录顺序表的基本概念与结构顺序表的分类静态顺序表动态顺序表顺序表问题与思考插入与删除的时间复杂度增容的开销如何解决空间浪费问题？顺序表作为一种常见的线性数据结构，广泛应用于各种编程任务中。它通过连续的物理内存存储数据元素，提供了高效的随机访问功能。在这篇博客中，我们将深入探讨顺序表的结构、分类、实现方法以及它的一些问题与优化策略，尤其是如何解决空间浪费和增容问题。顺序表的基本概念与结构顺序表（
【深入解析】棋类游戏算法：Minimax, Negamax, 蒙特卡洛树搜索与AlphaZero wit_@ ai python negamax
深入解析棋类游戏算法：Minimax,Negamax,蒙特卡洛树搜索与AlphaZero在人工智能领域，棋类游戏一直是测试和展示智能算法的经典舞台。从最早的Minimax算法到如今的AlphaZero，这些算法通过不同的方式解决了棋局中的决策问题，让计算机能够在复杂的棋局中做出合理甚至超越人类的决策。本文将详细解析几种经典的棋类游戏算法：Minimax，Negamax，蒙特卡洛树搜索（MCTS）以
深入探索Python编程技术：从入门到精通的全方位学习指南小码快撩 python 开发语言
引言在当今信息技术飞速发展的时代，Python以其简洁优雅、功能强大、易于上手的特点，成为了众多开发者和初学者首选的编程语言。无论是数据科学、机器学习、Web开发、自动化脚本编写，还是桌面应用开发，Python都能发挥其独特优势，帮助开发者高效完成任务。本文旨在为Python学习者提供一个全面的学习路径与关键知识点概述，助您快速掌握这门强大的编程语言。一、基础语法1.变量定义与数据类型示例代码：#
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu