helton_yan

【机器学习算法】基于前馈神经网络的反向传播算法解析

文章目录

走向深度：深度学习前馈神经网络
- 1.神经网络常见激活函数及其导函数
- - sigmoid
  - Tanh
  - ReLU （线性整流函数 Rectified Linear Unit）
  - Leakly ReLU
  - PReLU(Parametric ReLU)
  - ELU
- 2.深度学习的基石：误差反向传播算法(Back Propagation)
- - 梯度下降，参数更新
- 3.代码实战前馈神经网络分类
- - - 优化一：对前向传播每一层的输出结果进行标准归一化(和BN有所不同，不包括可学习γβ)：
    - 优化二：更科学的权重初始化方法
    - - 统一初始化为某数值
      - 随机初始化
- 4.代码实战前馈神经网络回归

走向深度：深度学习前馈神经网络

1.神经网络常见激活函数及其导函数

为什么要用非线性激活函数?

如果不使用激活函数，则n层神经网络的表达式看起来就会像这样：
$y = XW_1W_2···W_n$
由于矩阵运算是线性变换，因此有：
$\begin{aligned} &θ = W_1W_2···W_n\\ &\therefore y=Xθ \end{aligned}$
因此缺少了非线性激活函数的多层神经网络的效果就会和一层网络相当，那这样我们干脆使用多元线性回归模型就好了，为啥还大费周折的创建多层网络？显然这不是神经网络的初衷。

神经网络的意义就在于，加深网络的层数，使得模型能够具有更强的拟合能力和非线性表达能力，因此激活函数的作用就是给网络提供非线性变换的：
$y = σ_n(···σ_2(σ_1(XW_1)W_2)···W_n)$
常见激活函数：

sigmoid

$\sigma(x)=\frac{1}{1+e^{-z}}，\sigma(x)\in(0,1)$

导函数：
$\begin{aligned} &\sigma^{\prime}(z) =\frac{d}{d z} \frac{1}{1+e^{-z}} \\ &=\frac{1}{\left(1+e^{-z}\right)^{2}}\left(e^{-z}\right) \\ &=\frac{1}{\left(1+e^{-z}\right)} \cdot\left(1-\frac{1}{\left(1+e^{-z}\right)}\right) \\ &=\sigma(z)(1-\sigma(z))&\sigma^{\prime}(x)\in(0,0.25) \end{aligned}$
函数可视化

Tanh

$\sigma(z)=\frac{e^{z}-e^{-z}}{e^{z}+e^{-z}}，\sigma(x)\in(-1,1)$

导函数：
$\begin{aligned} &\sigma^{\prime}(z) =\frac{e^{z}-e^{-z}}{e^{z}+e^{-z}} \\ &=\frac{e^{z}+e^{-z}}{(e^{z}+e^{-z})^2}\left(e^{z}-e^{-z}\right) \\ &=1-\frac{e^{z}-e^{-z}}{e^{z}+e^{-z}} \\ &=1 - \sigma^2(z) &\sigma^{\prime}(x)\in(0,1) \end{aligned}$

ReLU （线性整流函数 Rectified Linear Unit）

$\begin{aligned} &\sigma(x)= \begin{cases}x & \text x>0 \\ 0 & \text x \leq 0\end{cases}\\ &或\\ &\sigma(x)=max(0,x) \end{aligned}$

导函数：
$\sigma^{\prime}(x)= \begin{cases}1 & \text x>0 \\ 0 & \text x \leq 0\end{cases}$

在神经网络当中，一般选择ReLU作为隐藏层的激活函数，这是因为对于层数较深的网络来说，如果使用sigmoid或者Tanh，则浅层的节点在反向传播的过程中通过链式求导法则会连乘上每一层的激活函数的导数，由于sigmoid和Tanh的导函数的值域都是(0,1)之间的浮点数，连乘后势必导致浅层节点的梯度越来越小，因此浅层节点的参数相较于深层节点就不能得到很好的更新。这种现象也叫做梯度消失。

但是ReLU函数也有一些缺点，那就是通过Relu函数激活后的数据都是非负的，这在梯度下降时就会导致前几周在正则化里提过的’Z型更新’。

除此之外，一旦某个节点通过ReLU激活后为0，那么在反向传播时梯度到这个节点乘上ReLU的导就等于0，导致该节点对先前节点的梯度贡献也为0，这样梯度的反向传播就被阻断了,导致某些神经元可能永远不会被激活，相应参数永远不会被更新 [神经元坏死现象(Dead ReLU Problem)]。

因此也诞生了许多对ReLU函数的改进：

Leakly ReLU

$\sigma(x)=max(0.01x,x)$

导函数：
$\sigma^{\prime}(x)= \begin{cases}1 & \text x>0 \\ 0.01 & \text x \leq 0\end{cases}$

PReLU(Parametric ReLU)

$\sigma(x)=max(\alpha x,x)$

导函数：
$\sigma^{\prime}(x)= \begin{cases}1 & \text x>0 \\ \alpha & \text x \leq 0\end{cases}$

ELU

$\sigma(x)=max(\alpha(\exp (x)-1),x)$

2.深度学习的基石：误差反向传播算法(Back Propagation)

对于没有隐藏层的神经网络而言，对网络模型中参数的更新只需要通过损失函数对参数求偏导即可解决，但在神经网络中，网络是由多层堆叠而成，较浅层的网络的梯度需要从较深层网络中获得。因此对于多层神经网络而言，梯度的传递就需要用到链式求导法则，这也是反向传播的数学基础。

下面简单对单层网络的反向传播算法进行一个推导，推导的数学原理需要用到高等数学中的复合函数的链式求导法则。

现在我们考虑每层网络有多个节点的情况，这时候就需要用到矩阵求导法则：

伪代码(W参数梯度更新法则基于经典的δ法则)：

梯度下降，参数更新

考虑m条样本时，需要对梯度取平均：
$\begin{gathered} &W^{n} =: W^{n}-\eta·\frac{1}{m} \sum_{x} \left(\sigma^{(n-1)}(Z^{(n-1)})\right)^{T}\delta^{(n)} \\ &b^{l} =: b^{l}-\frac{\eta}{m} \sum_{x} \delta^{x, l} \end{gathered}$

3.代码实战前馈神经网络分类

正向传播、反向传播实现手写数字分类：

import sklearn.datasets as datasets # 数据集模块
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split # 划分训练集和验证集
import sklearn.metrics # sklearn评估模块
from sklearn.preprocessing import StandardScaler # 标准归一化
from sklearn.metrics import accuracy_score




class MyNeuralNetwork():
    
    def __init__(self, input, label, class_num, hidden_layer_size, lr=1e-3, threshold=1e-4, epoch=10000, batchsize=200, weight_decay=1e-4, test_train_ratio=0.3, print_loop=1000):
        # 设置超参数
        self.CLS_NUM = class_num
        self.LR= lr         # 学习率
        self.EPOCH = epoch   # 最大迭代次数
        self.BATCH_SIZE = batchsize  # 批大小
        self.THRESHOLD = threshold # 判断收敛条件
        self.Xdata = input
        self.ydata = label
        self.WEGHT_DECAY = weight_decay
        self.PRINTLOOP = print_loop
        self.RATIO = test_train_ratio
        self.HIDDEN_LAYER_SIZE = hidden_layer_size


    # 将标签转化为one-hot编码:
    def label2one_hot(self, y, num_cls):
        return np.eye(num_cls)[y].astype(int)



    # 将概率转化为预测的类别
    def maxcls(self, y, num_cls, to_one_hot=True):
        y = np.argmax(y, 1)
        if to_one_hot:
            return self.label2one_hot(y=y, num_cls=num_cls)
        else:
            return y.astype(int)



    # 这部分代码打乱数据集，保证每次小批量迭代更新使用的数据集都有所不同
    def shuffle(self, m):
        # 产生一个长度为m的顺序序列
        index = np.arange(m)
        # shuffle方法对这个序列进行随机打乱
        np.random.shuffle(index)
        return index



    # Relu激活函数
    def ReLU(self, x):
        # np.clip截断函数,上限为x类型数的最大值,目的是为了保证x不溢出
        return np.clip(x, 0, np.finfo(x.dtype).max)

    # 巧妙求取Relu激活函数导函数
    def d_ReLU(self, x):
        X = np.array(x)
        X[X == 0] = 0
        return X



    # softmax函数
    def softmax(self, X):  
        # print(np.exp(X))  # 出现 ±inf,  0.00000000e+000 就是溢出了
        # 这里使用一个小trick防止exp上溢出:https://blog.csdn.net/csuzhaoqinghui/article/details/79742685
        max = np.max(X, axis=1).reshape(-1, 1)
        # 这里的np.sum不是对所有求和，而是对每一行求和，所以需要设置axis=1
        return np.exp(X - max) / np.sum(np.exp(X - max), axis=1).reshape(-1,1)



    # 交叉熵损失
    def cross_entropy(self, y_true, y_pred):
        # 使用截断函数避免y_pred太小导致后续计算log时y_pred = -inf
        y_pred= np.clip(y_pred, 1e-10, 1 - 1e-10)
        crossEntropy = -np.sum(y_true * np.log(y_pred)) / (y_true.shape[0])
        return crossEntropy



    # 数据预处理模块
    def data_processing(self, X, y, ratio, clsnum):
        # 测试集训练集划分比例
        RATIO = ratio
        # 导入数据集
        y = self.label2one_hot(y=y, num_cls=clsnum)
        r = X.shape[0]
        y = y.reshape(-1,clsnum)

        # 标准归一化
        scaler = StandardScaler()
        X = scaler.fit_transform(X)
        # 加入偏置项
        X = np.concatenate((np.ones((r, 1)), X), axis=1)
        # 划分训练集和验证集,使用sklearn中的方法
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=RATIO)
        m, n = X_train.shape[0], X_train.shape[1]

        print("datasets num: %d " % X.shape[0])
        return m, n, X_train, X_test, y_train, y_test



    # 判断训练是否收敛
    def judge_convergence(self, count, train_loss):
        d_loss = abs(train_loss[-2] - train_loss[-1])
        # print(d_loss)
        if d_loss < self.THRESHOLD:
            count += 1
        else:
            count = 0
        return count
        



    # 前向传播方法
    def forward(self, σ, W, b, X_batch, layer_num):
        # 输入层(没有激活函数)
        σ.append(X_batch)
        # 隐藏层(ReLU)
        for i in range(0, layer_num - 2):
            output = np.dot(σ[-1], W[i]) + b[i]
            σ.append(self.ReLU(output))
        # 输出层(softmax)
        σ.append(self.softmax(np.dot(σ[-1], W[i + 1])))
        


    # 反向传播方法
    def backward(self, σ, W, b, y_batch, layer_size, layer_num):
        # 初始化δ, grad = a*δ
        δ = [np.empty_like(size) for size in σ[1:]]
        # 初始化W梯度
        W_grads = [np.empty((fin, fout)) for fin, fout in zip(layer_size[:-1], layer_size[1:])]
        # 初始化b梯度
        b_grads = [np.empty(fout) for fout in layer_size[1:]]
        # 计算δ
        δ[-1] = σ[-1] - y_batch # 输出层的δ
        for i in range(layer_num - 3, -1, -1):
            δ[i] = self.d_ReLU(np.dot(δ[i + 1], W[i + 1].T))    # 隐藏层的δ

        # 迭代计算各个层前面的梯度:
        for i in range(layer_num - 2, -1, -1):
            # 输出层W的梯度+L2正则(这里的W是所有样本的梯度加和，所以需要求平均)
            W_grads[i] = (np.dot(σ[i].T, δ[i]) + self.WEGHT_DECAY * W[i]) / y_batch.shape[0]
            # 输出层b的梯度(对列求平均)
            b_grads[i] = np.mean(δ[i], axis=0)
        #print(b_grads[0])

        # 3, 利用梯度下降法更新参数
        for i in range(len(W)):
            W[i] -= self.LR * W_grads[i]
            b[i] -= self.LR * b_grads[i]



    # 记录与评估
    def eval(self, W, b, X_train, X_test, y_train, y_test, test_loss, test_acc, train_loss, train_acc, layer_num, current_loop):
        i = current_loop
        # 评估测试集
        σ_test = []  # sigma用来保存前向传播每一层的输出结果
        self.forward(σ_test, W, b, X_test, layer_num)
        test_loss.append(self.cross_entropy(y_true=y_test, y_pred=σ_test[-1]))
        test_acc.append(accuracy_score(y_true=y_test, y_pred=self.maxcls(σ_test[-1], num_cls=self.CLS_NUM)))
        # 评估训练集
        σ_train = []  # sigma用来保存前向传播每一层的输出结果
        self.forward(σ_train, W, b, X_train, layer_num)
        train_loss.append(self.cross_entropy(y_true=y_train, y_pred=σ_train[-1]))
        train_acc.append(accuracy_score(y_true=y_train, y_pred=self.maxcls(σ_train[-1], num_cls=self.CLS_NUM)))

        # 打印评估结果, 保存模型 
        if i % self.PRINTLOOP == 0:
            np.save("train_loss.npy",train_loss)
            np.save("test_loss.npy",test_loss)
            np.save("train_acc.npy",train_acc)
            np.save("test_acc.npy",test_acc)
            np.save("Weight.npy", W)    
            np.save("bias.npy", b) 
            print("eopch: %d | train loss: %.6f | test loss: %.6f | train acc.:%.4f | test acc.:%.4f" % (i, train_loss[i], test_loss[i], train_acc[i], test_acc[i]))




    # 打印最终结果
    def print_result(self, train_loss, test_loss, train_acc, test_acc):
        print('==============================')
        print("train loss:{}".format(train_loss))
        print("test loss:{}".format(test_loss))
        print("train acc.:{}".format(train_acc))
        print("test acc.:{}".format(test_acc))
        print('==============================')



    # 保存权重
    def save_result(self, W, b, train_loss, test_loss, train_acc, test_acc):
        np.save("Weight.npy",W)
        np.save("bias.npy",W)
        np.save("train_loss.npy",train_loss)
        np.save("test_loss.npy",test_loss)
        np.save("train_acc.npy",train_acc)
        np.save("test_acc.npy",test_acc)



    # 训练代码的核心
    def fit(self):
        # 超参数
        CLS_NUM = self.CLS_NUM
        LR= self.LR        # 学习率
        EPOCH = self.EPOCH   # 最大迭代次数
        BATCH_SIZE = self.BATCH_SIZE  # 批大小
        THRESHOLD = self.THRESHOLD # 判断收敛条件
        PRINTLOOP = self.PRINTLOOP
        HIDDEN_LAYER_SIZE = self.HIDDEN_LAYER_SIZE # 隐藏层尺寸
        RATIO = self.RATIO

        # 读取数据和标签
        X = self.Xdata
        y = self.ydata
        # 数据预处理
        m_samples, n_features, X_train, X_test, y_train, y_test = self.data_processing(X, y, RATIO, CLS_NUM)

        # 每个epoch包含的批数
        NUM_BATCH = m_samples // BATCH_SIZE + 1

        # 神经网络每一层尺寸
        LAYER_SIZE = [n_features] + HIDDEN_LAYER_SIZE + [CLS_NUM]
        # 神经网络层数
        LAYER_NUM = len(LAYER_SIZE)


        # 1, 随机初始化W参数
        W = []
        b = []
        for i in range(LAYER_NUM - 1):
            W.append(np.random.rand(LAYER_SIZE[i], LAYER_SIZE[i + 1]))
            b.append(np.random.rand(LAYER_SIZE[i + 1])) # 偏置只有一行，尺寸是当前层的节点数


        # 损失和准确率记录在列表中
        train_loss = [0.]
        test_loss = [0.]
        train_acc = []
        test_acc = []
        count = 0

        for i in range(EPOCH + 1):

            # 随机打乱数据集
            index = self.shuffle(m_samples)
            X_train = X_train[index]
            y_train =y_train[index]

            # 记录与评估
            self.eval(W, b, X_train, X_test, y_train, y_test, test_loss, test_acc, train_loss, train_acc, LAYER_NUM, i)
            
            for batch in range(NUM_BATCH-1):
                # 切片操作获取对应批次训练数据(允许切片超过列表范围)
                X_batch = X_train[batch*BATCH_SIZE: (batch+1)*BATCH_SIZE]
                y_batch = y_train[batch*BATCH_SIZE: (batch+1)*BATCH_SIZE]

                # 前向传播:
                σ = []  # sigma用来保存每一层的输出结果
                self.forward(σ, W, b, X_batch, LAYER_NUM)
                # 反向传播:
                self.backward(σ, W, b, y_batch, LAYER_SIZE, LAYER_NUM)

                # 4, 判断收敛
                count = self.judge_convergence(count, train_loss)
            if count >= 100:
                # 如果连续10次loss变化的幅度小于设定的阈值,让for循环退出
                for loop in range(32):
                    print('===', end='') 
                print("\ntotal iteration is : {}".format(i))
                break
        if count < 100 and i == EPOCH :
            print("循环已结束，但模型尚未收敛！")


        # 打印最终结果
        self.print_result(train_loss[-1], test_loss[-1], train_acc[-1], test_acc[-1])
        # 保存结果
        self.save_result(W, b, train_loss, test_loss, train_acc, test_acc)



if __name__ == "__main__":

    X, y = datasets.load_digits(return_X_y=True)
    hidden_layer = [64, 64]
    SF = MyNeuralNetwork(X, y ,hidden_layer_size=hidden_layer, lr=1e-3, class_num=10, threshold=1e-9,weight_decay=1e-3, epoch=10000, print_loop=400)
    SF.fit()

train loss:0.2560005751123368
test loss:0.31717534936199854
train acc.:0.94351630867144
test acc.:0.9351851851851852

可以发现loss最后收敛了，但是训练过程中容易出现较大的震荡。

优化一：对前向传播每一层的输出结果进行标准归一化(和BN有所不同，不包括可学习γβ)：

    # 前向传播方法
    def forward(self, σ, W, b, X_batch, layer_num):
        scaler = StandardScaler()
        # 输入层(没有激活函数)
        σ.append(X_batch)
        # 隐藏层(ReLU)
        for i in range(0, layer_num - 2):
            # 加入BN
            output = np.dot(σ[-1], W[i]) + b[i]
            output = scaler.fit_transform(output)
            σ.append(self.ReLU(output))
        # 输出层(softmax)
        σ.append(self.softmax(np.dot(σ[-1], W[i + 1])))

train loss:0.04842900862837068
test loss:0.1785419250660452
train acc.:0.9912490055688147
test acc.:0.9555555555555556

可以看见对每一层的输出结果进行标准归一化后训练网络的震荡现象有所缓解，并且准确率也有所提高。

优化二：更科学的权重初始化方法

统一初始化为某数值

首先，我们很容易想到的一种方法是将网络每一层的参数都初始化为0，这是一个简单且暴力的初始化方法，但是这种方法是最不可行的并且会导致巨大的问题，即导致网络是对称的。

我们可以将隐藏层的每一个节点想象成是提取了输入数据的不同特征(可以类比卷积神经网络中多个卷积核提取不同的特征，在全连接神经网络中，每个节点就相当于用一个感受野与输入特征维度相当的一维卷积提取的特征，即卷积核大小和原始输入相当)，但是这有一个前提，那就是不同节点的参数是不一样的，如果将所有参数都初始化为相同的数值，那就相当于所有节点提取了相同的特征，节点的输出自然也就是一样的。一直到loss反向传播时，由于每个节点提取的特征相同，那么它们得到的梯度也会是一样的，最终在梯度下降时，神经网络的横向梯度就会是一样的，这就会导致神经网络参数的更新值也相同，也就是说，网络的横向节点提取的参数始终保持不变，网络的性能实则就和宽度为1的网络相当(即网络是横向对称的)

我们可以通过每一层的参数分布直方图来可视化这个现象(激活函数为Tanh)：

(基于等值初始化(0.1)的输出和梯度分布)：

此时模型的参数被初始化为0.1，导致后续梯度的更新都是一致的

随机初始化

因此，更为常用的方法是通过随机出符合某高斯分布的随机数作为网络的初始化参数值，这也是更为普遍的做法,但是随机初始化也不能太大或太小，否则也会出现梯度爆炸或梯度消失的现象(激活函数为Tanh)：

(基于随机初始化(std=3)的输出和梯度分布):

如果权重初始化得太大，就会导致隐藏层激活函数达到饱和,使得每一层的分布都集中在激活函数的值域两端，这时候激活函数的导数是很小的，但是参数矩阵很大，这时候两者平衡一下就是下图的结果。给人直观的感觉就是，如果初始化参数很大，梯度在反向传播时会越来越大。

(基于随机初始化(std=0.1)的输出和梯度分布):

可见第一层隐藏层的输出还比较正常，随着越往前传播，参数就越来越小，参数越小梯度也就会越小，越小的梯度经过链式求导连乘项就会变的更小，导致反向传播时出现梯度消失的现象。

从直观的图像以及不太严谨的分析上看，似乎以上所述的几种初始化方法都不利于模型的收敛，那么什么样的初始化方法才是科学的呢?

请移步我总结的另一篇博客：(敬请期待)

4.代码实战前馈神经网络回归

正向传播、反向传播实现波士顿房价回归预测：

import sklearn.datasets as datasets # 数据集模块
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split # 划分训练集和验证集
import sklearn.metrics # sklearn评估模块
from sklearn.preprocessing import StandardScaler # 标准归一化
from sklearn.metrics import accuracy_score




class MyNeuralNetwork():
    
    def __init__(self, input, label, hidden_layer_size, lr=1e-3, threshold=1e-4, epoch=10000, batchsize=200, weight_decay=1e-4, test_train_ratio=0.3, print_loop=1000):
        # 设置超参数
        self.LR= lr         # 学习率
        self.EPOCH = epoch   # 最大迭代次数
        self.BATCH_SIZE = batchsize  # 批大小
        self.THRESHOLD = threshold # 判断收敛条件
        self.Xdata = input
        self.ydata = label
        self.WEGHT_DECAY = weight_decay
        self.PRINTLOOP = print_loop
        self.RATIO = test_train_ratio
        self.HIDDEN_LAYER_SIZE = hidden_layer_size
        # 首先确定数据样本的均值与方差
        self.SCALER = StandardScaler()
        self.SCALER.fit(self.Xdata)





    # 这部分代码打乱数据集，保证每次小批量迭代更新使用的数据集都有所不同
    def shuffle(self, m):
        pass

    # Relu激活函数
    def ReLU(self, x):
        pass

    # 巧妙求取Relu激活函数导函数
    def d_ReLU(self, x):
        pass


    def generate_batches(self, samples_size, batch_size):
        # 产生一个批次的样本数据的索引
        num_batchs = samples_size // batch_size # 每个epoch包含的批数
        begin = 0

        for _ in range(num_batchs):
            end = begin + batch_size
            # yield返回可迭代对象,slice表示一个切片范围
            yield slice(begin, end)
            begin = end
        if begin < samples_size:
            yield slice(begin, samples_size)




    # 均方根损失
    def mse(self, y_true, y_pred):
        #print(np.mean(np.square(y_pred - y_true)))
        mean_square_error = np.mean(np.square(y_pred - y_true))
        return mean_square_error



    # 权重初始化方法
    def init_param(self, layer_num, layer_size):
        W, b = [], []
        for i in range(layer_num - 1):
            in_size, out_size = layer_size[i], layer_size[i + 1]
            ''' Xavier Glorot初始化方法 '''
            # factor = 6.
            # init_boundary = np.sqrt(factor / (in_size + out_size))
            # # uniform 均匀分布
            # W.append(np.random.uniform(-init_boundary, init_boundary, (in_size, out_size)))
            # b.append(np.random.uniform(-init_boundary, init_boundary, out_size))# 偏置只有一行，尺寸是当前层的节点数
            ''' MSRA初始化方法(由何恺明团队提出，针对ReLU和PReLU激活函数)''' 
            W.append(np.random.randn(in_size, out_size) * np.sqrt(2./in_size))
            b.append(np.zeros(out_size))# 偏置只有一行，尺寸是当前层的节点数
        return W, b



    # 数据预处理模块
    def data_processing(self, X, y, ratio):
        # 测试集训练集划分比例
        RATIO = ratio
        # 导入数据集
        r = X.shape[0]

        # 标准归一化
        X = self.SCALER.transform(X)
        # 加入偏置项
        X = np.concatenate((np.ones((r, 1)), X), axis=1)
        # 划分训练集和验证集,使用sklearn中的方法
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=RATIO)
        m, n = X_train.shape[0], X_train.shape[1]

        print("datasets num: %d " % X.shape[0])
        return m, n, X_train, X_test, y_train, y_test



    # 判断训练是否收敛
    def judge_convergence(self, count, train_loss):
        pass
        

    # 前向传播方法
    def forward(self, W, b, X_batch, layer_num):
        σ = []
        scaler = StandardScaler()
        # 输入层(没有激活函数)
        σ.append(X_batch)
        # 隐藏层(ReLU)
        for i in range(0, layer_num - 2):
            output = np.dot(σ[-1], W[i]) + b[i]
            # 加入BN
            # output = scaler.fit_transform(output)
            σ.append(self.ReLU(output))
        # 输出层
        σ.append(np.dot(σ[-1], W[i + 1]))
        return σ
        


    # 反向传播方法
    def backward(self, σ, W, b, y_batch, layer_size, layer_num):
        pass


    # 记录与评估
    def eval(self, W, b, X_train, X_test, y_train, y_test, test_loss, train_loss, layer_num, current_loop):
        i = current_loop
        # 评估测试集
        σ_test = self.forward(W, b, X_test, layer_num)
        test_loss.append(self.mse(y_true=y_test, y_pred=σ_test[-1]))
        # 评估训练集
        σ_train = self.forward(W, b, X_train, layer_num)
        train_loss.append(self.mse(y_true=y_train, y_pred=σ_train[-1]))

        # 打印评估结果, 保存模型 
        if i % self.PRINTLOOP == 0:
            np.save("train_loss.npy",train_loss)
            np.save("test_loss.npy",test_loss)
            np.save("Weight.npy", W)    
            np.save("bias.npy", b) 
            print("eopch: %d | train loss: %.6f | test loss: %.6f" % (i, train_loss[i], test_loss[i]))




    # 打印最终结果
    def print_result(self, train_loss, test_loss):
        print('==============================')
        print("train loss:{}".format(train_loss))
        print("test loss:{}".format(test_loss))
        print('==============================')



    # 保存权重
    def save_result(self, W, b, train_loss, test_loss):
        np.save("Weight.npy",W)
        np.save("bias.npy",b)
        np.save("train_loss.npy",train_loss)
        np.save("test_loss.npy",test_loss)


    # 训练代码的核心
    def train(self):
        # 超参数
        EPOCH = self.EPOCH   # 最大迭代次数
        BATCH_SIZE = self.BATCH_SIZE  # 批大小
        HIDDEN_LAYER_SIZE = self.HIDDEN_LAYER_SIZE # 隐藏层尺寸
        RATIO = self.RATIO

        # 读取数据和标签
        X, y = self.Xdata, self.ydata

        # 数据预处理
        m_samples, n_features, X_train, X_test, y_train, y_test = self.data_processing(X, y, RATIO)


        # 神经网络每一层尺寸
        LAYER_SIZE = [n_features] + HIDDEN_LAYER_SIZE + [y.shape[1]]
        # 神经网络层数
        LAYER_NUM = len(LAYER_SIZE)
        print('Layer of neural network: ',LAYER_NUM)


        # 1, 初始化网络权重
        W, b = self.init_param(LAYER_NUM, LAYER_SIZE)

        # 损失和准确率记录在列表中
        train_loss, test_loss = [0.], [0.]
        count = 0

        for i in range(EPOCH + 1):
            # 随机打乱数据集
            index = self.shuffle(m_samples)
            X_train, y_train = X_train[index], y_train[index]

            # 记录与评估
            self.eval(W, b, X_train, X_test, y_train, y_test, test_loss, train_loss, LAYER_NUM, i)
            # 小批量训练
            for batch_slice in self.generate_batches(m_samples, BATCH_SIZE):
                # 切片操作获取对应批次训练数据
                X_batch = X_train[batch_slice]
                y_batch = y_train[batch_slice]

                # 前向传播:
                # σ用来保存每一层的输出结果
                σ = self.forward(W, b, X_batch, LAYER_NUM)
                # 反向传播:
                self.backward(σ, W, b, y_batch, LAYER_SIZE, LAYER_NUM)

                # 4, 判断收敛
                count = self.judge_convergence(count, train_loss)
            if count >= 100:
                # 如果连续10次loss变化的幅度小于设定的阈值,让for循环退出
                for loop in range(32):
                    print('===', end='') 
                print("\ntotal iteration is : {}".format(i))
                break
        if count < 100 and i == EPOCH :
            print("循环已结束，但模型尚未收敛！")

        # 打印最终结果
        self.print_result(train_loss[-1], test_loss[-1])
        # 保存结果
        self.save_result(W, b, train_loss, test_loss)



    # 测试代码的核心
    def test(self, x):
        W = np.load('Weight.npy', allow_pickle=True)
        b = np.load('bias.npy', allow_pickle=True)
        layer_num = len(W)+1
        # 标准归一化
        x = self.SCALER.transform(x.reshape(-1,x.shape[0]))
        # 加入偏置项
        x = np.concatenate((np.ones((x.shape[0], 1)), x), axis=1)
        # 前向传播
        σ = self.forward(W, b, x, layer_num)
        return σ[-1]
        


if __name__ == "__main__":

    X, y = datasets.load_boston(return_X_y=True)
    y = y.reshape(y.shape[0], -1)
    hidden_layer = [64, 32]
    model = MyNeuralNetwork(X, y ,hidden_layer_size=hidden_layer, lr=5e-4, threshold=1e-4, weight_decay=1e-3, epoch=20000, print_loop=100)
    model.train()

train loss:7.614726695528716
test loss:10.301053536960147

损失可视化：

字节跳动算法高频题：动态规划最优模板知识产权13937636601 计算机算法动态规划
本文系统梳理字节跳动近三年算法面试中的动态规划（DP）高频题型，提炼出适用于80%场景的通用解题模板。通过背包问题、字符串处理、状态压缩等六大核心模块解析，结合跳槽、股票交易、编辑距离等15道真题案例，揭示动态规划的状态转移方程构建规律与维度优化技巧，助您在面试中实现时间复杂度与空间复杂度的双重最优解。第一章动态规划基础框架1.1动态规划三大特征特征判定标准真题案例重叠子问题递归树中存在重复计算节
macOS 使用 enca 识别文件编码类型（比 file 命令准确）知识搬运bot 软件工具/使用技巧 macos enca file iconv 文件编码
文章目录macOS上安装enca基本使用起因-iconv关于enca安装Encaenca&enconv其它用法macOS上安装encabrewinstallenca基本使用encafilepath.txt示例$enca动态规划算法.txt[0]SimplifiedChineseNationalStandard;GB2312CRLFlineterminators起因-iconv在macOS上打开一些
利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
MySQL中基于机器学习的自适应缓存热点识别优化策略——开启数据库性能新纪元墨夶数据库学习资料1 数据库 mysql 机器学习
在数据驱动的世界里，数据库的性能直接影响到整个应用系统的响应速度和用户体验。随着业务量的增长和技术的发展，传统的缓存机制逐渐暴露出局限性。如何更智能地识别并利用热点数据进行缓存优化，成为提升数据库性能的关键所在。今天，我们将深入探讨一种创新的方法——基于机器学习的自适应缓存热点识别优化策略，并分享其在MySQL中的具体实现方案。为什么选择机器学习？‍传统上，开发者们依赖于手动配置或预设规则来决定哪
OpenCV图像拼接（4）图像拼接模块的一个匹配器类cv::detail::BestOf2NearestRangeMatcher 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::BestOf2NearestRangeMatcher是OpenCV库中用于图像拼接模块的一个匹配器类，专门用于寻找两幅图像之间的最佳特征点匹配。它是基于“最近邻与次近邻距离比”原则来过滤匹配点对的，以提高匹配结果的准确性。这个类特别适用于需
股票市场的量化交易策略如何应对市场情绪变化？云策量化程序化炒股量化软件量化交易量化炒股 QMT 股票交易 PTrade 量化交易股票投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》股票市场的量化交易策略如何应对市场情绪变化？在股票市场中，量化交易策略是一种基于数学模型和算法的交易方式，它通过分析历史数据来预测未来价格走势，并据此制定交易决策。然而，市场情绪的变化对股票价格有着不可忽视的影响。本文将探讨量化交易策略如何应对市场情绪的变化，并提供一些具体的代码示例。一、市场情绪的重要性市场情绪是指投资者对市
算法笔记——前缀树、贪心算法（更新ing....... 不吃香菜的码农左神算法笔记算法数据结构贪心算法 leetcode 堆栈
前缀树、贪心算法一、前缀树1.什么是前缀树2.如何生成前缀树二、贪心算法1.拼接字符串2.金条问题3.项目会议时间问题4.项目收益最大化4.随时获得数据流的中位数一、前缀树1.什么是前缀树前缀树一般指字典树这是指一种结构而不是一类题（注意信息是在树的路上）典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
python 列表倒序输出小琳爱分享 python python
python列表倒序输出#使用reverseli1=[1,6,4,3,7,9]li2=['a','m','s','g']li1.reverse()li2.reverse()print(li1,li2)#利用list切片li1=[1,6,4,3,7,9]li2=['a','m','s','g']print(li1[::-1])print(li2[::-1])#利用算法进行转换，这里需要用到深层cop
基于WebAssembly的浏览器密码套件闲人编程 wasm 服务器易于集成跨平台性密码套件浏览器 WebAssembly
目录一、前言二、WebAssembly与浏览器密码套件2.1WebAssembly技术概述2.2浏览器密码套件的需求三、系统设计思路与架构3.1核心模块3.2系统整体架构图四、核心数学公式与算法证明4.1AES-GCM加解密公式4.2SHA-256哈希函数五、异步任务调度与GPU加速设计5.1异步任务调度5.2GPU加速六、GUI设计与功能模块七、完整代码实现九、代码自查与总结十、总结与展望一、前
密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
力扣算法ing(35 / 100) 菥菥爱嘻嘻小白学习算法算法 leetcode typescript javascript
3.22104.二叉树的最大深度我的思路：dfs,深度优先搜索或者说能不能先根搜索，根层数3192nullmax=2202153nullmax=373nullmax=3我的代码：if(head.next===null)maxreturnfunctionmaxDepth(root:TreeNode|null):number{functionfindMax(root:TreeNode|null,dep
力扣算法ing(30 / 100) 菥菥爱嘻嘻小白学习算法算法 leetcode typescript javascript
3.1719.删除链表的倒数第n个结点给你一个链表，删除链表的倒数第n个结点，并且返回链表的头结点。示例1：输入：head=[1,2,3,4,5],n=2输出：[1,2,3,5]示例2：输入：head=[1],n=1输出：[]示例3：输入：head=[1,2],n=1输出：[1]删除指定的节点，给出头节点逆转链表，寻找第n个，删除不行不行，逆转录又要反转回去后面我想到了一个解决办法：利用数组计算总
力扣算法ing(9/100) 菥菥爱嘻嘻小白学习算法算法 leetcode 数据库 typescript
2.26438.找到字符串中所有字母的异位词438.找到字符串中所有字母异位词给定两个字符串s和p，找到s中所有p的异位词的子串，返回这些子串的起始索引。不考虑答案输出的顺序。示例1:输入:s="cbaebabacd",p="abc"输出:[0,6]解释:起始索引等于0的子串是"cba",它是"abc"的异位词。起始索引等于6的子串是"bac",它是"abc"的异位词。示例2:输入:s="abab
【C/C++】在排序数组中查找元素的第一个和最后一个位置（leetcode T34）勇士小蓝0727 c语言 c++leetcode 开发语言算法数据结构蓝桥杯
核心考点：法一双指针法;法二二分查找法题目描述：给你一个按照非递减顺序排列的整数数组nums，和一个目标值target。请你找出给定目标值在数组中的开始位置和结束位置。如果数组中不存在目标值target，返回[-1,-1]。你必须设计并实现时间复杂度为O(logn)的算法解决此问题。（示例见文末）答案详解：方法一：双指针法vectorsearchRange(vector&nums,inttarge
【人工智能时代】-人工智能发展史：1900~2023 xiaoli8748_软件开发人工智能时代人工智能搜索引擎
第一阶段：人工智能发展历史：1900-19591909年西班牙工程师LeonardoTorresyQuevedo发明了“Occultus”，这是一个可以自动执行国际象棋对弈的机器，预示了未来的计算智能。
每日算法题-Nim 游戏 - 台阶晚夜微雨问海棠呀算法游戏
给定一个台阶数n，玩家每次可以选择跳跃1到m个台阶，最后一个台阶到达者获胜。假设两位玩家都采取最优策略，判断先手玩家是否会获胜。输入格式一行包含两个整数n和m（1≤n,m≤10^9）。输出格式如果先手玩家能获胜，输出"Yes"；否则输出"No"。n,m=map(int,input().split())ifnm时，若n%(m+1)≠0，先手可以通过策略使剩余台阶数变为(m+1)的倍数，将必败态转移给
算法每日一练 (17) 张胤尘算法每日一练算法数据结构
欢迎来到张胤尘的技术站技术如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌文章目录算法每日一练(17)打家劫舍题目描述解题思路解题代码`c/c++``golang``lua`官方站点：力扣Leetcode算法每日一练(17)打家劫舍题目地址：打家劫舍题目描述你是一个专业的小偷，计划偷窃沿街的房屋。每间房内都藏有一定的现金，影响你偷窃的唯一制约因素就是相邻的
算法每日一练 (16) 张胤尘算法每日一练算法数据结构
欢迎来到张胤尘的技术站技术如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌文章目录算法每日一练(16)使用最小花费爬楼梯题目描述解题思路解题代码`c/c++``golang``lua`官方站点：力扣Leetcode算法每日一练(16)使用最小花费爬楼梯题目地址：使用最小花费爬楼梯题目描述给你一个整数数组cost，其中cost[i]是从楼梯第i个台阶向上爬需
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
万字深度解析：DeepSeek-V3为何成为大模型时代的“速度之王“？羊不白丶大模型算法
引言在AI军备竞赛白热化的2024年，DeepSeek-V3以惊人的推理速度震撼业界：相比前代模型推理速度提升3倍，训练成本降低70%。这背后是十余项革命性技术的叠加创新，本文将为您揭开这艘"AI超跑"的性能密码。DeepSeek-V3的技术路径证明：计算效率的本质是知识组织的效率。其MoE架构中2048个专家的动态协作，恰似人脑神经网络的模块化运作——每个专家不再是被动执行计算的"劳工"，而是具
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
燃爆！程序员如何借助 AI 大模型冲破编程效率枷锁？（以DeepSeek，ChatGPT为例）羑悻的小杀马特. AI学习 chatgpt deepseek AI大模型开发语言
AI大模型已成为程序员提升效率的有力助手。本文聚焦DeepSeek和ChatGPT，探讨程序员如何借其冲破编程效率枷锁。在代码编写阶段，它们能快速生成基础框架、实现特定功能及复杂算法代码；调试时，精准分析错误并给出优化建议；文档生成方面，为函数、类及项目文档助力。程序员需掌握高效交互技巧，结合自身经验，合理利用AI大模型，全面提升编程效率，开启高效编程新境界。目录一·本篇背景：二、AI大模型简介2
神经网络中层与层之间的关联 iisugar 神经网络深度学习计算机视觉
目录1.层与层之间的核心关联：数据流动与参数传递1.1数据流动（ForwardPropagation）1.2参数传递（BackwardPropagation）2.常见层与层之间的关联模式2.1典型全连接网络（如手写数字分类）2.2卷积神经网络（CNN，如图像分类）2.3循环神经网络（RNN/LSTM，如文本生成）2.4Transformer（如机器翻译）3.层间关联的核心原则3.1数据传递的“管道
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
图神经网络实战——分层自注意力网络盼小辉丶图神经网络从入门到项目实战神经网络人工智能深度学习
图神经网络实战——分层自注意力网络0.前言1.分层自注意力网络1.1模型架构1.2节点级注意力1.3语义级注意力1.4预测模块2.构建分层自注意力网络相关链接0.前言在异构图数据集上，异构图注意力网络的测试准确率为78.39%，比之同构版本有了较大提高，但我们还能进一步提高准确率。在本节中，我们将学习一种专门用于处理异构图的图神经网络架构，分层自注意力网络(hierarchicalself-att
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h