云端FFF

经典机器学习方法（3）—— 多层感知机

参考：动手学深度学习
注：本文是 jupyter notebook 文档转换而来，部分代码可能无法直接复制运行！

前文介绍的线性回归和 softmax回归，在模型结构上都属于单层神经网络（只有一个输入层和一个输出层，输入层不计入层数），网络内部本质上只做了一次仿射变换
为了提升模型的表示能力和性能，深度学习主要关注多层模型，并且在神经元中增加激活函数来引入非线性成分。本节以多层感知机（multilayer perceptron，MLP）为例，介绍多层神经网络的概念

Note：多层感知机其实一个历史遗留词汇，它的前身是 单层感知机 或直接称 感知机模型，是 Frank Rosenblatt 在1957年所发明的一种二元线性分类器，感知机是第一个能根据每个类别的输入样本来学习权重的模型，引发了神经网络相关研究的第一次浪潮，由于当时没有激活函数的概念，这个纯线性模型无法学习异或函数，这次浪潮也由此衰退。目前我们正处于以“深度学习”为代表的第三波神经网络浪潮中。关于感知机的详细介绍可以参考经典机器学习方法（4）—— 感知机

Note：几十年的研究历程中，先后有 “控制论”、“联结主义”、“神经网络”直到现在的“深度学习”等多个术语指代神经网络相关的研究，现代术语“深度学习”超越了目前机器学习模型的神经科学观点。它诉诸于学习多层次组合这一更普遍的原理，这一原理也可以应用于那些并非受神经科学启发的机器学习框架
理清概念
1. 感知机 = 受生物神经元启发设计的一种二元线性分类器，是神经网络和支持向量机的前身
2. 多层感知机MLP = 至少带一个隐藏层的，深度至少两层的神经网络
3. BP神经网络 = 采用 BP 算法进行训练的神经网络

文章目录

1. 多层感知机
- 1.1 隐藏层
- 1.2 激活函数
- - 1.2.1 激活函数的作用
  - 1.2.2 各种激活函数
- 1.3 多层感知机
- - 1.3.1 理解多层感知机（全连接神经网络） —— 数据升维
  - 1.3.2 理解多层感知机（全连接神经网络） —— 提取特征
2. 实现多层感知机
- 2.1 数据准备
- 2.2 模型设计
- 2.3 模型训练
- 2.4 完整代码
3. 利用 Pytorch 简洁地实现线性回归
- 3.1 模型设计
- 3.2 模型训练
- 3.3 完整代码

1. 多层感知机

1.1 隐藏层

多层感知机在单层神经网络的输入层和输出层之间引入了一到多个隐藏层（hidden layer），其中的神经元称为隐藏单元（hidden unit），其输出称为隐藏层变量/隐藏变量。如下图例

这里输入输出和隐藏层的尺寸分别为 4、3、5，由于输入层不涉及计算，以上多层感知机的层数为2，注意多层感知机中的隐藏层和输出层都是全连接层
具体来说，给定由 $n$ 个 $d$ 维特征样本组成的 batch data $\pmb{X}\in\mathbb{R}^{n\times d}$ ，假设多层感知机设输出个数为 $q$ ，只有一个含 $h$ 个隐藏单元的隐藏层，记其输出的隐藏变量为 $\pmb{H}\in\mathbb{R}^{n\times h}$ ，由于都是全连接层，设
1. 隐藏层的权重和偏置参数为 $\pmb{W}_h\in \mathbb{R}^{d\times h}, \pmb{b}_h\in\mathbb{R}^{1\times h}$
2. 输出层的权重和偏置参数为 $\pmb{W}_o\in \mathbb{R}^{h\times q}, \pmb{b}_o\in\mathbb{R}^{1\times q}$
则 batch data 的输出 $\pmb{O}\in\mathbb{R}^{n\times q}$ 如下计算（其中加法用到广播机制）
$\pmb{H}_{n\times h} = \pmb{X}_{n\times d}\pmb{W_h}_{d\times h}+\pmb{b_h}_{1\times h}\\ \pmb{O}_{n\times q} = \pmb{H}_{n\times h}\pmb{W_o}_{h\times q}+\pmb{b_o}_{1\times q}$ 注意到我们直接将隐藏层的输出作为输出层的输入。上述式子可以合并为
$\pmb{O} = (\pmb{XW_h}+\pmb{b_h})\pmb{W_o}+\pmb{b_o} = \pmb{XW_hW_o}+\pmb{b_hW_o}+\pmb{b_o}$ 从这个式子可以看出，如果仅仅引入隐藏层，不管多少层都依然等价于一个单层神经网络

1.2 激活函数

1.1 节中问题的根源在于全连接层只是做仿射变换，多个仿射变换的叠加仍然是仿射变换。解决此问题的方法就是引入非线性变换，具体地说：对隐藏层的每个隐层变量按使用按元素运算的非线性函数进行变换，然后再作为下一层的输入。这里使用的非线性函数就称为 激活函数（activate function）
激活函数可以在网络中加入非线性成分，具有一定的生物学基础
1. 在生物神经元的输入和输出之间不是线性关系，而是在输入信号强度达到一定程度时发出一个脉冲信号，然后经历一段不应期才能再次发射。神经元的信号强度是一定的，但是发射频率会随输入强度非线性变化
2. 对应到人工神经网络中，人工神经元的输出相当于生物神经元的放电频率，激活函数则相当于描述了输入强度和放电频率的关系
Note：人工神经网络模型只是生物脑的极简模型，有一派研究人员专门从生物视角研究智能及其人工复现，对应的学科称为“认知神经科学”，那边有很多更贴近生物脑的神经网络模型

1.2.1 激活函数的作用

更重要的是，引入激活函数后神经网络具有了“拟合任何函数”的能力，这非常重要，因为机器学习的本质，无论 CV 还是 NLP 甚至 RL，都是拟合函数（尽管这个函数很可能复杂到无法表示），在李宏毅老师的课程中对这一点有着非常清晰的讲解，请看以下图示
1. 简单线性模型表示能力有限，无法拟合复杂的红色目标函数（这个问题称为 model bias）
2. 任意分段函数都可以用一个常数偏置加上一组反Z字型函数（蓝色）拟合
  
  注意任意曲线都可以用一大堆小直线拟合，因此使用这种方法就能拟合出任意函数。神经网络中常用的 sigmoid 和 tanh 激活函数就是这个蓝色反Z字函数的近似连续函数
3. 这个反Z字本质也是一个分段函数，进一步拆开就得到了 ReLU 激活函数图形

1.2.2 各种激活函数

本节介绍常见的激活函数及其导数的图像
1. ReLU (rectified linear unit 线性整流单元)，它是一个很简单的线性变换，给定元素 $x$ ，该函数定义为
  $\text{ReLU}(x) = \max(x,0) = \left\{ \begin{aligned} 0 && ,x\leq 0\\ x && ,x >0 \end{aligned} \right.$ 可见 ReLU 就是输入为负数时输出零，否则保持原样输出的一个分段函数
2. Sigmoid 函数可以将元素的值变换到 $(0, 1)$ 范围，该函数定义为
  $\text{sigmoid}(x) = \frac{1}{1+\exp(-x)}$ sigmoid 函数在早期的神经网络中较为普遍，但它目前逐渐被更简单的ReLU函数取代。它的特点是输出值域在0到1之间，在 RNN 网络中利用此特性来控制信息在神经网络中的流动。其导数为
  $\text{sigmoid}'(x) = \text{sigmoid}(x)(1-\text{sigmoid}(x))$ 如下图所示，当输入为0时，sigmoid 函数的导数达到最大值0.25；当输入越偏离0时，sigmoid 函数的导数越接近0
3. tanh（双曲正切） 函数可以加将元素的值变换到 $(- 1, 1)$ 范围，该函数定义为
  $\text{tanh}(x) = \frac{1-\exp(-2x)}{1+\exp(-2x)}$ tanh 和 sigmoid 函数的形状很像，但 tanh 函数在坐标系的原点上对称。其导数为
  $\text{tanh}'(x) = 1-\text{tanh}^2(x)$ 如下图所示，当输入为0时，tanh 函数的导数达到最大值1；当输入越偏离0时，sigmoid函数的导数越接近0

用以下代码片绘制图像

import matplotlib.pyplot as plt
import torch

# 这两行代码解决 plt 中文显示的问题
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

x = torch.arange(-8.0, 8.0, 0.1, requires_grad=True)
funcs = [x.relu(),x.sigmoid(),x.tanh()]
names = ['ReLU', 'sigmoid', 'tanh']
fig = plt.figure(figsize = (12,9))
for i in range(3):
    p1 = fig.add_subplot(3,2,1+i*2,label='a{}'.format(1+i*2))
    p2 = fig.add_subplot(3,2,2+i*2,label='a{}'.format(2+i*2))

    name = names[i]
    y = funcs[i] 
    
    if x.grad != None:  # 清除上次计算的梯度
        x.grad.zero_()
    y.sum().backward()  # 这样会计算x中各元素梯度，存在x.grad中
    
    p1.plot(x.detach().numpy(), y.detach().numpy(), "r-",linewidth=2,c='r')
    p1.set_title(name)
    p1.grid(which='major',alpha=0.8)   
    p2.plot(x.detach().numpy(), x.grad, "r-",linewidth=2,c='r')
    p2.set_title(name+'梯度')
    p2.grid(which='major',alpha=0.8)   

plt.tight_layout()  # 防止子图title和轴标签重叠

1.3 多层感知机

多层感知机就是含有至少一个隐藏层的由全连接层组成的神经网络，且每个隐藏层的输出通过激活函数进行变换。其网络层数和各隐藏层中隐藏单元个数都是超参数。以单隐藏层为例，输出可以如下计算：
$\begin{aligned} \pmb{H} &= \phi(\pmb{XW_h}+\pmb{b_h}) \\ \pmb{O} &= \pmb{HW_o}+\pmb{b_o} \end{aligned}$ 其中 $\phi$ 表示激活函数
1. 对于分类问题，可以像 softmax 回归那样对输出 $\pmb{O}$ 进行 softmax 运算，然后优化交叉熵损失
2. 对于回归问题，可以像线性回归那样将输出个数设为 1，然后优化平方损失函数

1.3.1 理解多层感知机（全连接神经网络） —— 数据升维

注意到真正数据分类过程/回归过程发生在最后一个隐藏层和输出层之间。假设输入数据维度为 $n$ ，最后一个隐藏层的隐藏单元数为 $m > n$ ，可见这些隐藏层做的事其实是把数据从 $n$ 维上升到 $m$ 维
数据升维是处理分类问题的常用技巧，比如下面例子
在二维空间中无法线性分开的两类样本，升维到三维空间中就变得线性可分了，神经网络特别善于构造复杂的高维空间

1.3.2 理解多层感知机（全连接神经网络） —— 提取特征

有些时候，神经网络最后一个隐藏层的隐藏单元数目比输入维度更小（CV 相关的任务中常有这种情况）这时神经网络的作用就不是升维了，而是提取特征，比如在情感辨析任务中提取人物神态神态
每一个隐藏层都是对上一层的一次抽象/概括/整合，当隐藏层很多时，靠前的隐藏层会提取出更底层/基础的特征，靠后的隐藏层会得到更复杂一点的特征，并在这个过程中实现基础特征的复用，比如下面这时手写数字识别任务

靠前的层提取出各种笔画的特征，靠后的层将这些基础特征整合成圆圈、折线等复杂特征（整合过程会复用上一层的基础特征），最后输出层的每个神经元都代表一个具体数字的特征（所谓 “某个神经元代表一个特征”，是指输入含有整个特征时，这个神经元的输出会变大）

Note: 纯全连接网络不具有 “平移不变性”，注意构成数字 “8” 的上下两个圆形特征，对于全连接网络而言，即时这两个圆一模一样，再图像中的位置不同也会导致网络将其识别为不同的特征，而图片中物体位置移动是很常见的。卷积神经网络具有 “平移不变性”，因此在 CV 中特别常用

2. 实现多层感知机

使用和 softmax 回归实验中相同的 Fashion-MNIST 数据集，利用多层感知机完成图像分类任务

2.1 数据准备

定义好读取小批量数据的方法，构造数据读取迭代器

import torch
import torchvision
import torchvision.transforms as transforms
import numpy as np

def load_data_fashion_mnist(batch_size, num_workers=0, root='./Datasets/FashionMNIST'):
    mnist_train = torchvision.datasets.FashionMNIST(root=root, train=True, download=True,transform=transforms.ToTensor())
    mnist_test = torchvision.datasets.FashionMNIST(root=root, train=False, download=True,transform=transforms.ToTensor())

    train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_workers)
    test_iter = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False, num_workers=num_workers)

    return train_iter, test_iter

# 数据读取迭代器
batch_size = 256
train_iter, test_iter = load_data_fashion_mnist(batch_size, 4)

2.2 模型设计

模型参数初始化：Fashion-MNIST 数据集中图像形状为 28×28，类别数为10。我们将图像拉平为 $28\times 28=784$ 的向量作为输入，即
1. 输入层单元数为 728
2. 输出层单元数为 10，使用 softmax 运算将输出转为分类概率分布，构造交叉熵损失
3. 隐藏层和输出层的所有权重参数都从正态分布 $ N(0,0.01^2)$ 采样初始化；所有偏置参数都初始化为 0
4. 隐藏单元个数是超参数，这里设为 256
```
num_inputs, num_outputs, num_hiddens = 784, 10, 256

W1 = torch.tensor(np.random.normal(0, 0.01, (num_inputs, num_hiddens)), dtype=torch.float)
b1 = torch.zeros(num_hiddens, dtype=torch.float)
W2 = torch.tensor(np.random.normal(0, 0.01, (num_hiddens, num_outputs)), dtype=torch.float)
b2 = torch.zeros(num_outputs, dtype=torch.float)

params = [W1, b1, W2, b2]
for param in params:
    param.requires_grad_(requires_grad=True)
```
定义激活函数：这里使用 ReLU 激活函数，用 max 函数手动实现之
```
def relu(X):
    return torch.max(input=X, other=torch.tensor(0.0))
```

定义模型： $\pmb{O} = \text{ReLU}(\pmb{XW_h}+\pmb{b_h})\pmb{W_o}+\pmb{b_o}$

def net(X):
    X = X.view((-1, num_inputs))        # 原始图像拉平为一维向量输入
    H = relu(torch.matmul(X, W1) + b1)  # 隐藏层计算
    return torch.matmul(H, W2) + b2     # 输出层计算并返回

定义损失函数：直接用 Pytorch 提供的 CrossEntropyLoss 方法实现交叉熵损失，它内部是用 logsoftmax + NLLLoss 实现的，可以避免数据溢出，保证数据稳定性
```
loss = torch.nn.CrossEntropyLoss()
```

2.3 模型训练

手动编写小批量随机梯度下降（sgd）方法来优化参数

Note：PyTorch在计算 torch.nn.CrossEntropyLoss 时除过一次 batch_size，因此学习率设得比较大

num_epochs = 5  # 训练轮数
lr = 100.0          # 学习率
batch_size = 256    # batch容量

# 小批量随机梯度下降
def sgd(params, lr, batch_size):
    for param in params:
        param.data -= lr * param.grad / batch_size # 注意这里更改 param 时用的param.data，这样不会影响梯度计算

# 评估模型准确率
def evaluate_accuracy(data_iter, net):
    acc_sum = 0.0  # 所有样本总准确率
    n =  0         # 总样本数量
    for X, y in data_iter:
        acc_sum += (net(X).argmax(dim=1) == y).float().sum().item() # 注意这里中间的 mean() 改成 sum() 了
        n += y.shape[0]
    return acc_sum / n
        
def train(net, train_iter, test_iter, loss, num_epochs, batch_size, params=None, lr=None):
    # 训练执行 num_epochs 轮
    for epoch in range(num_epochs):
        train_l_sum = 0.0    # 本 epoch 总损失
        train_acc_sum = 0.0  # 本 epoch 总准确率
        n = 0                # 本 epoch 总样本数
        
        # 逐小批次地遍历训练数据
        for X, y in train_iter:
            
            # 计算小批量损失
            y_hat = net(X)
            l = loss(y_hat, y).sum()  

            # 梯度清零
            if params is not None and params[0].grad is not None:
                for param in params:
                    param.grad.data.zero_()
        
            # 小批量的损失对模型参数求梯度
            l.backward()
            
            # 做小批量随机梯度下降进行优化
            sgd(params, lr, batch_size)   # 手动实现优化算法
 
            # 记录训练数据
            train_l_sum += l.item()
            train_acc_sum += (y_hat.argmax(dim=1) == y).sum().item()
            n += y.shape[0]
        
        # 训练完成一个 epoch 后，评估测试集上的准确率
        test_acc = evaluate_accuracy(test_iter, net)
        
        # 打印提示信息
        print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f'
              % (epoch + 1, train_l_sum / n, train_acc_sum / n, test_acc))

        
# 进行训练
train(net, train_iter, test_iter, loss, num_epochs, batch_size, params, lr)

'''
epoch 1, loss 0.0030, train acc 0.719, test acc 0.735
epoch 2, loss 0.0019, train acc 0.826, test acc 0.807
epoch 3, loss 0.0017, train acc 0.844, test acc 0.793
epoch 4, loss 0.0015, train acc 0.855, test acc 0.842
epoch 5, loss 0.0015, train acc 0.863, test acc 0.852
'''

2.4 完整代码

以下代码可以直接复制到 vscode 运行

import torch
import torchvision
import torchvision.transforms as transforms
import numpy as np

# 数据集相关 --------------------------------------------------------------------------------------------------
# 加载数据集
def load_data_fashion_mnist(batch_size, num_workers=0, root='./Datasets/FashionMNIST'):
    mnist_train = torchvision.datasets.FashionMNIST(root=root, train=True, download=True,transform=transforms.ToTensor())
    mnist_test = torchvision.datasets.FashionMNIST(root=root, train=False, download=True,transform=transforms.ToTensor())

    train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_workers)
    test_iter = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False, num_workers=num_workers)

    return train_iter, test_iter

# 模型相关 --------------------------------------------------------------------------------------------------------
# 激活函数
def relu(X):
    return torch.max(input=X, other=torch.tensor(0.0))

# 定义模型
def net(X):
    X = X.view((-1, num_inputs))        # 原始图像拉平为一维向量输入
    H = relu(torch.matmul(X, W1) + b1)  # 隐藏层计算
    return torch.matmul(H, W2) + b2     # 输出层计算并返回

# 小批量随机梯度下降
def sgd(params, lr, batch_size):
    for param in params:
        param.data -= lr * param.grad / batch_size # 注意这里更改 param 时用的param.data，这样不会影响梯度计算

# 评估模型准确率
def evaluate_accuracy(data_iter, net):
    acc_sum = 0.0  # 所有样本总准确率
    n =  0         # 总样本数量
    for X, y in data_iter:
        acc_sum += (net(X).argmax(dim=1) == y).float().sum().item() # 注意这里中间的 mean() 改成 sum() 了
        n += y.shape[0]
    return acc_sum / n

# 进行训练
def train(net, train_iter, test_iter, loss, num_epochs, batch_size, params=None, lr=None):
    # 训练执行 num_epochs 轮
    for epoch in range(num_epochs):
        train_l_sum = 0.0    # 本 epoch 总损失
        train_acc_sum = 0.0  # 本 epoch 总准确率
        n = 0                # 本 epoch 总样本数
        
        # 逐小批次地遍历训练数据
        for X, y in train_iter:
            
            # 计算小批量损失
            y_hat = net(X)
            l = loss(y_hat, y).sum()  

            # 梯度清零
            if params is not None and params[0].grad is not None:
                for param in params:
                    param.grad.data.zero_()
        
            # 小批量的损失对模型参数求梯度
            l.backward()
            
            # 做小批量随机梯度下降进行优化
            sgd(params, lr, batch_size)   # 手动实现优化算法
 
            # 记录训练数据
            train_l_sum += l.item()
            train_acc_sum += (y_hat.argmax(dim=1) == y).sum().item()
            n += y.shape[0]
        
        # 训练完成一个 epoch 后，评估测试集上的准确率
        test_acc = evaluate_accuracy(test_iter, net)
        
        # 打印提示信息
        print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f'
              % (epoch + 1, train_l_sum / n, train_acc_sum / n, test_acc))


if __name__ == '__main__':
    # 模型参数
    num_inputs, num_outputs, num_hiddens = 784, 10, 256
    W1 = torch.tensor(np.random.normal(0, 0.01, (num_inputs, num_hiddens)), dtype=torch.float)
    b1 = torch.zeros(num_hiddens, dtype=torch.float)
    W2 = torch.tensor(np.random.normal(0, 0.01, (num_hiddens, num_outputs)), dtype=torch.float)
    b2 = torch.zeros(num_outputs, dtype=torch.float)
    params = [W1, b1, W2, b2]

    for param in params:
        param.requires_grad_(requires_grad=True)    # 全部设为允许梯度追踪

    # 数据读取迭代器
    batch_size = 256
    train_iter, test_iter = load_data_fashion_mnist(batch_size, 4)
        
    # 交叉熵损失
    loss = torch.nn.CrossEntropyLoss()

    # 训练
    num_epochs = 5      # 训练轮数
    lr = 100.0          # 学习率
    batch_size = 256    # batch容量

    train(net, train_iter, test_iter, loss, num_epochs, batch_size, params, lr)

3. 利用 Pytorch 简洁地实现线性回归

pytorch 中提供了大量预定义的神经网络层，常用损失函数及优化器，可以大大简化 softmax 回归模型的实现
数据准备、模型评价、使用模型进行预测等部分和第 2 节实现相同，本节不再重复

3.1 模型设计

和之前 softmax 回归实验一样，按照深度学习习惯把数据拉平这件事定义成神经网络的一个层，然后用 Sequential 容器搭建网络模型

相比之前的 softmax 回归网络，唯一的区别就是多加了一个全连接层作为隐藏层。它的隐藏单元个数为256，并使用ReLU函数作为激活函数

class FlattenLayer(nn.Module):
    def __init__(self):
        super(FlattenLayer, self).__init__()
        
    def forward(self, x): # x shape: (batch, *, *, ...)
        return x.view(x.shape[0], -1)

num_inputs, num_outputs, num_hiddens = 784, 10, 256
    
net = nn.Sequential(
    FlattenLayer(),
    nn.Linear(num_inputs, num_hiddens),
    nn.ReLU(),
    nn.Linear(num_hiddens, num_outputs), 
)

for params in net.parameters():
    init.normal_(params, mean=0, std=0.01) # 用 nn.init 进行参数初始化

3.2 模型训练

训练步骤和 softmax 回归几乎相同

Note：这里使用了 PyTorch 的 SGD，里面没有除 batch_size，所以学习率不用设得太大了

num_epochs = 5
batch_size = 256
loss = torch.nn.CrossEntropyLoss()

optimizer = torch.optim.SGD(net.parameters(), lr=0.5)

def train(net, train_iter, test_iter, loss, num_epochs, batch_size, params=None, lr=None, optimizer=None):
    # 训练执行 num_epochs 轮
    for epoch in range(num_epochs):
        train_l_sum = 0.0    # 本 epoch 总损失
        train_acc_sum = 0.0  # 本 epoch 总准确率
        n = 0                # 本 epoch 总样本数
        
        # 逐小批次地遍历训练数据
        for X, y in train_iter:
            
            # 计算小批量损失
            y_hat = net(X)
            l = loss(y_hat, y).sum()  

            # 梯度清零
            optimizer.zero_grad()

            # 小批量的损失对模型参数求梯度
            l.backward()
            
            # 做小批量随机梯度下降进行优化
            optimizer.step()              

            # 记录训练数据
            train_l_sum += l.item()
            train_acc_sum += (y_hat.argmax(dim=1) == y).sum().item()
            n += y.shape[0]
        
        # 训练完成一个 epoch 后，评估测试集上的准确率
        test_acc = evaluate_accuracy(test_iter, net)
        
        # 打印提示信息
        print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f'
              % (epoch + 1, train_l_sum / n, train_acc_sum / n, test_acc))

train(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, optimizer)

'''
epoch 1, loss 0.0033, train acc 0.690, test acc 0.754
epoch 2, loss 0.0019, train acc 0.824, test acc 0.809
epoch 3, loss 0.0016, train acc 0.845, test acc 0.803
epoch 4, loss 0.0015, train acc 0.857, test acc 0.804
epoch 5, loss 0.0014, train acc 0.865, test acc 0.823
'''

3.3 完整代码

以下代码可以直接复制到 vscode 运行

import torch
import torchvision
import torchvision.transforms as transforms
from torch import nn
from torch.nn import init

# 数据集相关 --------------------------------------------------------------------------------------------------
# 加载数据集
def load_data_fashion_mnist(batch_size, num_workers=0, root='./Datasets/FashionMNIST'):
    mnist_train = torchvision.datasets.FashionMNIST(root=root, train=True, download=True,transform=transforms.ToTensor())
    mnist_test = torchvision.datasets.FashionMNIST(root=root, train=False, download=True,transform=transforms.ToTensor())

    train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_workers)
    test_iter = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False, num_workers=num_workers)

    return train_iter, test_iter

# 模型相关 --------------------------------------------------------------------------------------------------------
class FlattenLayer(nn.Module):
    def __init__(self):
        super(FlattenLayer, self).__init__()
        
    def forward(self, x): # x shape: (batch, *, *, ...)
        return x.view(x.shape[0], -1)

# 评估模型准确率
def evaluate_accuracy(data_iter, net):
    acc_sum = 0.0  # 所有样本总准确率
    n =  0         # 总样本数量
    for X, y in data_iter:
        acc_sum += (net(X).argmax(dim=1) == y).float().sum().item() # 注意这里中间的 mean() 改成 sum() 了
        n += y.shape[0]
    return acc_sum / n

# 进行训练
def train(net, train_iter, test_iter, loss, num_epochs, batch_size, params=None, lr=None, optimizer=None):
    # 训练执行 num_epochs 轮
    for epoch in range(num_epochs):
        train_l_sum = 0.0    # 本 epoch 总损失
        train_acc_sum = 0.0  # 本 epoch 总准确率
        n = 0                # 本 epoch 总样本数
        
        # 逐小批次地遍历训练数据
        for X, y in train_iter:
            
            # 计算小批量损失
            y_hat = net(X)
            l = loss(y_hat, y).sum()  

            # 梯度清零
            optimizer.zero_grad()

            # 小批量的损失对模型参数求梯度
            l.backward()
            
            # 做小批量随机梯度下降进行优化
            optimizer.step()              

            # 记录训练数据
            train_l_sum += l.item()
            train_acc_sum += (y_hat.argmax(dim=1) == y).sum().item()
            n += y.shape[0]
        
        # 训练完成一个 epoch 后，评估测试集上的准确率
        test_acc = evaluate_accuracy(test_iter, net)
        
        # 打印提示信息
        print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f'
              % (epoch + 1, train_l_sum / n, train_acc_sum / n, test_acc))


if __name__ == '__main__':
    # 模型参数
    num_inputs, num_outputs, num_hiddens = 784, 10, 256
    
    # 数据读取迭代器
    batch_size = 256
    train_iter, test_iter = load_data_fashion_mnist(batch_size, 4)

    # 定义模型网络结构
    net = nn.Sequential(
    FlattenLayer(),
    nn.Linear(num_inputs, num_hiddens),
    nn.ReLU(),
    nn.Linear(num_hiddens, num_outputs), 
    )

    # 初始化模型参数
    for params in net.parameters():
        init.normal_(params, mean=0, std=0.01)

    # 交叉熵损失 & 优化器
    loss = torch.nn.CrossEntropyLoss()
    optimizer = torch.optim.SGD(net.parameters(), lr=0.5)

    # 训练
    num_epochs = 5      # 训练轮数
    batch_size = 256    # batch容量

    train(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, optimizer)

你可能感兴趣的:(#,实践,#,监督学习,#,PyTorch,深度学习,神经网络,多层感知机,动手学深度学习)

【Python Qt 基本概念】深入探讨 PySide6 与 PyQt6：选择、共存与最佳实践泡沫o0 Qt应用开发 -探索Qt的魅力与实践 Python 基础教程 mfc c++qt 开发语言 python 嵌入式 linux
目录标题第一章:Python绑定的Qt库——PySide6与PyQt6的比较1.1PySide6与PyQt6的基本介绍1.1.1PySide6：Qt官方推荐的Python绑定1.1.2PyQt6：成熟的第三方Python绑定1.1.3主要差异：许可证1.2两者的相似性与差异性1.2.1功能和性能差异1.2.2API差异与兼容性1.3总结：选择的自由与责任第二章:在VSCode中使用PySide6与
conda：一个当下最流行的Python虚拟环境工具 Wang_AI
点击上方“AI派”，选择“设为星标”最新分享，第一时间送达！作者：LeonWang，现为中科院特别研究助理(博士后)，在AI、数据科学和科学计算等方面相关的工程实践上积累了丰富的经验。编辑：王老湿前面的文章中，为大家介绍过Python下的虚拟环境和包管理。在实际中，更为流行的是用Conda来管理Python环境。今天这篇文章就为大家介绍这方面的相关内容。Conda环境Conda简介Conda是目前
Linux部署模型报错OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_mod dkgee linux pytorch 运维
报错内容：OSError:Errornofilenamedpytorch_model.bin,tf_model.h5,model.ckpt.indexorflax_model.msgpackfoundindirectory主要原因是transformer版本不对，需要升级pipinstall--upgradehuggingface_hubpipinstalltransformers[torch]其
Vue 中的日期格式化实践：从原生 Date 到可视化展示！！！小丁学Java 产品资质管理系统 vue.js 前端 javascript ts
Vue中的日期格式化实践：从原生Date到可视化展示在数据可视化场景中，日期时间的格式化显示是一个高频需求。本文将以一个邀请码关系树组件为例，深入解析Vue中日期格式化的核心方法、性能优化和最佳实践，并配合Mermaid流程图直观展示处理流程！一、️核心方法：原生Date对象处理代码实现privateformatDate(dateString:string|null):string{if(!dat
【机器学习】机器学习四大分类藓类少女机器学习机器学习分类人工智能
机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。学习目标是找到一个映射(f(X)\approxY)。适用于分类和回归问题。主要算法：分类（Classification）：逻辑回归（LogisticRegression）支持向量机（SVM）朴素贝叶斯（NaïveBa
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
HarmonyOS Next 应用性能优化实战 SameX-4869 harmonyos 性能优化华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中应用性能优化的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、性能评估指标与工具（一）关键性能评估指标CPU使用率CPU使用率是衡量应用在运行过程中对CPU资源占用情况的重要指标。一个高效的Ha
HarmonyOS Next 企业级移动办公应用构建 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）在企业级移动办公应用构建中的应用，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。第一章：应用场景与架构规划一、常见应用场景及要求任务管理在企业办公中，任务管理是核心场景之一。员工需要能够创建任务，详细描述任务
Github上神仙级大模型项目：大语言模型(LLM)入门学习路线图，三个月让你从大模型基础到精通！ AI大模型-大飞 github 语言模型学习人工智能 AI大模型程序员 AI
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
第十六章:Specialization and Overloading_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
SpecializationandOverloading一、模板特化与重载的核心概念二、代码实战与测试用例三、关键知识点总结四、进阶技巧五、实践建议多选题设计题代码测试说明一、模板特化与重载的核心概念函数模板重载(FunctionTemplateOverloading)//基础模板templateTmax(Ta,Tb){returna>b?a:b;}//显式特化(FullSpecializatio
鸿蒙NEXT开发【崩溃监测实践】开发运维沙人防火历飞雨开发日常 harmonyos 运维华为鸿蒙鸿蒙系统性能优化
概述崩溃（Crash）指的是应用程序在运行过程中突然停止运行或出现错误导致程序无法正常继续执行。崩溃率作为衡量应用质量的重要指标之一，监测崩溃点，解决崩溃问题，对维护应用的稳定性有着诸多方面的意义：用户体验：崩溃会直接影响用户体验，操作程序时突然Crash，可能导致用户不再打开应用、卸载应用。用户留存率：在同质化的市场竞争中，稳定的应用程序能够吸引用户并提高用户留存率，而崩溃率低就意味着应用的稳定
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
算力网协同创新与多场景应用实践智能计算研究中心其他
内容概要算力网协同创新正通过技术融合与场景适配，驱动算力资源的高效整合与跨域调度。核心突破方向涵盖异构计算架构优化、边缘计算实时响应能力提升，以及智能算力在工业互联网、数字孪生等场景的动态供给。随着“东数西算”工程推进，算力网络需兼顾性能与可持续性，在芯片制程优化、模型压缩算法及能耗管理等领域形成技术闭环。技术方向应用场景关键指标异构计算架构工业检测任务延迟<10ms模型压缩算法医疗影像分析计算资
【第1章＞第6节】CMAC小脑模型神经网络的理论学习与MATLAB仿真 fpga和matlab #第1章·神经网络学习 matlab CMAC 小脑模型神经网络人工智能
目录1.使用软件和版本2.CMAC小脑模型神经网络概述2.1CMAC网络结构2.2CMAC地址映射2.3学习过程3.CMAC网络的MATLAB编程实现4.分辨率，重叠度，学习率对CMAC网络的训练性能影响分析4.1分辨率4.2重叠度4.3学习率5.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》《★教程2:fpga入门100例》《★教程
JavaScript反爬技术解析与应对不做超级小白 web逆向知识碎片 web前端 javascript 开发语言 ecmascript
JavaScript反爬技术解析与应对前言在当今Web爬虫与数据抓取的生态环境中，网站运营方日益关注数据安全与隐私保护，因此逐步采用多种反爬技术来限制非授权访问。本文从JavaScript角度出发，深入剖析主流反爬策略的技术原理，并探讨相应的绕过方案，以期为研究者和开发者提供系统性的理解与实践指导。1.JavaScript反爬技术概述1.1右键禁用与开发者工具防护部分网站采用JavaScript拦
[代码规范]1_良好的命名规范能减轻工作负担啾啾大学习编程通用代码规范 Java命名规范命名规范长命名方案
欢迎来到啾啾的博客，一个致力于构建完善的Java程序员知识体系的博客，记录学习的点滴，分享工作的思考、实用的技巧，偶尔分享一些杂谈。欢迎评论交流，感谢您的阅读。目录引言命名——提炼含义减少注释类名命名接口与实现类的命名方法命名的最佳实践1.方法名的结构2.参数与返回值的隐含3.避免缩写4.逻辑与副作用的体现5.条件判断方法长命名处理——实战答疑处理方法1.利用上下文环境简化名称2.使用领域术语或缩
基于roop/insightface将视频中包含指定人脸的视频片段提取并合并成新视频阆遤 python roop pytorch insightface
利用insightface.app.FaceAnalysis提最一个视频中包含指定人脸的视频片段，并将其合并成一个新视频，使用“buffalo_l”模型，模型需安装在代码当前目录下的.\models中。需要roop或其他支持pytorch、insightface、moviepy的环境。pytorch安装请见我其他文章。#cython:language_level=3str#-*-coding:ut
关于pytorch3d的安装诚威_lol_中大努力中人工智能 pytorch 人工智能 python
更新1：2025_2_04今天发现，原来的pytorch3d不见了，在我的aaa1环境中。重新安装，我发现最好用的还是去github下载最新的pytorch3d的zip，unzip之后，进去pipinstall-e.然后安装成功！1、参考文章1：windows安装PyTorch3D详细指南-哔哩哔哩(bilibili.com)这篇文章巨好2、参考文章2：pytorch3d/INSTALL.mdat
Java基础7（解耦、引入工厂模式、代理设计模式、适配器设计模式、内部类）孤影恋长风 java
类设计的注意事项：类的设计主要是父类的设计子类最好不要继承一个已经完全实现的类，因为一旦发达向上转型，所调用的方法，一定是被子类覆盖过的方法，所以只会继承抽象类和接口。解耦耦合度是什么？两个对象之间相互依赖的程度，是衡量代码独立性的一个指标。软件开发追求高/低耦合度？软件开发追求低耦合度怎么才能降低代码的耦合度？降低代码的耦合度是一个非常重要的实践，它有助于提高代码的可维护性、可读性和可扩展性。引
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
华山论剑，大模型(deepseek qwq gemini)辩论人生意义 Lifeng66666666 语言模型语言模型人工智能
借助DeepDiscussion程序，通过让大模型(deepseekqwqgemini)讨论“人生意义是什么”这一挑战问题，我们得以客观观察目前这几种大模型的价值观，能力，不足。部分讨论过程：问题:人生的意义是什么？deepseek/deepseek-r1:free初始方案:针对“人生的意义是什么”这一终极问题，我的解决方案分为以下五个层次，融合东西方哲学智慧与实践心理学，并提供具体行动方向：一、
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
【零基础入门】一篇弄懂nn.Sequential以及ModuleList的使用（呕心沥血版）十二月的猫 PyTorch深度学习 pytorch 零基础入门
个人主页：十二月的猫-CSDN博客系列专栏：《PyTorch科研加速指南：即插即用式模块开发》CSDN博客十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光目录1.前言2.Sequential类的使用2.1序列容器简单注入2.2序列容器字典注入2.3序列容器函数注入2.4序列容器修改2.5序列容器删除3.nn.ModuleList()的使用3.1定义模型3.2使用模型4.总结1.前言《
HTML语言的贪心算法宇瞳月包罗万象 golang 开发语言后端
HTML语言的贪心算法：理论与实践引言在编程和算法研究中，贪心算法是一种广泛应用的解决问题的方法。它通过对每一阶段选择最优解的方式来构建整个问题的解决方案。贪心算法不一定能在所有情况下得到最优解，但在许多实际问题中，它能够提供一个足够好的近似解。本文将探讨贪心算法的基本概念、典型应用、优缺点，并结合HTML语言的特点，提出一些具体的实现示例和思考。一、贪心算法的基本概念贪心算法是一种求解最优化问题
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
Java中卫语句的设计思想而为. java 服务器开发语言
卫语句（GuardClauses）是一种通过提前返回简化条件嵌套、提升代码可读性的编程技巧。其核心思想是优先处理异常或边界情况，让主逻辑保持扁平化。以下是deepseek做出的设计思想详解：核心设计原则FailFast（快速失败）在函数入口处立即检查非法参数或无效状态，若不符合条件则提前终止（如返回、抛异常），避免后续无效操作。减少嵌套层级用卫语句替换多层if-else嵌套，将代码从“箭头型”结构
奇迹科技：蓝牙网关赋能少儿篮球教育的创新融合案例研究 Ms_lan 蓝牙网关北京桂花网智慧体育
一、引言本文研究了福建奇迹运动体育科技有限公司（简称‘奇迹科技’）如何利用其创新产品体系和桂花网蓝牙网关M1500，与少儿篮球教育实现深度融合。重点分析其在提升教学效果、保障训练安全、优化个性化教学等方面的实践与成效，为教育机构和从业者提供参考。二、企业背景奇迹科技由国资上市企业浙数集团与福建省互联网十强企业来玩互娱联合注资成立，专注于数字化体育产业，业务包括数字体育科技研发、打造并运营少儿科技篮
生成对抗网络（GAN）的高级变体及在图像生成领域的创新实践算法探索者生成对抗网络计算机视觉人工智能
摘要生成对抗网络（GAN）自提出以来，在诸多领域取得了显著进展，尤其是在图像生成方面展现出强大的潜力。本文深入探讨了GAN的多种高级变体，如CycleGAN、StyleGAN等，详细分析它们在结构设计、训练机制上的创新之处，阐述其在生成高分辨率、多样化图像时具备的独特优势，并结合丰富的实际案例，展示这些变体在图像生成领域的卓越应用成果，为相关研究与应用提供全面且深入的参考。一、引言生成对抗网络（G
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比