夜未央`樱花落

3.5 softmax回归的从零开始实现

通过框架中的内置函数将Fashion-MNIST数据集下载并读取到内存中。通过代码从零实现softmax回归。

参考资料：李沐《动手学深度学习-Pytorch版》ch3 线性神经网络
开源地址：动手学深度学习
链接至上一节：3.4 softmax回归
此篇仅仅学习记录，更详细的内容可参考开源的书和代码以及b站上李沐老师的视频动手学深度学习在线课程。

文章目录

1. 图像分类数据集-Fashion-MNIST数据集
- 1.0 导入Python包
- 1.1 读取数据集
- 1.2 读取小批量
- 1.3 整合所有组件
2. softmax回归的从零开始实现
- 2.1 初始化模型参数
- 2.2 定义softmax操作
- 2.3 定义模型
- 2.4 定义损失函数
- 2.5 分类精度
- 2.6 训练
- 2.7 预测
3.引用
4. softmax回归的简洁实现

1. 图像分类数据集-Fashion-MNIST数据集

1.0 导入Python包

%matplotlib inline
import torch
import torchvision
from torch.utils import data
from torchvision import transforms
from d2l import torch as d2l
from IPython import display
import torchvision.transforms as transforms
from torch import nn

d2l.use_svg_display()

1.1 读取数据集

MNIST数据集 :cite:LeCun.Bottou.Bengio.ea.1998 是图像分类中广泛使用的数据集之一，但作为基准数据集过于简单。将使用类似但更复杂的Fashion-MNIST数据集 :cite:Xiao.Rasul.Vollgraf.2017。

通过框架中的内置函数将Fashion-MNIST数据集下载并读取到内存中。

# 通过ToTensor实例将图像数据从PIL类型变换成32位浮点数形式
# 并除以255使得所有像素的数值均为0-1
trans = transforms.ToTensor()
# 通过框架中的内置函数将Fashion-MNIST数据集下载并读取到内存中。
mnist_train = torchvision.datasets.FashionMNIST(root="C:\\Users\\HP\\Desktop\\data1", train=True, transform=trans, download=True)
mnist_test = torchvision.datasets.FashionMNIST(root="C:\\Users\\HP\\Desktop\\data2", train=False, transform=trans, download=True)

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz to C:\Users\HP\Desktop\data1\FashionMNIST\raw\train-images-idx3-ubyte.gz
100%|█████████████████████████████████████████████████████████████████| 26421880/26421880 [00:07<00:00, 3750721.85it/s]
Extracting C:\Users\HP\Desktop\data1\FashionMNIST\raw\train-images-idx3-ubyte.gz to C:\Users\HP\Desktop\data1\FashionMNIST\raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz to C:\Users\HP\Desktop\data1\FashionMNIST\raw\train-labels-idx1-ubyte.gz
100%|████████████████████████████████████████████████████████████████████████| 29515/29515 [00:00<00:00, 125064.16it/s]
Extracting C:\Users\HP\Desktop\data1\FashionMNIST\raw\train-labels-idx1-ubyte.gz to C:\Users\HP\Desktop\data1\FashionMNIST\raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz to C:\Users\HP\Desktop\data1\FashionMNIST\raw\t10k-images-idx3-ubyte.gz
100%|███████████████████████████████████████████████████████████████████| 4422102/4422102 [00:02<00:00, 1899527.32it/s]
Extracting C:\Users\HP\Desktop\data1\FashionMNIST\raw\t10k-images-idx3-ubyte.gz to C:\Users\HP\Desktop\data1\FashionMNIST\raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz to C:\Users\HP\Desktop\data1\FashionMNIST\raw\t10k-labels-idx1-ubyte.gz
100%|██████████████████████████████████████████████████████████████████████████████████████| 5148/5148 [00:00

 
  Fashion-MNIST数据集由10个类别的图像组成，每个类别由训练数据集（train dataset）中的6000张图像和测试数据集（test dataset）中的1000张图像组成。因此，训练集和测试集分别包含60000和10000张图像。测试数据集不会用于训练，只用于评估模型性能。 
  每个输入图像的高度和宽度均为28像素。数据集由灰度图像组成，其通道数为1。 
  len(mnist_train), len(mnist_test)
 
  (60000, 10000)
 
  每个输入图像的高度和宽度均为28像素。数据集由灰度图像组成，其通道数为1。
 为了简洁起见，将高度 $h$ 像素、宽度 $w$ 像素图像的形状记为 $\times w$ 或（ $h$ , $w$ ）。 
  mnist_train[0][0].shape
 
  torch.Size([1, 28, 28])
 
  Fashion-MNIST中包含的10个类别，分别为t-shirt（T恤）、trouser（裤子）、pullover（套衫）、dress（连衣裙）、coat（外套）、sandal（凉鞋）、shirt（衬衫）、sneaker（运动鞋）、bag（包）和ankle boot（短靴）。 
  get_fashion_mnist_labels函数用于在数字标签索引及其文本名称之间进行转换。 
  # 定义函数get_fashion_mnist_labels用于在数字标签索引及其文本名称之间进行转换。
# 函数输入参数labels是一个整数列表，每个整数表示一个数据样本的标签。函数将每个标签转换为相应的文本标签，并返回一个文本标签列表。
def get_fashion_mnist_labels(labels):
    """返回Fashion-MNIST数据集的文本标签"""
    text_labels = ['t-shirt', 'trouser', 'pullover', 'dress', 'coat',
                  'sandal', 'shirt', 'sneaker', 'bag', 'ankle boot']
    # 函数使用int(i)将输入标签列表中的每个标签转换为整数，并使用这个整数从text_labels列表中获取相应的文本标签。
    # 最后，函数返回一个文本标签列表。
    return [text_labels[int(i)] for i in labels]
 
  show_images函数用于可视化样本。 
  # 创建函数show_images来可视化样本
# 输入参数：
# imgs：一个包含多个图像的列表。每个图像可以是一个PIL图像对象或一个PyTorch张量。
# num_rows和num_cols：要在子图中显示的行数和列数。
# titles（可选）：一个包含每个图像标题的列表。该列表应该和imgs列表具有相同的长度。如果未指定，则不显示标题。
# scale（可选）：每个子图的缩放比例。默认值为1.5。
def show_images(imgs, num_rows, num_cols, titles=None, scale=1.5):
    """绘制图像列表"""
    # 首先计算了子图的总数，并根据num_rows和num_cols参数创建了一个子图网格。
    figsize = (num_cols * scale, num_rows * scale)
    # 使用了Matplotlib库的subplots()函数来创建一个包含多个子图的网格。
    # 使用了d2l.plt模块中的subplots()函数来创建一个num_rows行、num_cols列的网格，每个子图的大小为figsize指定的大小。
    # _表示我们对该函数的返回值不感兴趣，而axes变量是返回的子图对象的数组。
    _, axes = d2l.plt.subplots(num_rows, num_cols, figsize=figsize)
    # 在Matplotlib中，subplots()函数返回的对象是一个二维数组，其中每个元素都是一个子图对象。
    # 使用flatten()方法，它将一个多维数组展平为一个一维数组。
    axes = axes.flatten()
    # 使用zip()函数将每个图像和相应的子图对象配对，并使用enumerate()函数获取每个子图的索引。
    for i,(ax, img) in enumerate(zip(axes, imgs)):
        
        # 对于每个子图，函数首先检查图像是否是一个PyTorch张量，
        # 并使用img.numpy()将其转换为一个NumPy数组，然后使用ax.imshow()方法将图像绘制到子图中。
        if torch.is_tensor(img):
            # 图像张量
            ax.imshow(img.numpy())
        else:
            # PIL图像
            ax.imshow(img)
        # 函数隐藏了子图的x轴和y轴标签
        ax.axes.get_xaxis().set_visible(False)
        ax.axes.get_yaxis().set_visible(False)
        # 设置了子图的标题
        if titles:
            ax.set_title(titles[i])
    # 函数返回一个包含所有子图对象的列表 
    return axes
 
  X,  y = next(iter(data.DataLoader(mnist_train, batch_size=18)))
show_images(X.reshape(18, 28, 28), 2, 9, titles=get_fashion_mnist_labels(y))
 
  array([,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ,
       ], dtype=object)
 
   
  1.2 读取小批量 
  为了读取训练集和测试集时更容易，使用内置的数据迭代器，而不是从零开始创建。在每次迭代中，数据加载器每次都会读取一小批量数据，大小batch_size。通过内置数据迭代器，可以随机打乱了所有样本，从而无偏见地读取小批量。 
  batch_size = 256

def get_dataloader_workers():
    """使用4个进程来读取数据"""
    return 4

# 使用PyTorch的DataLoader类来创建一个数据迭代器train_iter，该迭代器可以用于遍历MNIST训练集中的所有图像和标签。
# DataLoader类的输入参数包括要加载的数据集、批大小、是否对数据进行洗牌、以及可选的数据加载器工作进程数量等。
train_iter = data.DataLoader(mnist_train, batch_size, shuffle=True,
                            num_workers=get_dataloader_workers())
 
  查看读取训练数据所需的时间。 
  timer = d2l.Timer()
for X, y in train_iter:
    continue

f'{timer.stop():.2f} sec'
 
  '14.26 sec'
 
  1.3 整合所有组件 
  现在定义load_data_fashion_mnist函数，用于获取和读取Fashion-MNIST数据集。这个函数返回训练集和验证集的数据迭代器。此外，这个函数还接受一个可选参数resize，用来将图像大小调整为另一种形状。 
  def load_data_fashion_mnist(batch_size, resize=None):  #@save
    """下载Fashion-MNIST数据集，然后将其加载到内存中"""
    trans = [transforms.ToTensor()]
    
    # 首先检查resize参数是否为真。
    # 如果是，则将一个Resize预处理操作插入到预处理操作列表中。Resize操作用于将图像缩放到指定大小。
    # 接下来，我们使用transforms.Compose函数将所有预处理操作组合成一个transforms.Compose对象。
    # Compose对象可以将多个预处理操作串联起来，并将它们应用于输入数据。
    if resize:
        trans.insert(0, transforms.Resize(resize))
    trans = transforms.Compose(trans)
    
    
    mnist_train = torchvision.datasets.FashionMNIST(
        root="C:\\Users\\HP\\Desktop\\data1", train=True, transform=trans, download=True)
    mnist_test = torchvision.datasets.FashionMNIST(
        root="C:\\Users\\HP\\Desktop\\data2", train=False, transform=trans, download=True)
    return (data.DataLoader(mnist_train, batch_size, shuffle=True,
                            num_workers=get_dataloader_workers()),
            data.DataLoader(mnist_test, batch_size, shuffle=False,
                            num_workers=get_dataloader_workers()))
 
  下面，通过指定resize参数来测试load_data_fashion_mnist函数的图像大小调整功能。 
  train_iter, test_iter = load_data_fashion_mnist(32, resize=64)
for X, y in train_iter:
    print(X.shape, X.dtype, y.shape, y.dtype)
    break
 
  torch.Size([32, 1, 64, 64]) torch.float32 torch.Size([32]) torch.int64
 
  2. softmax回归的从零开始实现 
  使用Fashion-MNIST数据集，并设置数据迭代器的批量大小为256。 
  batch_size = 256
train_iter, test_iter = load_data_fashion_mnist(batch_size)
 
  2.1 初始化模型参数 
  同线性回归一样，这里的每个样本都将用固定长度的向量表示。原始数据集中的每个样本都是 $28 \times 28$ 的图像。将展平每个图像，把它们看作长度为784的向量。 
  在softmax回归中，输出与类别一样多。因为数据集有10个类别，所以网络输出维度为10。因此，权重将构成一个 $784 \times 10$ 的矩阵，偏置将构成一个 $\times 10$ 的行向量。将使用正态分布初始化我们的权重W，偏置初始化为0。 
  num_inputs =784
num_outputs = 10
W = torch.normal(0, 0.01, size=(num_inputs, num_outputs), requires_grad=True)
b = torch.zeros(num_outputs, requires_grad=True)
 
  2.2 定义softmax操作 
  实现softmax由三个步骤组成： 
   
   对每个项求幂（使用exp）； 
   对每一行求和（小批量中每个样本是一行），得到每个样本的规范化常数； 
   将每一行除以其规范化常数，确保结果的和为1。 
   
   $\mathrm{softmax}(\mathbf{X})_{ij} = \frac{\exp(\mathbf{X}_{ij})}{\sum_k \exp(\mathbf{X}_{ik})}.$  
  def softmax(X):
    X_exp = torch.exp(X)
    # 给定一个矩阵`X`，可以对所有元素求和（默认情况下）。也可以只求同一个轴上的元素，即同一列（轴0）或同一行（轴1）。
    # 当调用`sum`运算符时，可以指定保持在原始张量的轴数，而不折叠求和的维度。
    partition = X_exp.sum(1, keepdim=True)
    return X_exp / partition # 这里应用了广播机制
 
  通过softmax函数，对于任何随机输入，可以将每个元素变成一个非负数。此外，依据概率原理，每行总和为1。 
  X = torch.normal(0, 1, (2, 5))
X_prob = softmax(X)
X_prob, X_prob.sum(1)
 
  (tensor([[0.0502, 0.3213, 0.2161, 0.1118, 0.3005],
         [0.0515, 0.6224, 0.0304, 0.1231, 0.1726]]),
 tensor([1., 1.]))
 
  2.3 定义模型 
  定义softmax操作后，可以实现softmax回归模型。下面的代码定义了输入如何通过网络映射到输出。将数据传递到模型之前，使用reshape函数将每张原始图像展平为向量。 
  # 定义了一个简单的全连接神经网络，用于对MNIST图像进行分类。
# 该网络使用了一个权重矩阵W和一个偏置向量b，其中W的形状为784x10，b的形状为(1, 10)。
# 这意味着W包含了784个输入特征和10个输出特征，b包含了10个偏置项，每个输出特征对应一个偏置项。

def net(X):
    # 首先使用reshape()函数将输入张量变形为形状为(batch_size, 784)的二维张量，以便我们可以将其与权重矩阵相乘。
    # matmul()函数用于计算矩阵乘积，它将输入张量与权重矩阵相乘，并将偏置向量加到结果中。
    # 最后，softmax()函数用于计算每个输出特征的概率分布，它将网络输出的每个元素转换为一个非负数，并将它们归一化为和为1的概率分布。
    return softmax(torch.matmul(X.reshape((-1, W.shape[0])), W) + b)
 
  2.4 定义损失函数 
  使用交叉熵损失函数。交叉熵采用真实标签的预测概率的负对数似然。
  $l(\mathbf{y}, \hat{\mathbf{y}}) = - \sum_{j=1}^q y_j \log \hat{y}_j.$ 
 这里不使用Python的for循环迭代预测（这往往是低效的），而是通过一个运算符选择所有元素。创建一个数据样本y_hat，其中包含2个样本在3个类别的预测概率，以及它们对应的标签y。
 有了y，在第一个样本中，第一类是正确的预测；而在第二个样本中，第三类是正确的预测。然后使用y作为y_hat中概率的索引，选择第一个样本中第一个类的概率和第二个样本中第三个类的概率。 
  y = torch.tensor([0, 2])
print(y)
y_hat = torch.tensor([[0.1, 0.3, 0.6], [0.3, 0.2, 0.5]])
y_hat[[0, 1], y]
 
  tensor([0, 2])
tensor([0.1000, 0.5000])
 
  定义交叉熵损失函数cross_entropy 
  def cross_entropy(y_hat, y):
    # range(len(y_hat))生成一个包含从0到len(y_hat)-1的整数序列的张量，该序列用于选择每个批次中正确的预测概率
    # y_hat[range(len(y_hat)), y]使用y张量中的每个标签作为索引来选择y_hat张量中对应的预测概率。
    return -torch.log(y_hat[range(len(y_hat)), y])

cross_entropy(y_hat, y)
 
  tensor([2.3026, 0.6931])
 
  2.5 分类精度 
  给定预测概率分布y_hat，当必须输出硬预测（hard prediction）时，通常选择预测概率最高的类。当预测与标签分类y一致时，即是正确的。分类精度即正确预测数量与总预测数量之比。 虽然直接优化精度可能很困难（因为精度的计算不可导），但精度通常是我们最关心的性能衡量标准，在训练分类器时几乎总会关注它。 
  为了计算精度，执行以下操作。首先，如果y_hat是矩阵，那么假定第二个维度存储每个类的预测分数。使用argmax获得每行中最大元素的索引来获得预测类别。然后将预测类别与真实y元素进行比较。由于等式运算符“==”对数据类型很敏感，因此将y_hat的数据类型转换为与y的数据类型一致。结果是一个包含0（错）和1（对）的张量。最后，求和会得到正确预测的数量。 
  def accuracy(y_hat, y):
    """计算预测正确的数量"""
    # 首先，如果`y_hat`是矩阵，那么假定第二个维度存储每个类的预测分数
    if len(y_hat.shape)>1 and y_hat.shape[1] > 1:
        # 使用argmax获得每行中最大元素的索引来获得预测类别
        y_hat = y_hat.argmax(axis=1)
    # 将预测类别与真实y元素进行比较。由于等式运算符“==”对数据类型很敏感，因此将y_hat的数据类型转换为与y的数据类型一致
    # 结果是一个包含0（错）和1（对）的张量
    cmp = y_hat.type(y.dtype) == y
    # 求和得到正确预测的数量
    return float(cmp.type(y.dtype).sum())
 
  继续使用之前定义的变量y_hat和y分别作为预测的概率分布和标签。可以看到，第一个样本的预测类别是2（该行的最大元素为0.6，索引为2），这与实际标签0不一致。第二个样本的预测类别是2（该行的最大元素为0.5，索引为2），这与实际标签2一致。因此，这两个样本的分类精度率为0.5。 
  accuracy(y_hat, y) / len(y)
 
  0.5
 
  同样，对于任意数据迭代器data_iter可访问的数据集，可以评估在任意模型net的精度。 
  # 定义了一个函数evaluate_accuracy，用于计算模型在指定数据集上的准确率
# 输入参数包括模型net和数据集data_iter
def evaluate_accuracy(net, data_iter):  
    """计算在指定数据集上模型的精度"""
    # 如果模型是一个PyTorch的nn.Module对象，则通过调用net.eval()方法将模型设置为评估模式。
    # 这会禁用Dropout和Batch Normalization等训练时使用的技巧，以确保模型在评估时的输出结果是确定性的。
    if isinstance(net, torch.nn.Module):
        net.eval()  # 将模型设置为评估模式
    # 创建一个名为metric的累加器，该累加器有两个条目，用于跟踪正确的预测数和预测总数。这个累加器是自定义的Accumulator类的实例。
    metric = Accumulator(2)  # 正确预测数、预测总数
    
    # 使用PyTorch的torch.no_grad()上下文管理器，禁用梯度计算，以加快计算速度。
    with torch.no_grad():
        
        # 遍历数据集中的所有数据，对于每个数据样本，计算模型的输出，并计算预测标签的准确率。
        # 将正确预测的数量和总预测数量添加到metric累加器中。
        for X, y in data_iter:
            metric.add(accuracy(net(X), y), y.numel())
    
    # 最后，返回正确预测的数量除以总预测数量的比例，这就是模型在指定数据集上的准确率。
    return metric[0] / metric[1]

 
  定义一个实用程序类Accumulator，用于对多个变量进行累加。在上面evaluate_accuracy函数中，在 Accumulator实例中创建了2个变量，分别用于存储正确预测的数量和预测的总数量。当遍历数据集时，两者都将随着时间的推移而累加。 
  # 该实例对于求和数据集中所有样本的某个指标的值非常有用，如准确率、损失等。
# 在每次遍历数据集时，可以使用Accumulator类的实例进行累加，并在遍历完所有样本后，将结果除以数据集中的总样本数得到指标的平均值。

class Accumulator: 
    """在n个变量上累加"""
    
    # _init__方法接受一个整数n作为输入，创建一个长度为n的列表self.data，并将其中所有的元素初始化为0.0
    def __init__(self, n):
        self.data = [0.0] * n
        
    # add方法使用Python的可变参数列表*args接受任意数量的参数。这些参数可以是整数、浮点数或其他可转换为浮点数的类型
    # zip(self.data, args)将self.data和args中相同索引的元素打包成一个元组，返回一个迭代器。
    # for a, b in zip(self.data, args)循环遍历self.data和args中相同索引的元素，分别赋值给变量a和b。
    # a + float(b)将a和b转换为浮点数后相加，返回一个浮点数。
    # [a + float(b) for a, b in zip(self.data, args)]将所有相加后的浮点数放入一个列表中。   
    def add(self, *args):
        self.data = [a + float(b) for a, b in zip(self.data, args)]
    
    # reset方法将self.data中的所有元素重置为0.0
    def reset(self):
        self.data = [0.0] * len(self.data)
        
    # __getitem__方法接受一个整数idx作为输入，并返回self.data中索引为idx的元素
    def __getitem__(self, idx):
        return self.data[idx]
 
  由于使用随机权重初始化net模型，因此该模型的精度应接近于随机猜测。例如在有10个类别情况下的精度为0.1。 
  evaluate_accuracy(net, test_iter)
 
  0.0961
 
  2.6 训练 
  首先，定义一个函数来训练一个迭代周期。这里的updater是更新模型参数的常用函数，它接受批量大小作为参数。它可以是d2l.sgd函数，也可以是框架的内置优化函数。 
  def train_epoch_ch3(net, train_iter, loss, updater): 
    # 函数的输入参数包括模型net、训练数据集train_iter、损失函数loss和更新器updater
    """训练模型一个迭代周期"""
    
    # 如果模型是一个PyTorch的nn.Module对象，则通过调用net.train()方法将模型设置为训练模式
    # 这会启用Dropout和Batch Normalization等训练时使用的技巧
    # 将模型设置为训练模式
    if isinstance(net, torch.nn.Module):
        net.train()
        # 创建一个名为metric的累加器，该累加器有三个条目，用于跟踪训练损失总和、训练准确度总和和样本数
    
    # 训练损失总和、训练准确度总和、样本数
    metric = Accumulator(3)
    # 遍历数据集中的所有数据，对于每个数据样本，计算模型的输出，并计算训练损失和训练准确度
    # 将训练损失、训练准确度和样本数量添加到metric累加器中。
    for X, y in train_iter:
        # 计算梯度并更新参数
        y_hat = net(X)
        l = loss(y_hat, y)
        # 如果更新器是一个PyTorch的torch.optim.Optimizer对象，则使用PyTorch的优化器和损失函数来计算梯度并更新参数
        if isinstance(updater, torch.optim.Optimizer):
            # 使用PyTorch内置的优化器和损失函数
            updater.zero_grad()  # 调用updater.zero_grad()方法将梯度清零
            l.mean().backward()  # 调用l.mean().backward()方法计算损失对参数的梯度
            updater.step()  # 调用updater.step()方法使用梯度更新参数
        # 如果更新器不是PyTorch的优化器对象，则使用定制的优化器和损失函数来计算梯度并更新参数
        else:
            # 使用定制的优化器和损失函数
            l.sum().backward()  # 调用l.sum().backward()方法计算损失对参数的梯度
            updater(X.shape[0])  # 调用updater(X.shape[0])方法使用梯度更新参数
        metric.add(float(l.sum()), accuracy(y_hat, y), y.numel())
    # 返回训练损失和训练精度
    return metric[0] / metric[2], metric[1] / metric[2]
 
  在展示训练函数的实现之前，定义一个在动画中绘制数据的实用程序类Animator， 
  class Animator:
    """在动画中绘制数据"""
    
    # __init__方法接受多个可选参数，包括x轴标签、y轴标签、图例、x轴范围、y轴范围、x轴刻度、y轴刻度、线条样式、子图行数和列数、以及图像大小
    def __init__(self, xlabel=None, ylabel=None, legend=None, xlim=None,
                 ylim=None, xscale='linear', yscale='linear',
                 fmts=('-', 'm--', 'g-.', 'r:'), nrows=1, ncols=1,
                 figsize=(3.5, 2.5)):
        # 增量地绘制多条线
        if legend is None:  # 如果未指定图例，则默认为空列表。
            legend = []
        d2l.use_svg_display()   # 调用d2l.use_svg_display()方法将绘图设为SVG格式
        self.fig, self.axes = d2l.plt.subplots(nrows, ncols, figsize=figsize)   # 调用d2l.plt.subplots()方法创建一个子图
        
        # 如果子图的行列数为1，则将self.axes转换为一个长度为1的列表
        if nrows * ncols == 1:
            self.axes = [self.axes, ]
        
        # 使用lambda函数捕获参数
        # self.config_axes是一个函数，用于配置子图的属性，包括x轴标签、y轴标签、x轴范围、y轴范围、x轴刻度、y轴刻度和图例
        self.config_axes = lambda: d2l.set_axes(
            self.axes[0], xlabel, ylabel, xlim, ylim, xscale, yscale, legend)
        
        # self.X和self.Y分别是x轴和y轴的数据列表，初始值为None
        # self.fmts是一个包含多个字符串的元组，用于指定绘制线条的样式
        self.X, self.Y, self.fmts = None, None, fmts
    
    # add方法接受两个参数x和y，分别表示x轴和y轴的数据
    def add(self, x, y):
        # 向图表中添加多个数据点
        
        # 如果y不是一个列表，则将其转换为一个仅包含一个元素的列表
        if not hasattr(y, "__len__"):
            y = [y]
        n = len(y)
        # 如果x不是一个列表，则将其复制n次，其中n是y的长度
        if not hasattr(x, "__len__"):
            x = [x] * n
        # 如果self.X为None，则将其初始化为一个包含n个空列表的列表
        if not self.X:
            self.X = [[] for _ in range(n)]
        # 如果self.Y为None，则将其初始化为一个包含n个空列表的列表
        if not self.Y:
            self.Y = [[] for _ in range(n)]
        # 将每个x和y添加到相应的列表中
        for i, (a, b) in enumerate(zip(x, y)):
            if a is not None and b is not None:
                self.X[i].append(a)
                self.Y[i].append(b)
        # 清除子图
        self.axes[0].cla()
        
        # 使用self.fmts中指定的样式绘制每个列表中的数据
        for x, y, fmt in zip(self.X, self.Y, self.fmts):
            self.axes[0].plot(x, y, fmt)
        
        # 调用self.config_axes()方法配置子图的属性
        self.config_axes()
        
        # 使用display.display()和display.clear_output(wait=True)方法将子图显示在Jupyter Notebook中
        display.display(self.fig)
        display.clear_output(wait=True)
 
  接下来实现一个训练函数，在train_iter访问到的训练数据集上训练一个模型net。该训练函数将会运行多个迭代周期（由num_epochs指定）。在每个迭代周期结束时，利用test_iter访问到的测试数据集对模型进行评估。将利用Animator类来可视化训练进度。 
  # 函数的输入参数包括模型net、训练数据集train_iter、测试数据集test_iter、损失函数loss、训练周期数num_epochs和更新器updater。
def train_ch3(net, train_iter, test_iter, loss, num_epochs, updater): 
    """训练模型"""
    
    # 创建一个Animator类的实例，用于动态可视化训练和测试结果。
    # 设置x轴标签为“epoch”，x轴范围为[1, num_epochs]，y轴范围为[0.3, 0.9]，图例包括“train loss”、“train acc”和“test acc”。
    animator = Animator(xlabel='epoch', xlim=[1, num_epochs], ylim=[0.3, 0.9],
                        legend=['train loss', 'train acc', 'test acc'])
    
    # 在每个epoch中，使用train_epoch_ch3函数训练模型，并记录训练损失和训练准确度。
    # 使用evaluate_accuracy函数评估模型在测试集上的性能。
    # 将训练损失、训练准确度和测试准确度添加到Animator实例中，以动态展示训练和测试结果的变化过程。
    for epoch in range(num_epochs):
        train_metrics = train_epoch_ch3(net, train_iter, loss, updater)
        test_acc = evaluate_accuracy(net, test_iter)
        animator.add(epoch + 1, train_metrics + (test_acc,))
    train_loss, train_acc = train_metrics
    
    # 在训练结束后，检查训练损失和训练准确度是否满足要求
    # (训练损失小于0.5，训练准确度在0.7到1之间)，并检查测试准确度是否满足要求（在0.7到1之间）。
    assert train_loss < 0.5, train_loss
    assert train_acc <= 1 and train_acc > 0.7, train_acc
    assert test_acc <= 1 and test_acc > 0.7, test_acc
 
  # 使用之前定义的小批量随机梯度下降来优化模型的损失函数，设置学习率为0.01
lr = 0.1

def updater(batch_size):
    return d2l.sgd([W, b], lr, batch_size)
 
  训练模型10轮。 轮数（num_epochs）和学习率（lr）都是可调整的超参数，通过更改他们的值，可以提高模型的分类精度。 
  num_epochs = 10
train_ch3(net, train_iter, test_iter, cross_entropy, num_epochs, updater)
 
   
  2.7 预测 
  训练已经完成，模型已经准备好对图像进行分类预测。给定一系列图像，将比较它们的实际标签（文本输出的第一行）和模型预测（文本输出的第二行）。 
  def predict_ch3(net, test_iter, n=6):  #@save
    """预测标签（定义见第3章）"""
    
    # 使用test_iter迭代器获取测试数据集的第一个批次数据，并将其转换为NDArray类型。
    for X, y in test_iter:
        break
    
    # 使用get_fashion_mnist_labels函数获取真实标签trues，并使用模型net对数据进行预测。
    trues = d2l.get_fashion_mnist_labels(y)
    # 将预测结果转换为标签，并使用get_fashion_mnist_labels函数获取预测标签preds。
    preds = d2l.get_fashion_mnist_labels(net(X).argmax(axis=1))
    titles = [true +'\n' + pred for true, pred in zip(trues, preds)]
    d2l.show_images(
        X[0:n].reshape((n, 28, 28)), 1, n, titles=titles[0:n])

predict_ch3(net, test_iter)
 
   
   
  3.引用 
  引用原书: 
  @book{zhang2019dive,
    title={Dive into Deep Learning},
    author={Aston Zhang and Zachary C. Lipton and Mu Li and Alexander J. Smola},
    note={\url{http://www.d2l.ai}},
    year={2020}
}
 
  4. softmax回归的简洁实现 
   
   链接至下一节：3.6 softmax回归的简洁实现

ffmpeg-python安装 neverayever 计算机 ffmpeg python linux
centos-ffmpeg-python安装安装ffmpeg一：下载并解压wgethttp://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gztar-zxvfffmpeg-4.2.tar.gz若linux服务器没网，可以在windows上直接访问http://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gz就可下载，然后上传至服
扫雷游戏升级版含递归链式展开(一次展开一片区域) 代码详细解读 C语言 C r a z y c语言游戏游戏 c语言算法 java 游戏程序 python c++
1、前言：我看了CSDN有很多小伙伴也写了扫雷小游戏但是大部分写的代码都是一次输入坐标只能展开一个位置并没有还原我们小时候最初始的游戏玩法可玩性很低我在这用函数递归链式展开一片还原最初始游戏提高可玩性先放效果图↓2、建议：一个程序代码的实现并不是只靠看能看会的而是要落实到敲代码可以先靠自己画导图根据导图敲出代码敲代码的过程中难免会有些错误解决它这都将成为你宝贵的知识*在看的过程也可以拿出稿纸和笔来
Hadoop之HDFS的使用想要变瘦的小码头 hadoop hdfs 大数据
HDFS是什么：HDFS是一个分布式的文件系统，是个网盘，HDFS是一种适合大文件存储的分布式文件系统HDFS的Shell操作1、查看hdfs根目录下的内容-lshdfsdfs-lshdfs://hadoop01:9000/url在使用时默认是可以省略的，因为hdfs在执行的时候会根据HDOOP_HOME自动识别配置文件中的fs.defaultFS属性可以写成：hdfsdfs-ls/还有一版旧版写
PHP 安全与加密：守护 Web 应用的基石来恩1003 PHP 从入门到精通 php 安全前端
PHP学习资料PHP学习资料PHP学习资料在当今数字化时代，Web应用无处不在，而PHP作为一种广泛使用的服务器端脚本语言，承载着无数网站和应用的核心逻辑。然而，随着网络攻击手段日益复杂，PHP应用面临着诸多安全威胁，如SQL注入、XSS攻击等，同时，数据的加密保护也至关重要。本文将深入探讨PHP中的安全问题及加密算法的应用，帮助开发者构建更安全可靠的Web应用。一、PHP安全之殇——SQL注入攻
Python的那些事第二十七篇：Python中的“数据魔法师”NumPy 暮雨哀尘 Python的那些事 python numpy 开发语言数据分析算法数组索引
摘要在这篇幽默风趣的论文中，我们将深入探讨NumPy——Python中最强大的数值计算库之一。它不仅提供了高性能的多维数组对象，还让复杂的数学运算变得像吃冰淇淋一样简单。本文将通过生动的代码示例和幽默的比喻，带你领略NumPy的魔法世界，让你在欢笑中掌握这个强大的工具。一、引言：为什么NumPy是程序员的“超级英雄”？1.1NumPy的起源：从“数据苦力”到“数据魔法师”想象一下，你被困在一个全是
基于数据挖掘的股票预测系统 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1股票市场预测的挑战股票市场以其波动性和不可预测性而闻名。无数因素，从全球经济趋势到个别公司公告，都会影响股票价格。这使得准确预测股票价格极具挑战性，即使对经验丰富的投资者和金融分析师也是如此。1.2数据挖掘的兴起近年来，数据挖掘技术的出现为股票预测提供了新的可能性。数据挖掘是从大型数据集中提取有意义的模式和洞察力的过程。通过利用先进的算法和计算能力，数据挖掘可以揭示隐藏在海量金融
GPT (Generative Pre-trained Transformer) 彬彬侠自然语言处理 gpt transformer 预训练 NLP 自然语言处理
GPT(GenerativePre-trainedTransformer)是由OpenAI提出的一个基于Transformer架构的自回归语言模型。GPT模型通过大规模无监督预训练，使用大量的文本数据进行学习，然后再进行微调（fine-tuning）来适应具体的下游任务。GPT的设计目标是能够理解和生成自然语言文本，并且它以其出色的自然语言生成能力在多个领域取得了显著的成果。GPT的基本原理GPT
Vision Transformer（ViT）：用 Transformer 颠覆图像识别金外飞176 论文精读 transformer 深度学习人工智能
VisionTransformer（ViT）：用Transformer颠覆图像识别在计算机视觉领域，卷积神经网络（CNN）长期以来一直是图像识别任务的主流架构。然而，近年来，自然语言处理（NLP）领域中大放异彩的Transformer架构也开始在图像识别中崭露头角。今天，我们将深入探讨一种创新的架构——VisionTransformer（ViT），它将Transformer的强大能力直接应用于图像
Java 与设计模式（15）：模板方法模式暗星涌动设计模式 java 设计模式模板方法模式 spring boot
一、定义模板方法模式是一种行为设计模式，它定义了一个操作中的算法的骨架（也就是大致的步骤和流程），而将一些具体步骤的实现延迟到子类中。这样，子类可以不改变算法的结构即可重新定义算法的某些特定步骤。二、Java示例举个简单的例子：假设我们要泡一杯茶和一杯咖啡，这两者的制作过程有一些共同的步骤，比如烧水、倒水、搅拌等，但也有不同的地方，比如茶需要放茶叶，而咖啡需要放咖啡粉。泡茶的过程：烧水、放茶叶、倒
js的垃圾回收机制 www.www JavaScript 相关 javascript 前端开发语言
js中的垃圾回收机制JavaScript作为一种高级语言，开发者不需要手动管理内存的分配和释放。垃圾回收机制是JavaScript引擎中的一部分，负责自动回收那些不再被使用的内存，确保内存资源得到有效利用，避免内存泄漏。垃圾回收机制主要有两种算法：引用计数和标记清除引用计数基本原理：每个对象都有一个引用计数器，当有一个引用指向该对象时，计数器+1，当一个引用不再指向该对象时，计数器-1。如果某个对
Python爬虫TLS dme. Python爬虫零基础入门爬虫 python
TLS指纹校验原理和绕过浏览器可以正常访问，但是用requests发送请求失败。后端是如何监测得呢？为什么浏览器可以返回结果，而requests模块不行呢？https://cn.investing.com/equities/amazon-com-inc-historical-data1.指纹校验案例1.1案例：ascii2dhttps://ascii2d.net/importrequestsres
一文读懂MUSIC算法DOA估计的数学原理并仿真迎风打盹儿阵列信号处理 MUSIC算法 DOA估计阵列信号处理信号子空间噪声子空间
一文读懂MUSIC算法DOA估计的数学原理并仿真文章目录前言一、DOA估计基本原理二、MATLAB仿真总结前言MUSIC（MultipleSignalClassification）算法于1979年由R.O.Schmidt提出，是阵列信号处理中广泛应用的经典DOA（DirectionofArrival）估计算法，凭借其超分辨的估计性能受到广泛关注。本文将从数学公式推导的角度出发系统阐述MUSIC算法
python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解嘻嘻哈哈学编程程序员 python 爬虫 selenium
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！2.2访问页面2.3查找元素2.3.1单个元素下面
排序算法：冒泡排序（Python）娱乐不打烊丶排序算法算法数据结构
思路：大家一定都喝过汽水吧，汽水中常常有许多小小的气泡，往上飘，这是因为组成小气泡的二氧化碳比水要轻，所以小气泡才会一点一点的向上浮。而冒泡排序之所以叫冒泡排序，正是因为这种排序算法的每一个元素都可以向小气泡一样，根据自身大小，一点一点向着数组的一侧移动。一图解百惑，上图！那么，话不多说，上代码！defbubble_sort(input_list):#冒泡排序：每次循环，锁定一个最值，并朝着最大或
supervisord 命令介绍和使用案例 lisanmengmeng linux 命令工具系统运维 shell编程服务器 linux 运维
supervisord命令介绍和使用案例supervisord是一个用Python编写的进程管理工具，用于监控和管理Linux系统中的进程。它可以将普通的命令行进程转变为后台守护进程（daemon），并监控进程状态，在进程异常退出时自动重启。它通过fork/exec的方式把被管理的进程当作自己的子进程来启动。主要功能:进程管理：能够启动、停止、重启和关闭进程.自动重启：监控进程状态，并在进程崩溃时
ptython setup.py install 设置python包编译时的并行数 leo0308 基础知识 Python python pytorch3d
通过源码编译安装pytorch3d的时候，直接执行pythonsetup.pyinstall时，默认开的并行数很多，有10几个，直接导致机器卡死。通过设置下面的环境变量，可以设置较小的并行数，避免占用过多的资源。exportMAX_JOBS=4设置后，同时只有4个编译的进程。
【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解析... 985小水博一枚呀论文解读深度学习目标检测 YOLO 人工智能算法架构网络
【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解析…【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解析…文章目录【深度学习目标检测|YOLO算法5-1-1】YOLO家族进化史：从YOLOv1到YOLOv11的架构创新、性能优化与行业应用全解
基于MUSIC算法的DOA估计Matlab仿真 fpga和matlab ★MATLAB算法仿真经验板块1:通信与信号处理 matlab MUSIC算法 DOA估计
up目录一、理论基础二、核心程序三、测试结果一、理论基础阵列信号处理是信号处理领域内的一个重要分支，在近些年来得到了迅速发展。波达方向（DirectionofArrival，DOA）估计是阵列信号处理的一个重要的研究领域，在雷达、通信、声纳、地震学等领域都有着广泛的应用前景。在DOA估计的发展过程中，人们对高分辨DOA估计算法一直有很大的研究兴趣，并在这一领域取得了很多重要的进展。阵列信号处理主要
探索AI音乐创作的未来：八款顶尖AI音乐生成工具（本期介绍国外-国内另外专题介绍）带娃的IT创业者 AIGC 程序员创富人工智能音视频 ai
探索AI音乐创作的未来：八款顶尖AI音乐生成工具（本期介绍国外-国内另外专题介绍）在科技飞速发展的今天，人工智能（AI）已经渗透到我们生活的方方面面，其中音乐创作也不例外。AI音乐生成工具不仅为专业音乐人提供了新的创作方式，也让普通人能够轻松创作出高质量的音乐作品。本文将介绍八款知名的AI音乐生成工具，帮助你了解它们的特点和优势。1.SunoSuno是一款AI驱动的音乐生成器，能够快速创建高质量的
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理 dorabighead javascript 开发语言 ecmascript
《JavaScript高级程序设计》——第四章：变量、作用域与内存管理大家好！我是小哆啦，欢迎回到《JavaScript高级程序设计》的读书笔记大本营！在这章中，我们要聊的是两个让人头疼又迷人的话题——变量、作用域与内存管理。有些人一提到这些，就会感到一阵头晕目眩，恍若置身一场JavaScript版的迷宫大冒险！但今天，小哆啦会带你们轻松过关，深入了解这些概念，并且保持足够的幽默感，让你既能笑着学
深入理解DAG任务调度系统：核心原理与实现 AI天才研究院计算 Python实战编程实践 python 算法 dag
1.背景介绍随着大数据、人工智能等领域的发展，任务调度系统的重要性日益凸显。DirectedAcyclicGraph(DAG)任务调度系统是一种常见的任务调度系统，它可以有效地解决多个依赖关系复杂的任务调度问题。本文将深入探讨DAG任务调度系统的核心原理和实现，为读者提供一个深入的理解。1.1背景介绍1.1.1任务调度系统简介任务调度系统是计算机科学中一个重要的研究领域，它主要关注于在并行计算系统
python 自动化数据提取之正则表达式_python 正则提取(2) m0_60607245 程序员 python 学习面试
一、Python所有方向的学习路线Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。二、Python必备开发工具工具都帮大家整理好了，安装就可直接上手！三、最新Python学习笔记当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理
基于立创·天空星开发板-GD32F407VET6-青春版，开发一款手持热成像仪。该设备将采集热红外传感器的数据，经过处理后在LCD屏幕上显示热图像，并提供用户交互界面。嵌入式程序员小刘物联网单片机嵌入式硬件开源
本项目基于立创·天空星开发板-GD32F407VET6-青春版，开发一款手持热成像仪。该设备将采集热红外传感器的数据，经过处理后在LCD屏幕上显示热图像，并提供用户交互界面。关注微信公众号，提前获取相关推文一、需求分析核心功能:热图像采集:读取热红外传感器数据。图像处理:将原始传感器数据转换为可显示的彩色或灰度热图像。图像显示:在LCD屏幕上实时显示热图像。温度测量:计算并显示图像中特定点的温度值
GUI编程（window系统→Linux系统）诚信爱国敬业友善心得 linux python gui
最近有个项目需要将windows系统的程序往Linux系统上面移植，由于之前程序没有考虑过多平台兼容的问题，导致部分功能不可用以下是对近期遇到的问题的总结，以及相应的解决方案和经验分享。1.Python模块安装与管理在Linux系统中，安装和管理Python模块时可能会遇到权限问题或依赖冲突。安装模块：使用pip安装模块时，建议使用--user选项，避免需要管理员权限：bash复制pipinsta
spring boot基于知识图谱的阿克苏市旅游管理系统python-计算机毕业设计 QQ1963288475 spring boot 知识图谱旅游 python vue.js django flask
目录功能和技术介绍具体实现截图开发核心技术：开发环境开发步骤编译运行核心代码部分展示系统设计详细视频演示可行性论证软件测试源码获取功能和技术介绍该系统基于浏览器的方式进行访问，采用springboot集成快速开发框架，前端使用vue方式，基于es5的语法，开发工具IntelliJIDEAx64，因为该开发工具，内嵌了Tomcat服务运行机制，可不用单独下载Tomcatserver服务器。由于考虑到
Python从0到100（三十九）：数据提取之正则（文末免费送书）是Dream呀 python mysql 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
接入DeepSeek后，智慧园区安全调度系统的全面提升 Guheyunyi 安全数据分析 python 智慧城市人工智能信息可视化
随着人工智能技术的快速发展，智慧园区的安全管理正逐步向智能化、自动化方向迈进。DeepSeek作为先进的人工智能解决方案，为智慧园区安全调度系统注入了强大的技术动力。通过接入DeepSeek，智慧园区安全调度系统在多个方面实现了显著提升，进一步增强了园区的安全性、管理效率和用户体验。1.智能化监控：从被动到主动传统的监控系统主要依赖人工查看视频画面，容易出现漏检或误判。接入DeepSeek后，智慧
清华大学第四发《DeepSeek+DeepResearch 让科研像聊天一样简单》人工智能
当下科研领域，传统模式急需改变，清华大学第四版《DeepSeek+DeepResearch：让科研像聊天一样简单》全文一共86页，以下是文档的关键内容总结：一、智能组合优势DeepSeek与DeepResearch构建先进技术体系，有强大模型运算、智能数据处理和友好交互界面。模型在数据处理速度、精准度和泛化能力上远超传统模型。数据采集渠道广、处理快，能读取多种格式文件。数据分析深入，可视化直观，还
Python学习心得两大编程思想 lifegoesonwjl python 开发语言 pycharm 前端 c语言
一、两大编程思想：1.面向过程：功能上的封装典型代表：C语言2.面向对象：属性和行为上的封装典型代表：Python、Java二、面向过程与面向对象的异同点：1.区别：面向过程：事物比较简单，可用线性的思维去解决面向对象：事务比较复杂，使用简单的线性思维无法解决2.共同点：（1）面向过程和面向对象都是解决实际问题的一种思维方式；（2）二者相辅相成，并不是对立的；（3）解决复杂问题，通过面向对象方式便
Linux升级Anacodna并配置jupyterLab 伪_装环境部署 linux 服务器 Anaconda python jupyter
在使用Anaconda的过程中，随着项目和需求的发展，可能需要升级Anaconda的Base环境中的Python版本。本文将详细介绍如何安全地进行升级，包括步骤、代码示例与最终流程图。升级Python一、环境准备在进行任何升级之前，建议先检查当前的Python版本以及各个库的兼容性。我们可以通过以下命令检查当前的Python版本：condainfo你会看到类似以下的输出，其中包含了当前Python
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

3.5 softmax回归的从零开始实现

文章目录

1. 图像分类数据集-Fashion-MNIST数据集

1.0 导入Python包

1.1 读取数据集

1.2 读取小批量

1.3 整合所有组件

2. softmax回归的从零开始实现

2.1 初始化模型参数

2.2 定义softmax操作

2.3 定义模型

2.4 定义损失函数

2.5 分类精度

2.6 训练

2.7 预测

3.引用

4. softmax回归的简洁实现

你可能感兴趣的:(动手学深度学习Pytorch版,回归,数据挖掘,人工智能,python,算法,深度学习,神经网络)