不牌不改

Pytorch学习笔记（四）

下面的若干段代码是循循渐进的，而且保证了每段代码只对前一段代码进行最小程度的修改，方便连续阅读，这也是我学习的过程，有错误的地方希望不吝赐教，共同进步。

纯手工实现线性回归

10个样本，每个样本特征数为1，需要训练的参数为一个特征权重和一个偏置，所以总共两个要训练的超参数。

采用批量梯度下降法，即使用全部样本的梯度更新权重和偏置。

实现代码

"""
手工实现 y=wx+b 线性回归（梯度下降法）
"""

import torch
import numpy as np

def generate_dataset(true_w, true_b, num_examples, random_seed=10) :
    """
    生成数据集
    :param true_w: 规定的准确权重
    :param true_b: 规定的准确偏置
    :param num_examples: 样本个数
    :param random_seed: 随机种子，保证每次执行都能生成相同的数据集
    :return: 特征与标签（真实值）
    """
    torch.manual_seed(random_seed)  # 为CPU设置随机种子
    np.random.seed(random_seed)  # Numpy module
    x = torch.randn(num_examples, dtype=torch.float32) # 随机生成若干个数据
    y = true_w * x + true_b # 因变量的值
    y += torch.normal(0, 0.01, size=y.size(), dtype=torch.float32) # 加入噪声
    return x, y

def model(x, w, b) :
    """
    模型，计算预测的值，即y_hat
    :param x: 特征
    :param w: 预测的权重
    :param b: 预测的偏置
    :return: 每个样本对应的预测值
    """
    return w * x + b

def loss(y_hat, y) :
    """
    损失函数，计算损失值，每个样本的预测值与真实值之间的误差的平方的均值
    :param y_hat: 预测值
    :param y: 真实值
    :return: 损失值
    """
    return ((y_hat - y) ** 2).mean()

def calculate_gradient(x, y, w, b) :
    """
    计算梯度值，即loss对w的偏导和loss对b的偏导
    :param x: 样本特征
    :param y: 真实值
    :param w: 预测的权重
    :param b: 预测的偏置
    :return: 返回loss对w的偏导和loss对b的偏导
    """
    y_hat = model(x, w, b) # 计算预测值
    dloss_dw = (2 * (y_hat - y) * x).mean() # loss对w的偏导
    dloss_db = (2 * (y_hat - y) * 1).mean() # loss对b的偏导
    return torch.tensor([dloss_dw, dloss_db], dtype=torch.float32) # 这里是将两个数合成一个tensor去操作

def tarin_model(num_epochs, learning_rate, params, x, y) :
    """
    模型训练，梯度下降法更新 w 和 b
    :param num_epochs: epoch次数
    :param learning_rate: 学习率
    :param params: w 和 b构成的一维tensor
    :param x: 样本特征
    :param y: 真实值
    :return: 最终训练完毕的 w 和 b
    """
    for epoch in range(1, num_epochs + 1) :
        w, b = params
        y_hat = model(x, w, b)
        loss_value = loss(y_hat, y)
        gradient = calculate_gradient(x, y, w, b)

        params -= learning_rate * gradient # 更新 w 和 b

        print("Epoch %d  Loss %f" % (epoch, loss_value.item()))

    return w, b

"""
生成数据集
"""
x, y = generate_dataset(true_w=2.5, true_b=4.2, num_examples=10)
# print(x, y)

"""
初始化 w 和 b
"""
w = 0
b = 0

"""
计算梯度
"""
grad_w, grad_b = calculate_gradient(x=x, y=y, w=w, b=b)

"""
反向传播，更新 w 和 b
"""
w, b = \
tarin_model(
    num_epochs=100,
    learning_rate=0.1,
    params=torch.tensor([w, b], dtype=torch.float32),
    x=x,
    y=y
)
print("After Training w = %f b = %f" % (w, b))

几点说明

使用批量梯度下降，即使用全部样本更新权重和偏置。
因为w和b是两个数，所以可以使用torch.tensor([w, b])将两个数合并成一个tensor，但是如果w和b本身就是tensor，是不可以这样合并成更高维度的tensor的，需要使用torch.stack([w, b])。
由于本数据集过于完美，所以收敛效果比较好，设置大的学习步长也没问题，但其他数据集就不一定了。

使用 backward() 实现线性回归

既然我们学习了backward()，那尝试用backward()实现一下。

首先，说明一下，下面代码中所用数据集为1000个样本，每个样本具有2个特征。为了计算方便，我将权重系数w和偏置b合在一起进行计算了，即代码中的w表示的就是w和b，所以代码中的w其实是三维的，同样的道理，样本本来是1000行2列，但由于w和b的合并，所以样本矩阵变为1000行3列了，新增的最后一列全1。

而且下面采用了小批量梯度下降法。

实现代码

import torch
import numpy as np


def generate_dataset(true_w, num_examples, random_seed=10) :
    """
    生成数据集
    :param true_w: 规定的准确权重（含偏置）
    :param num_examples: 样本个数
    :param random_seed: 随机种子，保证每次执行都能生成相同的数据集
    :return: 特征与标签（真实值）
    """
    # ----- 保证每次的随机数都一样 -----
    torch.manual_seed(random_seed)  # 为CPU设置随机种子
    np.random.seed(random_seed)  # Numpy module

    # ----- 生成特征信息 -----
    x = torch.ones(size=(num_examples, 3), dtype=torch.float32) # 1000×3的全1张量 # 这里不用加requires_grad=True，因为我们最后是对w（含b）求导
    x[:,:2] = torch.randn(size=(num_examples, 2), dtype=torch.float32) # 随机生成num_examples个数据，每个数据两个特征，即将x的前两列改为特征，最后一列保持为1

    # ----- 生成标签信息 -----
    y = torch.mm(x, true_w) # 进行矩阵乘法 x * w => 1000×3 * 3×1 = 1000×1 # y和x同理，无需加requires_grad=True
    y += torch.normal(0, 0.01, size=y.size(), dtype=torch.float32) # 加入噪声

    return x, y

def model(x, w) :
    """
    模型，返回每个样本对应的预测值，即y_hat
    :param x: 特征+一列1
    :param w: 预测的权重（含偏置）
    :return: 每个样本对应的预测值
    """
    return torch.mm(x, w) # 矩阵乘法

def loss(y_hat, y) :
    """
    损失函数，计算损失值，每个样本的预测值与真实值之间的误差的平方的均值
    :param y_hat: 预测值
    :param y: 真实值
    :return: 损失值
    """
    return ((y_hat - y) ** 2).mean()

# 与“纯手写线性回归”不同，这里不需要写计算梯度的函数了，因为backward自动计算

def train_model(num_epochs, learning_rate, batch_size, w, x, y) :
    """
    训练模型，本质就是更新 w 。
    每个epoch内进行多次更新，每次更新都使用一个batch，循环完一次全部的样本才算一个epoch结束。
    :param num_epochs: epoch次数
    :param learning_rate: 学习率
    :param batch_size: 每个batch大小，即一个batch多少个样本
    :param w: 训练的权重（含偏置）
    :param x: 样本特征
    :param y: 样本标签（真实值）
    :return: 训练完成后的权重（含偏置）
    """
    num_examples = len(x) # 样本数就是x的行数 # 对于二维矩阵而言，len返回的是行的数量

    for epoch in range(1, num_epochs + 1) :

        disorderly_idx = list(np.arange(num_examples)) # 生成0~num_examples-1的序列，即索引
        np.random.shuffle(disorderly_idx) # 随机打乱索引，得到乱序索引

        for i in range(0, num_examples, batch_size) : # 每次循环访问batch_size个索引，作为一组batch

            batch_idx = disorderly_idx[i : min(i + batch_size, num_examples)] # 获取到这组batch的索引 # 之所以存在一个min，是因为防止出现最后一组不足一个batch的情况
            batch_x = x.index_select(0, torch.LongTensor(batch_idx)) # 取出对应行，索引必须为Int64
            batch_y = y.index_select(0, torch.LongTensor(batch_idx)) # 取出对应行，索引必须为Int64

            # ----- 使用这组 batch 更新 w
            loss_value = loss(model(batch_x, w), batch_y) # 有关小批量batch_x和batch_y的损失值
            loss_value.backward() # 反向传播，计算梯度！
            w_data = w.detach() # w是叶子节点，欲修改其值需要使用detach或data
            w_data -= learning_rate * w.grad # 小批量梯度下降（由于计算损失值的时候已经取过均值了，所以这里就不再除以batch_size了）

            w.grad.data.zero_() # 不要忘了梯度清零，而且要使用.data或.detach()

        print("Epoch %d  Loss %f" % (epoch, loss(model(x, w), y).item())) # 显示全部数据集用当前训练得到的w去预测，得到的损失值

    return w

"""
生成数据集
注意：样本的特征是两维（样本数×2），所以权重矩阵w本应为两维（样本数×2），
    但可以将偏置b放入权重矩阵w中，即w为三维（样本数×3），最终结果w的最后一维（列）就是b。
    对应地，样本矩阵也要扩展一维至三维，即最后一维（列）为全1。
"""
num_examples = 1000
num_features = 2 # 样本特征数为2，但特征矩阵列数为3，同样的权重矩阵列数也为3，所以要求num_features始终比true_w中元素个数少1
true_w = torch.tensor([2.5, -1.5, 3.5], dtype=torch.float32).view(-1, 1) # 转换成1列

x, y = \
generate_dataset(
    true_w=true_w,
    num_examples=num_examples
)


"""
初始化 w（含偏置b）
"""
w = torch.ones(size=(num_features + 1, 1), dtype=torch.float32, requires_grad=True) # 注意+1（要求num_features始终比true_w中元素个数少1） # 不要忘记requires_grad=True

"""
训练模型
其中包含反向传播、计算梯度、更新 w 等过程
"""
w = train_model(num_epochs=10, learning_rate=0.01, batch_size=10, w=w, x=x, y=y)

print("True wieght true_w = ", true_w.storage().tolist()) # tensor.stroage()相当于将张量拉伸成一维的，之后使用tolist()转换为列表
print("After Training w = " , w.data.storage().tolist())

几点说明

明确哪些变量是要进行设置requires_grad，哪些不需要。
注意叶子节点更新值的时候要使用.data或.detach()。
学习如何实现小批量梯度下降。

使用神经网络框架实现线性回归

神经网络的基本框架

从最开始”纯手工实现线性回归“中需要自己写计算梯度的过程，需要自己求出导函数；到”使用 backward() 实现线性回归“中调用自带的 backward() 函数实现计算梯度的过程。我们发现调用现有的函数多是一件美事啊！下面就尝试调用更多的现有函数来实现线性回归

（如果有些函数或者类之前的学习笔记没有讲过，会在使用时补充到用到该函数的博客中，但至于会不会添加到学习笔记三中，另说。也就是说知识点的补充可能会比较零散）。

创建一个继承自 Pytorch 中的 nn.Module 的类来实现神经网络，这样可以使用 Pytorch 提供的许多高级 API，而无需自己实现。

基于 nn.Module的类的最低要求是覆盖__init__()方法和forward()方法。

基本形式如下：

class myModel(nn.Module):
    def __init__(self):
        # 继承父类构造函数
        super(myModel, self).__init__()
        # 这里我们定义一些层次实例。
        self.my_conv_layer = nn.Linear()

    def forward(self, x):
        # 这里我们调用在__init__中定义好的层次实例。
        y_hat = my_conv_layer(x)
        return y_hat

简单来说，在__int__函数内我们定义实例，相当于构建出整个网络的架构；在forward函数内只需要简单地调用定义好的实例就行，偶尔处理一下数据的维度等。

使用创建好的模型的方法：y_hat = myModel(x)。

但是这个网络并不具有计算损失函数、进行更新等功能。因为这些功能都是网络结构之外的，我们只是定义了一个网络而已，也就是说，这个网络只有前向传播的能力，即进行预测。整体来看，和我们自定义的model函数没什么区别，都是输入样本x，预测值输出y_hat。

不妨看个“高级”的网络模型：（千万不要把每一处都搞明白，这样浪费时间，看清楚结构即可）

class SimpleCNN(nn.Module):
    def __init__(self):
        #继承父类构造函数
        super(SimpleCNN, self).__init__()
        # 这里我们定义一些层次实例。
        # 比如：
        # 先卷积，再relu，再池化
        self.myconv1 = nn.Conv2d(in_channels=3, out_channels=32, kernel_size=(3, 3), padding=1, stride=1, bias=True)
        self.myrelu1 = nn.ReLU(inplace=True)
        self.mymaxpooling1 = nn.MaxPool2d(kernel_size=(2, 2), stride=1)

        # 先卷积，再relu，再池化
        self.myconv2 = nn.Conv2d(in_channels=32, out_channels=64, kernel_size=(3, 3), padding=1, stride=1, bias=True)
        self.myrelu2 = nn.ReLU(inplace=True)
        self.mymaxpooling2 = nn.MaxPool2d(kernel_size=(2, 2), stride=1)

        # 先卷积，再relu，再池化
        self.myconv3 = nn.Conv2d(in_channels=64, out_channels=128, kernel_size=(3, 3), padding=1, stride=1, bias=True)
        self.myrelu3 = nn.ReLU(inplace=True)
        self.mymaxpooling3 = nn.MaxPool2d(kernel_size=(2, 2), stride=1)

        # 开始全连接 2048 -> 512 -> 64 -> 10
        self.myfullconnected1 = nn.Linear(in_features=2048, out_features=512)
        self.myrelu4 = nn.ReLU(inplace=True)
        self.myfullconnected2 = nn.Linear(in_features=512, out_features=64)
        self.myrelu5 = nn.ReLU(inplace=True)
        self.myfullconnected3 = nn.Linear(in_features=64, out_features=10)

    def forward(self, x):
        # 这里我们调用在__init__中定义好的层次实例。
        conv1 = self.myconv1(x)
        relu1 = self.myrelu1(conv1)
        maxpooling1 = self.mymaxpooling1(relu1)

        conv2 = self.myconv2(maxpooling1)
        relu2 = self.myrelu2(conv2)
        maxpooling2 = self.mymaxpooling2(relu2)

        conv3 = self.myconv3(maxpooling2)
        relu3 = self.myrelu3(conv3)
        maxpooling3 = self.mymaxpooling3(relu3)

        output = maxpooling3.view(maxpooling3.size(0), -1) # 不要忘记Linear函数的输入必须是二维的！

        fullconnected1 = self.myfullconnected1(output)
        relu4 = self.myrelu4(fullconnected1)

        fullconnected2 = self.myfullconnected2(relu4)
        relu5 = self.myrelu5(fullconnected2)

        y_hat = self.myfullconnected3(relu5)

        return y_hat

基础好的已经看出这是个手写数字识别的网络了（单看最后10个输出就知道了）。

这里只是让大家看看“学习笔记三”中的一些函数可以如此用，整体上把握网络结构即可，现在还不用能自己写出来。

我觉得学习pytorch，最重要的是模仿，先模仿着写，再明白为什么。这和我们入门人生中的第一门语言C语言是一样的道理，最开始大家都是先去试着写printf，但其实并不知道用法。

实现代码

import torch
import numpy as np
import torch.nn as nn


"""
定义简单的线性神经网络。
输入样本具有二维特征，输出为一维预测标签，学习时含偏置。
"""
class MyLinearRegression(nn.Module) :
    def __init__(self): # 注意别把init写成int
        # 继承父类构造函数
        super(MyLinearRegression, self).__init__()
        # torch.nn.Linear(in_features, out_features, bias=True)
        # 输入样本的特征数为2，输出特征数（标签维度）为1，加上偏置
        self.linear = nn.Linear(in_features=2, out_features=1, bias=True)

    def forward(self, x):
        """
        前向传播。
        对于该类来说就是进行线性计算。
        :param x: 输入样本特征值
        :return: 返回计算结果，输出特征值，即预测标签
        """
        y_hat = self.linear(x)
        return y_hat

"""
生成数据集，该函数与上面代码的不同在于不再将偏置b算入权重w中了，因为Linear函数我们设置了bais=True，会将bais当作一个单独的可学习参数进行训练
"""
def generate_dataset(true_w, num_examples, random_seed=10) :
    """
    生成数据集
    :param true_w: 规定的准确权重（含偏置）
    :param num_examples: 样本个数
    :param random_seed: 随机种子，保证每次执行都能生成相同的数据集
    :return: 特征与标签（真实值）
    """
    # ----- 保证每次的随机数都一样 -----
    torch.manual_seed(random_seed)  # 为CPU设置随机种子
    np.random.seed(random_seed)  # Numpy module

    # ----- 生成特征信息 -----
    x = torch.randn(size=(num_examples, 2), dtype=torch.float32) # 随机生成num_examples个数据，每个数据两个特征

    # ----- 生成标签信息 -----
    y = torch.mm(x, true_w) # 进行矩阵乘法 x * w
    y += torch.normal(0, 0.01, size=y.size(), dtype=torch.float32) # 加入噪声

    return x, y



if __name__ == "__main__" :
    # 创建 MyLinearRegression() 的实例
    model = MyLinearRegression()
    print(model) # 显示模型层次

    # ----- 规定一些参数的值 -----
    num_examples = 1000             # 1000个样本
    batch_size = 10
    num_epochs = 10                 # 迭代次数
    learning_rate = 1e-2            # 学习率 0.01
    mse_loss = torch.nn.MSELoss()   # 损失函数，均方误差
    true_w = torch.tensor([2.5, -1.5], dtype=torch.float32).view(-1, 1)  # 转换成1列，为了方便进行矩阵乘法。其实放在generate_dataset函数内实现也可
    true_b = torch.tensor([3.5], dtype=torch.float32)
    # ----- -----

    optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)  # 优化函数

    # 生成数据集
    x, y = \ 
        generate_dataset(
            true_w=true_w,
            num_examples=num_examples
        )

    # 迭代更新
    for epoch in range(1, num_epochs+1) :

        disorderly_idx = list(np.arange(num_examples))  # 生成0~num_examples-1的序列，即索引
        np.random.shuffle(disorderly_idx)  # 随机打乱索引，得到乱序索引

        for i in range(0, num_examples, batch_size):
            # 生成batch
            batch_idx = disorderly_idx[i: min(i + batch_size, num_examples)]  # 获取到这组batch的索引 # 之所以存在一个min，是因为防止出现最后一组不足一个batch的情况
            batch_x = x.index_select(0, torch.LongTensor(batch_idx))  # 取出对应行，索引必须为Int64
            batch_y = y.index_select(0, torch.LongTensor(batch_idx))  # 取出对应行，索引必须为Int64

            # 预测
            batch_y_hat = model(batch_x)

            # 计算损失值
            loss_value = mse_loss(batch_y_hat, batch_y)

            # 反向传播
            loss_value.backward()

            # 一旦梯度被如backward()之类的函数计算好后，我们就可以调用这个函数更新参数
            optimizer.step()

            # 将可训练参数的梯度清零
            optimizer.zero_grad()

        print("Epoch %d  Loss %f" % (epoch, mse_loss(model(x), y).item()))

torch.optim

torch.optim是一个实现了各种优化算法的库。所谓的优化算法就是更新可学习参数的方法，比如梯度下降等等。

只讲解SGD，Adam不大理解。

torch.optim.SGD

torch.optim.SGD(params, lr=, momentum=0, dampening=0, weight_decay=0, nesterov=False)：随机梯度下降

参数的讲解（由于篇幅比较长，所以选择放在另一篇博客中）

实例化：optimizer = torch.optim.SGD(传入参数)。

optimizer.step()

这是大多数optimizer所支持的简化版本。一旦梯度被如backward()之类的函数计算好后，我们就可以调用这个函数来自动使用我们定义好的optimizer优化算法来更新权重。

使用方法：optimizer.step()

optimizer.zero_grad()

将梯度清零。

至于与model.zero_grad()的区别，网上几乎都是复制粘贴的，没什么参考价值，只找到了两篇相对有价值的讨论，但还是不理解。

Model.zero_grad() or optimizer.zero_grad()? - PyTorch Forums

PyTorch中的model.zero_grad() vs optimizer.zero_grad() - 简书

暂时这部分只能囫囵吞枣了。

使用优化算法的一般流程

optimizer = optim.SGD(model.parameters(), lr = 0.01, momentum=0.9) # 实例化

for epoch in range(1, num_epochs + 1) : # 迭代
    optimizer.zero_grad() # 梯度清零
    loss_value.backward() # 反向传播
    optimizer.step()	  # 更新权重

使用utils.data生成批量数据实现线性回归

torch.utils.data.Dataset：将tensor数据封装成数据集方便处理。生成的是索引型数据集。
torch.utils.data.DataLoader：生成迭代器，按自定义的方式读取数据集中的数据。生成的是迭代型数据集。

torch.utils.data.Dataset

功能：Dataset 是抽象类，所有自定义的 Dataset 都需要继承该类，并且重写__getitem()__方法和__len__()方法。__getitem()__方法的作用是接收一个索引，返回索引对应的样本和标签，这是我们自己需要实现的逻辑。__len__()方法是返回所有样本的数量。

import torch
import numpy as np
from torch.utils.data import DataLoader, Dataset

class MyDataSet(Dataset) :
    # 重载了 __init__, __getitem__, __len__
    # 将 Tensor 数据封装成 Tensor 数据集
    # 通过索引可以获取某个样本信息，通过 len 可以获取样本个数

    def __init__(self, features, target) :
        self.x = features
        self.y = target

    def __getitem__(self, index) :
        return self.x[index], self.y[index]

    def __len__(self) :
        return self.x.size(0)

# 生成数据
num_examples = 1000     # 样本数
num_features = 3        # 样本特征数
x = torch.randn(num_examples, num_features)
y = torch.randn(num_examples)

# 将数据封装成 Dataset
mydataset = MyDataSet(x, y)

# 索引获取样本信息
print(mydataset[0])

# len获取样本数量
print(len(mydataset))
"""
(tensor([-0.1909,  0.9481,  0.1173]), tensor(1.0922))
1000
"""

torch.utils.data.TensorDataSet

torch.utils.data.TensorDataset(*tensors)：将张量封装成数据集。

描述一下就是，可以传入多个不同维度的张量，但是它们的第一维必须相同。这些张量将被封装成一个多个元组，元组个数为第一维大小。

举两个例子理解：

TensorDataSet与Dataset的关系：

你不感觉TensorDataSet更像是DataSet的一种特殊情况吗？也就是说我们可以通过继承DataSet类实现处理数据并封装成数据集形式，但TensorDataSet的输入参数只能是满足一定条件张量，直接将输入张量打包封装，可实现的功能更局限，而且无法自定义其他功能。

torch.utils.data.DataLoader

torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, multiprocessing_context=None, generator=None, *, prefetch_factor=2, persistent_workers=False)

基础概念

Epoch、Iteration 和 Batchsize

Epoch：所有训练样本都已经输入到模型中，称为一个 Epoch
Iteration：一批样本输入到模型中，称为一个 Iteration
Batchsize：批大小，决定一个 iteration 有多少样本，也决定了一个 Epoch 有多少个 Iteration

假设样本总数有 80，设置 Batchsize 为 8，则共有 80÷8 个 Iteration。这里 1 Epoch = 10 Iteration。

重要参数讲解

dataset：（数据类型 Dataset）

输入的数据类型，也是最重要的参数，它表示要加载数据的数据集对象。
batch_size：（数据类型 int）

批处理样本的大小，默认为1。
shuffle：（数据类型 bool）

在每轮迭代训练时是否将数据洗牌。默认设置为False。设置为True则是在每一轮中，输入数据的顺序将被打乱，这是为了使数据更有独立性，训练的时候一般都设置为True，若输入数据是有序的，就不要设置成True了。
collate_fn：（数据类型 callable可调用对象）

将一小段数据合并成数据列表，默认设置是False。如果设置成True，系统会在返回前会将张量数据（Tensors）复制到CUDA内存中。
sampler：（数据类型 Sampler）

采样，默认设置为None。根据定义的策略从数据集中采样输入。如果定义采样规则，则洗牌（shuffle）设置必须为False。
num_workers：（数据类型 Int）

子进程数量，默认是0。使用多少个子进程来加载数据。0 就是使用主进程来加载数据。注意：这个数字必须是大于等于0的，该值的设置应该量内存大小而为。
pin_memory：（数据类型 bool）

内存寄存，默认为False。在数据返回前，是否将数据复制到CUDA内存中。
drop_last：（数据类型 bool）

丢弃最后数据，默认为False。设置了 batch_size 的数目后，最后一批数据未必是设置的数目，有可能会小些。这时你是否需要丢弃这批数据。
timeout：（数据类型 numeric）

超时值，默认为0。是用来设置数据读取的超时时间，超过这个时间还没读取到数据的话就会报错。所以，数值必须大于等于0。

简单代码方便理解DataLoader

"""
    批训练，把数据变成一小批一小批数据进行训练。
    DataLoader就是用来包装所使用的数据，每次抛出一批数据
"""
import torch
import torch.utils.data as Data

BATCH_SIZE = 5

x = torch.linspace(1, 10, 10)
y = torch.linspace(10, 1, 10)
# 把数据放在数据库中
torch_dataset = Data.TensorDataset(x, y)
loader = Data.DataLoader(
    # 从数据库中每次抽出batch size个样本
    dataset=torch_dataset,
    batch_size=BATCH_SIZE,
    shuffle=True,
    num_workers=2,
)


def show_batch():
    for epoch in range(3):
        for step, (batch_x, batch_y) in enumerate(loader):
            # training

            print("step:{}, batch_x:{}, batch_y:{}".format(step, batch_x, batch_y))

if __name__ == '__main__':
"""
step:0, batch_x:tensor([ 5.,  8.,  7.,  2., 10.]), batch_y:tensor([6., 3., 4., 9., 1.])
step:1, batch_x:tensor([1., 9., 4., 6., 3.]), batch_y:tensor([10.,  2.,  7.,  5.,  8.])
step:0, batch_x:tensor([3., 7., 9., 2., 5.]), batch_y:tensor([8., 4., 2., 9., 6.])
step:1, batch_x:tensor([ 4.,  8., 10.,  1.,  6.]), batch_y:tensor([ 7.,  3.,  1., 10.,  5.])
step:0, batch_x:tensor([ 3.,  6.,  9.,  2., 10.]), batch_y:tensor([8., 5., 2., 9., 1.])
step:1, batch_x:tensor([8., 5., 7., 1., 4.]), batch_y:tensor([ 3.,  6.,  4., 10.,  7.])
"""

你可以尝试着将 $x$ 改为更高维度的样本试试输出。

DataLodaer与DataSet类不同在于不能通过索引去访问每个样本信息，只能通过迭代的方式获取样本信息，更方便我们去遍历每一个batch。

实现代码

讲了这么多终于可以写使用这些库来生成batch了！

import torch
import numpy as np
import torch.nn as nn
import torch.utils.data as Data

"""
定义简单的线性神经网络。
输入样本具有二维特征，输出为一维预测标签，学习时含偏置。
"""
class MyLinearRegression(nn.Module) :
    def __init__(self):
        super(MyLinearRegression, self).__init__()
        self.linear = nn.Linear(in_features=2, out_features=1, bias=True)

    def forward(self, x):
        y_hat = self.linear(x)
        return y_hat

"""
生成数据集，该函数与上面代码的不同在于不再将偏置b算入权重w中了，因为Linear函数我们设置了bais=True，会将bais当作一个单独的可学习参数进行训练
"""
def generate_dataset(true_w, num_examples, random_seed=10) :
    torch.manual_seed(random_seed)
    np.random.seed(random_seed)

    x = torch.randn(size=(num_examples, 2), dtype=torch.float32)

    y = torch.mm(x, true_w)
    y += torch.normal(0, 0.01, size=y.size(), dtype=torch.float32)

    return x, y



if __name__ == "__main__" :
    # 创建 MyLinearRegression() 的实例
    model = MyLinearRegression()
    print(model) # 显示模型层次

    # ----- 规定一些参数的值 -----
    num_examples = 1000             # 1000个样本
    batch_size = 10
    num_epochs = 10                 # 迭代次数
    learning_rate = 1e-2            # 学习率 0.01
    mse_loss = torch.nn.MSELoss()   # 损失函数，均方误差
    true_w = torch.tensor([2.5, -1.5], dtype=torch.float32).view(-1, 1)  # 转换成1列，为了方便进行矩阵乘法。
    true_b = torch.tensor([3.5], dtype=torch.float32)
    # ----- -----

    optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)  # 优化函数

    # 生成数据集
    x, y = \
        generate_dataset(
            true_w=true_w,
            num_examples=num_examples
        )

    # 封装成DataSet
    dataset = Data.TensorDataset(x, y)

    # 生成迭代器
    loader = Data.DataLoader(
        dataset=dataset,
        batch_size=batch_size,
        shuffle=True,
        num_workers=2,
    )

    # 迭代更新
    for epoch in range(1, num_epochs+1) :

        for step, (batch_x, batch_y) in enumerate(loader): # 换成DataLoader的迭代方式
            # 预测
            batch_y_hat = model(batch_x)

            # 计算损失值
            loss_value = mse_loss(batch_y_hat, batch_y)

            # 反向传播
            loss_value.backward()

            # 一旦梯度被如backward()之类的函数计算好后，我们就可以调用这个函数更新参数
            optimizer.step()

            # 将可训练参数的梯度清零
            optimizer.zero_grad()

            print("Epoch %d Step %d Loss %f" % (epoch, step+1, mse_loss(model(x), y).item()))
"""
输出太多不打印了，自己运行一下就知道了
"""

REF

[1] 线性回归的从零开始实现 - Dive-into-DL-PyTorch

[2] PyTorch纯手工构建模型并训练 - CSDN博客

[3] pytorch 固定随机数种子 - CSDN博客

[4] 【小白学习PyTorch教程】四、基于nn.Module类实现线性回归模型 - CSDN博客

[5] 卷积神经网络中nn.Conv2d()和nn.MaxPool2d()以及卷积神经网络实现minist数据集分类 - 博客园

[6] PyTorch 学习笔记 2.1 DataLoader 与 DataSet - 知乎

[7] PyTorch中torch.utils.data.DataLoader加载数据 - CSDN博客

[8] Pytorch笔记05-自定义数据读取方式orch.utils.data.Dataset与Dataloader - 知乎

[9] Pytorch Sampler详解 - 博客园

你可能感兴趣的:(【Pytorch学习】,pytorch,深度学习,机器学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
【安装环境】配置MMTracking环境 xuanyu22 安装环境机器学习神经网络深度学习 python
版本v0.14.0安装torchnumpy的版本不能太高，否则后面安装时会发生冲突。先安装numpy，因为pytorch的安装会自动配置高版本numpy。condainstallnumpy=1.21.5mmtracking支持的torch版本有限，需要找到合适的condainstallpytorch==1.11.0torchvision==0.12.0cudatoolkit=10.2-cpytor
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本