人邮异步社区

PyTorch自动求导：反向传播的一切

在之前的介绍中，我们看到了一个简单的反向传播的例子：通过使用链式规则反向传播导数，我们计算了模型和损失的复合函数关于其内部参数w和b的梯度。这里的基本要求是我们处理的所有函数都是可微的。如果满足该基本要求，我们就可以计算梯度，我们之前称之为“损失变化率”，它是相对一次扫描的参数而言的。

即使我们有一个包含数百万个参数的复杂模型，只要我们的模型是可微的，计算关于参数的损失梯度就是写出导数的解析表达式并计算一次。当然，写一个非常深的线性和非线性函数的导数的解析表达式并不是很有趣，同时该表达式运行得也不会特别快。

5.5.1　自动计算梯度

这时PyTorch张量就会发挥作用（使用名为autograd的PyTorch组件）。第3章全面介绍了张量以及我们可以调用的相关函数。然而，我们忽略了非常有趣的一点：PyTorch张量可以记住它们自己从何而来，根据产生它们的操作和父张量，它们可以根据输入自动提供这些操作的导数链。这意味着我们不需要手动推导模型，给定一个前向表达式，无论嵌套方式如何，PyTorch都会自动提供表达式相对其输入参数的梯度。

1．应用自动求导

此时，最好的方法之一是重写我们的温度计校准代码，这次使用自动求导，看看会发生什么。首先，我们回顾一下我们的模型和损失函数，见代码清单5.1。

代码清单5.1　code/p1ch5/2_autograd.ipynb

# In[3]:
def model(t_u, w, b):
    return w * t_u + b

# In[4]:
def loss_fn(t_p, t_c):
    squared_diffs = (t_p - t_c)**2
    return squared_diffs.mean()

让我们再一次初始化一个参数张量：

# In[5]:
params = torch.tensor([1.0, 0.0], requires_grad=True)

2．使用grad属性

注意到张量构造函数的requires_grad=True参数了吗？这个参数告诉PyTorch跟踪由对params张量进行操作后产生的张量的整个系谱树。换句话说，任何将params作为祖先的张量都可以访问从params到那个张量调用的函数链。如果这些函数是可微的（大多数PyTorch张量操作都是可微的），导数的值将自动填充为params张量的grad属性。

通常，所有PyTorch张量都有一个名为grad的属性。通常情况下，该属性值为None：

# In[6]:
params.grad is None

# Out[6]:
True

我们所要做的就是从一个requires_grad为True的张量开始，调用模型并计算损失，然后反向调用损失张量：

# In[7]:
loss = loss_fn(model(t_u, *params), t_c)
loss.backward()

params.grad

# Out[7]:
tensor([4517.2969, 82.6000])

此时，params的grad属性包含关于params的每个元素的损失的导数。

当我们计算损失时，参数w和b需要计算梯度。除了执行实际的计算外，PyTorch还创建了以操作（黑色圆圈）为节点的自动求导图，如图5.10上部所示。当我们调用loss.backward()时，PyTorch将反向遍历此图以计算梯度，如图5.10下部所示。

图5.10　执行自动求导计算得到模型的前向图和后向图

3．累加梯度函数

我们可以有任意数量的requires-grad为True的张量和任意组合的函数。在这种情况下，PyTorch将计算整个函数链（计算图）中损失的导数，并将它们的值累加到这些张量的grad属性中（图的叶节点）。

注意，这是许多PyTorch初学者以及一些有经验的人经常会弄错的，我们在这里要强调的是导数是累加存储到grad属性中的。

注意　
调用backward()将导致导数在叶节点上累加。使用梯度进行参数更新后，我们需要显式地将梯度归零。

让我们一起复述一遍：调用backward()将导致导数在叶节点上累加，因此如果提前调用backward()，则会再次计算损失，再次调用backward()（就像在任何训练循环中一样），每个叶节点上的梯度将在上一次迭代中计算的梯度之上累加（求和），这会导致梯度计算不正确。

为了防止这种情况发生，我们需要在每次迭代时明确地将梯度归零。我们可以就地使用zero()_方法轻松地完成这一任务：

# In[8]:
if params.grad is not None:
    params.grad.zero_()

注意　
你可能会好奇为什么梯度的归零是一个必要的步骤，而不是当我们调用backward()时自动进行归零。这样做为在复杂模型中使用梯度提供了更多的灵活性和控制力。

有了这些提醒，让我们看看自动求导训练代码从头到尾是什么样的：

# In[9]:
def training_loop(n_epochs, learning_rate, params, t_u, t_c):
    for epoch in range(1, n_epochs + 1):
        if params.grad is not None:    ⇽---  这可以在循环中调用loss.backward()之前的任何时间完成
            params.grad.zero_()

        t_p = model(t_u, *params)
        loss = loss_fn(t_p, t_c)
        loss.backward()

        with torch.no_grad():    ⇽---  这是一段有点儿烦琐的代码，但是正如我们将在5.5.2小节中看到的那样，这在实践中不是一个问题
            params -= learning_rate * params.grad

        if epoch % 500 == 0:
            print('Epoch %d, Loss %f' % (epoch, float(loss)))

    return params

注意，params并不像我们预期的那样简单，其有2个特殊性。首先，我们使用Python的with语句将更新封装在非梯度上下文中，这意味着在with块中，PyTorch自动求导机制将不起作用[9]：也就是说，不向前向图添加边。实际上，当我们执行这段代码时，PyTorch记录的前向图在我们调用backward()时被消费掉，留下params叶节点。但是现在我们想在叶节点建立一个新的前向图之前改变它。虽然这个例子通常被封装在我们在5.5.2小节所讨论的优化器中，但是当我们在5.5.4小节中看到no_grad()的另一种常见用法时我们还会做进一步讨论。

其次，我们在适当的地方更新params张量，这意味着我们保持相同的params张量但从中减去更新。当使用自动求导时，我们通常避免就地更新，因为PyTorch的自动求导引擎可能需要我们修改反向传播的值。然而，在这里，我们没有自动求导操作，保持params张量是有益的。当我们在5.5.2小节中向优化器注册参数时，不通过为其变量名分配新的张量来替换参数将变得至关重要。

让我们看看它是否有效：

# In[10]:
training_loop(
    n_epochs = 5000,
    learning_rate = 1e-2,
    params = torch.tensor([1.0, 0.0], requires_grad=True),    ⇽---  添加requires_grad=True是关键
    t_u = t_un,    ⇽---  同样，我们用的是归一化的t_un，而不是t_u
    t_c = t_c)

# Out[10]:
Epoch 500, Loss 7.860116
Epoch 1000, Loss 3.828538
Epoch 1500, Loss 3.092191
Epoch 2000, Loss 2.957697
Epoch 2500, Loss 2.933134
Epoch 3000, Loss 2.928648
Epoch 3500, Loss 2.927830
Epoch 4000, Loss 2.927679
Epoch 4500, Loss 2.927652
Epoch 5000, Loss 2.927647

tensor([  5.3671, -17.3012], requires_grad=True)

结果和我们之前得到的是一样的。这意味着，虽然我们有能力手动计算导数，但我们不再需要这样做。

5.5.2　优化器

在示例代码中，我们使用了批量梯度下降（vanilla[10]）进行优化，这在我们的简单例子中运行良好。毋庸置疑，有一些优化策略和技巧可以帮助收敛，特别是当模型变得复杂时。

我们将在后文深入探讨这个主题，但是现在是时候介绍PyTorch从用户代码中提取优化策略的方法了（也就是我们检查过的训练循环），这就避免了我们必须自己更新模型中的每个参数的烦琐工作。

torch模块有一个optim子模块，我们可以在其中找到实现不同优化算法的类。以下是一个简要列表（code/p1ch5/ 3_optimizers.ipynb）：

# In[5]:
import torch.optim as optim

dir(optim)

# Out[5]:
['ASGD',
 'Adadelta',
 'Adagrad',
 'Adam',
 'Adamax',
 'LBFGS',
 'Optimizer',
 'RMSprop',
 'Rprop',
 'SGD',
 'SparseAdam',
...
]

每个优化器构造函数都接收一个参数列表（又称PyTorch张量，通常将requires_grad设置为True）作为第1个输入。传递给优化器的所有参数都保留在优化器对象中，这样优化器就可以更新它们的值并访问它们的grad属性，如图5.11所示。

图5.11　（A）优化器如何保持对参数引用的概念表示；（B）从输入中计算出损失后；（C）调用.backward导致.grad被填充到参数中；（D）此时，优化器可以访问.grad并计算参数更新

每个优化器公开2个方法：zero_grad()和step.zero_grad()，在构造函数中将传递给优化器的所有参数的grad属性归零。step()根据特定优化器实现的优化策略更新这些参数的值。

1．使用一个梯度下降优化器

让我们创建params张量并实例化一个梯度下降优化器：

# In[6]:
params = torch.tensor([1.0, 0.0], requires_grad=True)
learning_rate = 1e-5
optimizer = optim.SGD([params], lr=learning_rate)

这里SGD代表随机梯度下降。只要动量因子momentum参数设置为0.0，该参数默认值也是0.0，那么优化器本身也是一种批量梯度下降算法。“随机”一词来自这样一个事实，即梯度通常是通过对所有输入样本的一个随机子集（称为小批量）取平均值而得到的。然而，优化器不知道损失是在所有样本（批量）上评估的，还是在它们的随机子集（随机）上评估的，所以在这2种情况下，算法实际上是相同的。

不管怎样，让我们来看看我们的新优化器：

# In[7]:
t_p = model(t_u, *params)
loss = loss_fn(t_p, t_c)
loss.backward()

optimizer.step()

params

# Out[7]:
tensor([ 9.5483e-01, -8.2600e-04], requires_grad=True)

params的值在调用step()时更新，而不需要我们自己去操作！即优化器会查看params.grad并更新params，从中减去学习率乘梯度，就像我们以前手动编写的代码一样。

在将这段代码放入一个训练循环之前，我们需要把梯度归零。

如果我们在一个循环中调用前面的代码，梯度就会在每次调用backward()时在叶节点中累加，那么我们的梯度下降就会遍布整个循环区域！下面是准备循环的代码，在适当的位置即在调用backward()之前对zero_grad()的调用。

# In[8]:
params = torch.tensor([1.0, 0.0], requires_grad=True)
learning_rate = 1e-2
optimizer = optim.SGD([params], lr=learning_rate)

t_p = model(t_un, *params)
loss = loss_fn(t_p, t_c)

optimizer.zero_grad()    ⇽---  与前面一样，这个调用有些随意，它也可能是在循环的早期被调用
loss.backward()
optimizer.step()

params

# Out[8]:
tensor([1.7761, 0.1064], requires_grad=True)

完美！看看optim模块如何帮助我们抽象出特定的优化方案？我们所要做的就是向它提供一个参数列表（这个列表可能非常长，这是深度神经网络模型所需要的）。

让我们相应地更新我们的训练循环：

# In[9]:
def training_loop(n_epochs, optimizer, params, t_u, t_c):
    for epoch in range(1, n_epochs + 1):
        t_p = model(t_u, *params)
        loss = loss_fn(t_p, t_c)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if epoch % 500 == 0:
           print('Epoch %d, Loss %f' % (epoch, float(loss)))

    return params

# In[10]:
params = torch.tensor([1.0, 0.0], requires_grad=True)
learning_rate = 1e-2
optimizer = optim.SGD([params], lr=learning_rate)    ⇽---  

training_loop(
    n_epochs = 5000,
    optimizer = optimizer,
    params = params,    ⇽---  2个params都是同一个对象很重要，否则优化器不知道模型使用了什么参数
    t_u = t_un,
    t_c = t_c)

# Out[10]:
Epoch 500, Loss 7.860118
Epoch 1000, Loss 3.828538
Epoch 1500, Loss 3.092191
Epoch 2000, Loss 2.957697
Epoch 2500, Loss 2.933134
Epoch 3000, Loss 2.928648
Epoch 3500, Loss 2.927830
Epoch 4000, Loss 2.927680
Epoch 4500, Loss 2.927651
Epoch 5000, Loss 2.927648

tensor([  5.3671, -17.3012], requires_grad=True)

同样，我们得到了和之前一样的结果。这进一步证实了虽然我们知道如何手动降低梯度，但我们不再需要这样做。

2．测试其他优化器

为了测试其他优化器，我们所要做的就是实例化一个不同的优化器，如Adam，而不是SGD。代码的其余部分保持原样。

关于Adam优化器，我们将不介绍过多细节。它是一个更复杂的优化器，其中学习率是自适应设置的。此外，它对参数的缩放不太敏感——以至于我们可以使用原始的（非归一化的）输入t_u，甚至可以将学习率提高到1e-1。

# In[11]:
params = torch.tensor([1.0, 0.0], requires_grad=True)
learning_rate = 1e-1
optimizer = optim.Adam([params], lr=learning_rate)    ⇽---  新的优化器类

training_loop(
    n_epochs = 2000,
    optimizer = optimizer,
    params = params,
    t_u = t_u,    ⇽---  我们使用原始的输入t_u
    t_c = t_c)

# Out[11]:
Epoch 500, Loss 7.612903
Epoch 1000, Loss 3.086700
Epoch 1500, Loss 2.928578
Epoch 2000, Loss 2.927646

tensor([   0.5367, -17.3021], requires_grad=True)

优化器不是我们训练循环中唯一灵活的部分，现在让我们把注意力转向模型。为了在相同的数据和相同的损失上训练神经网络，我们只需要改变模型函数。在这种情况下，这样做并没有什么特别的意义，因为我们知道，将摄氏温度转换为华氏温度等于一个线性变换，但我们还是会在第6章中这样做。我们很快就会看到，神经网络允许我们去除对我们要逼近的函数形状的任意假设。即便如此，我们还是要看看神经网络是如何被训练的，即使其基础过程是高度非线性的（如用一句话描述图像，就像我们在第2章看到的那样）。

我们已经触及了许多基本概念，这些概念将使我们能够训练复杂的深度学习模型，同时了解底层是如何运行的：反向传播估计梯度、自动求导，以及使用梯度下降或其他优化器优化模型的权重，其余的主要是填补空白。

接下来，我们将顺便提一下如何分割我们的样本，因为这为学习更好地控制自动求导建立了一个“完美”的用例。

5.5.3　训练、验证和过拟合

开普勒告诉了我们一件我们还没有讨论的事情，还记得吗？他把部分数据放在一边，以便从独立的观测结果中验证他的模型。这是一件非常重要的事情，尤其是当我们采用的模型（如神经网络）可以潜在地逼近任何形状的函数时。换句话说，一个具有高度适应性的模型将倾向于使用它的许多参数来确保在数据点的损失最小，但是我们不能保证模型远离数据点后或在数据点之间运行良好。毕竟，这就是我们要求优化器做的事情：最小化数据点的损失。可以肯定的是，如果我们有独立的数据点，我们不会将其用来评估我们的损失或沿着它的负梯度下降，因为我们很快会发现，评估这些独立数据点的损失将产生比预期更高的损失。我们已经提到过这种现象，叫作过拟合。

我们应对过拟合的第1个行动就是认识到它可能会发生。为了做到这一点，开普勒在1600年就指出了，我们必须从我们的数据集（验证集）中取出一些数据点，并且只在剩下的数据点（训练集）上拟合我们的模型，如图5.12所示。然后，当我们拟合模型时，我们可以评估训练集和验证集上的损失。当我们试图决定我们是否已经很好地将模型与数据拟合时，我们必须同时考虑二者！

1．评估训练损失

训练损失会告诉我们，我们的模型是否能够完全拟合训练集，换句话说，我们的模型是否有足够的能力处理数据中的相关信息。如果我们的温度计以某种方式使用对数刻度来测量温度，那么我们的线性模型就没有机会拟合这些测量值，也不能为我们提供一个合理的摄氏温度转换值。在这种情况下，我们的训练损失（我们在训练循环中输出的损失）将在接近0的时候停止下降。

图5.12　数据产生过程、收集和使用训练数据以及独立验证数据的概念表示

深度神经网络可以潜在地近似复杂的函数，前提是神经元的数量和参数足够多。参数的数目越少，我们的网络所能近似的函数的形状就越简单。所以，规则1：如果训练损失没有减少，一种可能是因为模型对数据来说太简单了。训练损失没有减少的另一种可能性是我们的数据没有有意义的信息以让模型对输出做出解释，如果商店里的店员卖给我们一个气压计而不是温度计，即使我们使用魁北克最新的神经网络结构，也几乎不可能仅仅通过气压来预测摄氏温度。

2．推广到验证集

对于验证集呢？如果在验证集中评估的损失没有随着训练集的增加而减少，这意味着我们的模型正在改进它在训练过程中看到的样本的拟合度，但是它不能推广到这个精确数据集之外的样本。一旦我们在新的、先前未见的点上评估模型，损失函数的值就会很差。规则2：如果训练损失和验证损失发散，则表明出现了过拟合现象。

让我们稍微研究一下这个现象。回到温度计的例子，我们决定用一个更复杂的函数来拟合数据，如分段多项式或者一个非常大的神经网络。它可以生成一个蜿蜒通过数据点的模型，如图5.13所示，因为它将损失降到非常接近于0的水平。由于函数远离数据点的行为不会增加损失，因此没有什么可以让模型检查远离训练数据点的输入。

图5.13　这是过拟合的一个极端例子

那么有什么好的解决办法呢？从我们刚才说的来看，过拟合看起来确实是一个问题，它要确保模型在数据点之间的行为对我们试图近似的过程是合理的。首先，我们应该确保我们有足够的数据用于这个过程。如果我们从正弦曲线上采集数据，定期以低频率采样，我们很难拟合一个模型。

如果我们有足够的数据点，我们应该确保能够拟合训练数据的模型在数据点之间尽可能有规律。有几种方法可以实现这一点。一种方法是在损失函数中添加惩罚项，以降低模型的成本，使其表现更平稳、变化更缓慢（直到某一点）。另一种方法是在输入样本中添加噪声，人为地在训练数据样本之间创建新的数据点，并迫使模型也试图拟合这些数据点。还有其他几种方法，它们都与这两种方法有某种关系。但我们能做的最好的事情是让我们的模型更简单，至少能做的第一步是这样的。从直观的角度来看，一个更简单的模型可能不能像一个更复杂的模型那样完美地拟合训练数据，但它可能在数据点之间表现得更有规律。

我们有一些很好的折衷方法。一方面，我们需要模型有足够的能力来拟合训练集。另一方面，我们需要避免模型过拟合。因此，为神经网络模型选择合适的参数的过程分为2步：增大参数直到拟合，然后缩小参数直到停止过拟合。

我们在第12章将会看到更多拟合和过拟合的情况，我们会发现我们的模型是在拟合和过拟合之间寻求平衡。现在回到我们的例子，看看我们如何把数据分割成一个训练集和一个验证集。我们将通过同样的方式打乱t_u和t_c，然后把打乱后的张量分割成2部分。

3．分割数据集

把一个张量的元素打乱，就等于找到一种方法将其元素索引重排列，randperm()函数就是这样做的：

# In[12]:
n_samples = t_u.shape[0]
n_val = int(0.2 * n_samples)

shuffled_indices = torch.randperm(n_samples)

train_indices = shuffled_indices[:-n_val]
val_indices = shuffled_indices[-n_val:]

train_indices, val_indices    ⇽---  由于这些值是随机的，所以如果你得到的值与这里打印的值不一样，也不要感到惊讶

# Out[12]:
(tensor([9, 6, 5, 8, 4, 7, 0, 1, 3]), tensor([ 2, 10]))

我们刚刚得到了索引张量，可以使用索引张量从数据张量开始构建训练集和验证集：

# In[13]:
train_t_u = t_u[train_indices]
train_t_c = t_c[train_indices]

val_t_u = t_u[val_indices]
val_t_c = t_c[val_indices]

train_t_un = 0.1 * train_t_u
val_t_un = 0.1 * val_t_u

我们的训练循环实际上并没有改变。我们只是想额外评估每个迭代周期的验证损失，以便有机会认识到我们是否过拟合：

# In[14]:
def training_loop(n_epochs, optimizer, params, train_t_u, val_t_u,
                  train_t_c, val_t_c):
    for epoch in range(1, n_epochs + 1):
        train_t_p = model(train_t_u, *params)    ⇽---  
        train_loss = loss_fn(train_t_p, train_t_c)

        val_t_p = model(val_t_u, *params)    ⇽---  除了train_*和val_*，这2行代码是相同的
        val_loss = loss_fn(val_t_p, val_t_c)

        optimizer.zero_grad()
        train_loss.backward()    ⇽---  注意，这里没有val_loss.backward()，因为我们不想在验证集上训练模型
        optimizer.step()

        if epoch <= 3 or epoch % 500 == 0:
           print(f"Epoch {epoch}, Training loss {train_loss.item():.4f},"
                 f" Validation loss {val_loss.item():.4f}")

    return params

# In[15]:
params = torch.tensor([1.0, 0.0], requires_grad=True)
learning_rate = 1e-2
optimizer = optim.SGD([params], lr=learning_rate)

training_loop(
    n_epochs = 3000,
    optimizer = optimizer,
    params = params,
    train_t_u = train_t_un,    ⇽---  
    val_t_u = val_t_un,
    train_t_c = train_t_c,    ⇽---  由于我们再次使用SGD，我们又回到了使用归一化输入
    val_t_c = val_t_c)

# Out[15]:
Epoch 1, Training loss 66.5811, Validation loss 142.3890
Epoch 2, Training loss 38.8626, Validation loss 64.0434
Epoch 3, Training loss 33.3475, Validation loss 39.4590
Epoch 500, Training loss 7.1454, Validation loss 9.1252
Epoch 1000, Training loss 3.5940, Validation loss 5.3110
Epoch 1500, Training loss 3.0942, Validation loss 4.1611
Epoch 2000, Training loss 3.0238, Validation loss 3.7693
Epoch 2500, Training loss 3.0139, Validation loss 3.6279
Epoch 3000, Training loss 3.0125, Validation loss 3.5756

tensor([  5.1964, -16.7512], requires_grad=True)

在这里，我们对模型的处理并不是很公平。因为验证集很小，所以验证损失也只有在一定程度上才有意义。在任何情况下，我们注意到验证损失比训练损失要高，尽管不是一个数量级。我们期望模型在训练集上表现得更好，因为模型参数是由训练集塑造的。我们的主要目标是同时减少训练损失和验证损失。虽然在理想情况下，2种损失的值应大致相同，但只要验证损失与训练损失接近程度合理，我们就知道我们的模型在继续学习关于数据集的一般性知识。在图5.14中，C模型是理想的，D模型是可以接受的，而A模型根本不学习，B模型存在过拟合。我们将在第12章中看到更多关于过拟合的有意义的例子。

图5.14　在考虑训练（实线）和验证（虚线）损失时的过拟合场景。（A）由于数据中没有信息或模型没有足够的能力，导致训练损失和验证损失没有减少。（B）训练损失减少，而验证损失增加：过拟合。（C）训练损失和验证损失同步减少，当模型不处于过拟合的极限时，性能可以进一步提高。（D）训练损失和验证损失的绝对值不同，但趋势相似：过拟合得到控制

5.5.4　自动求导更新及关闭

从前面的训练循环中，我们可以了解到我们只对train_loss调用了backward()，因此，误差只会在训练集上反向传播。验证集用于提供一份独立的模型评估，评估模型对未用于训练的数据的输出的准确性。

好奇的读者此时会有一个小小的疑问，那就是对模型进行了2次评估，一次在train_t_u上，一次在val_t_u上，然后才调用backward()，这难道不会让自动求导“迷惑”吗？难道backward()不会受到在验证集上传递时生成的值的影响吗？

幸运的是，情况并非如此。训练循环中的第1行对train_t_u上的模型进行评估，以生成train_t_p，然后从train_t_p评估train_loss。这将创建一个计算图，将train_t_u、train_t_p和train_loss连接起来。当模型再次在val_t_u上求值时，将生成val_t_p和val_loss。在本例中，将创建一个单独的计算图，将val_t_u、val_t_p和val_loss连接起来。将单独的张量经过相同的函数，即model和loss_fn()运算，得到单独的计算图，如图5.15所示。

图5.15　通过一张图显示了对于2个损失，其中一个损失调用了backward()之后，梯度是如何传播的

图5.15中的A、B、C唯一相同的是张量的参数，当我们在train_loss上调用backward()时，我们在第1张图上运行backward()。换句话说，我们基于train_t_u生成的计算结果，将train_loss对参数的导数进行累加。

如果我们对val_loss误调用backward()，则会累加val_loss相对同一叶节点上的参数的导数。还记得zero_grad()吗？每次调用backward()时，梯度都是相互累加的，除非我们显式地将梯度归零。嗯，这里会发生一些非常相似的事情：在val_loss上调用backward()，在train_loss.backward()调用生成的结果之上，将导致梯度在params张量中累加。在这种情况下，我们将在整个数据集上（训练集和验证集）有效地训练我们的模型，因为梯度将依赖于这二者，非常有趣。

这里还有一个需要讨论的因素，既然我们从来没有在val_loss上调用backward()，那么为什么要首先构建这个图呢？实际上，我们可以只将model()和loss_fn()作为普通函数调用，而不用跟踪计算结果。无论如何优化，构建自动求导图都会带来额外的开销，在验证过程中我们完全可以放弃这些开销，特别是当模型有数百万个参数时。为了解决这个问题，PyTorch允许我们在不需要的时候关闭自动求导，使用上下文管理器torch.no_grad()[11]。在这个小问题上，我们并不会看到构建自动求导图在速度或内存开销方面有任何有意义的优势。不过，对于更大的模型，这些差异会累加起来。我们可以通过检查val_loss张量上的requires_grad属性的值来确保这是有效的：

# In[16]:
def training_loop(n_epochs, optimizer, params, train_t_u, val_t_u,
                  train_t_c, val_t_c):
    for epoch in range(1, n_epochs + 1):
        train_t_p = model(train_t_u, *params)
        train_loss = loss_fn(train_t_p, train_t_c)

        with torch.no_grad():    ⇽---  这里是上下文管理器
            val_t_p = model(val_t_u, *params)
            val_loss = loss_fn(val_t_p, val_t_c)
            assert val_loss.requires_grad == False    ⇽---  检查在此块中输出的requires_grad属性的值是否被强制设为False

        optimizer.zero_grad()
        train_loss.backward()
        optimizer.step()

使用相关的set_grad_enabled()，我们还可以根据一个布尔表达式设定代码运行时启用或禁用自动求导的条件，典型的条件是我们是在训练模式还是推理模式下运行。例如，我们可以定义一个calc_forward()方法，它接收数据作为输入，根据一个布尔类型的参数决定model()和loss_fn()是否会进行自动求导。

# In[17]:
def calc_forward(t_u, t_c, is_train):
    with torch.set_grad_enabled(is_train):
        t_p = model(t_u, *params)
        loss = loss_fn(t_p, t_c)
    return loss

本文摘自《PyTorch深度学习实战》

PyTorch核心开发者教你用PyTorch创建神经网络和深度学习系统的实践指南，基于Python3.6，提供源代码下载，PyTorch联合创作者作序推荐。

虽然很多深度学习工具都使用Python，但PyTorch 库是真正具备Python 风格的。对于任何了解NumPy 和scikit-learn 等工具的人来说，上手PyTorch 轻而易举。PyTorch 在不牺牲高级特性的情况下简化了深度学习，它非常适合构建快速模型，并且可以平稳地从个人应用扩展到企业级应用。由于像苹果、Facebook和摩根大通这样的公司都使用PyTorch，所以当你掌握了PyTorth，就会拥有更多的职业选择。
本书是教你使用 PyTorch 创建神经网络和深度学习系统的实用指南。它帮助读者快速从零开始构建一个真实示例：肿瘤图像分类器。在此过程中，它涵盖了整个深度学习管道的关键实践，包括 PyTorch张量 API、用 Python 加载数据、监控训练以及将结果进行可视化展示。

本书主要内容：
（1）训练深层神经网络；
（2）实现模块和损失函数；
（3）使用 PyTorch Hub 预先训练的模型；
（4）探索在 Jupyter Notebooks 中编写示例代码。

本书适用于对深度学习感兴趣的 Python 程序员。了解深度学习的基础知识对阅读本书有一定的帮助，但读者无须具有使用 PyTorch 或其他深度学习框架的经验。

你可能感兴趣的:(pytorch,深度学习,python)

Python3 利用正则转化参数化表达式（qbit）正则表达式
前言技术栈Python3.11regex2023.5.5案例测试代码#encoding:utf-8#author:qbit#date:2024-04-24#summary:利用正则转换参数化表达式importregexline1='owner=x_111ANDdoc_type=%x%_222ORauthor=x_333ORorgan=x_444AND(NOTpub_year=x_555)'dic=
基于SpringBoot的物业管理系统计算机学姐 Java精选实战项目源码 SpringBoot源码 Vue源码 spring boot 后端 java mysql vue.js spring intellij-idea
作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：Java精选实战项目源码、Python精选实战项目源码、大数据精选实战项目源码系统展示【2025最新】基于Java+SpringBoot+Vu
Javascript(turfjs)等值线图绘制前端空间计算mapbox
使用气象、环境类空间数据绘制等值线通常是由NCL、Python来做，在一些场景中：你只是想在WEB端做一些简单的绘制你的后端只有Node.js环境你纯粹是个前端工程师你也许需要使用纯Javascript来做这件事。本文尝试根据空间中的一组散点来绘制等值线图（或色斑图）。1.准备工作turfjs，空间分析（geospatialanalysis）工具包，支持在浏览器和Node.js环境中运行，空间数据
Python入门：3.Python的输入和输出格式化平凡程序猿~ Python python 开发语言
引言在Python编程中，输入与输出是程序与用户交互的核心部分。而输出格式化更是对程序表达能力的极大增强，可以让结果以清晰、美观且易读的方式呈现给用户。本文将深入探讨Python的输入与输出操作，特别是如何使用格式化方法来提升代码质量和可读性。一、输入操作Python提供了简单而强大的输入功能，通过内置函数input()可以从用户那里获取字符串形式的输入。以下是一些基本用法和注意事项：1.基本用法
后端开发技术后端
在当今数字化和互联网化的时代背景下，后端开发技术作为连接前端和用户的重要桥梁，正以前所未有的速度发展和演进。后端开发的核心技术通常包括主流服务器端语言如Java、Python、Node.js等；关系型或非关系型数据库如MySQL、MongoDB等；容器编排工具如Docker、Kubernetes等。以Python为例，其简洁明了的语法受众多开发者青睐，适合快速原型开发和敏捷项目交付。随着云计算的普
python头歌实验五作业_3.1(hbut) 树先生. python 开发语言
第1关：判断火车票座位##第1关：判断火车票座位seat=input()try:letter=seat[-1]line=int(seat[:len(seat)-1])ifline17or(letternotin['A','a','B','b','C','c','D','d','F','f']):print("输入错误")elifletterin['A','a','F','f']:print("窗口
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后