Sonhhxg_柒

【Pytorch Lighting】第 10 章：扩展和管理培训

大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流

个人主页－Sonhhxg_柒的博客_CSDN博客

欢迎各位→点赞 + 收藏⭐️ + 留言

系列专栏 - 机器学习【ML】自然语言处理【NLP】深度学习【DL】

foreword

✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。

如果你对这个系列感兴趣的话，可以关注订阅哟

文章目录

技术要求

管理培训

保存模型超参数

解决方案

高效调试

解决方案

使用 TensorBoard 监控训练损失

解决方案

扩大培训

使用多个工人加速模型训练

解决方案

GPU/TPU 训练

解决方案

混合精度训练/16位训练

解决方案

控制训练

使用云时保存模型检查点

解决方案

更改检查点功能的默认行为

解决方案

从保存的检查点恢复训练

解决方案

使用云时保存下载和组装的数据

解决方案

进一步阅读

概括

到目前为止，我们已经在深度学习( DL ) 领域踏上了一段激动人心的旅程。我们已经学会了如何识别图像，如何创建新图像或生成新文本，以及如何在没有完全标记集的情况下训练机器。一个公开的秘密是，为 DL 模型获得良好的结果需要大量的计算能力，通常需要图形处理单元( GPU ) 的帮助。自从数据科学家不得不手动将训练分配到 GPU 的每个节点时，我们已经走了很长一段路。PyTorch Lightning 混淆了与管理底层硬件或将训练下推到 GPU 相关的大部分复杂性。

在前面的章节中，我们已经通过蛮力推倒了训练。但是，当您必须处理大规模数据的大量培训工作时，这样做是不切实际的。在本章中，我们将对大规模训练模型和管理训练所面临的挑战进行细致入微的看法。我们将描述一些常见的陷阱以及如何避免它们的提示和技巧。我们还将描述如何设置您的实验，如何使模型训练对底层硬件中的问题具有弹性，以及如何利用硬件来提高训练效率等。将本章视为您更复杂的培训需求的现成估算器。

在本章中，我们将介绍以下主题以帮助训练 DL 模型：

管理培训
扩大培训
控制训练

技术要求

在本章中，我们将使用 PyTorch Lightning 1.5.2 版本。请使用以下命令安装此版本

管理培训

在本节中，我们将介绍您在使用过程中可能遇到的一些常见挑战管理 DL 模型的训练。这包括在保存模型参数和高效调试模型逻辑方面进行故障排除。

保存模型超参数

有通常需要保存模型的超参数。一些原因是可重复性、一致性以及某些模型的网络架构对超参数极为敏感。

在不止一种情况下，您可能会发现自己无法从检查点加载模型。LightningModule类的load_from_checkpoint方法失败并出现错误。

解决方案

检查点只不过是模型的保存状态。检查点包含模型使用的所有参数的精确值。但是，默认情况下，传递给__init__模型的超参数不会保存在检查点中。在LightningModule类的__init__中调用self.save_hyperparameters 也会将参数的名称和值保存在检查点中。

检查您是否将其他参数（例如学习率）传递给LightningModule类的__init__模型。如果是，那么您需要确保这些参数的值也被捕获在您的检查点中。为此，请在LightningModule类的__init__中调用self.save_hyperparameters 。

以下代码片段显示了我们如何在实现的卷积神经网络-循环神经网络( CNN-RNN ) 级联模型中使用self.save_hyperparameters作为第 7 章中的 CNN -Long Short-Term Memory ( LSTM ) 架构：

def __init__(self, cnn_embdng_sz, lstm_embdng_sz, lstm_hidden_lyr_sz, lstm_vocab_sz, lstm_num_lyrs, max_seq_len=20):
    super(HybridModel, self).__init__()
    """CNN"""
    resnet = models.resnet152(pretrained=False)
    module_list = list(resnet.children())[:-1]
    self.cnn_resnet = nn.Sequential(*module_list)
    self.cnn_linear = nn.Linear(resnet.fc.in_features,
                  cnn_embdng_sz)
    self.cnn_batch_norm = nn.BatchNorm1d(cnn_embdng_sz,
                       momentum=0.01)

    """LSTM"""
    self.lstm_embdng_lyr = nn.Embedding(lstm_vocab_sz,
                      lstm_embdng_sz)
    self.lstm_lyr = nn.LSTM(lstm_embdng_sz, lstm_hidden_lyr_sz,
                lstm_num_lyrs, batch_first=True)
   self.lstm_linear = nn.Linear(lstm_hidden_lyr_sz,
                   lstm_vocab_sz)
    self.max_seq_len = max_seq_len
    self.save_hyperparameters()

在前面代码片段，__init__中的最后一行调用self.save_hyperparameters。

高效调试

实验使用和调试用 PyTorch 编写的 DL 模型可能是一个非常耗时的过程，原因如下：

使用大量数据训练 DL 模型。培训过程可能需要数小时或数天才能运行，甚至在 GPU 或张量处理单元( TPU )等高性能硬件上。使用多批数据和时期迭代地执行训练。这种笨拙的训练-验证-测试循环可能会导致编程逻辑中的错误出现延迟。
Python 不是编译语言；它是一种解释性语言。诸如拼写错误和缺少导入语句之类的语法错误不会像在 C 和 C++ 等编译语言中那样事先被捕获。只有在运行该特定代码行时才会出现此类错误Python 虚拟机。

PyTorch 闪电可以吗有助于快速发现编程错误，以节省纠正错误后重复重新运行所浪费的时间？

解决方案

PyTorch Lightning 框架提供了不同的参数，可以在模型训练期间传递给Trainer模块，以减少调试时间。这里是其中的一些：

limit_train_batches：这个可以将参数传递给Trainer以控制要用于训练时期的数据子集。以下代码片段提供了一个示例：

import pytorch_lightning as pl
...
# use only 10% of the training data for each epoch
trainer = pl.Trainer(limit_train_batches=0.1)
# use only 10 batches per epoch
trainer = pl.Trainer(limit_train_batches=10)

此设置对于调试在一个纪元之后发生的一些问题很有用。它节省了时间，因为它加快了一个 epoch 的运行时间。

请注意，有类似的参数，分别命名为limit_test_batches和limit_val_batches用于测试和验证数据。

fast_dev_run：这个参数限制训练、验证和测试批次以快速检查错误。与limit_train / val / test_batches参数不同，该参数禁用检查点、回调、记录器等，并且只运行一个 epoch。所以，顾名思义，这个参数应该只在用于快速调试的开发。您可以在以下代码片段中看到它的实际效果：
```
import pytorch_lightning as pl
...
# runs 5 train, val, test batches and then terminate
trainer = pl.Trainer(fast_dev_run=5)
# run 1 train, val, test batch and terminate
trainer = pl.Trainer(fast_dev_run=True)
```
max_epochs：这个参数限制 epoch 的数量，一旦达到max_epochs参数的数量，训练就会终止。

以下代码片段显示了我们在训练 CNN 模型时如何使用此参数以将训练限制为 100 个 epoch：

trainer = pl.Trainer(max_epochs=100, gpus=-1)

使用 TensorBoard 监控训练损失

这是重要的是要确保在整个训练过程中训练损失在不收敛的情况下收敛陷入局部最小值。如果不收敛，则需要调整学习率、批量大小或优化器等参数并重新开始训练过程。我们如何可视化损失曲线来监控损失是否在不断减少？

解决方案

默认情况下，PyTorch Lightning 支持TensorBoard框架，该框架提供跟踪和可视化指标，例如训练损失。您可以通过调用LightningModule代码中的log()方法来保存在每个批次和 epoch 执行期间计算的损失。例如，下面的代码片段展示了我们如何在第 7 章，半监督学习中在model.py 中定义的HybridModel类的training_step方法的定义中注册损失：

def training_step(self, batch, batch_idx):
    loss_criterion = nn.CrossEntropyLoss()
    imgs, caps, lens = batch
    outputs = self(imgs, caps, lens)
    targets = pk_pdd_seq(caps, lens, batch_first=True)[0]
    loss = loss_criterion(outputs, targets)
    self.log('train_loss', loss, on_epoch=True)
    return loss

这调用self.log 会在内部保存损失值，为此，如前所述，PyTorch Lightning 默认使用 TensorBoard 框架。我们还为这个损失指标命名：train_loss。on_epoch =True参数指示 PyTorch Lightning 框架不仅记录每个批次的损失，还记录每个时期的损失。

我们已经描述了对前面损失度量的跟踪。接下来，我们描述损失度量的可视化。在本节的其余部分，我们将使用tensorboard.ipynb笔记本。从 notebook 中可以看出，我们只需将 TensorBoard 指向模型训练期间 PyTorch Lightning 框架创建的 Lightning_logs 目录的位置。因此，从Lightning_logs的父目录启动tensorboard.ipynb笔记本。这是执行可视化技巧的代码：

%load_ext tensorboard
%tensorboard --logdir "./lightning_logs"

在前面的代码片段中，我们首先加载tensorboard扩展，然后使用--logdir命令行参数向其提供Lightning_logs目录的位置。

执行时在笔记本单元格中，TensorBoard 框架在单元格下方启动，如以下屏幕截图所示：

图 10.1 – 用于可视化损失的 TensorBoard

重要的提示

TensorBoard 框架可能需要几秒钟才能显示出来，特别是如果您在模型训练期间已经运行了数千个 epoch。TensorBoard 加载所有指标数据需要更多时间。

未来回到前面代码片段中training_step方法定义中调用self.log时用于损失度量的名称train_loss ，TensorBoard 显示两个损失图表。向下滚动到 TensorBoard 中的epoch和hp_metric图表下方，然后展开以下屏幕截图所示的train_loss_epoch和train_loss_step选项卡：

图 10.2 – TensorBoard 损失图表选项卡

笔记PyTorch 闪电框架会自动将_epoch和_step附加到我们在代码中提供的名称train_loss中，以区分 epoch 指标和 step 指标。这是因为我们要求框架记录每个 epoch 的损失以及通过将on_epoch=True参数传递给self.log前面代码片段中的每一步。

以下屏幕截图显示了两个损失图表：

图 10.3 – TensorBoard 损失图表

最后，注意不同的颜色会自动用于不同的版本。从上图左下角可以看出，version_0 使用了橙色，version_1使用了蓝色。如果您的训练过程跨越多个版本，那么您可以选择显示这些版本中的一个或多个版本的指标，方法是选中这些版本号旁边的复选框或单选按钮。为了例如，以下屏幕截图中的训练共有 8 个版本。我们对版本 0 到 5 使用了0.001的学习率值，但是由于训练没有收敛，然后我们将学习率值降低到0.0003并重新开始训练，结果创建了后续版本。我们在以下屏幕截图中仅选择了 6、7 和 8 来可视化学习率值为0.0003的损失曲线：

图 10.4 – TensorBoard 选择版本

扩大培训

扩大训练要求我们加快大量数据的训练过程，更好地利用 GPU 和 TPU。在本节中，我们将介绍一些有关如何有效使用 PyTorch Lightning 中的规定来完成此任务的技巧。

使用多个工人加速模型训练

怎么可能PyTorch Lightning 框架有助于加快模型训练？要知道的一个有用参数是num_workers，它来自 PyTorch，PyTorch Lightning 在此基础上构建，提供有关工人数量的建议。

解决方案

PyTorch Lightning 框架提供了许多用于加速模型训练的规定，例如：

您可以为num_workers参数设置一个非零值以加快模型训练。以下代码片段提供了一个示例：
```
import torch.utils.data as data
...
dataloader = data.DataLoader(num_workers=4, ...)
```

最佳num_workers值取决于批量大小和您的配置机器。一般准则是从等于计算机上中央处理单元( CPU ) 核心数的数量开始。正如在https://pytorch-lightning.readthedocs.io/en/stable/guides/speed.html#num-workers找到的文档中提到的，“最好的办法是慢慢增加 num_workers ，一旦看到就停止你的训练速度没有再提高。 ”

请注意，PyTorch Lightning 提供了有关num_workers的建议，如下面的输出截图所示，当模型训练在DataLoader上使用num_workers=1参数运行时发出的输出：

图 10.5 – 使用 num_workers=1 参数运行的模型训练输出

如前面屏幕截图中突出显示的文本所示，框架会发出警告。以下是前面屏幕截图中显示的用户警告旁边的全文：

"UserWarning: The dataloader, train dataloader, does not have many workers which may be a bottleneck. Consider increasing the value of the `num_workers` argument` (try 4 which is the number of cpus on this machine) in the `DataLoader` init to improve performance."

注意Jupyter 笔记本环境Google Colaboratory ( Google Colab )、Amazon SageMaker 和 IBM Watson Studio等允许您为 Jupyter notebook 设置底层硬件的配置。

例如，在 Google Colab 中，在Change Runtime Type设置中，您可以将Runtime shape字段设置为High-RAM而不是Standard，以便您可以将num_workers参数的值增加到DataLoader。

GPU/TPU 训练

一个 CPU 是通常不足以达到模型训练所需的速度。使用 GPU 是一种选择。如果您使用的是 Google Cloud 或 Colab 等基于笔记本的服务，那么 TPU 也是一种选择。这是专为 DL 模型设计的处理单元。现在让我们看看 PyTorch Lightning 框架如何帮助利用 GPU/TPU 硬件。

解决方案

如果您运行 Jupyter notebook 的机器的底层硬件有 GPU/TPU，那么您应该使用它来加速训练。PyTorch Lightning 框架通过简单更改作为参数传递给Trainer的标志，可以非常轻松地切换到 GPU/TPU 。以下代码片段中提供了一个示例：

import pytorch_lightning as pl
...
# use 2 gpus
trainer = pl.Trainer(gpus=2)
# use all gpus
trainer = pl.Trainer(gpus=-1)

您可以使用传递给Trainer的gpus参数来指定 GPU 的数量。你可以将其设置为-1以指定您要使用所有 GPU。以下代码片段显示了我们在训练 CNN 模型时如何使用此参数：

trainer = pl.Trainer(max_epochs=100, gpus=-1)

对于 TPU 训练，请使用Trainer的tpu_cores参数，如下所示：

# use 1 TPU core
trainer = Trainer(tpu_cores=1)
# use 4 TPU cores
trainer = Trainer(tpu_cores=4)

请注意，在 Google Colab 中，您可以更改运行时类型以将硬件加速器设置为GPU或TPU而不是None。

以下屏幕截图显示了Google Colab 中的笔记本设置弹出对话框：

图 10.6 – Google Colab 中的笔记本设置

这将帮助您在 Google Colab 上启用 GPU 服务。

混合精度训练/16位训练

深度学习模型例如 CNN 将高维对象（例如图像）转换为低维对象（例如张量）。换句话说，我们不需要精确的计算，如果我们可以牺牲一点精度，那么我们可以在速度上得到很大的提升。TPU 提高性能的方法之一就是使用这个概念。但是，对于非 TPU 环境，此功能不可用。

利用更好的正如我们在上一节中讨论的那样，GPU 或多 CPU 等处理单元显着提高了训练性能。但是我们还可以在框架级别启用较低的精度吗？PyTorch Lightning 允许您通过简单地将名为precision的附加参数传递给Trainer模块来使用混合精度训练。

解决方案

混合精度训练使用两种不同位数的浮点数——较高的 32 位和较低的 16 位。这减少了模型训练期间的内存占用，进而提高了训练性能。

PyTorch Lightning 支持 CPU 和 GPU 以及 TPU 的混合精度训练。以下示例显示了如何将精度选项与gpus选项一起使用：

import pytorch_lightning as pl
...
trainer = pl.Trainer(gpus=-1, precision=16)

这使得模型可以更快地训练，并且性能提升可以与将 epoch 训练时间减少一半一样大。在第 7 章中，我们看到通过使用 16 位精度，我们将 CNN 模型的训练速度提高了大约 30-40%。

控制训练

有通常需要有一个审计、平衡和控制机制在训练过程中。想象一下，您正在训练一个模型 1,000 个 epoch，而网络故障会在 500 个 epoch 后导致中断。如何从某个点恢复训练，同时确保不会丢失所有进度，或从云环境中保存模型检查点？让我们看看如何应对这些通常是工程师生活中不可或缺的实际挑战。

使用云时保存模型检查点

笔记本托管在 Google Colab 等云环境中具有资源限制和空闲超时期限。如果在模型开发过程中超出这些限制，则笔记本电脑将被停用。由于云环境固有的弹性（这是云的价值主张之一），当笔记本停用时，底层计算和存储资源将被停用。如果您刷新已停用笔记本的浏览器窗口，笔记本通常会使用全新的计算/存储资源重新启动。

在云环境中托管的笔记本由于资源限制或空闲超时时间而停用后，将无法再访问检查点目录和文件。解决此问题的一种方法是使用已安装的驱动器。

解决方案

正如我们之前提到的，PyTorch Lightning 会自动将最后一个训练 epoch 的状态保存在一个检查点中，该检查点默认保存在当前工作目录中。但是，启动笔记本的机器的当前工作目录不是在云笔记本中保存检查点的好选择，因为它们的底层基础设施具有瞬态性，如上一节所述。在这样的环境中，云提供商通常会提供可以从笔记本电脑访问的持久存储。

接下来，我们将描述如何在 Google Colab 中使用 Google Drive 持久存储，它只不过是一个云笔记本。我们将按以下步骤进行：

首先，我们将 Google Drive 导入到我们的 notebook 中，如下：
```
from google.colab import drive
drive.mount('/content/gdrive')
```
然后，我们可以使用以/content/gdrive/MyDrive开头的路径来引用 Google Drive 中的目录。请注意，在执行前面的drive.mount()语句期间，将提示您进行身份验证，如以下屏幕截图所示：

图 10.7 – 输入授权码

单击连接到 Google Drive 按钮。在下一个弹出窗口中选择您的帐户。然后，在下一个弹出窗口中单击允许，如下所示：。

图 10.8 – 允许访问 Google Drive

然后，使用PyTorch Lightning Trainer模块的default_root_dir参数将检查点路径更改为您的 Google Drive。例如，以下代码将检查点存储在 Google Drive 的Colab Notebooks/cnn目录中。它的完整路径是/content/gdrive/MyDrive/Colab Notebooks/cnn，如以下代码片段所示：
```
import pytorch_lightning as pl
...
ckpt_dir = "/content/gdrive/MyDrive/Colab Notebooks/cnn"
trainer = pl.Trainer(default_root_dir=ckpt_dir,
                     max_epochs=100)
```

在/content/gdrive/MyDrive/Colab Notebooks/cnn目录中，检查点存储在Lightning_logs/version_/checkpoints目录结构下。

更改检查点功能的默认行为

你怎么去关于更改 PyTorch Lightning 框架的检查点功能的默认行为？

解决方案

PyTorch Lightning 框架默认自动将最后一个训练 epoch 的状态保存到当前工作目录。为了让用户改变这种默认行为，框架在 pytorch_lightning.callbacks 中提供了一个名为ModelCheckpoint的类。我们将在本节中描述一些此类自定义的示例，如下所示：

首先，您可以选择保存每第n个 epoch 的状态，而不是保存最后一个训练 epoch 的状态，如下所示：

import pytorch_lightning as pl
...
ckpt_callback = pl .callbacks.ModelCheckpoint(every_n_epochs=10)
trainer = pl.Trainer(callbacks=[ckpt_callback],
                     max_epochs=100)

传递给ModelCheckpoint的every_n_epochs参数指定保存检查点的周期。我们将值10用于前面代码片段中的every_n_epochs参数。然后使用回调数组参数将ModelCheckpoint传递给Trainer 。前面的代码会将检查点保存在当前工作目录中，但当然，您可以使用传递给Trainer的default_root_dir参数更改该位置，如下所示：
```
import pytorch_lightning as pl
...
ckpt_dir = "/content/gdrive/MyDrive/Colab Notebooks/cnn"
ckpt_callback = pl .callbacks.ModelCheckpoint(every_n_epochs=10)
trainer = pl.Trainer(default_root_dir=ckpt_dir,
                     callbacks=[ckpt_callback],
                     max_epochs=100)
```
这个定制只存储一个 10 倍数的 epoch 之后的最新检查点——也就是说，它在第 10个epoch 之后保存一个检查点，然后用第 20个epoch 之后的检查点替换它，然后在第 30个epoch之后替换它，等等。
但是，如果您想保存五个最近的检查点而不是一个，或者如果您想保存所有检查点怎么办？
您可能希望保存多个检查点，以便以后对检查点执行一些比较分析。您可以使用 ModelCheckpoint 的save_top_k参数来完成此操作。框架默认只存储最新的检查点，因为save_top_k参数的默认值为1。

您可以将save_top_k设置为-1以保存所有检查点。当它与every_n_epochs=10参数一起使用时，将保存所有 10 的倍数的检查点，如下所示：

import pytorch_lightning as pl
...
ckpt_dir = "/content/gdrive/MyDrive/Colab Notebooks/cnn"
ckpt_callback = pl .callbacks.ModelCheckpoint(every_n_epochs=10,
                                save_top_k=-1)
trainer = pl.Trainer(default_root_dir=ckpt_dir,
                     callbacks=[ckpt_callback],
                     max_epochs=100)

以下屏幕截图显示所有 10 的倍数的检查点均已保存到 Google 云端硬盘。请注意，epoch 编号从0开始，因此以epoch=9开头的检查点用于第 10个epoch，以epoch=19开头的检查点用于第 20个epoch，依此类推：

图 10.9 – 10 的倍数的所有检查点

请注意，您还可以使用ModelCheckpoint对象的best_model_path和best_model_score属性来访问最佳模型检查点。

从保存的检查点恢复训练

唠叨之一DL 模型的一个方面是它们需要很长时间（通常是几天）才能完成训练过程。在此期间，如何查看任何中间结果？或者，如果训练过程因失败而中断，如何从保存的检查点恢复训练？

解决方案

如本章所述，托管在 Google Colab 等云环境中的笔记本具有资源限制和空闲超时期限。如果在模型开发过程中超过了这些限制，则 notebook 将被停用，其底层文件系统将无法访问。在这种情况下，您应该使用云提供商的持久存储来保存检查点；例如，使用 Google Colab 时使用 Google Drive 存储检查点。

但即便如此，训练也可能由于超时或由于底层基础设施中的某些问题、程序逻辑中的问题等而中断。在这种情况下，PyTorch Lightning 框架允许您使用Trainer的ckpt_path参数恢复训练。这对于 DL 算法很重要，因为它们通常需要对大量数据进行长时间的训练，因此有助于避免浪费时间重新训练模型。

以下代码使用保存的检查点来恢复模型训练：

import pytorch_lightning as pl
...
ckpt_dir = "/content/gdrive/MyDrive/Colab Notebooks/cnn"
latest_ckpt = "/content/gdrive/MyDrive/Colab Notebooks/cnn/lightning_logs/version_4/checkpoints/epoch=39-step=1279.ckpt"
ckpt_callback = pl .callbacks.ModelCheckpoint(every_n_epochs=10, save_top_k=-1)
trainer = pl.Trainer(default_root_dir=ckpt_dir, callbacks=[ckpt_callback], ckpt_path=latest_ckpt, max_epochs=100)

这个代码片段使用Trainer的default_root_dir参数指定 Google Drive 中保存检查点的位置。此外，ModelCheckpoint类被赋予every_n_epochs和save_top_k参数，以便保存对应于所有 10 倍数的 epoch 的检查点。最后但同样重要的是，代码使用epoch=39-step=1279.ckpt（对应于第 40个epoch，因为 epoch 编号从 0 开始）作为Trainer的ckpt_path参数的值。

以下屏幕截图显示了 PyTorch Lightning 框架如何从检查点文件恢复状态（如输出的第一行中突出显示的那样），以便可以在第 40个epoch 之后恢复训练：

图 10.10 – 恢复训练

如进度条开始前屏幕截图的最后一行所示，训练在第 40 个 epoch 恢复（同样，实际上是第 41 个epoch，因为 epoch 编号从 0 开始）。

注意我们用于恢复训练的检查点的位置：lightning_logs/version_4/checkpoints/epoch=39-step=1279.ckpt。它是version_4。因此，后续检查点 50 到 100 将保存在version_5目录下，如下图所示：

图 10.11 – 保存在 version_5 目录下的检查点 50 到 100

这有助于我们跟踪所有保存的检查点作为故障安全机制，并使用不同时间范围内的模型来比较模型训练结果。

使用云时保存下载和组装的数据

这用于训练 DL 模型的数据的下载和组装通常是一次性处理步骤。诚然，有时您可能会意识到您需要进一步清理已处理的数据或获取更多数据以创建更好的模型，但数据不会超过某个点而发生变化——它必须被冻结。

另一方面，模型训练可能需要几天甚至几周才能完成。它涉及对数据进行数千或数十万次迭代，调整模型的超参数，并重新启动或恢复训练以通过避免局部最小值来实现收敛。我们如何确保不会不必要地重做数据处理步骤？我们如何在整个训练过程中提供相同的处理数据副本？

解决方案

您可以捆绑处理过的数据并将其保存，然后在整个模型训练过程中取消捆绑并使用数据。这在云笔记本环境中尤为重要，因为其底层基础架构具有瞬态特性，如前一节所述。让我们通过一个例子来学习；以下是如何修改我们在第 7 章，半监督学习中使用的笔记本：

在第 7 章“半监督学习”中，我们使用了三种不同的 notebook 进行数据处理：download_data.ipynb、filter_data.ipynb和process_data.ipynb。第二个和第三个笔记本从前一个笔记本的结束点开始和拾取。他们假设上一个笔记本中的数据位于当前工作目录中。换句话说，当前工作目录充当三个笔记本之间的公共上下文，如果笔记本是在云环境中启动的，情况肯定不是这样。这三款笔记本电脑都将分配有自己独立的计算和存储基础设施。以下要点描述了如何解决此问题。
您可以将三个笔记本组合在一起。从download_data.ipynb笔记本的内容开始，然后附加来自filter_data.ipynb笔记本的单元格，然后附加来自process_data.ipynb笔记本的单元格。让我们将这个合成的笔记本简称为data.ipynb；它会下载 COCO 2017 数据，对其进行过滤、调整图像大小并创建词汇表。
将以下代码单元附加到data.ipynb笔记本以捆绑处理后的数据：
```
!tar cvf coco_data_filtered.tar coco_data
!gzip coco_data_filtered.tar
```

前面的代码创建了一个名为coco_data_filtered.tar.gz的包并将其存储在当前工作目录中。

最后，将以下代码单元附加到data.ipynb笔记本，以将coco_data_filtered.tar.gz包存储在运行data.ipynb笔记本的云基础架构之外的持久存储中。该代码使用已安装的 Google Drive 来保存数据包，但您可以改为使用云提供商支持的任何其他持久性存储：
```
from google.colab import drive
drive.mount('/content/gdrive')
!cp ./coco_data_filtered.tar.gz /content/gdrive/MyDrive/Colab\ Notebooks/cnn-rnn
```

先上代码将 Google Drive 挂载到/content/gdrive。然后，它将数据包保存在Colab\ Notebooks文件夹内名为cnn-rnn的文件夹中。

重要的提示

在执行前面的drive.mount()语句期间，系统会提示您通过 Google 进行身份验证并输入授权码，如本章前一节所述。

进一步阅读

我们已经提到了一些我们发现对常见故障排除有用的关键提示和技巧。您可以随时参考加速模型训练文档以获取有关如何加速训练或其他主题的更多详细信息。这是文档的链接：https ://pytorch-lightning.readthedocs.io/en/latest/guides/speed.html 。

我们已经描述了 PyTorch Lightning 如何默认支持 TensorBoard 日志框架。这是 TensorBoard 网站的链接：https ://www.tensorflow.org/tensorboard 。

此外，PyTorch Lightning 支持 CometLogger、CSVLogger、MLflowLogger 和其他日志记录框架。您可以参考Logging文档，了解如何启用其他记录器类型的详细信息。这是文档的链接：https ://pytorch-lightning.readthedocs.io/en/stable/extensions/logging.html 。

概括

我们开始本书的初衷只是对 DL 和 PyTorch Lightning 是什么感到好奇。任何深度学习新手或 PyTorch Lightning 的好奇初学者都可以尝试简单的图像识别模型，然后通过学习迁移学习( TL ) 等技能或如何利用其他预训练有素的架构。我们继续利用 PyTorch Lightning 框架来处理图像识别模型以及自然语言处理( NLP ) 模型、时间序列和其他传统机器学习( ML ) 挑战。在此过程中，我们了解了 RNN、LSTM 和 Transformers。

在本书的下一部分中，我们探索了奇异的 DL 模型，例如生成对抗网络( GAN )、半监督学习和自监督学习，它们扩展了 ML 领域的可能性，而这些不仅仅是先进的模型，但创造艺术的超酷方式和很多乐趣。我们在最后一节中总结了这本书，介绍了将 DL 模型投入生产和常见故障排除技术以扩展和管理大型培训工作负载。

虽然这本书的目的是让那些正在开始他们的 DL 之旅的人开始并运行，但我们希望那些来自其他框架的人也发现这是一种快速而简单地过渡到 PyTorch Lightning 的方法。

虽然这一章我们的旅程可能即将结束，但您的深度学习之旅才刚刚开始！在人工智能( AI ) 领域，我们仍有许多未解决的问题需要开发新的算法，还有许多未解决的问题需要设计新的架构。未来几年将是成为专注于深度学习的数据科学家最激动人心的时刻！使用 PyTorch Lightning 等工具，您可以专注于做一些很酷的事情，例如研究新方法或构建新模型，同时让框架为您完成繁重的工作。尽管过去几年与 DL 相关的所有浮华、魅力和炒作，ML 社区都几乎没有到达大本营。我们仍处于登顶山峰的早期阶段AGI（Artificial General Intelligence），从AGI顶层的角度来看，将是一台真正可以与人类智能和智力相媲美的机器。成为 DL 社区的一员将使您成为改变人类的冒险的一部分！

你可能感兴趣的:(DL,with,Pytorch,Lighting,pytorch,深度学习,人工智能)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
ARM驱动学习之4小结 JT灬新一嵌入式 C++arm开发学习 linux
ARM驱动学习之4小结#include#include#include#include#include#defineDEVICE_NAME"hello_ctl123"MODULE_LICENSE("DualBSD/GPL");MODULE_AUTHOR("TOPEET");staticlonghello_ioctl(structfile*file,unsignedintcmd,unsignedlo
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
02-Cesium聚合分析EntityCluster完整代码 fxshy html css javascript
1.完整代码Document-->-->Cesium.Ion.defaultAccessToken='eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJqdGkiOiJhZjZkZDAwZC1mNTFhLTRhOTEtOGExNi00MzRhNGIzMDdlNDQiLCJpZCI6MTA1MTUzLCJpYXQiOjE2NjA4MDg0Njd9.qajeJtc4-kp
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
Ubuntu18.04 Docker部署Kinship(Django)项目过程 Dante617
1Docker的安装https://blog.csdn.net/weixin_41735055/article/details/1003551792下载镜像dockerpullprogramize/python3.6.8-dlib下载的镜像里包含python3.6.8和dlib19.17.03启动镜像dockerrun-it--namekinship-p7777:80-p3307:3306-p55
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
golang实现从服务器下载文件到本地指定目录余生逆风飞翔 golang 服务器开发语言
一、连接服务器，采用sftp连接模式packagemiddlewaresimport("fmt""time""github.com/pkg/sftp""golang.org/x/crypto/ssh")//建立服务器连接funcConnect(user,password,hoststring,portint)(*sftp.Client,error){var(auth[]ssh.AuthMethod
el-table实现全选整表，单元一页复选框功能周bro vue.js elementui javascript 前端
全选整表单选一页0":popper-append-to-body="false":total="tableData.length":page-size="pageObj.pagesize":page-sizes="[10,50,100]"layout="total,sizes,prev,pager,next"@size-change="handleSizeChange"@current-chang
spring security中几大组件的作用和执行顺序阿信在这里 java spring
springsecurity中几大组件的作用和执行顺序在SpringSecurity中，AuthenticationProvider、GroupPermissionEvaluator、PermissionEvaluator、AbstractAuthenticationProcessingFilter、DefaultMethodSecurityExpressionHandler和ManageSecu
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen