m0_72579657

机器学习基础

本章涵盖了以下主题：

分类和回归之外的其他类型的问题；
评估问题，理解过拟合、欠拟合，以及解决这些问题的技巧；
为深度学习准备数据。

请记住，在本章中讨论的大多数技术都是机器学习和深度学习通用的，一部分用于解决过拟合问题的技术（如dropout）除外。

4.1　三类机器学习问题

在之前的所有例子中，尝试解决的是分类（预测猫或狗）或回归（预测用户在平台上花费的平均时间）问题。所有这些都是有监督学习的例子，目的是找到训练样例和目标之间的映射关系，并用来预测未知数据。

有监督学习只是机器学习的一部分，机器学习也有其他不同的部分。以下是3种不同类型的机器学习：

有监督学习；
无监督学习；
强化学习。

下面详细讲解各种算法。

4.1.1　有监督学习

在深度学习和机器学习领域中，大多数成功用例都属于有监督学习。本书中所涵盖的大多数例子也都是有监督学习的一部分。来看看有监督学习的一些常见的例子。

分类问题：狗和猫的分类。
回归问题：预测股票价格、板球比赛成绩等。
图像分割：进行像素级分类。对于自动汽车驾驶来说，从摄像机拍摄的照片中，识别出每个像素属于什么物体是很重要的。这些像素可以是汽车、行人、树、公共汽车等。
语音识别：OK Google、Alexa和Siri都是语音识别的例子。
语言翻译：从一种语言翻译成另一种语言。

4.1.2　无监督学习

在没有标签数据的情况时，可以通过可视化和压缩来帮助无监督学习技术理解数据。两种常用的无监督学习技术是：

聚类；
降维。

聚类有助于将所有相似的数据点组合在一起。降维有助于减少维数，从而可视化高维数据，并找到任何隐藏的模式。

4.1.3　强化学习

强化学习是最不流行的机器学习范畴。在真实世界中没有发现它的成功用例。然而，近年来有了些改变，来自Google的DeepMind团队成功地构建了基于强化学习的系统，并且在AlphaGo比赛中赢得世界冠军。计算机可以在比赛中击败人类的这种技术上的进展，曾被认为需要花费数十年时间才能实现。然而，使用深度学习和强化学习却可以这么快就达到目标，比任何人所预见的都要快。这些技术已经可以看到早期的成功，但可能需要几年时间才能成为主流。

在本书中，我们将主要关注有监督的技术和一些特定于深度学习的无监督技术，例如用于创建特定风格图片的生成网络：风格迁移（style transfer）和生成对抗网络（generative adversarial network）。

4.2　机器学习术语

前面几章出现了大量的术语，如果大家刚入门机器学习或深度学习领域，这些术语看起来会比较生疏。这里将列出机器学习中常用的多数术语，这些通常也在深度学习文献中使用。

样本（sample）或输入（input）或数据点（data point）：训练集中特定的实例。我们在上一章中看到的图像分类问题，每个图像都可以被称为样本、输入或数据点。
预测（prediction）或输出（output）：由算法生成的值称为输出。例如，在先前的例子中，我们的算法对特定图像预测的结果为0，而0是给定的猫的标签，所以数字0就是我们的预测或输出。
目标（target）或标签（label）：图像实际标注的标签。
损失值（loss value）或预测误差（prediction error）：预测值与实际值之间的差距。数值越小，准确率越高。
类别（classes）：给定数据集的一组可能的值或标签。在前一章的例子中有猫和狗两种类别。
二分类（binary classification）：将输入实例归类为两个互斥类别中的其中一个的分类任务。
多类别分类（multi-class classification）：将输入实例归类为两个以上的不同类别的分类任务。
多标签分类（multi-label classification）：一个输入实例可以用多个标签来标记。例如根据提供的食物不同来标记餐馆，如意大利菜、墨西哥菜和印度菜。另一个常见的例子是图片中的对象检测，它使用算法识别出图片中的不同对象。
标量回归（scalar regression）：每个输入数据点都与一个标量质量（scalar quality）相关联，该标量质量是数值型的。这样的例子有预测房价、股票价格和板球得分等。
向量回归（vector regression）：算法需要预测不止一个标量质量。一个很好的例子当你试图识别图片中鱼的位置边界框时。为了预测边界框，您的算法需要预测表示正方形边缘的4个标量。
批（batch）：大多数情况下，我们在称为批的输入样本集上训练我们的算法。取决于GPU的内存，批尺寸一般从2～256不等，权重也在每个批次上进行更新，因此算法往往比在单个样例上训练时学习的更快。
轮数：在整个数据集上运行一遍算法称为一个Epoch。通常要训练（更新权重）几个Epoch。

4.3　评估机器学习模型

在上一章中介绍的图像分类示例中，我们将数据分成两个不同的部分，一个用于训练，一个用于验证。使用单独的数据集来测试算法的性能是一种很好的做法，因为在训练集上测试算法可能无法让用户获得算法真正的泛化能力。在大多数现实世界的用例中，基于验证的准确率，我们经常以不同方式来调整算法，例如添加更多的层或不同的层，或者使用不同的技术，这些将在本章的后面部分进行介绍。因此，选择基于验证数据集来调整算法的可能性更高。以这种方式训练的算法往往在训练数据集和验证数据集上表现良好，但当应用到未知的数据时可能会失败。验证数据集上的信息泄露会影响到对算法的调整。

为了避免信息泄露并改进泛化的问题，通常的做法是将数据集分成3个不同的部分，即训练、验证和测试数据集。我们在训练集和验证集上训练算法并调优所有超参数。最后，当完成整个训练时，在测试数据集上对算法进行测试。我们讨论过有两种类型的参数。一种是在算法内使用的参数或权重，通过优化器或反向传播进行调优。另一种是称为超参数（hyper parameter）的参数，这些参数控制着网络中所用层的数量、学习率以及通常改变架构（这种改变经常是手动调整的）的其他类型的参数。

特定的算法在训练集中表现非常优越，但在验证集或测试集上却表现不佳的现象称为过拟合（overfitting），或者说算法缺乏泛化的能力。存在一种相反的现象，即算法在训练集上的表现不佳，这种现象称为欠拟合（underfitting）。后面将学习可以帮助解决过拟合和欠拟合问题的不同策略。

在了解过拟合和欠拟合之前，先看看可用于拆分数据集的各种策略。

4.3.1　训练、验证和测试集的拆分

将数据划分成3个部分——训练、验证和测试数据集是最佳实践。使用保留（holdout）数据集的最佳方法如下所示。

1．在训练数据集上训练算法。

2．在验证数据集上进行超参数调优。

3．迭代执行前两个步骤，直到达到预期的性能。

4．在冻结算法和超参数后，在测试数据集上进行评估。

应避免只将数据划分成两部分，因为这可能导致信息泄露。在相同的数据集上进行训练和测试是绝对不不允许的，这将无法保证算法的泛化能力。将数据分割成训练集和验证集有3种常用的保留策略，它们是：

简单保留验证；
K折验证；
迭代K折验证。

1．简单保留验证

划分一定比例的数据作为测试数据集。留出多大比例的数据可能是和特定问题相关的，并且很大程度上依赖于可用的数据量。特别是对于计算机视觉和自然语言处理领域中的问题，收集标签数据可能非常昂贵，因此留出30%的测试数据（比例相当大）可能会使算法学习起来非常困难，因为用于训练的数据很少。因此，需要根据数据的可用性，谨慎地选择划分比例。测试数据拆分后，在冻结算法及其超参数前，要保持数据的隔离。为了给问题选择最佳超参数，请选择单独的验证数据集。为了避免过拟合，通常将可用数据划分成3个不同的集合，如图4.1所示。

上一章使用了图4.1的简单实现来创建验证数据集，实现的快照如下：

图4.1

这是最简单的保留策略之一，通常在开始时使用。在小型数据集上使用这种划分策略有一个弊端，验证数据集或测试数据集中的现有数据可能不具有统计代表性。在划分数据前混洗数据即可以轻松意识到这一点。如果得到的结果不一致，那么需要使用更好的方法。为了避免这个问题，我们最后通常使用K折（K-fold）验证或迭代K折（iterated k-fold）验证。

2．K折验证

留出一定比例的数据用于测试，然后将整个数据集分成K个数据包，其中K可以是任意数值，通常从2到10不等。在任意给定的迭代中，选取一个包作为验证数据集，并用其余的数据包训练算法。最后的评分通常是在K个包上获得的所有评分的平均值。图4.2所示为一个K折验证的实现，其中K为4；也就是说，数据划分成4部分（称为4折验证）。

使用K折验证数据集时，要注意的一个关键问题是它的代价非常昂贵，因为需要在数据集的不同部分上运行该算法数次，这对于计算密集型算法来说是非常昂贵的，特别是在计算机视觉算法领域。有时候，训练算法可以花费从几分钟到几天的时间。所以，请谨慎地使用这项技术。

3．带混洗的K折验证

为了使算法变得复杂和健壮，可以在每次创建保留的验证数据集时混洗数据。当小幅度的性能提升提升可能会对业务产生巨大影响时，这种做法是有益的。如果我们的情况是快速构建和部署算法，并且可以接受百分之几的性能差异，那么这种方法可能并不值得。所有这一切都取决于试图要解决的问题，以及对准确率的要求。

图4.2

在拆分数据时可能需要考虑其他一些事情，例如：

数据代表性；
时间敏感性；
数据冗余。

1．数据代表性

在上一章中的例子中，我们把图像分类为狗或者猫。假设有这样一个场景，所有的图像已被排序，其中前60%的图像是狗，其余的是猫。如果选择前面的80%作为训练数据集，其余的作为验证集来分割这个数据集，那么验证数据集将无法代表数据集的真实性，因为它只包含猫的图像。因此，在这些情况下，应该注意通过在分割或进行分层抽样之前对数据进行混洗来实现数据的良好混合。分层抽样是指从每个类别中提取数据点来创建验证和测试数据集。

2．时间敏感性

让我们以股价预测为例。我们有从1月到12月的数据。在这种情况下，如果进行混洗或分层抽样，那么最终将会造成信息的泄露，因为价格很可能是时间敏感的。因此，创建验证数据集时应采用不会引起信息泄露的方式。本例中，选择12月的数据作为验证数据集可能更合理。实际的股价预测用例比这要复杂得多，因此在选择验证分割时，特定领域的知识也会发挥作用。

3．数据冗余

重复数据是很常见的。需要注意的是，在训练、验证和测试集中存在的数据应该是唯一的。如果有重复，那么模型可能无法很好地泛化未知数据。

4.4　数据预处理与特征工程

我们已经了解了使用不同的方法来划分数据集并构建评估策略。在大多数情况下，接收到的数据可能并不是训练算法立即可用的格式。本节将介绍一些预处理技术和特征工程技术。虽然大部分的特征工程技术都是针对特定领域的，特别是计算机视觉和文本处理领域，但还是有一些通用的特征工程技术，这将在本章中讨论。

神经网络的数据预处理是一个使数据更适合于深度学习算法训练的过程。以下是一些常用的数据预处理步骤：

向量化；
归一化；
缺失值；
特征提取。

4.4.1　向量化

数据通常表现为各种格式，如文本、声音、图像和视频。首先要做的就是把数据转换成PyTorch张量。在前面的例子中，使用tourchvision的工具函数将Python图形库（Python Imaging Library，PIL）的图片转换成张量对象，尽管PyTorchtorchvision库抽取出了大部分的复杂度。在第7章中处理递归神经网络（Recurrent Neural Network，RNN）时，将了解如何把文本数据转换成PyTorch张量。对于涉及结构化数据的问题，数据已经以向量化的格式存在，我们需要做的就是把它们转换成PyTorch张量。

4.4.2　值归一化

在将数据传递到任何机器学习算法或深度学习算法之前，将特征归一化是一种通用实践。它有助于更快地训练算法并达到更高的性能。归一化是指，将特定特征的数据表示成均值为0、标准差为1的数据的过程。

在上一章所描述的狗猫分类的例子中，使用了ImageNet数据集中已有的均值和标准差来归一化数据。我们选择ImageNet数据集的均值和标准差的原因，是因为使用的ReNet模型的权重是在ImageNet上进行预训练的。通常的做法是将每个像素值除以255，使得所有值都在0和1之间，尤其是在不使用预训练权重的情况下。

归一化也适用于涉及结构化数据的问题。假设我们正在研究房价预测问题，可能存在不同规模的不同特征。例如，到最近的机场的距离和房子的屋龄是具备不同度量的变量或特征。将它们与神经网络一起使用可以防止梯度收敛。简单来说，损失可能不会像预期的那样下降。因此，在对算法进行训练之前，应该谨慎地将归一化应用到任何类型的数据上。为了使算法或模型性能更好，应确保数据遵循以下规则。

取较小的值：通常取值在0和1之间。
相同值域：确保所有特征都在同一数据范围内。

4.4.3　处理缺失值

缺失值在现实世界的机器学习问题中是很常见的。从之前预测房价的例子来看，房屋屋龄的某些信息可能会丢失。通常用不可能出现的数字替换缺失值是安全的。算法将能够识别模式。还有其他技术可用于处理更特定领域的缺失值。

4.4.4　特征工程

特征工程是利用特定问题的领域知识来创建可以传递给模型的新变量或特征的过程。为了更好地理解，来看一个销售预测的问题。假设我们有促销日期、假期、竞争者的开始日期、与竞争对手的距离以及特定日期的销售情况。在现实世界中，有数以百计的特征可以用来预测店铺的价格，可能有一些信息在预测销售方面很重要。一些重要的特征或衍生价值是：

知道下一次促销的日期；
距离下一个假期还有多少天；
竞争对手的业务开放天数。

还有许多这样的特征可以从领域知识中提取出来。对于任何机器学习算法或深度学习算法，算法自动提取这种类别的特征都是相当具有挑战性的。对于某些领域，特别是在计算机视觉和文本领域，现代深度学习算法有助于我们摆脱特征工程。除了这些领域，良好的特征工程对下述方面也总是有益的。

用较少的计算资源就可以更快地解决问题。
深度学习算法可以使用大量数据自己学习出特征，不再使用手动的特征工程。所以，如果你注重数据，可以专注于构建良好的特征工程。

4.5　过拟合与欠拟合

理解过拟合和欠拟合是成功构建机器学习和深度学习模型的关键。在本章的开头，我们简要地描述了什么是过拟合和欠拟合，这里将详细解释过拟合和欠拟合的概念，以及如何解决过拟合和欠拟合问题。

过拟合或不泛化，是机器学习和深度学习中的一类常见问题。当特定的算法在训练数据集上执行得很好，但在未知数据或验证和测试数据集上表现不佳时，就说算法过拟合了。这种情况的发生主要是因为算法过于特定于训练集而造成的。简单来说，我们可以理解为该算法找出了一种方法来记忆数据集，使其在训练数据集上表现得很好，但无法对未知数据执行。有不同的技术可以用来避免算法的过拟合。这些技术是：

获取更多数据；
缩小网络规模；
应用权重正则化；
应用dropout。

4.5.1　获取更多数据

如果能够获得更多的用于算法训练的数据，则可以通过关注一般模式而不是特定于小数据点的模式来帮助算法避免过拟合。在某些情况下，获取更多标签数据可能是一项挑战。

有一些技术，如数据增强，可用于在计算机视觉相关的问题中生成更多的训练数据。数据增强是一种让用户通过执行不同的操作，如旋转、裁剪和生成更多数据，来轻微调整图像的技术。在对行业知识足够了解时，如果获取实际数据的成本很高，也可以创建人造数据。当无法获得更多数据时，还有其他方法可以帮助避免过拟合。让我们看看这些方法。

4.5.2　缩小网络规模

网络的大小通常是指网络中使用的层数或权重参数的数量。在上一章中的图像分类例子中，我们使用了一个ResNet模型，它包含具有不同层的18个组成模块。PyTorch中的torchvision库具有不同大小的ResNet模型，从18个块开始，最多可达152个块。比如说，如果我们使用具有152个块的ResNet模型导致了过拟合，那么可以尝试使用101个块或50个块的ResNet。在构建的自定义架构中，可以简单地去除一些中间线性层，从而阻止我们的PyTorch模型记忆训练数据集。让我们来看一个示例代码片段，它演示了缩小网络规模的确切含义：

上面的架构有3个线性层，假设它在训练数据上过拟合了，让我们重新创建更低容量的架构：

上面的架构只有两个线性层，减少了容量后，潜在地避免了训练数据集的过拟合问题。

4.5.3　应用权重正则化

有助于解决过拟合或泛化问题的关键原则之一是建立更简单的模型。一种构建简单模型的技术是通过减小模型大小来降低架构的复杂性。另一个重要的事情是确保不会采用更大的网络权重值。当模型的权重较大时，正则化通过惩罚模型来提供对网络的约束。每当模型使用较大的权重值时，正则化开始启动并增加损失值，从而惩罚模型。有两种类型的可能的正则化方案，如下所示。

L1正则化：权重系数的绝对值之和被添加到成本中。它通常称为权重的L1范数。
L2正则化：所有权重系数的平方和被添加到成本中。它通常称为权重的L2范数。

PyTorch提供了一种使用L2正则化的简单方法，就是通过在优化器中启用weight_decay参数：

默认情况下，权重衰减参数设置为0。可以尝试不同的权重衰减值；一个较小的值，比如1e-5大多时候都是有效的。

4.5.4　应用dropout

dropout是深度学习中最常用和最强大的正则化技术之一，由多伦多大学的Hinton和他的学生开发。dropout在训练期间被应用到模型的中间层。让我们看一下如何在生成10个值的线性层的输出上应用dropout（见图4.3）。

图4.3所示为dropout阈值设置为0.2并应用于线性层时发生的情况。它随机地屏蔽或归零20%的数据，这样模型将不依赖于一组特定的权重或模式，从而不会导致过拟合。让我们来看另一个例子，在这里使用一个阈值为0.5的dropout（见图4.4）。

图4.3

图4.4

通常dropout的阈值在0.2～0.5的范围内，并且dropout可以应用在不同的层。dropout仅在训练期间使用，在测试期间，输出值使用与dropout相等的因子缩小。PyTroch允许将dropout作为一层，从而使它更容易使用。下面的代码片段展示了如何在PyTorch中使用一个dropout层：

dropout层接受一个名为training的参数，它需要在训练阶段设置为True，而在验证阶段或测试阶段时设置为False。

4.5.5　欠拟合

当模型明显在训练数据集上表现不佳时，模型可能无法学习出任何模式。当模型无法拟合的时候，通常的做法是获取更多的数据来训练算法。另一种方法是通过增加层数或增加模型所使用的权重或参数的数量，来提高模型的复杂度。通常在实际过拟合数据集之前，最好不要使用上述的任何正则化技术。

4.6　机器学习项目的工作流

在本节中，我们通过将问题描述、评估、特征工程和避免过拟合结合起来，形成一个可用于解决任何机器学习问题的解决方案框架。

4.6.1　问题定义与数据集创建

为了定义问题，我们需要两件重要的事情，即输入数据和问题类型。

我们的输入数据和对应标签是什么？比如说，我们希望根据顾客提供的评论基于提供的特色菜式对餐馆进行分类，区别意大利菜、墨西哥菜、中国菜和印度菜等。要开始处理这类问题，需要手动将训练数据标注为可能的类别之一，然后才可以对算法进行训练。在此阶段，数据可用性往往是一个具有挑战性的因素。

识别问题的类型将有助于确定它是二分类、多分类、标量回归（房屋定价）还是向量回归（边界框）。有时，我们可能不得不使用一些无监督的技术，如聚类和降维。一旦识别出问题类型，就更容易确定应该使用什么样的架构、损失函数和优化器。

在获得了输入并确定了问题的类型后，就可以开始使用以下假设来构建模型：

数据中隐藏的模式有助于将输入映射到输出；
我们拥有的数据足以让模型进行学习。

作为机器学习的实践者，我们需要理解的是可能无法仅用一些输入数据和目标数据来构建模型。下面以股票价格预测为例。假设有代表历史价格、历史表现和竞争细节的特征，但仍然不能建立一个有意义的模型来预测股票价格，因为股票价格实际上可能受到各种其他因素的影响，比如国内外政治环境、自然因素，以及输入数据可能无法表示的许多其他因素。因此，任何机器学习或深度学习模型都无法识别出模式。因此，请基于领域仔细挑选可以成为目标变量的真实指标的特征。所有这些都可能是模型不拟合的原因。

机器学习还有另一个重要的假设。未来或未知的数据将接近历史数据所描述的模式。有时，模型失败的原因可能是历史数据中不存在模式，或者模型训练的数据未涵盖某些季节性或模式。

4.6.2　成功的衡量标准

成功的衡量标准将直接取决于业务目标。例如，当试图预测风车何时会发生下一次机器故障时，我们会对模型能够预测到故障的次数更感兴趣。简单地使用准确率可能是错误的度量，因为大多数时候模型在机器不出现故障时预测都正确，因为这是最常见的输出。假设得到了98%的准确率，但模型每次预测故障时都是错误的，这样的模型在现实世界中可能没有任何用处。选择正确的成功度量标准对于业务问题至关重要。通常，这类问题具有不平衡的数据集。

对于平衡分类问题，其中所有的类别都具有相似的准确率，ROC和AUC是常见的度量。对于不平衡的数据集，可以使用查准率（precision）和查全率（recall）。对于排名问题，可以使用平均精度均值（Mean Average Precision，MAP）。

4.6.3　评估协议

决定好如何评估当前的进展后，重要的事情就是如何评估数据集。可以从评估进展的3种不同方式中进行选择。

保留验证集：这是最常用的，尤其是当有足够的数据时。
K折交叉验证：当数据有限时，这个策略有助于对数据的不同部分进行评估，从而有助于更好地了解性能。
迭代K折验证：想进一步提升模型的性能时，这种方法会有所帮助。

4.6.4　准备数据

通过向量化将不同格式的可用数据转换成张量，并确保所有特征进行了伸缩和归一化处理。

4.6.5　模型基线

创建一个非常简单的模型来打破基线分数。在之前的狗猫分类示例中，基线准确度应该是0.5，我们的简单模型应该能够超过这个分数。如果无法超过基线分数，则输入数据可能不包含进行必要预测所需的必要信息。记住，不要在这一步引入任何正则化或dropout。

要使模型工作，必须要做出3个重要的选择。

最后一层的选择：对于回归问题，应该是生成标量值作为输出的线性层。对于向量回归问题，应是生成多个标量输出的相同线性层。对于边界框问题，输出的是4个值。对于二分类问题，通常使用sigmoid，对于多类别分类问题，则为softmax。
损失函数的选择：问题的类型将有助于决定损失函数。对于回归问题，如预测房价，我们使用均方误差（Mean Squared Error，MSE），对于分类问题，使用分类交叉熵。
优化：选择正确的优化算法及其中的一些超参数是相当棘手的，我们可以通过试验找出。对于大多数用例，Adam或RMSprop优化算法效果更好。下面将介绍一些可用于学习率选择的技巧。

下面总结一下在深度学习算法中，网络的最后一层将使用什么样的损失函数和激活函数（见表4.1）。

表4.1

问题类型	激活函数	损失函数
二分类	sigmoid	nn.CrossEntropyLoss()
多类别分类	softmax	nn.CrossEntropyLoss()
多标签分类	sigmoid	nn.CrossEntropyLoss()
回归	无	MSE
向量回归	无	MSE

4.6.6　大到过拟合的模型

一旦模型具有了足够的容量来超越基线分数，就要增加基线容量。增加架构能力的一些简单技巧如下：

为现有架构中添加更多层；
为已存在的层加入更多权重；
训练更多轮数。

我们通常将模型训练足够的轮数，当训练准确率还在提高但验证准确性却停止增加并且可能开始下降时停止训练，这就是模型开始过拟合的地方。到达这个阶段后，就需要应用正则化技术。

请记住，层的数量、大小和训练轮数可能会因问题而异。较小的架构可以用于简单的分类问题，但是对于面部识别等复杂问题，模型架构要有足够的表示能力，并且模型要比简单的分类问题训练更长的时间。

4.6.7　应用正则化

找到最佳的方法来调整模型或算法是过程中最棘手的部分之一，因为有很多参数需要调整。可对下面这些用于正则化模型的参数进行调整。

添加dropout：这可能很复杂，因为可以在不同的层之间添加，并且找到最佳位置通常是通过试验来完成的。要添加的dropout百分比也很棘手，因为它纯粹依赖于我们试图解决的问题的描述。从较小的数值开始（如0.2），通常是最佳实践。
尝试不同的架构：可以尝试不同的架构、激活函数、层数、权重，或层的参数。
添加L1或L2正则化：可以使用正则化中的任何一个。
尝试不同的学习率：在这里有不同的技术可以使用，本章后面部分将讨论。
添加更多特征或更多数据：可以通过获取更多的数据或增强数据来实现。

我们将使用验证数据集来调整所有上述的超参数。在不断地迭代和调整超参数的同时，可能会遇到数据泄露的问题。因此，应确保有用于测试的保留数据。如果模型在测试数据集上的性能相比训练集和验证集要好，那么我们的模型很有可能在未知的数据上表现良好。但是，如果模型在测试数据上表现不佳，但是在验证和训练数据上表现很好，那么验证数据很可能不是对真实世界数据集的良好表示。在这样的情况下，可以使用K折验证或迭代K折验证数据集。

4.6.8　学习率选择策略

找到合适的学习率来训练模型是一个还在进行中的研究领域，并且已经取得了很多进展。PyTorch提供了一些调整学习率的技术，它们由torch.optim.lr_sheduler包提供。我们将探讨PyTorch提供的一些动态选择学习率的技术。

StepLR：这个调度器有两个重要的参数。第一个参数是步长，它表示学习率多少轮改变一次，第二个参数是gamma，它决定学习率必须改变多少。
对学习率0.01来说，在步长10和gamma为0.1的情况下，学习率每10轮以gamma的倍数变化。也就是说，对于前10轮，学习率变为0.001，并且在接下来的10轮，变成0.0001。下面的代码解释了StepLR的实现。

MultiStepLR：MultiStepLR与StepLR的工作方式类似，只不过步长不是规则间断的，步长以列表的形式给出。例如，给出的步长列表为10、15、30，并且对于每个步长，学习率要乘上gamma值。下面的代码演示了MultiStepLR的实现。

ExponentialLR：每一轮都将学习率乘上gamma值。
ReduceLROnPlateau：这是常用的学习率策略之一。应用本策略时，当特定的度量指标，如训练损失、验证损失或准确率不再变化时，学习率就会改变。通用实践是将学习率的原始值降低为原来的1/2～1/10。

了解更多专业信息，请关注：人工智能技术与咨询

你可能感兴趣的:(大数据,人工智能,机器学习,深度学习,pytorch)

利用AI与MySQL提升工业物联网健康监测的智慧水平——构建预测性维护的新纪元墨夶数据库学习资料1 人工智能 mysql 物联网
在工业4.0和智能制造的大背景下，如何确保生产设备的高效稳定运行成为企业竞争力的核心要素之一。传统的事后维修方式已经难以满足现代制造业的需求，而基于人工智能（AI）的预测性维护系统则为这一挑战提供了全新的解决方案。今天，我们将深入探讨如何结合AI技术和MySQL数据库，打造一个智能、高效的工业物联网（IIoT）健康监测平台，助力企业在激烈的市场竞争中脱颖而出。一、为什么选择AI+MySQL？1.A
MySQL中基于机器学习的自适应缓存热点识别优化策略——开启数据库性能新纪元墨夶数据库学习资料1 数据库 mysql 机器学习
在数据驱动的世界里，数据库的性能直接影响到整个应用系统的响应速度和用户体验。随着业务量的增长和技术的发展，传统的缓存机制逐渐暴露出局限性。如何更智能地识别并利用热点数据进行缓存优化，成为提升数据库性能的关键所在。今天，我们将深入探讨一种创新的方法——基于机器学习的自适应缓存热点识别优化策略，并分享其在MySQL中的具体实现方案。为什么选择机器学习？‍传统上，开发者们依赖于手动配置或预设规则来决定哪
股神系列：蒋菲的量化投资中，如何利用大数据优化模型？她的数据来源有哪些？云策量化量化交易量化软件量化炒股量化炒股 QMT 量化交易入门教程 PTrade 股票投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》标题：股神系列：蒋菲的量化投资中，如何利用大数据优化模型？她的数据来源有哪些？正文：在金融投资的世界里，量化投资以其科学、系统和客观的特点，成为了众多投资者追求的“圣杯”。而在量化投资领域，蒋菲以其独特的大数据量化投资模型而闻名。本文将深入探讨蒋菲如何利用大数据优化其量化投资模型，以及她的数据来源有哪些。一、量化投资模型的优化
Open3D 点云DBSCAN聚类算法 MelaCandy 算法聚类 numpy 计算机视觉图像处理 3d
目录一、DBSCAN基本原理二、代码实现2.1关键函数2.2完整代码三、实现效果3.1原始点云3.2聚类后点云Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、DBSCAN基本原理DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）是一种基于密度的聚类算法，
密码学，算法在人工智能的实战利用 china—hbaby 人工智能密码学
在人工智能（AI）的快速发展中，数据安全和隐私保护成为了核心议题。密码学，作为保护信息安全的基石，其在AI领域的应用显得尤为重要。本文将探讨密码学在AI中的利用，并提供一些代码示例来展示其实际应用。密码学的概述即常用加密方式密码学（Cryptography）是数学和计算机科学的一个分支，它涉及保护信息的安全性和隐私性。密码学的主要目标是确保信息在传输过程中不被未授权的第三方读取或篡改，以及确保信息
【人工智能时代】-人工智能发展史：1900~2023 xiaoli8748_软件开发人工智能时代人工智能搜索引擎
第一阶段：人工智能发展历史：1900-19591909年西班牙工程师LeonardoTorresyQuevedo发明了“Occultus”，这是一个可以自动执行国际象棋对弈的机器，预示了未来的计算智能。
2024年第五届MathorCup数学应用挑战赛--大数据竞赛思路、代码更新中..... 宇哥预测优化代码学习 1024程序员节
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️研赛及概况一、竞赛背景与目的二、组织机构与参赛对象三、竞赛时间与流程四、竞赛要求与规则五、奖项设置与奖励六、研究文档撰写建议七、参考资料与资源1找程序网站推荐2公式编辑器、流程图、论文排版324年研赛资源下载4思路、Python、Matlab代码分享......⛳
目标检测领域总结：从传统方法到 Transformer 时代的革新 DoYangTan 目标检测系列目标检测 transformer 人工智能
目标检测领域总结：从传统方法到Transformer时代的革新目标检测是计算机视觉领域的一个核心任务，它的目标是从输入图像中识别并定位出目标物体。随着深度学习的兴起，目标检测方法已经取得了显著的进展。从最早的传统方法到现如今基于Transformer的先进算法，目标检测的发展经历了多个重要的阶段。本文将详细总结目标检测领域的演进，涵盖传统方法、两阶段检测方法、单阶段检测方法和基于Transform
2024MathorCup数学建模之——MathorCup奖杯”获得者经验思路分享美赛数学建模数学建模
一、经验分享1.工具选择：顺手即可。Matlab和Python都是比较主流的选择，二者的应用场合各有不同。Python在数据分析、深度学习方面的优势愈发明显，而Matlab更适合进行物理仿真和数值计算。不过随着Python社区不断发展，其功能也愈发全面与强大，因此我们比较推荐学有余力的情况下可以更早接触Python。2.模型算法：多多益善。不一定要精通所有的算法，但是手上至少要准备一些常用的算法（
AI人工智能软件开发方案：开启智能时代的创新钥匙广州硅基技术官方人工智能
一、引言：AI浪潮下的软件开发新机遇近年来，人工智能（AI）技术的迅猛发展如同一股汹涌澎湃的浪潮，席卷了全球各个领域。从最初的概念提出到如今的广泛应用，AI历经了漫长的发展历程，终于迎来了属于它的黄金时代。回首过去，AI的发展并非一帆风顺，早期由于计算能力和算法的限制，经历了多次起伏。但随着大数据、云计算、机器学习、深度学习等技术的不断突破，AI迎来了爆发式增长。如今，AI已经深入到人们生活和工作
深度学习框架PyTorch——从入门到精通（6.2）自动微分机制 Fansv587 深度学习 pytorch 人工智能经验分享 python 机器学习
本节自动微分机制是上一节自动微分的扩展内容自动微分是如何记录运算历史的保存张量非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式（GradModes）默认模式（梯度模式）无梯度模式推理模式评估模式（`nn.Module.eval()`）自动求导中的原地操作原地操作的正确性检查多线程自动求导CPU上的并发不确定性计算图保留自动求导节点的线程安全性C++钩子函数不存在线程安全
Pytorch深度学习教程_9_nn模块构建神经网络 tRNA做科研深度学习保姆教程深度学习 pytorch 神经网络
欢迎来到《深度学习保姆教程》系列的第九篇！在前面的几篇中，我们已经介绍了Python、numpy及pytorch的基本使用，进行了梯度及神经网络的实践并学习了激活函数和激活函数，在上一个教程中我们学习了优化算法。今天，我们将开始使用pytorch构建我们自己的神经网络。欢迎订阅专栏进行系统学习：深度学习保姆教程_tRNA做科研的博客-CSDN博客目录1.理解nn模块：(1)使用nn.Sequent
【机器学习】算法分类 CH3_CH2_CHO 什么？！是机器学习！！机器学习算法有监督学习无监督学习半监督学习强化学习
1、有监督学习1.1定义使用带标签的数据训练模型。有监督学习是机器学习中最常见的一种类型，它利用已知的输入特征和对应的输出标签来训练模型，使模型能够学习到特征与标签之间的映射关系。在训练过程中，模型会不断地调整自身的参数，以最小化预测值与真实标签之间的误差，从而提高预测的准确性。1.2回归问题1.2.1目标预测连续值。回归问题的目标是预测一个连续的数值结果，模型的输出是一个实数值。1.2.2解释回
Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
Angular中`trackBy`函数的独特性与性能优化 t0_54program 编程问题解决手册 angular.js 前端 javascript 个人开发
在Angular项目中，优化性能是每一个开发者都需要考虑的问题。特别是在处理大数据量或动态变化的列表时，Angular的trackBy函数成为了我们手中的利器。然而，当我们面对多个列表使用相同trackBy函数时，可能会产生一些疑问：如果这些列表中的项有相同的ID，是否会影响Angular的变更检测？本文将详细探讨trackBy函数在这种情境下的表现及其带来的性能优化。trackBy函数简介tra
使用 Baseten 部署和运行机器学习模型的指南 shuoac 机器学习人工智能 python
随着机器学习模型在各个行业中的广泛应用，如何高效地部署和运行这些模型成为一个关键问题。本文将介绍如何使用Baseten平台来部署和服务机器学习模型。Baseten是LangChain生态系统中的一个重要提供者，它提供了所需的基础设施来高效地运行模型。无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
石油储运生产 2D 可视化，组态应用赋能工业智慧发展智慧园区智慧城市 big data 人工智能大数据物联网网络
当前，国际油价低位徘徊导致各国石油化工行业投资大幅缩减，石油化工建设行业竞争环境日趋严峻，施工企业的利润空间也被不断压缩。内外交困的环境下，促使企业采取更有效的管理手段来提高效率和降低成本。石油工业大数据具有无限潜力与价值，将大数据与数据挖掘技术应用其中，不仅可以提升石油行业工业化水平，而且对其智慧化发展起到强有力的推动作用。图扑软件-构建先进2D和3D可视化所需要的一切图扑软件采用自主研发的HT
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
机器学习——分类、回归、聚类、LASSO回归、Ridge回归（自用）代码的建筑师模型学习模型训练机器学习机器学习分类回归正则化项 LASSO Ridge 朴素
纠正自己的误区：机器学习是一个大范围，并不是一个小的方向，比如：线性回归预测、卷积神经网络和强化学都是机器学习算法在不同场景的应用。机器学习最为关键的是要有数据，也就是数据集名词解释：数据集中的一行叫一条样本或者实例，列名称为特征或者属性。样本的数量称为数据量，特征的数量称为特征维度机器学习常用库：Numpy和sklearn朴素的意思是特征的各条件都是相互独立的机器学习（模型、策略、算法）损失函数
《AI医疗系统开发实战录》第6期——智能导诊系统实战骆驼_代码狂魔程序员的法宝人工智能 django python neo4j 知识图谱
关注我，后期文章全部免费开放，一起推进AI医疗的发展核心主题：如何构建95%准确率的智能导诊系统？技术突破：结合BERT+知识图谱的混合模型设计一、智能导诊架构设计python基于BERT的意图识别模型（PyTorch）fromtransformersimportBertTokenizer,BertForSequenceClassificationimporttorchclassTriageMod
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
人民日报报道，华为云赋能智能制造助力图扑软件构造数字孪生场景智慧园区华为人工智能物联网
2021年12月22日，《人民日报》头版头条刊登了《华为云赋能智能制造，助力图扑软件构造数字孪生场景》一文，聚焦数据可视化建设发展。报道指出，数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神;高效便捷管控的背后，是云端平台各大企业的互助共赢;高质精准2D、3D数据可视图的背后，是专注于数据可视化Web组态开发的厦门图扑软件科技有限公司。并对厦门图扑软件科技有限公司进
华为云赋能智能制造，助力图扑软件构造数字孪生场景 36Kr网科技华为云制造 big data
出行手机查看交通方案、物业管理的智能可视勘察管控、疫情地图提前预知危害……这些曾经存在于科幻片中的高科技场景一一在现代生活得到了应用与普及，其背后的数据可视化应用，正贯穿于当今大数据时代的各行各业，成为人们洞察数据内涵的有力工具，推动数字经济发展驶入“快车道”。数字经济发展的背后，是大数据时趋势下各地区积极贯彻国家数字经济发展战略的时代精神；高效便捷管控的背后，是云端平台各大企业的互助共赢；高质精
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【Spark】查询优化中分区（Partitioning）和分桶（Bucketing）是什么关系？什么时候应当分区，什么时候应当分桶？ petrel2015 spark 大数据分布式数据库
在学习Spark的过程中，分区和分桶乍一看很像，都能为了计算加速，但是仔细一想，一查还是有些差异的，甚至说差异很大。那么具体有什么差异点，有什么相同点。我做出了如下的整理，供大家参考，欢迎指正。相同点分区（Partitioning）和分桶（Bucketing）在很多方面具有相似性，它们都是用于优化大数据查询性能的技术数据划分的目的：优化查询性能分区和分桶的核心目标是通过将数据分割成更小的逻辑单元来
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

机器学习基础

4.1 三类机器学习问题

4.1.1 有监督学习

4.1.2 无监督学习

4.1.3 强化学习

4.2 机器学习术语

4.3 评估机器学习模型

4.3.1 训练、验证和测试集的拆分

4.4 数据预处理与特征工程

4.4.1 向量化

4.4.2 值归一化

4.4.3 处理缺失值

4.4.4 特征工程

4.5 过拟合与欠拟合

4.5.1 获取更多数据

4.5.2 缩小网络规模

4.5.3 应用权重正则化

4.5.4 应用dropout

4.5.5 欠拟合

4.6 机器学习项目的工作流

4.6.1 问题定义与数据集创建

4.6.2 成功的衡量标准

4.6.3 评估协议

4.6.4 准备数据

4.6.5 模型基线

4.6.6 大到过拟合的模型

4.6.7 应用正则化

4.6.8 学习率选择策略