AI科技大本营

从0开始，基于Python探究深度学习神经网络

来源 | Data Science from Scratch， Second Edition

作者 | Joel Grus

全文共6778字，预计阅读时间50分钟。

深度学习

1. 张量

2. 层（Layer）的抽象

3. 线性层

4. 神经网络作为一个层的序列

5. 损失和优化

6. 示例：XOR 重新实现

7. 其他激活函数

8. 示例：重新实现 FizzBuzz

9. softmax 和交叉熵（cross-entropy）

10. Dropout

11. 例子：MNIST

12. 保存和加载模型

13. 以供进一步探索

深度学习最初指的是“深度”神经网络（即具有多个隐藏层的网络）的应用，尽管实际中这个术语现在包含各种各样的神经结构。

在本章中，我们将基于之前的工作，研究更广泛的神经网络。为此，我们将引入一些抽象概念，允许我们以更普遍的方式思考神经网络。

张量

以前，我们对向量（一维数组）和矩阵（二维数组）进行了区分。当我们开始使用更复杂的神经网络时，我们也需要使用高维数组。

在许多神经网络库中，n维数组被称为张量，我们也会这样叫。(不把n维数组称为张量是有迂腐的数学原因的；如果你是这样一个书呆子，你的反对意见会被注意到。)

如果我写一本关于深度学习的书，我会实现一个功能齐全的张量类，它重载Python的算术运算符，并可以处理各种其他操作。这样的实施本身就需要一整个章节。在这里我们会取巧，说一个张量只是一个list。这在一个方向上是正确的——我们所有的向量、矩阵和高维类似物都是列表。在另一个方向当然不是真的——大多数Python列表在我们看来不是n维数组。

注意

理想情况下，你可能这样认为：

但是，Python不允许你定义这样的递归类型。即使它这样做了，这个定义仍然不正确，因为它允许坏的“张量”，比如：[[1.0,2.0]，[3.0]]，它们的行大小不同，这使得它不是一个n维数组。

所以，就像我说的，我们只会取巧，认为：

我们将编写一个辅助函数来找到一个张量的大小：

因为张量可以有任意数量的维度，所以我们通常需要递归地处理它们。我们将在一维情况下做一件事，并在高维情况下进行递归：

我们可以用它来编写一个递归的tensor_sum函数：

如果你不习惯递归思考，你应该思考直到弄明白它的意思，因为我们将在本章使用相同的逻辑。但是，我们将创建一些辅助函数，以便我们不必在各处重写此逻辑。第一个方法将一个函数单独应用于单个张量：

我们可以使用它来编写一个函数，它创建一个与给定张量形状相同的零张量：

我们还需要对两个张量的相应元素应用函数（最好是完全相同的形状，尽管我们不会检查）：

层（Layer）的抽象

在前一章中，我们建立了一个简单的神经网络，允许我们堆叠两层神经元，每层神经元都计算sigmoid（dot（weights, inputs））。

虽然这可能是实际神经元的理想化表示，但实际实践中我们希望允许更广泛的事情。也许我们希望神经元能记住他们以前的输入。也许我们想使用不同于sigmoid的激活函数。而且我们经常希望使用两层以上的隐含层。(我们的feed_forward函数实际上处理了任意数量的层，但我们的梯度计算没有。)

在本章中，我们将构建实现各种神经网络的机制。我们的基本抽象将是Layer，它知道如何将一些函数应用到其输入中，并知道如何反向传播梯度。

思考我们在第18章中构建的神经网络的一种方式是作为一个“线性”层，然后是一个“sigmoid”层，然后是另一个线性层和另一个“sigmoid”层。我们没有用这些术语来区分它们，但这样做将允许我们尝试使用更一般的结构：

正向和反向的方法将必须在我们的具体子类中实现。一旦我们建立了一个神经网络，我们就需要使用梯度下降来训练它，这意味着我们就需要使用其梯度来更新网络中的每个参数。因此，我们坚持认为每一层都应该能够告诉我们它的参数和梯度。

某些层（例如，对其每个输入应用sigmoid函数的层）没有需要更新的参数，因此我们提供了处理这种情况的默认实现。让我们来看看这一层：

这里有几件事需要注意到。一种是在向前传递过程中，我们保存了计算出的sigmoid，这样我们就可以在反向传递中使用它们。我们的Layer通常需要做这种事情。

其次，你可能会想知道sig*（1-sig）* grad来自哪里。这是微积分中的链规则，对应于我们之前的神经网络中的output（1-output）（output - target）项。

最后，你可以看到我们是如何使用tensor_apply和tensor_combine函数的。我们的大多数层都将类似地使用这些函数。

线性层

我们需要复制第18章的神经网络是“线性”层，代表神经元的dot（weight，input）部分。

该层将有参数，我们希望用随机值初始化这些参数。

结果证明，初始参数值可以对网络运行的速度（有时是是否能够运行）产生巨大的影响。如果权重太大，它们可能在激活函数具有接近零梯度的范围内产生大输出。而网络中梯度为零的部分必然不能通过梯度下降学习任何东西。

因此，我们将实现三种不同的方案来随机生成权值张量。首先是从[0,1]上的随机均匀分布（即random.random()）中选择每个值。第二种值（这种策略是默认策略）是从标准正态分布中随机选择每个值。第三种是使用Xavier初始化，其中每个权重由均值为0，方差为2/(num_inputs+num_outputs)的正态分布随机抽取。事实证明，这通常对神经网络权值很有效。我们将使用random_uniform函数和random_normal函数来实现这些功能：

然后将它们全部包装在一个random_tensor函数中：

现在我们可以定义我们的线性层了。我们需要用输入的维度（它告诉我们每个神经元需要多少权重)、输出的维度(它告诉我们应该有多少神经元）和我们想要的初始化方案来初始化它：

注意

本章中的一些网络我根本无法使用不同的初始化方法进行训练，现在我相信你知道初始化方案有多重要了。

forward方法易于实现。我们将得到每个神经元的一个输出，并一直放在一个向量中。每个神经元的输出是其输入与权重的内积（dot），加上其偏差：

backward方法更复杂，但如果你知道微积分并不难：

注意

在“真正的”张量库中，这些（以及许多其他）操作将表示为矩阵或张量乘法，这些库设计得非常快。我们的库速度很慢。

最后，在这里，我们确实需要实现params和grads。我们有两个参数和两个相应的梯度：

神经网络作为一个层的序列

我们希望将神经网络视为层的序列，所以让我们想出一种将多层组合到一起的方法。所得到的神经网络本身是一个层，它以下面明显的方式实现了该层的方法：

所以我们可以将我们用于XOR的神经网络表示为：

但我们仍然需要更多的机器来训练它。

损失和优化

之前，我们为我们的模型编写了单个损失函数和梯度函数。这里我们希望试验不同的损失函数，因此（如往常）我们将引入一个新的损失抽象，它封装损失计算和梯度计算：

我们已经处理了很多次损失，这个损失就是平方误差的总和，所以我们应该很容易地实现它。唯一的诀窍是，我们需要使用tensor_combine：

（后面我们将查看不同的损失函数。）

最后一件要处理的事情是梯度下降。在整本书中，我们通过一个训练循环手动完成了所有的梯度下降：

在这里，这对我们不太有效，有几个原因。首先，我们的神经网络将有许多参数，我们需要更新所有参数。第二，我们希望能够使用更聪明的梯度下降变体，而且我们不想每次都要重写它们。

因此，我们将引入一个（你猜到了）优化器抽象，那么梯度下降就可以看成一个具体实例：

之后，再次使用tensor_combine轻松实现梯度下降：

唯一令人惊讶的是“切片分配”，这反映了重新分配列表不会改变其原始值的事实。也就是说，如果你只是计算了param=tensor_combine（……），你将重新定义局部变量param，但你不会影响存储在神经网络层中的原始参数张量。但是，如果你给slice[：]赋值，它实际上会更改列表中的值。

下面是一个简单的示例来演示：

如果你对Python缺乏经验，这种行为可能令人惊讶，所以思考一下，自己尝试例子，直到弄懂为止。

要演示此抽象定义的价值，让我们实现另一个使用动量（momentum）的优化器。其想法是，我们不想对每个新梯度反应过度，因此我们动态地保持我们看到的梯度的平均值，用每个新梯度进行更新，并朝着平均方向迈出一步：

因为我们使用了一个优化器抽象，所以我们可以很容易地在不同的优化器之间切换。

示例：XOR重新实现

让我们看看使用我们的新框架来训练能够计算XOR的网络是多么容易。我们首先要重新创建训练数据：

然后我们定义网络，尽管现在我们暂时不考虑最后一个sigmoid层：

我们现在可以编写一个简单的训练循环，现在我们还可以使用优化器和损失的抽象。这使我们可以轻松地尝试不同的方法：

这应该训练得很快，你应该看到损失会下降。现在我们可以检查一下权重了：

对于我的网络，我大致发现：

所以如果两个输入都不是1，hidden1激活。如果两个输入都是1，hidden2激活。如果两个隐藏输出都不是1，输出就会激活（也就是说，如果两个输入不相同则激活，两个输入不同则激活）。事实上，这正是XOR的逻辑。

请注意，这个网络学习到的特性与我们在第18章中训练到的特性不同，但它们任然试图做同样的事情。

其他激活函数

sigmoid函数失宠有几个原因。一个原因是sigmoid（0）等于1/2，这意味着一个输入和为0的神经元有一个正输出。另一个问题是，对于非常大和非常小的输入，它的梯度非常接近0，这意味着它的梯度会“饱和”，其权重更新可能会卡住。

一个流行的替代方法是tanh（“双曲切线”），它是一个不同的符号形函数，范围从-1到1，如果输入为0，则输出为0。tanh(x)的导数是1-tanh(x)**2，这使得该层易于构建：

在较大的网络中，另一种流行的替代方法是Relu，当输入为负时值为0，当输入为正时等价于恒等函数：

还有许多其他的函数。我鼓励你在你的网络中多尝试。

示例：重新实现FizzBuzz

我们现在可以使用“深度学习”框架从“FizzBuzz”重现我们的解决方案。让我们来设置这些数据：

并创建该网络：

在训练时，我们还要跟踪训练集的准确性：

经过1000次训练迭代，模型在测试集上的准确率达到90%；如果训练时间更长，它应该做得更好。（我不认为仅仅25个隐藏单元就能训练到100%准确，但如果你达到50个隐藏单元，则绝对有可能。）

softmax和交叉熵（cross-entropy）

我们在前一节中使用的神经网络以sigmoid层结束，这意味着它的输出是一个在0到1之间的数字向量。特别是，它可以输出一个完全为0s的向量，也可以输出一个完全为1s的向量。但是，当我们处理分类问题时，我们希望为正确的类输出1，为所有不正确的类输出0。一般来说，我们的预测不会那么完美，但我们至少希望预测类上的实际概率分布。

例如，如果我们有两个类，并且我们的模型输出[0,0]，很难理解。它认为输出不属于任何一个类吗？

但是如果我们的模型输出[0.4,0.6]，我们可以把它解释为预测我们的输入属于第一类的概率为0.4，我们输入属于第二类的概率为0.6。

为了实现这一点，我们通常放弃最后的sigmoid层，而使用softmax函数，它将一个实数向量转换为一个概率向量。我们计算向量中的每个数的exp(x)，从而得到一个正数的向量。在那之后，我们只把每个正数除以和，这就得到了累加值为1的向量，也就是一个概率向量。

如果我们最终尝试计算，比如，exp（1000），我们会得到一个Python错误，所以在取exp之前，我们减去最大的值（这样处理会获得相同的概率），这样就让在Python中的计算更安全：

一旦我们的网络产生概率，我们经常使用不同的损失函数称为交叉熵（有时“负对数似然”)。

你可能还记得，在“最大似然估计”中，我们通过验证（在某些假设下）最小二乘系数使观察数据的可能性最大化，来证明在线性回归中使用最小二乘是合理的。

在这里我们可以做类似的事情：如果我们的网络输出是概率，交叉熵损失表示观测数据的负对数可能性，这意味着最小化损失与最大化训练数据的对数似然（因此似然）是一样的。

通常，我们不会将softmax函数作为神经网络本身的一部分。这是因为，如果softmax是损失函数的一部分，而不是网络本身的一部分，那么关于网络输出的损失梯度就很容易计算出来。

如果我现在使用SoftmaxCrossEntropy损失来训练相同的FizzBuzz网络，我发现它通常训练得更快（也就是说，花更少的epochs）。这大概是因为找到Softmax给定分布的权重比找到sigmoid给定分布的权重要容易得多。

也就是说，如果我需要预测类0（第一个位置为1，其余位置为0的向量），在 linear + sigmoid 情况下，我需要第一个输出是大正数，其余输出是大负数。然而，在softmax的情况下，我只需要第一个输出大于剩余的输出。显然，第二种情况有更多的可能，这表明应该更容易找到这样的权重：

Dropout

像大多数机器学习模型一样，神经网络很容易过度拟合它们的训练数据。我们之前已经看到过改善这一点的方法；例如，在“正则化”中，我们惩罚了大的权重，这有助于防止过度拟合。

正则化神经网络的一种常见方法是使用dropout。在训练时，我们用一些固定的概率随机关闭每个神经元（即将其输出替换为0）。这意味着网络不能学习依赖于任何单个神经元，这似乎有助于解决过度拟合问题。

在评估时，我们不想dropout任何神经元，所以dropout层需要知道它是否在训练。此外，在训练时，dropout层只传递其输入的一些随机部分。为了使其输出在评估期间可比较，我们将使用相同比例（均匀）缩小输出：

我们将使用此方法来帮助我们防止深度学习模型过度拟合。

例子：MNIST

MNIST是一个每个人都用来学习深度学习的手写数字数据集。

它有一种有点棘手的二进制格式，因此我们将安装mnist库来使用它。（是的，从技术上讲，这部分并不是“从零开始”。）

然后我们可以加载数据：

让我们绘制前100张训练图像，了解它们的形状（图19-1）：

MNIST图像

你可以看到，它们看起来确实像手写的数字。

注意

我第一次尝试显示这些图像，结果是黑色背景上的黄色数字。我既不聪明也不微妙，不知道我需要添加cmap=Greys来获得黑白图像；我通过谷歌搜索，找到了堆栈溢出的解决方案。作为一名数据科学家，你将非常熟练于这个工作流程。

我们还需要加载测试图像：

每张图像为28×28像素，但我们的线性层只能处理一维输入，因此我们将使它们变平（并除以256以使它们在0和1之间）。此外，如果我们的输入平均为0，神经网络训练更好，因此我们将减去平均值：

我们还想要对目标进行一次热编码，因为我们有10个输出。首先，让我们编写一个one_hot_encode函数：

然后将其应用于我们的数据中：

我们抽象的优点之一是，我们可以对各种模型使用相同的训练/评估循环。所以，让我们先写下这个问题吧。我们将传递我们的模型、数据、损失函数以及（如果我们正在训练）优化器。它将传递我们的数据、跟踪性能以及（如果我们传递了优化器）更新我们的参数：

作为一个基线，我们可以使用我们的深度学习库来训练一个（多类）逻辑回归模型，它只是一个线性层，然后是一个softmax。这个模型（本质上）只寻找10个线性函数，这样如果输入代表，比如说，一个5，那么第5个线性函数就会产生最大的输出。

通过我们的6万个训练实例就足以学习这个模型了：

这种准确率约为89%。让我们看看使用深度神经网络能否做得更好。我们将使用两个隐藏层，第一层有30个神经元，第二层有10个神经元。我们将使用Tanh激活函数：

我们也可以使用相同的训练循环！

我们的深度模型在测试集上的精度优于92%，这与简单的logistic模型相比是一个很好的改进。

注意

MNIST网站（http://yann.lecun.com/exdb/mnist/）描述了各种性能优于这些模型的模型。其中许多都可以使用我们迄今为止开发的方法来实现，但这需要非常长的时间才能在张量列表框架（lists-as-tensors）中进行训练。一些最好的模型涉及到卷积层，这很重要，但不幸的是，这完全超出了一本关于数据科学的介绍性书的范围。

保存和加载模型

这些模型需要很长时间来训练，所以如果我们能保存它们，这样就不用每次训练它们就好了。幸运的是，我们可以使用json模块轻松地将模型权重序列化到文件中。

为了保存，我们可以使用Layer.params来收集权重，将它们粘贴在一个列表中，并使用json.dump将该列表保存到一个文件中：

把权重加载回去只是需要多做一点工作。我们只使用json.load从文件中获取权重列表，并通过切片（slice）分配来设置模型的权重。

(特别是，这意味着我们必须自己实例化模型，然后加载权重。另一种方法也是保存模型体系结构的一些表示，并使用它来实例化模型。这不是一个可怕的想法，但它需要更多的代码和更改我们的所有层，所以我们将坚持更简单的方法。）

在加载权重之前，我们要检查它们的形状是否与我们要加载到的模型参数相同。（这是一种保障，例如尝试将保存深度网络的权重加载到浅网络或类似问题。）

注意

JSON将数据存储为文本，这使得它成为一种非常低效的表示。在实际应用程序中，你可能会使用pickle序列化库，它将内容序列化为更高效的二进制格式。在这里，我决定保持它的简单性和可读性。

你可以从书中的GitHub存储库(https://github.com/joelgrus/data-science-from-scratch)中下载我们训练的各种网络的权重。

以供进一步探索

深度学习现在真的很热，在这一章中，我们几乎只涉及到皮毛。关于你想知道的深度学习的任何方面，都有很多的好书籍和博客文章（当然，也有许多很糟糕的博客文章）。

· 由伊恩·古德费罗、约舒亚·本吉亚和亚伦·考维尔（麻省理工学院出版社）撰写的标准教科书《深度学习》可以在网上免费提供（https://www.deeplearningbook.org/）。它很好，但它涉及到相当多的数学知识。

· 弗朗索瓦·乔莱特的Python深度学习（Manning）是一个伟大的介绍Keras库，之后我们的深度学习库有点模式化了（基本都吸收了Keras的风格）。

· 我自己主要使用PyTorch来进行深度学习。它的网站上有很多文档和教程。

更多精彩推荐
Windows 11 上手机！小米 8、一加 6T、微软 Lumia 950 XL 都可以运行

深度学习教你重建赵丽颖的三维人脸

Openpose+Tensorflow 这样实现人体姿态估计 | 代码干货

点分享点收藏点点赞点在看

你可能感兴趣的:(神经网络,python,机器学习,人工智能,深度学习)

神经网络架构搜索 IJCAST主编进化计算神经网络架构人工智能
InternationalJournalofComplexityinAppliedScienceandTechnology，投稿网址:https://www.inderscience.com/jhome.php?jcode=ijcast,发表论文不收取任何费用，论文平均审稿25天内即可录用。1.神经网络架构搜索方法分类当前，神经网络架构搜索的方法主要可以归纳为以下三类：a.基于强化学习的NAS方法
SpringBoot生态全景图：从SpringCloud到云原生技术栈演进 fanxbl957 Web spring boot spring cloud 云原生
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot生态全景图：从S
利用大数据领域Doris提升企业数据决策效率大数据洞察大数据网络 ai
利用大数据领域Doris提升企业数据决策效率关键词：大数据、Doris、企业数据决策、数据处理、效率提升摘要：本文围绕利用大数据领域的Doris来提升企业数据决策效率展开。首先介绍了背景，包括目的、预期读者、文档结构和相关术语。接着阐述了Doris的核心概念、架构以及与其他系统的联系。详细讲解了Doris的核心算法原理和具体操作步骤，并给出Python代码示例。同时介绍了相关的数学模型和公式。通过
Python爬虫技术实战：高效市场趋势分析与数据采集 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 easyui 汽车
摘要本文将深入探讨如何利用最新的Python爬虫技术进行市场趋势分析，涵盖异步IO、无头浏览器、智能解析等前沿技术，并提供完整可运行的代码示例。文章将系统介绍从基础爬虫到高级反反爬策略的全套解决方案，帮助读者掌握市场数据采集的核心技能。1.市场趋势分析与爬虫技术概述市场趋势分析已成为现代商业决策的核心环节，而数据采集则是分析的基石。根据2024年最新统计，全球83%的企业已将网络爬虫技术纳入其数据
Nuitka打包python脚本 __如风__ python 开发语言
Python脚本打包Python是解释执行语言，需要解释器才能运行代码，这就导致在开发机上编写的代码在别的电脑上无法直接运行，除非目标机器上也安装了Python解释器，有时候还需要额外安装Python第三方包，相当麻烦。事实上Python并不适合干这种事，但有时候确实需要Python编写的程序打包给他人一键运行。思路通常都是分析脚本依赖（所有使用到的模块），然后收集相关资源，为了能在目标机器上正确
燕大《Python机器学习》实验报告：探索机器学习的奥秘温冰礼
燕大《Python机器学习》实验报告：探索机器学习的奥秘【下载地址】燕大Python机器学习实验报告下载这份实验报告是燕山大学软件工程专业的学生在进行机器学习实验时所编写的，内容详实，结构清晰，可以直接下载使用。报告中的实验数据和代码均经过验证，确保下载后可以直接应用于实际项目或作为学习参考项目地址:https://gitcode.com/Open-source-documentation-tut
Python 运用 Matplotlib 绘制动画图的流程 Python编程之道 Python人工智能与大数据 Python编程之道 python matplotlib 开发语言 ai
Python运用Matplotlib绘制动画图的流程关键词：Python、Matplotlib、动画图、绘制流程、动画原理摘要：本文详细介绍了使用Python的Matplotlib库绘制动画图的完整流程。从背景知识入手，阐述了Matplotlib动画绘制的目的和适用读者群体，接着深入剖析了核心概念，包括动画的基本原理和架构。通过核心算法原理的讲解和Python源代码示例，展示了如何实现动画绘制。同
Python Pandas 如何进行数据分组统计 Python编程之道 Python人工智能与大数据 Python编程之道 python pandas 网络 ai
PythonPandas如何进行数据分组统计关键词：PythonPandas、数据分组、groupby、聚合函数、数据透视表、数据统计、数据分析摘要：本文将深入探讨如何使用PythonPandas库进行高效的数据分组统计操作。我们将从基础概念入手，详细讲解groupby机制的原理和使用方法，介绍各种聚合函数的应用，探讨高级分组技巧，并通过实际案例展示如何解决复杂的数据分析问题。文章还将涵盖性能优化
Python可视化环境：Matplotlib_Seaborn+Conda配置 Python编程之道 Python人工智能与大数据 Python编程之道 python matplotlib conda ai
Python可视化环境：Matplotlib/Seaborn+Conda配置关键词：Python可视化、Matplotlib、Seaborn、Conda、环境配置摘要：本文主要探讨了如何利用Conda来配置Python可视化所需的Matplotlib和Seaborn环境。首先介绍了Python可视化的背景和重要性，明确目标读者为想要学习Python可视化的初学者和有一定基础的开发者。接着详细解析了
Nuitka 打包Python程序 Humbunklung 学海泛舟 python 开发语言 nuitka
文章目录Nuitka打包Python程序**一、Nuitka核心优势**⚙️**二、环境准备（Windows示例）****三、基础打包命令****单文件脚本打包****带第三方库的项目**️**四、高级配置选项****示例：完整命令**⚠️**五、常见问题与解决****六、Nuitkavs其他工具****七、最佳实践建议****八、使用举例**总结Nuitka打包Python程序需要把Python
python selenium 滚动页面到定位元素我有一个希哥 python selenium 前端
用js语句target=driver.find_element_by_id("id")driver.execute_script("arguments[0].scrollIntoView();",target)或target=WebDriverWait(driver,3).until(expected_conditions.presence_of_element_located((By.ID,"i
pythonselenium时间选择_使用pythonselenium选择特定日期（滚动日期） xu534328661
所有人我们正在尝试自动化日期选择过程以供参考Clickhere。请参考出生日期和预约日期字段。我们选择日期的方式是不同的。我不知道如何为这两个字段选择日期。你能帮帮我吗？在我已经尽了我的最大努力，它与下面的代码除了日期字段Python版本：2.7硒3.8.0铬：48倍importseleniumimportsysfromseleniumimportwebdriverfromselenium.web
python与anaconda安装（先安装了python后安装anaconda，基于python已存在的基础上安装anaconda）——逼死强迫症、超详解苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
版权声明：本文为CSDN博主「牛斌帅」的原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/qq_43529415/article/details/100847887目录一、安装python（python3.7.4）1、下载(1)下载1(32位)(2)下载2(64位)2、安装3、配置python环境变量4、检验pytho
（转）优秀的 python 机器学习库 patrick75 python 机器学习 python 机器学习
优秀的python机器学习库IntroductionThereisnodoubtthatneuralnetworks,andmachinelearningingeneral,hasbeenoneofthehottesttopicsintechthepastfewyearsorso.It’seasytoseewhywithallofthereallyinterestinguse-casestheys
DAY 10 机器学习建模与评估心落薄荷糖 Python训练营机器学习人工智能
知识点：1.数据集的划分2.机器学习模型建模的三行代码3.机器学习模型分类问题的评估今日代码比较多，但是难度不大，仔细看看示例代码，好好理解下这几个评估指标。作业：尝试对心脏病数据集采用机器学习模型建模和评估#一、导入库importpandasaspdimportpandasaspd#用于数据处理和分析，可处理表格数据。importnumpyasnp#用于数值计算，提供了高效的数组操作。impor
DAY 2 字符串与比较运算心落薄荷糖 Python训练营 python 算法
文章目录题目1：字符串的操作小结题目2：比较运算题目1：字符串的操作题目:定义两个字符串变量，str1赋值为“Hello”，str2赋值为“Python”。将这两个字符串拼接起来（中间加一个空格），并将结果存储在变量greeting中；计算greeting字符串的长度，存储在变量length中；获取greeting字符串的第一个字符，存储在变量first_char中。然后，使用f-string分三
python学习记录14 彤银浦学习 python
1.字符串的编码和解码不同的计算机之间在信道中传输的信息本质上是二进制数据，因此当你有一串文本需要传输给另外一台电脑时，则需要将这串文本编译为二进制类型的数据。python中的二进制数据类型称为byte类型。将字符串的str类型转变为byte类型称为字符串的编码，将byte类型转变为str类型称为字符串的解码。字符串的编码用到的是encode的方法，语法格式为：string.encode(enco
【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
Python实例之十大歌手评分 *濒危物种* 算法前端 python
实例背景：十大歌手，为丰富校园文化生活，学校拟组织一场歌手大赛，从参赛选手中选拔出十名相对突出的学生，授予“校园十大歌手”称号。比赛之中设置有评委组，每名选手演唱完毕之后会由评委组的十名评委打分。为保证比赛公平公正、防止作弊和恶意打分，计算得分(即平均分)时会先去掉最高分和最低分要求实现：根据每位评委的输入分数，实现计算每位选手得分的功能。【重要步骤提示】定义列表放评委给分找出列表的最高分和最低分
如何用Python统计字符串（引用ASCII码）【两种方法】 *濒危物种* python 前端 linux
要求实现：根据输入的字符串，统计其中大写字母、小写字母、数字、字符各有多少个【重要步骤提示】0-9的ASCII数字的ASCII码值取值范围为48-57；a-z小写英文字母的取值范围为97-122；A-Z大写英文字母的取值范围为65-90；Len()、append()方法的使用ord()函数获取字符对应的ASCII码值方法一#引到用户输入字符list1=list(input('请输入一行字符：'))
Python机器学习元学习库higher 音程机器学习人工智能 python 机器学习
higher是一个用于元学习（Meta-Learning）和高阶导数（Higher-ordergradients）的Python库，专为PyTorch设计。它扩展了PyTorch的自动微分机制，使得在训练过程中可以动态地计算参数的梯度更新，并把这些更新过程纳入到更高阶的梯度计算中。一、主要用途higher主要用于以下场景：元学习（Meta-Learning）比如MAML（Model-Agnosti
Python Selenium 滚动到特定元素 Humbunklung 学海泛舟 python selenium 开发语言
文章目录PythonSelenium滚动到特定元素⚙️**1.使用`scrollIntoView()`方法（最推荐）**️**2.结合`ActionChains`移动鼠标（模拟用户行为）****3.使用坐标计算滚动（精确控制像素）**⚠️**4.处理复杂场景的进阶技巧****（1）元素在iframe中****（2）动态加载内容****（3）横向滚动****5.常见问题与解决方案****总结：根据场
Python 常用正则表达式大全朱公子的Note python 爬虫正则表达式
你是否在写Python爬虫时，总是卡在“正则提取”这一步？明明页面源码已经拿到，却怎么也匹配不到目标数据……不是提取失败，就是提取不全，搞得调试半天还抓不到核心字段？别急！今天我们就来一次**“正则一网打尽”**，专为爬虫而生的表达式宝典，让你写起爬虫来如虎添翼！在当下数据驱动时代，网络数据是企业的“金矿”，而Python爬虫则是挖掘这金矿的“利器”！从电商价格到社交媒体评论，爬虫技术让数据采集变
基于迁移学习的ResNet50模型实现石榴病害数据集多分类图片预测深度学习乐园深度学习实战项目迁移学习分类人工智能
完整源码项目包获取→点击文章末尾名片！番石榴病害数据集背景描述番石榴（Psidiumguajava）是南亚的主要作物，尤其是在孟加拉国。它富含维生素C和纤维，支持区域经济和营养。不幸的是，番石榴生产受到降低产量的疾病的威胁。该数据集旨在帮助开发用于番石榴果实早期病害检测的机器学习模型，帮助保护收成并减少经济损失。数据说明该数据集包括473张番石榴果实的注释图像，分为三类。图像经过预处理步骤，例如钝
学校老师课堂点名管理系统带TkinterUI界面深度学习乐园 oracle 数据库
完整源码项目包获取→点击文章末尾名片！基于PythonTkinter的学生管理系统，有最基本的增删改查功能，还有随机点名、顺序点名功能##1、研究现状综述目前，在学生信息管理领域，各大高校面临的难题在于对学生信息管理的效率过低，传统的人工管理造成了资金和劳动力的浪费。因此，大部分学者研究的是针对高校的学生信息或成绩管理系统，而用python语言的也很少，其中大多用的是PyQt5模块。而且，针对低年
四个机器学习模型对比道路裂缝检测识别分类模型深度学习乐园深度学习实战项目机器学习分类人工智能
完整源码项目包获取→点击文章末尾名片！一、课题综述1.1.课题简介在机器学习的研究领域中，传统分类算法模型数量众多，适合的应用场景也各不相同。1.2.课题目标（示例）本课题使用的数据集来自于数据分析与数据挖掘竞赛Kaggle，该竞赛为数据科学领域著名的国际性赛事之一。课题使用的数据集为带标签的图像数据集，包含带有裂痕和不带有裂痕的桥梁、墙和人行道图片。课题的目标为对于目标数据集，搭建相应的传统机器
Densenet模型花卉图像分类深度学习乐园分类数据挖掘人工智能
项目源码获取方式见文章末尾！600多个深度学习项目资料，快来加入社群一起学习吧。《------往期经典推荐------》项目名称1.【基于CNN-RNN的影像报告生成】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LSTM住宅用电量预测】7.【VG
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
算法训练营|数组总结慧泽huize 数据结构算法 leetcode python c++
时间复杂度：算法执行语句的次数空间复杂度：算法在运行过程中临时占存储空间大小数组（C++）：存放在连续内存空间的相同类型固定大小的数据的集合，不能删除，只能覆盖列表（Python）：数据可以是不同类型，列表长度可变1.二分查找循环不变量原则，清楚区间定义时间复杂度：O(logn)空间复杂度：O(1)2.双指针法快指针找到新数组元素，慢指针指向新数组下标时间复杂度：O(n)空间复杂度：O(1)3.双
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案 mmlihaio 数据库云原生 python
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案1.引言在当今的人工智能和大数据时代，高效的向量检索已成为许多应用场景的关键需求。Tair作为阿里云开发的云原生内存数据库服务，不仅提供了丰富的数据模型和企业级能力，还引入了基于非易失性内存(NVM)存储介质的持久内存优化实例。本文将深入探讨如何利用Tair向量数据库功能，实现高性能的向量存储和检索。2.Tair向量数据库概述Ta
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少