Sonhhxg_柒

【Pytorch Lighting】第 1 章：PyTorch Lightning adventure

大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流

个人主页－Sonhhxg_柒的博客_CSDN博客

欢迎各位→点赞 + 收藏⭐️ + 留言

系列专栏 - 机器学习【ML】自然语言处理【NLP】深度学习【DL】

foreword

✔说明⇢本人讲解主要包括Python、机器学习（ML）、深度学习（DL）、自然语言处理（NLP）等内容。

如果你对这个系列感兴趣的话，可以关注订阅哟

文章目录

是什么让 PyTorch Lightning 如此特别？

第一个…。

这么多框架？

PyTorch 与 TensorFlow

中庸之道——PyTorch Lightning

– My Lightning adventure

了解 PyTorch Lightning 的关键组件

深度学习管道

PyTorch Lightning 抽象层

使用 PyTorch Lightning 制作 AI 应用程序

图像识别模型

迁移学习

NLP Transformer模型

Lightning Flash

使用 LSTM 的时间序列模型

具有自动编码器的生成对抗网络

结合 CNN 和 RNN 的自监督模型

用于对比学习的自我监督模型

部署和评分模型

扩展模型和生产力技巧

进一步阅读

概括

我们正在见证由人工智能( AI ) 驱动的被普遍称为第四次工业革命)。自从大约 350 年前创造了蒸汽机以来，人类走上了工业化道路，我们看到了另外两次工业革命。大约 100 年前，我们看到电力带来了翻天覆地的变化，大约 50 年后，数字时代彻底改变了我们今天的生活方式。人工智能同样具有变革性的力量。我们所知道的关于世界的一切都在快速变化，并将继续以前所未有的速度发生变化，当然也没有人计划过。随着人工智能聊天机器人的出现，我们看到了我们联系客户服务的方式发生了变革；在我们如何观看电影/视频方面，AI 会推荐我们应该观看的内容；在我们的购物方式中，使用针对供应链优化的算法；使用自动驾驶技术如何驾驶汽车；通过将人工智能应用于蛋白质折叠等复杂问题来开发新药；通过在大量数据中发现隐藏模式，了解如何进行医疗诊断。支撑上述每项技术的是人工智能的力量。人工智能对我们世界的影响不仅仅是我们使用的技术；相反，它在我们如何与社会互动、我们如何工作以及我们如何生活方面更具变革性。正如许多人所说，人工智能是新的电力，为 21 世纪的引擎提供动力在我们如何与社会互动、我们如何工作以及我们如何生活方面，它更具变革性。正如许多人所说，人工智能是新的电力，为 21 世纪的引擎提供动力在我们如何与社会互动、我们如何工作以及我们如何生活方面，它更具变革性。正如许多人所说，人工智能是新的电力，为 21 世纪的引擎提供动力圣世纪。

人工智能对我们的生活和心理的巨大影响是该领域最近取得突破的结果深度学习( DL )。长期以来，科学家们一直梦想创造出模仿大脑的东西。大脑是一种迷人的自然进化现象。人类大脑的突触比宇宙中的星星还要多，正是这些神经连接使我们变得聪明，让我们能够做一些事情，比如思考、分析、识别物体、用逻辑推理和描述我们的理解。虽然人工神经网络( ANN ) 的工作方式与生物神经元不同，但它们确实起到了启发作用。

在物种进化过程中，最早的生物是单细胞生物（如变形虫），大约在 40 亿年前首次出现，随后是小型多细胞物种，在大约 35 亿年的时间里盲目导航，没有方向感。当你周围的每个人都是盲人时，第一个发展出视力的物种通过成为最聪明的物种而比所有其他物种具有显着优势，而在进化生物学中，这一步（发生在大约 5 亿年前）被称为寒武纪大爆发. 这个单一事件导致物种进化的显着增长，导致了我们今天在地球上看到的一切。换句话说，尽管地球大约有 45 亿年的历史，但所有复杂的生命形式，包括人类大脑，都是在过去 5 亿年（仅占地球生命的 10%）中进化的，由单一进化事件主导，这反过来又导致有机体“看到”事物的能力。

事实上，在人类中，我们大脑的 1/3 与视觉皮层有关。这远远超过任何其他感官。也许通过首先掌握“视觉”能力来解释我们的大脑如何进化为最聪明的。

借助图像识别的 DL 模型，我们终于可以让机器“看到”事物（李飞飞将其描述为机器学习 (ML) 的寒武纪大爆发），这一事件将使 AI 完全走上不同的轨迹，其中一个有一天它可能真的可以和人类的智慧相媲美。

2012 年，DL 模型在图像识别方面实现了接近人类的准确度，从那时起，已经创建了许多框架，使数据科学家能够轻松地训练复杂模型。创建特征工程（FE) 步骤、复杂的转换、训练反馈循环和优化需要大量的手动编码。框架有助于抽象某些模块并使编码更容易以及标准化。PyTorch Lightning 不仅是最新的框架，而且可以说是在正确的抽象级别和执行复杂研究的能力之间取得完美平衡的最佳框架。它是 DL 初学者以及希望将模型产品化的专业数据科学家的理想框架。在本章中，我们将了解为什么会出现这种情况，以及我们如何利用 PyTorch Lightning 的强大功能快速轻松地构建有影响力的 AI 应用程序。

在本章中，我们将介绍以下主题：

是什么让 PyTorch Lightning 如此特别？
—My Lightning adventure
了解 PyTorch Lightning 的关键组件
使用 PyTorch Lightning 制作 AI 应用程序

是什么让 PyTorch Lightning 如此特别？

所以，如果你作为一名数据科学家新手，你脑海中的问题是：我应该从哪个 DL 框架开始？如果您对 PyTorch Lightning 感到好奇，那么您可能会问自己：为什么我要学习这个而不是其他东西？另一方面，如果您是一位已经构建 DL 模型一段时间的专家数据科学家，那么您将已经熟悉其他流行的框架，例如 TensorFlow、Keras 和 PyTorch。那么问题就变成了：如果你已经在这个领域工作，为什么要切换到一个新的框架？ 当您已经知道另一种工具时，是否值得努力学习不同的东西？这些都是公平的问题，我们将在本节中尝试回答所有这些问题。

让我们从 DL 框架的简要历史开始，以确定 PyTorch Lightning 在这种情况下的适合位置。

第一个…。

第一个DL模型于 1993 年在麻省理工学院( MIT ) 实验室执行由DL教父Yann LeCun设计。这是用 Lisp 编写的，不管你信不信，它甚至包含卷积层，就像现代卷积神经网络( CNN ) 模型一样。图中显示的网络演示在他的神经信息处理系统( NIPS ) 1989 年题为“使用反向传播网络的手写数字识别”的论文中进行了描述。

以下屏幕截图显示了此演示的摘录：

图 1.1 - Yann LeCun 在 1993 年的 MIT 手写数字识别演示

Yann LeCun 他本人在他的博客文章中详细描述了第一个模型是什么，这在以下视频中显示：https ://www.youtube.com/watch?v=FwFduRA_L6Q 。

正如您可能已经猜到的那样，用 C 语言编写整个 CNN 并不容易。他们的团队花费了多年的手动编码努力来实现这一目标。

DL 的下一个重大突破出现在 2012 年，创建了 AlexNet，赢得了 ImageNet 竞赛。Geoffrey Hinton 等人的AlexNet论文。被认为是最有影响力的论文，在社区中被引用次数最多。AlexNet 在准确性方面开创了先河，让神经网络再次酷起来，并且是一个经过训练的海量网络优化的图形处理单元( GPU )。他们还引入了许多重要的东西，例如 BatchNorm、MaxPool、Dropout、SoftMax 和 ReLU，我们将在稍后的旅程中看到这些东西。由于网络架构如此复杂和庞大，很快就需要一个专门的框架来训练它们。

这么多框架？

Theano、Caffe 和 Torch可以说是帮助数据科学家创建深度学习模型的第一波深度学习框架。虽然 Lua 是某些编程语言的首选（Torch 最初是用 Lua 编写的 LuaTorch），但许多其他语言是基于 C++ 的，可以帮助在 GPU 等分布式硬件上训练模型并管理优化过程。当该领域本身是新的且不稳定时，它主要由学术界的 ML 研究人员（通常是博士后）使用。数据科学家应该知道如何使用梯度下降代码编写优化函数，并使其在特定硬件上运行，同时还能操作内存。显然，业内人士无法轻易使用它来训练模型并将其投入生产。

模型训练框架的一些示例如下所示：

【Pytorch Lighting】第 1 章：PyTorch Lightning adventure_第2张图片

图 1.2 – 模型训练框架

Google 的 TensorFlow 通过恢复为基于 Python 的抽象函数驱动框架成为该领域的游戏规则改变者，非研究人员可以使用该框架进行试验，同时保护他们免受在硬件上运行 DL 代码的复杂性。紧随其后的是 Keras，它进一步简化了深度学习，任何知识渊博的人都可以用四行代码训练一个深度学习模型。

但可以说，TensorFlow 没有很好地并行化。它也更难在分布式 GPU 环境中进行有效训练，因此社区认为需要一个新框架——某种东西它结合了基于研究的框架的强大功能和 Python 的易用性。PyTorch 诞生了！自首次亮相以来，该框架就席卷了 ML 世界。

PyTorch 与 TensorFlow

看着在 PyTorch 和 TensorFlow 竞争的 Google Trends 上，你可以说 PyTorch 在最近几年已经从 TensorFlow 手中接过，几乎已经超越了它。

摘录自谷歌趋势可以在这里看到：

图 1.3 – 谷歌趋势中 PyTorch 与 TensorFlow 的社区兴趣变化

虽然有些人可能会说 Google Trends 不是判断 ML 社区脉搏的最科学方法，但您也可以看看许多有影响力的 AI 参与者，它们工作量很大，例如 Facebook、Tesla 和 Uber，它们默认使用 PyTorch 框架管理他们的 DL 工作负载并显着节省计算和内存。

不过，在 ML 研究社区中，Tensorflow 和 PyTorch 之间的选择非常明确。获胜者是毫无疑问的 PyTorch！

【Pytorch Lighting】第 1 章：PyTorch Lightning adventure_第4张图片

图 1.4 – TensorFlow 与 PyTorch 在顶级 AI 会议上发表论文的趋势

这两个框架都会有他们的铁杆粉丝，但 PyTorch 被认为在分布式 GPU 环境中更高效，因为它具有固有的架构。以下是使 PyTorch 优于 TensorFlow 的其他一些因素：

提供更高的稳定性。
易于构建的扩展和包装器。
更全面的领域库。
静止的TensorFlow 中的图形表示并不是很有帮助。轻松地训练网络是不可行的。
PyTorch 中的动态张量改变了游戏规则，使其易于训练和扩展。

中庸之道——PyTorch Lightning

我很少遇到像 PyTorch Lightning 一样令人兴奋的东西！这个框架是 William Falcon 的心血结晶，他的博士导师是（猜猜是谁）..Yann LeCun！这就是它的原因站出来：

编码不仅很酷，而且还允许您进行认真的 ML 研究（与 Keras 不同）。
它具有更好的 GPU 利用率（与 TensorFlow 相比）。
它具有 16 位精度支持（对于不支持张量处理单元( TPU ) 的平台非常有用，例如 IBM Cloud）。
它也有一个非常好的收藏以Lightning Flash 形式的最先进( SOTA ) 模型存储库。
它是第一个原生框架能力和自我监督学习( SSL )。

简而言之，PyTorch Lightning 让制作 DL 模型和执行快速实验变得既有趣又酷，同时不会通过从数据科学家那里抽象出核心数据科学方面而使核心数据科学方面变得愚蠢，并且始终为深入研究 PyTorch 敞开大门你想要！

我想它通过允许更多的能力来做数据科学，同时自动化大部分“工程”部分，达到了完美的平衡。这是 TensorFlow 终结的开始吗？对于这个问题的答案，我们将不得不拭目以待。

– My Lightning adventure

得到从 PyTorch Lightning 开始非常容易。您可以使用 Anaconda 发行版在本地设置您的环境或使用云选项例如Google Colaboratory ( Google Colab )、Amazon Web Services ( AWS )、Azure 或 IBM Watson工作室开始。（建议您使用云环境来运行一些更复杂的模型。）本书中的大部分代码都是在 Google Collab 或 Anaconda 上使用 Python 3.6 和 Mac OS 运行的。请在其他系统上对您的环境进行适当的更改以进行安装。

可以在 Jupyter 笔记本环境中使用pip安装 PyTorch Lightning，如下所示：

pip install pytorch-lightning

除了导入 PyTorch Lightning（第一个导入语句可以在以下代码片段中看到）之外，以下导入块显示通常是代码一部分的语句：

import pytorch_lightning as pl
import torch
from torch import nn
import torch.nn.functional as F
from torchvision import transforms

火炬包用于定义张量和对张量执行数学运算。torch.nn包用于构建神经网络，这就是nn的意思。torch.nn.functional包含包括激活和损失函数在内的函数，而torchvision.transforms是一个单独的库，提供常见的图像转换。安装 PyTorch Lightning 框架和所有包后，您应该会看到完成日志，如以下屏幕截图所示：

【Pytorch Lighting】第 1 章：PyTorch Lightning adventure_第5张图片

图 1.5 – PyTorch Lightning 的安装结果

安装 PyTorch Lightning 后，您可以检查 PyTorch 和 Torch 的版本

【Pytorch Lighting】第 1 章：PyTorch Lightning adventure_第6张图片

图 1.6 – 验证安装

而已！现在，你们都准备好了开始你的闪电冒险！

了解 PyTorch Lightning 的关键组件

在我们跳之前在构建 DL 模型之前，让我们修改一个深度学习项目遵循的典型管道。

深度学习管道

让我们修改用于 DL 网络架构的典型 ML 管道。这是它的样子：

【Pytorch Lighting】第 1 章：PyTorch Lightning adventure_第7张图片

图 1.7 – 深度学习管道

一个深度学习管道通常涉及以下步骤。我们将继续在整本书中看到它们，将它们用于解决问题的各个方面：

定义问题：
- 设定明确的任务和预期目标。
资料准备：
- 这一步包括找到正确的数据集来解决这个问题，摄取并清理它。对于大多数 DL 项目，这涉及到数据工程师在图像、视频或文本语料库中工作以获取数据集（有时通过网页抓取），然后将它们分类为大小。
- 大多数 DL 模型需要大量数据，而模型还需要对图像的微小变化（例如裁剪）具有弹性。为此，工程师通过创建原始图像或黑白( B/W ) 版本的裁剪或反转它们等来扩充数据集。
建模：
- 这个将首先涉及 FE 并定义我们想要构建什么样的网络架构。
- 例如，在数据科学家创建新的图像识别模型的情况下，这将涉及定义具有三层卷积的 CNN 架构，可以定义步长、滑动窗口、梯度下降优化、损失函数等。
- 对于 ML 研究人员来说，这一步可能涉及定义新的损失函数，以更有用的方式测量准确度，或者通过使用提供相同准确度的较低密度网络的模型训练来执行一些魔法，或者定义分布良好的新梯度优化或收敛更快。
培训：
- 现在来了有趣的一步。在数据科学家定义了 DL 网络架构的所有配置后，他们需要训练模型并不断调整它，直到它实现收敛。
- 对于海量数据集（这是 DL 中的常态），这可能是一场噩梦般的练习。数据科学家必须兼任 ML 工程师，通过编写代码将其分发到底层 GPU 或中央处理单元( CPU ) 或 TPU，管理内存和时代，并不断迭代充分利用计算能力的代码。较低的 16 位精度可能有助于更快地训练模型，因此数据科学家可能会尝试这样做。
- 或者，可以使用分布式倾盆大雨梯度下降来更快地优化。如果您发现自己对这些术语感到喘不过气来，请不要担心。许多数据科学家都经历过这一点，因为它与统计的关系较少，而与工程的关系更多（这就是我们将看到 PyTorch Lightning 如何拯救的地方）。
- 其他分布式计算的主要挑战是能够充分利用所有硬件并准确计算分布在各种 GPU 中的损失。做数据并行（将数据批量分发到不同的 GPU）或模型并行（将模型分发到不同的 GPU）并不简单。
部署工程：
- 后模型已经训练过了，我们需要接受它到生产。ML 操作( MLOps ) 工程师通过创建可在其环境中工作的部署就绪格式文件来工作。
- 此步骤还涉及创建一个应用程序编程接口( API )与终端应用程序集成以供消费。有时，如果模型预计具有大量工作负载，它还可能涉及创建基础架构来为传入流量大小的模型评分。

PyTorch Lightning 抽象层

PyTorch 闪电框架使构建整个 DL 模型以帮助数据科学家变得容易。这是如何实现的：

LightningModule类用于定义模型结构、推理逻辑、优化器和调度器细节、训练和验证逻辑等。
Lightning Trainer抽象出循环、硬件交互、拟合和评估模型等所需的逻辑。
您可以将 PyTorch DataLoader直接传递给培训师，也可以选择定义LightningDataModule以提高可共享性和重用性。

使用 PyTorch Lightning 制作 AI 应用程序

在本书中，你将看到我们如何构建各种使用 PyTorch Lightning 轻松高效地构建各种类型的 AI 模型。借助具有行业范围应用和实际优势的动手示例，您不仅会接受 PyTorch Lightning 的培训，还会接受不同深度学习系列的整个范围的培训。

图像识别模型

我们将在第 2 章中以图像识别模型的形式创建我们的第一个 DL 模型，开始我们的旅程，开始使用第一个深度学习模型。图像识别是深度学习框架的典型身份，通过使用 PyTorch Lightning，我们将了解如何使用 CNN 构建图像分类模型。

迁移学习

深度学习模型众所周知，在收敛之前需要在大量 epoch 上进行训练，从而在此过程中消耗大量 GPU 计算能力。在第 3 章，使用预训练模型的迁移学习中，您将学习一种已知的技术作为迁移学习( TL )，通过从大型预训练架构（例如用于图像分类的 ResNet-50 或用于文本分类的 BERT）中迁移知识，无需付出太多努力即可获得良好的结果。

NLP Transformer模型

我们将还可以查看自然语言处理( NLP ) 模型并了解 DL 如何生成文本可以对大量文本数据进行分类。您将在第 3 章“使用预训练模型的迁移学习”中了解如何使用著名的预训练 NLP 模型，包括 Transformer，并轻松适应您的业务需求。

Lightning Flash

这DL 模型的创建还涉及相当复杂的特征工程管道过程，以及同样繁琐的训练和优化步骤。大多数数据科学家通过采用赢得 Kaggle 比赛或有影响力的研究论文的 SOTA 模型开始他们的旅程。在第 4 章，Lightning Flash 的现成模型中，您将了解 Lightning Flash 等开箱即用的实用程序如何通过为标准任务（如对象检测或文本分类）提供标准网络架构的存储库来提高生产力、音频或视频。我们将很快建立视频分类和音频文件自动语音检测的模型。

使用 LSTM 的时间序列模型

预测预测时间序列中的下一个事件是行业内的常青挑战。在第 5 章，时间序列模型中，您将了解我们如何使用具有长短期记忆( LSTM ) 网络架构的递归神经网络( RNN )在 PyTorch Lightning 中构建时间序列模型。

具有自动编码器的生成对抗网络

生成对抗网络( GAN ) 模型是最引人入胜的方面之一DL的应用程序，并且可以创建现实生活中根本不存在的人或地点或物体的逼真图像。在第 6 章，深度生成模型中，您将学习如何使用 PyTorch Lightning，轻松制作 GAN 模型，以创建逼真的动物、食品或人的假图像。

结合 CNN 和 RNN 的自监督模型

应用程序DL 模型不仅限于使用 GAN 创建精美的假图像。我们甚至可以让机器描述电影中的场景或询问有关图像内容的信息性问题（例如图片中的人或他们在做什么）。这种模型架构被称为半监督模型并且，在第 7 章，半监督学习中，您将学习 CNN-RNN 架构（其中RNN代表递归神经网络）的混合体，可用于教机器如何编写情景诗歌。在同一章中，我们还将了解如何从头开始训练模型并使用 16 位精度和其他操作技巧来加速模型以确保顺利训练。

用于对比学习的自我监督模型

如果机器可以创建逼真的图像或编写类似人类的描述，他们不能自学吗？自我监督模型旨在让机器学习如何执行低标签或根本没有标签的复杂任务，从而彻底改变我们可以用人工智能做的一切。在第 8 章，自监督学习中，您将了解 PyTorch Lightning 如何为自监督模型提供原生支持。您将学习如何教机器执行对比学习（CL），它可以纯粹通过表示学习来区分没有任何标签的图像。

部署和评分模型

每个 DL 模型可以训练有朝一日被生产化并用于在线预测的梦想。这部分 ML 工程需要数据科学家熟悉自己具有各种模型文件格式。在第 9 章，部署和评分模型中，您将学习如何在可与语言无关的可移植模型中部署和评分模型借助 Pickle 和开放式神经网络交换( ONNX ) 格式，在生产环境中与硬件无关。

扩展模型和生产力技巧

最后，PyTorch Lightning 的功能不仅限于在定义的架构上创建新模型，还包括使用新的研究推进 SOTA。在第 10 章，扩展和管理培训中，我们将看到一些使此类新研究成为可能的功能，以及如何通过提供故障排除技巧和快速提示来提高生产力。我们还将关注扩展模型训练的各种方法。

进一步阅读

以下是 PyTorch Lightning 的一些链接，您发现它们非常有用：

官方文档：https ://pytorch-lightning.readthedocs.io/en/latest/?_ga=2.177043429.1358501839.1635911225-879695765.1625671009 。
GitHub 来源：https ://github.com/PyTorchLightning/pytorch-lightning 。
如果您在代码中遇到任何问题，可以通过在 GitHub 上提出问题来寻求帮助。Pytorch Lightning团队通常反应迅速：https ://github.com/PyTorchLightning/lightning-flash/issues 。
您可以在 PL 社区频道上寻求帮助。PyTorch Lightning 社区正在快速发展并且非常活跃。

概括

您可能是探索深度学习领域的初学者，看看它是否适合您。您可能是一名高级学位的学生，试图在 ML 方面进行研究以完成您的论文或发表论文。或者，您可能是一位在训练 DL 模型并将其投入生产方面拥有多年经验的专家数据科学家。PyTorch Lightning 让每个人都可以在 DL 中做几乎任何事情。

它通过提供对复杂性的包装器，结合了 PyTorch 的原始功能（提供效率和严谨性）和 Python 的简单性。你可以随心所欲地做一些创新工作（正如你将在本书后面看到的那样），同时你也可以获得许多开箱即用的神经网络架构，让你不必重新发明轮子（稍后您还将了解）。它与 PyTorch 完全兼容，并且可以轻松重构代码。它也可能是第一个为数据科学家角色设计的框架，而不是其他角色，例如 ML 研究员、ML-Ops 工程师或数据工程师。

我们将从一个简单的深度学习模型开始我们的旅程，并将在每一章中继续将我们的范围扩展到更高级和更复杂的模型。你会发现它涵盖了所有著名的模型，让你拥有深度学习技能，从而对你的组织产生影响。因此，让我们在下一章中使用您的第一个 DL 模型进行下一步。

你可能感兴趣的:(DL,with,Pytorch,Lighting,pytorch,人工智能)

AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
力扣 160 - Intersection of Two Linked Lists. (相交链表) Python双指针小杨快没头发了 Leetcode 刷题
力扣160-IntersectionofTwoLinkedLists.(相交链表)Python双指针原题地址：https://leetcode.com/problems/intersection-of-two-linked-lists/Giventheheadsoftwosinglylinked-listsheadAandheadB,returnthenodeatwhichthetwolistsi
LeetCode 160 Intersection of Two Linked Lists（链表） nudt_oys 数据结构 LeetCode
Writeaprogramtofindthenodeatwhichtheintersectionoftwosinglylinkedlistsbegins.Forexample,thefollowingtwolinkedlists:A:a1→a2↘c1→c2→c3↗B:b1→b2→b3begintointersectatnodec1.Notes:Ifthetwolinkedlistshavenoin
[LeetCode]--160. Intersection of Two Linked Lists 杜鲁门 LeetCode LeetCode算法分析 leetcode 链表相同尾部算法链表遍历算法算法遍历
Writeaprogramtofindthenodeatwhichtheintersectionoftwosinglylinkedlistsbegins.Forexample,thefollowingtwolinkedlists:A:a1→a2↘c1→c2→c3↗B:b1→b2→b3begintointersectatnodec1.Notes:Ifthetwolinkedlistshavenoin
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
【零基础入门】一篇弄懂nn.Sequential以及ModuleList的使用（呕心沥血版）十二月的猫 PyTorch深度学习 pytorch 零基础入门
个人主页：十二月的猫-CSDN博客系列专栏：《PyTorch科研加速指南：即插即用式模块开发》CSDN博客十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光目录1.前言2.Sequential类的使用2.1序列容器简单注入2.2序列容器字典注入2.3序列容器函数注入2.4序列容器修改2.5序列容器删除3.nn.ModuleList()的使用3.1定义模型3.2使用模型4.总结1.前言《
【网络】数据流（Data Workflow）Routes（路由）、Controllers（控制器）、Models（模型）和 Middleware（中间件）一袋米扛几楼98 网络工程/安全中间件
在图片中，数据流（DataWorkflow）描述了应用程序中数据的流动过程，涉及Routes（路由）、Controllers（控制器）、Models（模型）和Middleware（中间件）。作为初学者，理解这些组件及其联系是掌握Web应用程序开发的关键。以下是对每个技术点的详细解释，以及它们如何相互关联的分析。1.Routes（路由）定义：路由定义了应用程序的URL端点（Endpoints）以及服
一文读懂Python列表（5）跟着杰哥学Python python
列表让你能够在一个地方存储成组的信息，其中可以只包含几个元素，也可以包含数百万个元素，列表是新手可直接使用的最强大的Python功能之一。一、列表是什么1.列表由按顺序排列的元素组成，用[]表示列表，用逗号分隔元素2.举例：bicycles=['trek','cannondale','redline','specialized']二、列表的索引1.第一个列表元素的索引为0，而不是12.举例：三、访
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
mysql笔记 m0_67015473 mysql 笔记
mysql日志分析错误日志日志默认开启，查询showvariableslike“%error_log%”，日志存在于/var/log/mysqld.log二进制日志日志默认开启，记录所有的DDL(Create等)和DML(insert等)，但不包括数据查询（SELECT、SHOW)语句作用：灾难时的数据恢复mysql的主从复制查询showvariableslike“%log_bin%”，日志存在于
深入理解 Vue3 中的 Reflect 和 Proxy 使用写完这行代码打球去 #vue vue.js 前端 javascript
Proxy详解讲到Proxy对象相信大家都肯定很熟悉，vue3的响应式原理就是以此为基础的。Proxy对象用于创建一个对象的代理，从而实现基本操作的拦截和自定义（如属性查找、赋值、枚举、函数调用等）。Proxy语法简要介绍constp=newProxy(target,handler)handler常用方法get-拦截对象属性的读取操作set-拦截对象属性的设置操作has-拦截属性查询操作delet
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
Gradle 打包调试终极指南：全维度日志输出与问题定位有时很滑稽 Android android
Gradle打包调试终极指南：全维度日志输出与问题定位一、Gradle日志级别全解析1.1日志级别控制参数#按日志详细程度递增排序：./gradlewassembleDebug-q#QUIET-仅错误信息./gradlewassembleDebug#LIFECYCLE-默认级别（任务执行概览）./gradlewassembleDebug-i#INFO-显示任务输入/输出变化./gradlewass
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
【001安卓开发方案调研】之Java+Gradle+XML 原生安卓开发 ThinkPet 移动app开发 android java xml
基于2025年国内安卓开发领域的最新动态，结合Java+Gradle+XML技术组合的生态发展，以下是综合分析：一、技术成熟度评估1.核心架构稳定性Java语言基础作为安卓开发官方支持语言，Java在国内拥有超过15年的技术积累，字节码编译机制与安卓ART虚拟机的深度适配，使其在内存管理、多线程处理等场景表现稳定。主流应用如微信、支付宝均保留Java核心模块。Gradle构建体系Gradle8.5
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
测试模板：Showcase规范和流程 iBigder 小测试管理软件测试全套常用模板测试管理
【测试资料】https://fzqxk86ywz.feishu.cn/share/base/view/shrcnp65x91aNEkF2REnU2VcmmH【AIGC和小红书】https://fzqxk86ywz.feishu.cn/sheets/GugIsI9zKhNaEwtJscbcgKFCn6bFiddler成功汉化完整过程和汉化补丁下载：https://zhuanlan.zhihu.com
pytorch v1.4.0安装问题大柠丶 pytorch 人工智能 python
直接使用conda安装报错：(CenterNet)C:\Users\16323>condainstallpytorch==1.4.0torchvision==0.5.0cudatoolkit=10.1-cpytorch-cconda-forgeChannels:-pytorch-conda-forge-defaultsPlatform:win-64Collectingpackagemetadata
RK3568平台（音频篇）音频ALSA框架嵌入式_笔记瑞芯微音视频
一.ALSA框架简介ALSA表示先进linux声音架构（AdvancedLinuxSoundArchiecture），它由一系列的内核驱动、应用程序编程接口（API）以及支持linux下声音的应用程序组成、ALSA项目发起的原有是linux下的声卡驱动（OSS）没有获得积极的维护，而且落后于新的声卡技术。JaroslavKysela早先写了一个声卡驱动，并由此开始了ALSA项目，随后，更多的开发者
DCNV2 报错ImportError: dynamic module does not define module export function(PyInit__ext) 搜索路径问题你好星酉君深度学习 pytorch 人工智能
import_extas_backendTraceback(mostrecentcalllast):File"/yourpath/model/backbone/dla_dcn.py",line16,infrommodel.backbone.DCNv2.dcn_v2importDCNFile"/yourpath/model/backbone/DCNv2/dcn_v2.py",line12,inimp
芯片的未来发展趋势 iccnewer
2024年，该行业将专注于AI/ML、RISC-V、量子、安全等发展趋势。今年年初，大多数人从未听说过生成式人工智能。现在整个世界都在竞相利用它，而这仅仅是个开始。量子计算、6G、智能基础设施等新市场领域专用处理正在加速对更快、更高效、更多数据的需求。与每隔几年等待下一个工艺节点的日子相比，未来几年的事件将与电话或汽车的引入一样重要。但可能不会只有一种创新技术，将会有很多技术一起以一种将让科技界惊
mysql 游标分页_MySQL采用游标分页的方式，“下一页”很好实现，那“上一页”如何实现呢？... 酸流 mysql 游标分页
为让mysql达到最佳查询性能，我将分页查询改为cursor查询方式：select*fromreplywherereply_id>last_idlimit20orderbyreply_idASC;上面的last_id为本页最后一条回复的reply_id，这样就能实现“下一页”的查询了，但是“上一页”如何实现呢？我想过改变排列顺序select*fromreplywherereply_id,这样不管是
Vision mamba(mamba_ssm)安装踩坑指南 ggitjcg 深度学习 python
在这篇博客中，我将分享我在linux环境安装和使用VisionMamba（mamba_ssm）过程中遇到的一些问题和解决方法。前置检查：PyTorch和Python版本在安装mamba_ssm前，请确保你的PyTorch和Python环境版本正确。以下代码可用来检查环境信息：importtorchprint("PyTorchVersion:{}".format(torch.__version__)
关于forward函数 oioz 深度学习
定义forward函数是模型的核心前向传播逻辑，定义了输入数据如何在模型中传递和计算。它将输入数据通过模型的各层（如卷积层、全连接层等），计算出模型的输出。作用负责模型的主要计算逻辑。在训练和验证过程中都会被调用。特点必须实现：在PyTorch中，forward函数是模型的核心部分，必须显式定义。灵活性高：可以根据模型需要，自由定义forward函数的内容，包括各种计算操作。示例（PyTorch）
CEF 控制台添加一函数，枚举注册的供前端使用的CPP交互函数有哪些清水迎朝阳 CEF应用 CEF 交互注入函数注册 CPP
一、前序知识1、设置单进程模式，方便调试voidClientApp::OnBeforeCommandLineProcessing(constCefString&process_type,CefRefPtrcommand_line){if(process_type.empty()){//cef在debug模式下有问题#ifdef_DEBUGcommand_line->AppendSwitchWith
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen