数据与智能

「PyTorch自然语言处理系列」3. 神经网络的基本组件（中）

来源 | Natural Language Processing with PyTorch

作者 | Rao，McMahan

译者 | Liangchu

校对 | gongyouliu

编辑 | auroral-L

全文共5283字，预计阅读时间45分钟。

上下拉动翻看整个目录

1. 感知机：最简单的神经网络

2. 激活函数

2.1 Sigmoid

2.2 Tanh

2.3 ReLU

2.4 Softmax

3. 损失函数

3.1 均方误差损失

3.2 分类交叉熵损失

3.3 二元交叉熵损失

4. 深入有监督训练

4.1 构造玩具数据

4.1.1 选择模型

4.1.2 转换概率到具体类

4.1.3 选择损失函数

4.1.4 选择优化器

4.2 放到一起：基于梯度的监督学习

5. 补充训练概念

5.1 正确度量模型表现：评估度量

5.2 正确度量模型表现：分割数据集

5.3 知道什么时候停止训练

5.4 找到正确的超参数

5.5 正则化

6. 示例：分类餐馆评论的情感

6.1 Yelp 评论数据集

6.2 理解 PyTorch 的数据集表示

6.3 Vocabulary，Vectorizer和DataLoader

6.3.1 Vocabulary

6.3.2 Vectorizer

6.3.3 DataLoader

6.4 感知机分类器

6.5 训练例程

6.5.1 设置阶段来启动训练

6.5.2 训练循环

6.6 评估（evaluation），推理（inference）和检查（inspection）

6.6.1 在测试数据上评估

6.6.2 推理和分类新的数据点

6.6.3 检查模型权重

7. 总结

参考资料

4. 深入有监督训练

监督学习是在给定示例标签的情况下学习如何将观察结果（observation）映射到特定目标（target）的问题。在这一节中，我们将探讨更多细节。具体来讲，我们明确地描述如何使用模型预测（prediction）和损失函数（loss function）对模型参数（parameter）进行基于梯度的优化。本节内容十分重要，因为本书的其余部分都基于此，所以即使你对监督学习有些熟悉，也最好仔细阅读本节。

回顾第一章，有监督学习需要以下内容：模型、损失函数、训练数据和优化算法。监督学习的训练数据是观察和目标对，模型从观察中计算预测，损失衡量预测相对于目标的误差。训练的目的是利用基于梯度的优化算法来调整模型的参数，使损失尽可能小。

在本节的剩余部分，我们将讨论一个经典的玩具问题（toy problem）：将二维点划分为两个类中的一个。直观上，这意味着学习一条直线（称为决策边界(decision boundary)或超平面(hyperplane)）来区分类之间的点。我们将一步步描述数据构造、选择模型、选择一个损失、建立优化算法，最后一起运行这些内容。

4.1 构造玩具数据

在机器学习中，当试图理解一个算法时，创建具有易于理解属性的人造数据是一种司空见惯的做法。本节中，我们使用人造合成数据将二维点分类为两类中的一个。为了构建数据，我们从xy平面的两个不同部分采样点，为模型创建一个易于学习的环境，示例下图（3-2）所示。模型的目标是将星星（⭐）和圆圈（⚪）分别分类为两个不同的类，我们可以从图的右侧认识到这一点，虚线上方和下方的东西分类是不同的。生成数据的代码位于本章附带的 Python notebook中名为get_toy_data()的函数中。

4.4.1 选择模型

我们在这里使用的模型是本章开头所介绍的感知器。感知器是灵活的，这是因为它允许任何大小的输入。在典型的建模情况下，输入大小是由任务和数据决定的。在这个玩具示例中，输入大小为 2，这是因为我们显式地将数据构造为二维平面。对于这个二分类问题，我们为类分别指定一个数字索引：0 和 1。映射标签⭐和⚪到类的映射是任意的——只要在数据预处理、训练、评估和测试的过程中是一致的。该模型另一个重要属性是其输出的性质。由于感知器的激活函数是一个 sigmoid函数，感知器的输出就是数据点（x）为类 1 的概率，即P(y = 1 | x)。

4.1.2 转换概率到具体类

对于二分类问题，我们可以通过利用决策边界δ将输出概率转换成两个离散类。如果预测的概率P(y = 1 | x) > δ，那么预测类是 1，其他类为0。通常，这个决策边界被设置为 0.5，但在实际运用时，你可能需要微调优化这个超参数（使用一个评估数据集），以便在分类中达到理想的精度。

4.1.3 选择损失函数

在准备好数据并选择了模型体系结构之后，在有监督的训练中还可以选择另外两个重要组件：损失函数和优化器。在模型输出为概率的情况下，最合适的损失函数家族是基于交叉熵的损失函数（cross entropy–based losses）。对于这个玩具数据示例，由于模型产生二进制结果，所以我们特别使用 BCE 损失。

4.1.4 选择优化器

在这个简化的监督训练示例中，最后要选择优化器。当模型产生预测并且损失函数衡量预测和目标之间的误差时，优化器使用错误信号更新模型的权重。最简单的形式是，有一个超参数能控制优化器的更新行为，这个超参数称为学习率（learning rate），它控制错误信号对更新权重的影响。学习速率是一个关键的超参数，你应该尝试几种不同的学习速率并比较它们的效果。学习率过高会使得参数产生较大的变化，并会影响其收敛性，而学习率过低会导致在训练过程中进展甚微（收敛太慢）。

PyTorch 库提供了几种优化器以供选择。随机梯度下降法（Stochastic gradient descent，SGD）是一种经典的选择算法，但对于比较麻烦的优化问题，SGD 存在收敛性问题，往往会导致模型较差。目前首选的替代方案是自适应优化器（adaptive optimizer），例如 Adagrad 或 Adam，它们随时间变化使用关于更新的信息。在下面的例子中，我们使用 Adam，但看看其他一些不同的优化器也是有益无害的。对于 Adam，默认的学习率是 0.001。对于学习率之类的超参数，我们总是建议首选默认值，除非你从论文中获得了选取特定值的秘诀。

示例 3-9：实例化 Adam 优化器

Input[0] 
import torch.nn as nn 
import torch.optim as optim 
 
input_dim = 2 
lr = 0.001 
 
perceptron = Perceptron(input_dim=input_dim) 
bce_loss = nn.BCELoss() 
optimizer = optim.Adam(params=perceptron.parameters(), lr=lr)

4.2 放到一起：基于梯度的监督学习

学习从计算损失开始，也就是说，模型预测离目标有多远。损失函数的梯度，继而就是参数应该改变多少的信号。每个参数的梯度表示给定参数的损失值的瞬时变化率。实际上，这意味着你可以知道每个参数对损失函数的贡献有多大。直观上来看，这是一个斜率，你可以想象每个参数都站在它自己的山上，并且想要向上或向下移动一步。基于梯度的模型训练所涉及的最简单的形式就是迭代地更新每个参数，并使用与该参数相关的损失函数的梯度。

下面看一下这个梯度步进（gradient-stepping）算法长什么样。首先，所有诸如梯度之类的簿记信息当前都存储在模型（感知器）对象中，这些簿记信息都被名为zero_grad()的函数所清除。然后，模型计算给定输入数据（x_data）的输出（y_pred）。接下来，通过比较模型输出（y_pred）和预期目标（y_target）的大小来计算损失。这正是有监督训练信号的有监督部分。PyTorch 损失对象（criterion）包含一个名为backward()的函数，它通过计算图迭代地向后传播损失，并将其梯度通知给每个参数。最后，优化器（opt）使用一个名为step()的函数指导参数如何在知道梯度的情况下更新它们的值。

整个训练数据集被划分成多个批（batch）。每个梯度步的迭代都在一批数据上完成。名为batch_size的超参数指定批次大小。由于训练数据集固定，增加批的大小就会减少批的数量。

注意

在文献中，当然也包括在本书中，术语minibatch也可以和batch互换使用，以强调每个batch都明显小于训练数据的大小。例如，训练数据可能有数百万个，而minibatch可能只有几百个。

在多个批（通常是有限大小数据集中的批量数量）之后，训练循环完成了一个周期（epoch）。周期是一个完整的训练迭代。如果每个周期的批数量与数据集中的批数量相同，那么一个周期就是对数据集的完整迭代。模型是为一定数量的周期而训练的。要训练的周期数量并不难选择，但也有一些方法可以决定何时停止，我们稍后将讨论这点。如下例（3-11）所示，有监督的训练循环是一个嵌套循环：数据集或批集合上的内循环，以及外循环，后者在固定数量的周期或其他终止条件上重复内循环。

示例 3-11：感知机和二分类的有监督训练循环

# each epoch is a complete pass over the training data 
for epoch_i in range(n_epochs): 
    # the inner loop is over the batches in the dataset 
    for batch_i in range(n_batches): 
 
        # Step 0: Get the data 
        x_data, y_target = get_toy_data(batch_size) 
 
        # Step 1: Clear the gradients 
        perceptron.zero_grad() 
 
        # Step 2: Compute the forward pass of the model 
        y_pred = perceptron(x_data, apply_sigmoid=True) 
 
        # Step 3: Compute the loss value that we wish to optimize 
        loss = bce_loss(y_pred, y_target) 
 
        # Step 4: Propagate the loss signal backward 
        loss.backward() 
 
        # Step 5: Trigger the optimizer to perform one update 
        optimizer.step()

5. 补充训练概念

基于梯度的有监督学习的核心概念很简单：定义模型、计算输出、使用损失函数计算梯度、应用优化算法使用梯度更新模型参数。然而，在训练过程中有几个重要的概念需要补充了解，我们将在本节介绍其中一些概念。

5.1 正确度量模型表现：评估度量

核心的有监督训练循环之外最重要的部分是使用模型从未训练过的数据来客观衡量表现。我们使用一个或多个评估度量（evaluation metrics）对模型进行评估。在自然语言处理中有许多种评价指标。最常见的也是我们将在本章使用的就是准确性（accuracy）。简单地说，准确性就是在训练过程中未见的数据集上预测正确的部分。

5.2 正确度量模型表现：分割数据集

请一定记住：我们最终的目标是很好地概括（generalize）数据的真实分布。这又是什么意思？假设我们能够看到无限数量的数据（“真实/不可见的分布”），那么存在一个全局的数据分布。显然我们是无法看到无限数量的数据的。相反，我们用有限的样本作为训练数据。我们观察数据在有限样本中的分布，这是真实分布的近似或不完全版本。如果一个模型不仅降低了训练数据中样本的误差，而且减少了来自不可见分布的样本的误差，那么这个模型就比另一个模型具有更好的普遍性/泛化。当模型致力于降低它在训练数据上的损失时，它可能过度拟合（overfit）并适应了那些实际上不是真实数据分布一部分的特性。

要很好地概括数据的真实分布，标准实践是：要么将数据集分割为三个随机采样的分区（称为训练集training、验证集validation和测试集testing）；要么进行k-fold交叉验证（k-fold cross validation）。前者是比较简单的一种，因为它只需要一次计算。你应该采取预防措施，确保在划分的三个数据集之间的类分布保持相同。换句话说也就是通过类标签聚合数据集，然后将每个由类标签分隔的集合随机拆分为训练集、验证集和测试集，这是一种很好的实践。一个常见的分割百分比是：70% 用于训练，15% 用于验证，15% 用于测试。不过，这不是一个死板的划分约定，你当然也可以自行划分数据集的百分比。

在某些情况下，可能存在预定义的训练集、验证集和测试集，这在用于基准测试任务的数据集中很常见。在这种情况下，重要的是只使用训练数据更新模型参数、在每个周期结束时使用验证数据测量模型效果、并在选择了所有的模型以及报告了最终结果之后只使用一次测试数据。这最后一部分是极其重要的，因为机器学习工程师越是关注测试数据集上的模型效果，他们就越倾向于选择在测试集上表现更好的模型。

使用k-fold交叉验证的模型评估与使用预定义分割的评估非常相似，但是在此之前还有一个额外的步骤：将整个数据集分割为 k 个大小相同的“fold”。保留其中一个fold用于评估，剩下的k-1个fold都用于训练。这是通过交换用于评估的fold来重复的。因为有 k 个fold，每个fold都有机会成为一个评估fold，从而产生 k 个精度值。最终被报告的准确性只是具有标准差的平均值。k-fold评估在计算上的成本是昂贵的，但是对于小规模数据集来说还是非常有必要的，对于较小的数据集来说，错误的分割可能导致过于乐观（因为测试数据太简单）或过于悲观（因为测试数据太复杂）的情况。

5.3 知道什么时候停止训练

先前的例子使用固定次数的周期来训练模型，虽然这是最简单的方法，但它是任意并且不必要的。正确度量模型效果的一个关键功能是使用该度量来知道何时应该停止训练。最常用的方法是使用名为早停法（early stopping）的启发式方法。早停法通过跟踪验证数据集上从一个周期到另一个周期的效果以及注意效果何时不再改进来工作。然后，如果模型效果继续没有改善，训练将终止。在结束训练之前需要等待的周期数称为patience。一般来说，模型停止改进某些数据集的时间点称为模型收敛（converge）的时间点。在实际应用中，我们很少等模型完全收敛，因为收敛是耗时的，而且会导致过拟合。

5.4 找到正确的超参数

我们在前面了解到，一个参数（或权重）采用优化器关于称为小批量minibatch的固定训练数据子集所调整得到的实际值。一个超参数（hyperparameter）是影响模型中参数数量和参数所取值的模型设置。有许多不同的选择可以决定如何训练模型，它们包括选择一个损失函数、优化器、优化器的学习率（如layer的大小，将在第四章中讲解）、早停法的patience和各种正则化决策（也将在第四章中讨论）。需要注意的是，这些决策会对模型是否收敛及其效果产生很大影响，所以你应该系统地探索各种选择点。

5.5 正则化

深度学习（以及普遍意义上的机器学习）中最重要的概念之一是正则化（regularization）。正则化的概念来源于数值优化理论。回想一下，大多数机器学习算法都在优化损失函数，以找到对于模型来说最可能的参数值，以解释观测结果（即产生的损失最少）。对于大多数数据集和任务，这个优化问题可能有多个解决方案（可能的模型）。那么我们（或优化器）应该选择哪一个模型呢？为了形成直观的理解，请考虑下图（3-3），它通过一组点拟合曲线：

两条曲线都拟合（fit）这些点，但哪一条是不太可能的解释呢？通过应用奥卡姆剃刀（Occam’s razor），我们可以凭直觉知道：一个简单的解释比复杂的解释更好。这种机器学习中的平滑约束称为 L2 正则化（L2 regularization）。在 PyTorch 中，你可以通过在优化器中设置weight_decay参数来控制这一点。weight_decay值越大，优化器选择的解释就越流畅，也即L2 正则化越强。

除了 L2，另一种流行的正则化是 L1 正则化（L1 regularization）。L1 通常用来鼓励稀疏解（sparser solutions），也就是说大多数模型参数值都接近于零。在第四章中，你将看到一种结构正则化技术，称为“dropout”。模型正则化是一个很活跃的研究领域，而PyTorch 是实现自定义正则化的灵活框架。

【Grafana】Prometheus指标可视化Grafana，手把手教你如何自定义图形景天科技苑 grafana prometheus prometheus可视化 grafana自定义图形手撕grafana 自定义监控图形
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，Prometheu
Python量化实战：基于索提诺比率的价值投资策略回测量化价值投资入门到精通 python 网络开发语言 ai
Python量化实战：基于索提诺比率的价值投资策略回测关键词：Python量化分析、索提诺比率、价值投资策略、回测框架、风险调整收益、下行风险、量化实战摘要：本文深入探讨如何利用Python构建基于索提诺比率（SortinoRatio）的价值投资策略，并通过完整的回测框架验证策略有效性。首先解析索提诺比率的数学原理与核心优势，对比传统夏普比率的差异；其次详细演示价值投资策略的构建步骤，包括低估值因
Python+Allpairspy实战：高效正交法测试用例设计全攻略聪明的一休哥哥测试开发技术大全 python 测试用例自动化测试
引言：正交法的核心价值正交实验法是一种通过科学筛选参数组合来优化测试用例设计的技术。其核心思想是从所有可能的参数组合中，选择最具代表性的N个组合进行测试，既能显著减少用例数量（通常可减少30%-70%），又能保证覆盖关键场景。例如：传统全组合测试：3因素×3水平=27种组合正交法优化后：仅需4-9种组合即可覆盖核心场景1、Allpairspy库安装与基础使用1.1、安装命令pipinstallal
Python 应用无监督学习（一）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/6b15c463e64a9f03f0d968a77b424918译者：飞龙协议：CCBY-NC-SA4.0前言关于本节简要介绍了作者、本书的内容覆盖范围、开始时你需要的技术技能，以及完成所有活动和练习所需的硬件和软件要求。本书简介无监督学习是一种在没有标签数据的情况下非常有用且实用的解决方案。Python应用无监督学习引导你使用无监督学习技术与Py
Python包高级开发技术：性能优化与系统集成软考和人工智能学堂 Python开发经验深度学习强化学习 python 性能优化开发语言
引言掌握Python包的高级开发技术是构建工业级应用的关键。本文将深入探讨Python包的性能优化策略、C扩展开发、异步IO集成以及跨语言互操作等高级主题，帮助你将Python包提升到专业水平。1.性能优化技术1.1性能分析工具链#性能分析工具矩阵perf_tools={'cProfile':'标准库分析器，提供函数级耗时统计','line_profiler':'行级分析器，需要@profile装
2、Python 测试全攻略：自动化与驱动开发辣条鉴定师 Python测试自动化测试测试驱动开发
Python测试全攻略：自动化与驱动开发1.测试的乐趣与收益编程过程中，测试常被视为徒劳或浪费时间的事。但实际上，测试可以变得轻松有趣且富有成效。比如回忆一下曾遇到的恼人bug，可能是数据库模式不匹配、数据结构错误等。若有一小段代码能在恰当时间捕捉到该bug并告知你，而所有代码都配有这样易执行的测试代码，那bug存活时间会大大缩短。基本思路是用简单易写的代码片段告知计算机期望结果，让计算机在编码过
华为OD机考2025B卷 - 表达式括号匹配（Java & Python& JS & C++ & C ）算法大师最新华为OD机试真题华为OD机试真题 (Java/JS/Py/C)华为od java python javascript c++
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看2025华为od机试2025B卷-华为机考OD2025年B卷题目描述(1+(2+3)*(3+(8+0))+1-2)这是一个简单的数学表达式,今天不是计算它的值,而是比较它的括号匹配是否正确。前面这个式子可以简化为(()(()))这样的括号我们认为它是匹配正确的,而((())这样的我们就说他是错误的。注意括号里面的表达式可能是错
SpringBoot单元测试全攻略：MockMVC+Testcontainers+覆盖率分析 fanxbl957 Web spring boot 单元测试后端
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot单元测试全攻略：
Python.03 唯怡委员 python
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程是Linux中资源分配的基本单位，代表程序在内存中的执行实例，拥有独立的地址空间和系统资源。通过ps、top命令查看，kill命令终止，或使用systemctl管理服务进程。线程是进程内的轻量级执行单元，共享进程资源（如内存），切换开销小。Linux通过POSIX线程（pthread）库实现，可用htop查
Python.01 唯怡委员 python
Python.011.技术面试题（1）TCP与UDP的区别是什么？（2）DHCP和DNS的作用是什么？（3）简述Linux文件系统的目录结构，其中/boot、/var、/usr目录的作用分别是什么？（4）Linux系统突然无法访问外网，但内网通信正常。请列出至少5个可能的故障点及排查步骤。2.HR面试题（1）假如你成功入职，却发现直属领导能力远不如你，你会如何与他共事？（2）你简历上的经历并不突出
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
大数据领域数据架构的实时数据可视化架构 AGI大模型与大数据研究院 AI大模型应用开发实战信息可视化大数据架构 ai
大数据领域数据架构的实时数据可视化架构关键词：大数据架构、实时数据处理、数据可视化、流式计算、数据管道、可视化工具、性能优化摘要：本文深入探讨了大数据领域中实时数据可视化架构的设计与实现。我们将从基础概念出发，逐步分析实时数据处理流程，介绍关键技术和工具，并通过实际案例展示如何构建高性能的实时可视化系统。文章将涵盖数据采集、处理、存储和可视化展示的全链路架构，同时讨论性能优化策略和未来发展趋势。1
【算法-贪心算法-python】柠檬水找零檀越@新空间 P1 算法与数据结构 s1 Python 算法贪心算法 python
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kuan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
【算法】贪心算法——柠檬水找零
题解：柠檬水找零(贪心算法)目录1.题目2.题解3.参考代码4.证明5.总结1.题目题目链接：LINK2.题解分情况讨论+贪心算法当顾客为5元时，收下当顾客为10元时，收下10元并找回5元当顾客为20元时，收下20元并找回10+5元或者5+5+5元这里仅20元时候找钱会有分歧，所以这里我们用贪心算法，即优先留下尽可能多的5元，尽快把10元扔出去。原因：5元是“万金油”，既可以给10元找零，也可以给
python爬虫-国家企业信用信息公示系统_GitHub - yong771/Crack-JS: Python3爬虫项目进阶实战、JS加解密、逆向教程 - 犀牛数据 | 美团美食 | 企名片 | 七麦... 日向夕阳
Crack-JSPython3爬虫实战、JS加解密、逆向教程犀牛数据|美团美食|企名片|七麦数据|淘大象|梦幻西游藏宝阁|漫画柜|财联社|中国空气质量在线监测分析平台|66ip代理|零度ip|国家企业信用信息公示系统|中国产品大目录Author咸鱼微信公众号咸鱼学PythonIntroduce数据解密、反爬处理、逆向教程一、代码配套说明目录JS解密案例│├──lingduip//-----零度ip
python pywebview + vue3 做桌面端妃衣 python 开发语言
pythonpywebview+vue3做桌面端Api.py#传给前端的api对象,定义了一个可以通过js调用退出当前应用的函数classApi:def__init__(self)->None:self._window=None#java运行的线程self.process=Nonedefset_process(self,_process):self.process=_processdefset_w
python的pywebview库结合Flask和waitress开发桌面应用程序简介 czliutz python 笔记 python flask 开发语言
pywebview的用途与特点用途pywebview是一个轻量级Python库，用于创建桌面应用程序（GUI）。它通过嵌入Web浏览器组件（如Windows的Edge/IE、macOS的WebKit、Linux的GTKWebKit），允许开发者使用HTML/CSS/JavaScript构建界面，并用Python处理后端逻辑。这种方式结合了Web技术的灵活性和Python的强大功能，适合快速开发跨平
python笔记day1 w的狗子啊
01.Holleword1.pycharm快捷键ctrl+/----添加或者取消注释ctrl+s----保存ctrl+c----复制ctrl+v----粘贴ctrl+n----新建ctrl+f----搜索ctrl+r----替换ctrl+z----撤销ctrl+shift+z-----反撤销ctrl+a----全选2.注意事项在程序中涉及到的所有和语法相关的符号，都是在英文输入法下对应的符号。实际
从文本到语音：使用 ElevenLabs 和 FFmpeg 实现语音合成与播放曦紫沐语音模型 ffmpeg ElevenLabs 语音合成
摘要在当今的人工智能时代，语音合成技术正变得越来越普及。ElevenLabs是一个强大的语音合成平台，能够生成高质量的语音音频。本文将详细介绍如何结合Python、ElevenLabsAPI和FFmpeg工具集，实现从文本到语音的转换，并通过ffplay播放生成的音频文件。同时，我们将解决常见的问题，如ffplay未找到或音频无法播放等。1.引言随着人工智能技术的发展，语音合成（Text-to-S
Python就业薪资好不好，学Python工作机会多吗？ Python小辰
Python就业薪资好不好？学Python工作机会多吗？人工智能时代的来临让Python崭露头角，各大企业纷纷加大对相关人才的招聘力度吸引了很多人入行学习Python。近年来Python开发发展迅猛，吸引了很多科技公司入驻，且看小编的分析。Python薪资好不好?数据是最有力的答案。职友集统计数据显示，全国Python工程师的平均月资达19160，其中20-30K的工程师数量超过了四成。来自智联招
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
函数对象 tal0n
函数对象是STL库提供的除了迭代器，迭代器配接器以外的另外一种概念。简单来说：函数对象提供了一种方法，将要调用的函数与准备传递给这个函数的隐藏参数捆绑在一起。即：该对象实现了operator()的同时还提供了部分执行时的上下文环境。下面我们通过例子来详细看下函数对象。例子STL中有一个find_if的算法实现，他的参数包括：一组表示范围的迭代器，一个用于生成bool类型值的判断式。例如我们需要在一
践行乡村支教，助力乡村振兴 bc1bd9748b57
在大数据时代，大量农村青年进城寻求机遇，在工资待遇环境各个方面追求改善，导致大批留守儿童与孤寡老人，教育环境差，师资力量薄弱，这些孩子的教育问题受到大众关注。同时，大学毕业生在求职时也更加倾向于留在大城市，发展较快的地方寻求更大的发展机遇。当然也不乏大学生回乡为新一代的成长奉献自己，通过支教或者直接就业的形式，为乡村孩子的成长奉献自己的力量。有一些有才华的人放弃自己在大城市继续深造的机会，专心于这
时序数据库：数据库领域的未来之星数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库时序数据库 ai
时序数据库：数据库领域的未来之星关键词：时序数据库、时间序列数据、物联网、大数据分析、数据库优化、TSDB、实时数据处理摘要：本文深入探讨了时序数据库(TimeSeriesDatabase,TSDB)这一新兴数据库技术。我们将从基本概念入手，分析时序数据库的核心原理和架构设计，详细讲解其特有的数据模型和存储机制。通过实际代码示例展示如何使用主流时序数据库处理时间序列数据，并探讨其在物联网、金融科技
飞算JavaAI：力臻开发之本真，破 AI 代码之繁琐，传统项目一键生成微学AI 人工智能 java javaAI
飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成文章目录飞算JavaAI：力臻开发之本真，破AI代码之繁琐，传统项目一键生成一、前言二、飞算JavaAI是什么？2.1背景与实力2.2飞算JavaAI的“独门绝技”三、飞算JavaAI实战体验3.1IDEA插件安装配置3.2Main中写一个简单的梯度下降算法3.3main函数搭建一个卷积神经网络网络3.4飞算JavaAI：需求分析
PyCharm 高效入门指南：从安装到进阶，解锁 Python 开发全流程
作为Python开发者的利器，PyCharm的安装与配置是开启高效编程之旅的第一步。面对Community和Professional两个版本，该如何选择呢？Community版是免费开源的，适合初学者和简单项目开发，包含基础的Python开发功能；而Professional版虽收费，但功能更强大，支持Web开发、数据库连接等高级功能，适合专业开发者和复杂项目。1.安装与配置下载与安装下载PyCha
嵌入式知识篇---机械臂的运动学结算（简单2自由度） Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇人工智能机械臂解算
机械臂的“解算”本质是运动学解算，核心是解决“关节角度”和“末端位置”的互转问题。下面用最通俗的方式解释，并结合2自由度平面机械臂（结构最简单，适合入门）给出Python和ESP32代码，以及参数细节。一、机械臂运动学解算的通俗原理想象你有一条“简化的手臂”：只有大臂和小臂两个关节（类似人类的上臂和前臂），只能在桌面（X-Y平面）内运动。正解：知道“大臂转30°，小臂转60°”，算出“手掌”的位置
MySQL 大数据量分页查询优化实战：从 90秒到 965毫秒的性能飞跃要阿尔卑斯吗. mysql 数据库分布式架构 java
在日常开发中，我们经常需要对数据库中的数据进行分页展示。特别是当表数据量达到几十万甚至上百万级时，传统的LIMIT分页方式会面临严重的性能瓶颈。今天，我将分享一个真实的性能优化案例，通过模拟大页码查询的现场，从90秒缩短到965毫秒，显著提升了查询效率。本篇文章将从问题出现的原因、索引原理、优化思路和最终实战效果等方面，为你全面讲解如何高效处理MySQL大数据分页查询问题。一、问题背景：大页码分页
老码农和你一起学AI：Python系列-Pandas 并行计算 chilavert318 熬之滴水穿石 pandas python
但凡用到科学计算，Pandas几乎是绕不开的工具——它以简洁的API、灵活的数据操作能力成为数据处理的“瑞士军刀”。但随着数据量增长（比如从10万行到1000万行），你可能会发现：原本流畅的代码突然变慢了，一个简单的apply操作要等好几分钟，读取大文件时进度条仿佛凝固了。这不是你的代码有问题，而是原生Pandas的“单线程”基因在多核时代遇到了瓶颈。并行计算正是解决这个问题的核心方案。简单来说，
老码农和你一起学AI：Python系列-Pandas大数据处理 chilavert318 熬之滴水穿石 pandas python
今天开始梳理一下pandas的大数据处理，在数据处理领域，Pandas凭借简洁的API和强大的功能成为Python开发者的首选工具。但当面对GB级甚至更大的数据集时，直接读取数据往往会触发“内存不足”的错误——这是因为Pandas默认将数据全部加载到内存中进行处理。此时，分块处理（Out-of-Core）技术就成为解决问题的关键。它通过将大文件拆分为小块，逐块加载并处理，最终整合结果，实现“用有限
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。