0x落尘

论文阅读笔记《Ranking Sentences for Extractive Summarization with Reinforcement Learning》

文章目录

0 摘要
1 介绍
2 通过句子排序进行自动摘要

2.1 句子编码器(sentence encoder)
2.2 文档编码器(document encoder)
2.3 句子抽取器(sentence extractor)

3 交叉熵损失的陷阱
4 使用强化学习进行句子排序

4.1 策略学习(Policy Learning)
4.2 使用高概率样本进行训练

5 实验

5.1 摘要数据集
5.2 实现细节

6 结果
7 相关工作
8 结论

转载请注明原文出处

0 摘要

此文将抽取式单文档摘要概念化为句子排序任务并且提出了一种新颖的训练算法：通过强化学习对ROUGE度量进行全局优化, 使用这个算法训练了一个在CNN/Daily Mail数据集上的抽取式摘要模型。
这个模型通过自动验证与人工验证，达到了2018年的state-of-the-art

1 介绍

自动文摘是个应用化很广泛潜力很大的方向，得益于许多应用场景，例如:
帮助用户导航和消化网页内容(新闻，社交媒体，产品评论等), 问题回答, 个性化推荐引擎
而单文档摘要是自动文摘领域最基本的任务
单文档摘要的现代化方法是数据驱动的，得益于神经网络的学习连续特征能力的强大，无需使用预处理工具或语言注释等步骤
生成式摘要：包括各种文本重写操作(例如替换，删除，重新排序), 并且最近被构造为seq2seq问题
最近两年许多模型的中心思想都是用RNN建模一个编码-解码架构: 编码器将源序列读入连续空间表示的列表，解码器从该列表生成目标序列, 而且在解码时经常使用注意力机制
抽取式摘要：最近两年的论文大多把它做成序列标注任务，用神经网络来导出文档的含义表示，再用这个来标注句子是否应该被保留。这些模型通常使用交叉熵损失函数以最大化得出训练标注结果的可能性，不过因为它们缺少对句子重要程度排名的目标，它们没有对句子按重要性程度进行排序(个人不同意这句话，至少SummaRuNNer的作者就做了这个工作)
此文作者观点是对于抽取式摘要，以交叉熵作为损失函数不是最佳选择，作者认为这个损失函数容易造成信息冗余，生成过长的摘要
作者提出解决办法是让模型学习对句子排序，通过强化学习目标来对ROUGE度量进行全局优化，这个神经网络摘要模型由分层文档编码器(encoder)和分层句子提取器(extractor)组成。在训练期间，它将最大似然交叉熵损失与policy gradient强化学习的奖励相结合，直接优化与摘要任务相关的评估指标。
结果显示在CNN/Daily Mail新闻重点数据集上，就ROUGE度量而言，此模型达到新的state-of-the-art(超越以前的抽取式与生成式模型的最优结果)
作者的人工评估方法很有意思，他们有两个人工评估步骤:
a) 参与者更喜欢哪种类型的摘要结果(比较抽取式、生成式)
b) 参与者觉得摘要中保留了原文里多少关键信息
此文的三个贡献:

一个新颖的强化学习应用方法: 强化学习作用于句子排序来做抽取式自动摘要
分析与实验结果证实，交叉熵不太适用于自动摘要任务
大规模用户研究表明，目前最先进的摘要式系统落后于最先进的抽取式系统

2 通过句子排序进行自动摘要

文档 $D$ 由句子序列 $(s_1, s_2, \cdots, s_n)$ 组成, 抽取式系统的目标是通过从 $D$ 中选择 $m$ 个句子( $m < n$ )生成摘要 $S$ : 对于每个句子 $s_i \in D$ , 生成一个预测标注 $y_i \in \{0, 1\}$ 。这里 $y_i$ 为1代表句子被保留在摘要中，为0代表不保留。通过 $p(y_i | s_i, D, \theta)$ 来定量 $s_i$ 要保留到摘要中这件事的相关度。
如果 $s_i$ 的相关性比 $s_j$ 的相关性更高，这个模型对这两个句子的分配分数就会是 $s_i, D, \theta) > p(1 | s_j, D, \theta)$ , $\theta$ 表示模型参数。这个模型会把得分最高的 $m$ 个句子保留下来作为摘要 $S$ 。
模型组成: 句子编码器(sentence encoder)，文档编码器(document encoder)，句子提取器(sentence extractor)

2.1 句子编码器(sentence encoder)

最近几年，CNN(Convolutional Neural Network)被证实适用于多种NLP任务，因为CNN识别显著的输入模式牛逼。比如在自动文摘的案例中，CNN可以识别与人工生成的摘要相关的命名实体识别和事件。
模型使用temporal narrow convolution(大名鼎鼎的TCN)：一个宽度为 $h$ 的kernel filter $K$ (它用一个大小为 $h$ 个词的窗口，从句子 $s$ 中去提取特征)。
这个filter会产生一个feature map: $\in R^{k-h+1}$ , 这里 $k$ 是句子 $s$ 的长度(准确点说是句子的词数)
然后加一个max-pooling到feature map上去，将最大值作为特定滤波器的特征。
作者使用多个kernel,每个kernel扫描多次来构建句子的表示。
在下图中，大小为2的红色的kernel与大小为4的蓝色的kernel每个都被应用了3次。
max-pooling随着时间的推移产生两个特征列表 $f^{K_2}, f^{K_4} \in \bold{R}^3$ 。
最终的句子嵌入拥有6个维度。

2.2 文档编码器(document encoder)

文档编码器说白了就是组合句子序列来获得文档的表示。通常训练长序列时，用LSTM网络来避免梯度消失问题。
给定由句子序列 $(s_1, s_2, \cdots, s_n)$ 组成的文档 $D$ ，作者遵循通常的处理办法，用相反的顺序将句子送入模型中。通过这种办法可以确保这个网络一直在考虑着文档中对于摘要特别重要的句子。

2.3 句子抽取器(sentence extractor)

句子抽取器用0或1序列化地标注文档中的每个句子，通过带softmax层的LSTM网络实现。在时刻 $t_i$ , 它读入句子 $s_i$ 并且通过从文档编码器获得的文档表示以及之前的被标注地句子综合考虑，做出一个二分类预测。通过这种方式，句子抽取器能识别文档中的局部重要句及全局重要句。再对句子抽取器中的softmax层分配的置信分数 $p(y_i=1 | s_i, D, \theta)$ 进行排序。
作者通过强化学习框架对句子进行排序，直接优化最终的评估度量: ROUGE
在作者描述我们的训练算法之前，他想先在第3部分详细说明为什么最大似然交叉熵目标可能不足以对摘要的句子进行排序，然后在第4部分定义强化学习的目标函数，并且表明他们的训练方式将允许模型更好地区分句子，即如果句子经常出现在高得分的摘要中，则句子将在选择中的排名更高。
整个模型架构如下图:

3 交叉熵损失的陷阱

之前的工作通过最大化 $p(y|D,\theta) = \prod_{i=1}^n p(y_i | s_i, D, \theta)$ ,即给定文档 $D$ 与模型参数 $\theta$ , 最大化句子序列 $(s_1, s_2, \cdots, s_n)$ 的训练标注 $(y_1, y_2, \cdots, y_n)$ 的似然。
这个目标可以通过最小化每个解码步骤的交叉熵损失达成:
$L(\theta) = -\sum_{i=1}^n\log p(y_i | s_i, D, \theta) \tag{1}$
交叉熵训练导致模型中出现两种不符合(discrepancies) :

第一个不符合源自任务定义与训练目标的脱节(disconnect):公式(1)中的最大似然估计旨在最大化ground truth的似然，然而模型的任务是 a) 对句子进行排名以生成摘要和 b)在测试时刻使用ROUGE进行评估
第二个不符合来源于对ground truth标签的依赖：用于训练摘要系统的文档集合不会自然地包含标签(暗示某个句子是否应该被保留)，相反，它们通常都是人工生成的摘要中进行推断得出的 (这个理由，个人真的觉得很有见地，不应该对标签过度依赖)：
   Cheng和Lapata（2016）遵循Woodsend和Lapata（2010）采用基于规则的方法，根据与人工生成的摘要的语义对应，分别为文档中的每个句子分配标签。
   另一种方法是(Svore et al., 2007; Cao et al., 2016; Nallapati et al., 2017)采用的方法: 识别能达到最高的ROUGE度量的句子集合(collectively),这个集合中的句子被标为1，其余的标为0。
   单独标记句子通常会产生太多的为1的标签，导致模型过度拟合数据。举例，下表中的文档(一共31句话，只显示了头10句)竟然有12个被标为正的句子。集体标签(collective labels) 提供了更好的选择，因为它们仅涉及被认为最适合形成摘要的少数句子。然而，一个使用交叉熵在集体标签上训练出来的模型会欠拟合(under-fit)，因为它们只会最大化在集合中的句子的概率并忽略所有其它的句子。其实在训练过程中有许多合适的句子会取得比较高的ROUGE分数，这些候选句也应该被考虑到。

上表中的最后一列显示了句子的排名(根据ROUGE-1,ROUGE-2,ROUGE-L F1的平均值)。有意思的是，可以发现，排名高的句子拥有合理的高ROUGE分数
这些不符合的地方让模型针对抽取式摘要进行句子排序的时候不是那么有效，作者采用的训练策略不是最大化ground truth的似然，而是训练模型对文档中的每个句子去预测单一的ROUGE分数，然后再选择分数最高的m个句子组成摘要。不过高ROUGE分数的句子不一定导致高分数的摘要，例如某些句子会包括重叠的内容并形成冗长和冗余的摘要。举例，上面的句子3，拥有比较高的ROUGE 分数：35.6%，但是前5个高分摘要中都没有它。接下来作者介绍如何使用强化学习解决这个问题。

4 使用强化学习进行句子排序

强化学习被提出作为一个训练系列-序列生成模型的方法，为了直接优化使用在测试阶段的度量（如BLEU或ROUGE）。作者提出了一个组合了最大似然交叉熵与policy gradient强化学习中的奖励的目标函数来全局优化ROUGE。
这个训练算法允许探索可能的摘要空间，使得模型对于没见过的数据更加robust
总而言之，强化学习帮助抽取式摘要主要体现在两个方面:
a) 直接优化验证时的度量目标而不是最大化ground-truth标签的似然
b) 更好地对句子进行判别，一个句子如果经常出现在高分的摘要中，它的排名才会高

4.1 策略学习(Policy Learning)

将上图的抽取式神经网络模型转换为一个强化学习范例。因此，该模型可以被视为一个和文档组成的环境(environment)交互的代理(agent)。首先，代理被随机初始化，读入文档 $D$ 再对每个句子 $s_i \in D$ 使用策略(policy)—— $p(y_i|s_i,D,\theta)$ 来预测相关分数（relevance score）。
一旦代理读完一篇文档，一个带有标签 $\hat{y}$ 的摘要就会从排名的句子中抽取出来，然后给代理一个"奖励"——这个抽取摘要与标注摘要有多像。作者使用ROUGE-1，ROUGE-2, ROUGE-L的平均值的F1 score作为"奖励": $r$ 。Unigram和bigram重叠（ROUGE-1和ROUGE-2）用于评估信息量，而最长的共同子序列（ROUGE-L）用于评估语句流畅度。
公式化:
$L(\theta) = - \Bbb E_{\hat{y} \sim p_\theta}[r(\hat{y})] \tag{2}$
以上 $p_\theta$ 代表 $p(y|D,\theta)$ ，作者最小化这个公式即达到训练目标。
强化学习算法是基于这个观察(observation): 不可微分的奖励函数(这里指ROUGE)的期望梯度可以被以下公式计算出来:
$\nabla L(\theta) = - \Bbb E_{\hat{y} \sim p_\theta}[r(\hat y) \nabla\log p(\hat y | D, \theta)] \tag{3}$
公式(1)旨在最大化训练数据的似然，然而公式(2)的目标在于通过在高分摘要中出现的频率来学习区分句子(是否应该在摘要中出现)

4.2 使用高概率样本进行训练

计算公式(3)中的期望项很困难，因为可能的抽取方式太多了。在实践中，作者采用来自 $p_\theta$ 中的单一样本 $\hat y$ 来作为一个训练batch中的期望梯度的近似，即：
$\begin{aligned} \nabla L(\theta) & \approx -r(\hat y) \nabla \log p(\hat y | D, \theta) \\ & \approx -r(\hat y)\sum_{i=1}^n \nabla \log p(\hat y_i | s_i, D, \theta) \end{aligned} \tag{4}$
强化学习算法可以通过随机策略(random policy)开始学习, 它的优点是能够挑战复杂任务, 比如这个从非常大量的候选句子摘要中进行选择的任务。
作者将等式(4)中 $\hat y$ 的搜索空间限制为最大概率样本集合: $\hat \Bbb Y$ , 并使用获得最高分的 $k$ 次抽取结果来作为 $\hat \Bbb Y$ 的近似。更具体地说，他们通过首先从文档中选择 $p$ 个句子来有效地组合候选摘要，而这些句子本身具有比较高的ROUGE分数。然后在满足最大长度 $m$ 的情况下生成 $p$ 个句子的所有组合，并且用人工摘要进行验证。所有的这些摘要将按照ROUGE-1，ROUGE-2和ROUGE-L的平均值的F1 score进行排序。 $\hat \Bbb Y$ 包括了top $k$ 个候选摘要, 在训练过程中，将从 $\hat \Bbb Y$ 而非 $p(\hat y | D, \theta)$ 中进行采样。
Ranzato et al. (2015)提出了另一种强化学习方案:MIXER(混合增量交叉熵增强)，首次使用ground truth标签进行带交叉熵损失模型的预训练，然后遵循课程学习(curriculum learning) 策略（Bengio et al., 2015）逐步教导模型自己生成稳定的预测。作者的实验结果显示MIXER比Nallapati et al. (2017)仅在集体标签上训练的模型表现更差。作者猜想这是由于他们的排名问题的无穷性(unbounded nature)。回顾一下，作者的模型将相关性分数分配给句子而不是分配给单词。与其它使用固定词汇表的预测任务(Li et al., 2016; Paulus et al., 2017; Zhang and Lapata, 2017)相比，句子表示的空间是巨大的并且相当不受约束。此外，作者对梯度的近似将会使模型更快地收敛到最优策略。另一个有利的地方是此方法不需要在线奖励预估器(online reward estimator), 通过预计算 $\hat \Bbb Y$ ,对比MIXER及相关训练的模式来说有着显著的加速效果。

5 实验

作者介绍了用于评估模型性能的实验装置，作者将其称为REFRESH，作为基于加强学习的抽取式摘要的简写。作者描述了他们的数据集，讨论了实现细节，他们的验证协议(evaluation protocol)以及用于比较的系统。

5.1 摘要数据集

CNN/Daily Mail数据集, 使用Hermann et al. (2015)中的标准数据集切分

5.2 实现细节

对于CNN数据集，抽取3个句子( $m = 3$ )
对于Daily Mail数据集，抽取4个句子( $m = 4$ )
这是因为CNN/Daily Mail验证集中的gold highlights句子长度比为2.6 / 4.2
对这两个数据集作者使用具有最高分的10个文档句子序列( $p = 10$ )来估计高分抽取
通过调整，作者发现当在CNN数据集上 $k = 5$ 时，在Daily Mail上 $k = 15$ 时模型表现最好
使用One Billion Word Benchmark 语料 (Chelba et al., 2013)，skip-gram模型(Mikolov et al., 2013) (上下文窗口大小为6，负采样大小10，分层softmax 1)来训练词嵌入, 对已知词的嵌入维度200，对未知词的初始嵌入维度为0，不过在训练时，句子将增加0到长度100
其余的略。。。真心不想肝了，反正不太重要，作者原文也写得挺详细的。

6 结果

论文阅读笔记《Ranking Sentences for Extractive Summarization with Reinforcement Learning》_第4张图片

一顿操作，证明自己达到state-of-the-art

7 相关工作

介绍了很多以前的工作，并说作者没听说过以前有用强化学习训练句子排名来做抽取式摘要的尝试工作。

8 结论

在这项工作中，作者开发了一个抽取式摘要模型，该模型通过优化ROUGE评估指标进行全局训练。训练算法探索候选摘要的空间，同时学习优化与手头任务相关的奖励功能。实验结果表明，强化学习提供了一种很好的方法来引导他们的模型，以生成信息丰富，流畅，简洁的摘要，优于CNN和DailyMail数据集上最先进的抽取式和生成式系统。在未来，作者希望关注较小的话语单元（discourse unit）（Mann和Thompson，1988），而不是单独的句子，建模压缩和联合抽取

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
2.2.6 通知类控件 Toast、Menu 常思行
本文例程下载：WillFlow_Toast、WillFlowMenu一、什么是Toast？Toast也被叫做吐司，是Android系统提供的一种非常好的提醒方式，在程序中可以使用它将一些短小的信息通知给用户，它有如下两个特点：Toast是没有焦点的Toast显示的时间有限过一定的时间就会自动消失所以一般来讲Toast的使用并不会影响我们的正常操作，并且它通常不会占用太大的屏幕空间，有着良好的用户体
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
Python神器！WEB自动化测试集成工具 DrissionPage 亚丁号 python 开发语言
一、前言用requests做数据采集面对要登录的网站时，要分析数据包、JS源码，构造复杂的请求，往往还要应付验证码、JS混淆、签名参数等反爬手段，门槛较高。若数据是由JS计算生成的，还须重现计算过程，体验不好，开发效率不高。使用浏览器，可以很大程度上绕过这些坑，但浏览器运行效率不高。因此，这个库设计初衷，是将它们合而为一，能够在不同须要时切换相应模式，并提供一种人性化的使用方法，提高开发和运行效率
matlab mle 优化,MLE+: Matlab Toolbox for Integrated Modeling, Control and Optimization for Buildings... Simon Zhong matlab mle 优化
摘要：FollowingunilateralopticnervesectioninadultPVGhoodedrat,theaxonguidancecueephrin-A2isup-regulatedincaudalbutnotrostralsuperiorcolliculus(SC)andtheEphA5receptorisdown-regulatedinaxotomisedretinalgan
微信母婴闲置群如何盈利赚钱母婴优惠券群主怎么做古楼
宝妈闲置群群主怎么赚钱微信母婴闲置群如何盈利赚钱怎么做母婴优惠券群作为宝妈闲置群群主，你可以通过以下几种方式赚取收益：1.分享优惠券和佣金实现带货赚钱：宝妈闲置群群主带货赚钱最常见的方式就是直接做母婴优惠群群分享商品赚钱。母婴闲置群群主通过对接高省优惠券返利app这类第三方平台分享优惠券获得推广购物返利佣金赚钱。高省，含有自动云发单功能，开通云发单，宝妈闲置群群主就可以解放双手，自动分享商品优惠券
基于STM32与Qt的自动平衡机器人：从控制到人机交互的的详细设计流程极客小张 stm32 qt 机器人物联网人机交互毕业设计 c语言
一、项目概述目标和用途本项目旨在开发一款基于STM32控制的自动平衡机器人，结合步进电机和陀螺仪传感器，实现对平衡机器人的精确控制。该机器人可以用于教育、科研、娱乐等多个领域，帮助用户了解自动控制、机器人运动学等相关知识。技术栈关键词STM32单片机步进电机陀螺仪传感器AD采集电路Qt人机界面实时数据监控二、系统架构系统架构设计本项目的系统架构设计包括以下主要组件：控制单元:STM32单片机传感器
《 C++ 修炼全景指南：九》打破编程瓶颈！掌握二叉搜索树的高效实现与技巧 Lenyiin C++修炼全景指南技术指南 c++算法 stl
摘要本文详细探讨了二叉搜索树（BinarySearchTree,BST）的核心概念和技术细节，包括插入、查找、删除、遍历等基本操作，并结合实际代码演示了如何实现这些功能。文章深入分析了二叉搜索树的性能优势及其时间复杂度，同时介绍了前驱、后继的查找方法等高级功能。通过自定义实现的二叉搜索树类，读者能够掌握其实际应用，此外，文章还建议进一步扩展为平衡树（如AVL树、红黑树）以优化极端情况下的性能退化。
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
【Python搞定车载自动化测试】——Python实现车载以太网DoIP刷写（含Python源码）疯狂的机器人 Python搞定车载自动化 python DoIP UDS ISO 14229 1SO 13400 Bootloader tcp/ip
系列文章目录【Python搞定车载自动化测试】系列文章目录汇总文章目录系列文章目录前言一、环境搭建1.软件环境2.硬件环境二、目录结构三、源码展示1.DoIP诊断基础函数方法2.DoIP诊断业务函数方法3.27服务安全解锁4.DoIP自动化刷写四、测试日志1.测试日志五、完整源码链接前言随着智能电动汽车行业的发展，汽车=智能终端+四个轮子，各家车企都推出了各自的OTA升级方案，本章节主要介绍如何使
《 C++ 修炼全景指南：十》自平衡的艺术：深入了解 AVL 树的核心原理与实现 Lenyiin C++修炼全景指南技术指南 c++数据结构 stl
摘要本文深入探讨了AVL树（自平衡二叉搜索树）的概念、特点以及实现细节。我们首先介绍了AVL树的基本原理，并详细分析了其四种旋转操作，包括左旋、右旋、左右双旋和右左双旋，阐述了它们在保持树平衡中的重要作用。接着，本文从头到尾详细描述了AVL树的插入、删除和查找操作，配合完整的代码实现和详尽的注释，使读者能够全面理解这些操作的执行过程。此外，我们还提供了AVL树的遍历方法，包括中序、前序和后序遍历，
进销存小程序源码 PHP网络版ERP进销存管理系统全开源可二开摸鱼小号 php
可直接源码搭建部署发布后使用：一、功能模块介绍该系统模板主要有进，销，存三个主要模板功能组成，下面将介绍各模块所对应的功能；进：需要将产品采购入库，自动生成采购明细台账同时关联财务生成付款账单；销：是指对客户的销售订单记录，汇总生成产品销售明细及回款计划；存：库存的日常盘点与统计，库存下限预警、出入库台账、库存位置等。1.进购管理采购订单：采购下单审批→由上级审批通过采购入库；采购入库：货品到货>
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方