帅帅梁

论文笔记：Cross-Lingual Semantic Role Labeling with High-Quality Translated Training Corpus

基于高质量翻译训练语料库的跨语言语义角色标注

摘要
介绍
2 相关工作
3 SRL Translation（SRL 翻译）
4 The SRL Model
- 4.1 Word Representation（词语表征）
- 4.2 Encoding Layer
- 4.3 Output Layer
5 Experiments
- 5.1 Universal Proposition Bank
- 5.2 SRL Translation
- 5.3 Settings
- 5.4 Cross-Lingual Transfer from English
- 5.5 Multi-Source Transfer（多源传输）
- 5.6 Analysis
6 Conclusion

摘要

许多研究工作致力于语义角色标记（SRL），这对于自然语言理解至关重要。当大规模语料库可用于资源丰富的语言（如英语）时，监督方法取得了令人印象深刻的表现。而对于没有注释 SRL 数据集的低资源语言，获得有竞争力的性能仍然具有挑战性。跨语言 SRL 是解决该问题的一种很有前途的方法，它在模型转移和注释投影（model transferring and annotation projection) 的帮助下取得了很大进展。在本文中，我们提出了一种基于语料库翻译的新替代方案，从源黄金标准 SRL 注释构建目标语言的高质量训练数据集。在 Universal Proposition Bank 上的实验结果表明，基于翻译的方法非常有效，并且自动伪数据集可以显着提高目标语言 SRL 的性能。

介绍

语义角色标注(SRL)旨在捕捉句子的高级含义，如谁对谁做了什么，是促进广泛的自然语言处理(NLP)任务的基础任务。目前，由于有大量的标注数据，关于SRL的大部分研究工作都致力于英语。在这一点上，跨语言的SRL，特别是将资源丰富的源语言(如英语)的优势转移到标记数据稀缺甚至不可用的目标语言的SRL是非常重要的。

前人对跨语言SRL的研究大致可以分为两大类：模型迁移和标注投影。

前者基于语言无关的特征构建跨语言模型，例如跨语言单词表示和通用词性（POS）标签，可以直接将其转换为目标语言。后者基于源语言和目标语言之间的大规模平行语料库，其中源侧句子由源 SRL 标签器自动使用 SRL 标签注释，然后将源注释投影到目标侧句子上单词对齐。此外，标注投影可以自然地与模型传递相结合。

特别是，由于源端自动注释，注释投影中投影的SRL标记可能包含很多噪声。一个简单的解决方案是基于翻译的方法，该方法已被证明对跨语言依赖分析有效。其核心思想是直接将黄金标准源训练数据翻译成目标语言，避免了源注释质量低下的问题。幸运的是，由于近年来神经机器翻译（NMT）的巨大进步，这种方法在跨语言迁移方面有很大的潜力。

SRL自动标注演示

对于源语言自动注释，所以投影到目标语言上可能包含噪音，为什么翻译过来就可以避免注释质量低了？

为此，本文研究了基于翻译的跨语言SRL方法。图1说明了以前的方法之间的差异。将源语言训练语料库中的句子翻译成目标语言，然后将源SRL注释投影到目标端，生成一组高质量的目标语言SRL语料库，用于训练目标SRL模型。进一步，我们将黄金标准源语料库和翻译目标语料库合并在一起，这可以看作是基于翻译的方法和模型转换的结合。我们的基线是一个简单的BiLSTM CRF模型（目前还不知道是啥），使用多语言语境化的单词表示（Peters等人，2018年；Devlin等人，2019年）。为了更好地探索混合语料库，我们采用了参数生成网络（PGN）（也还不知道是啥）来增强BiLSTM模块，该模块可以有效地捕捉语言差异（Platanios等人，2018年；Jia等人，2019年）。

上面是语料库翻译，下面是注释投影

（这个图里面Auto-predicted指的是什么意思，自动标注SRL吗？）

我们基于 Universal Proposition Bank corpus （一种语料库）(v1.0) (Akbik et al., 2015; Akbik and Li, 2016) 对七种语言进行实验。首先，我们验证了我们的方法在单源 SRL 迁移中的有效性，其中英语作为源语言，其余语言作为目标语言。结果表明，基于翻译的方法对于跨语言 SRL 非常有效，并且在使用 PGN-BiLSTM 时性能进一步提高。此外，我们对多源 SRL 迁移进行了实验，其中对于每种目标语言，所有剩余的六种语言都用作源语言（这里的意思就是我训练的时候使用多种语言，迁移到其他语言上的效果）。可以观察到与单源设置相同的趋势。我们对这两种设置进行了详细的分析工作，以全面了解我们提出的方法。

总之，我们在这项工作中做出了以下两个主要贡献：

我们介绍了基于翻译的无监督跨语言 SRL 方法的第一项工作。我们为目标语言构建了一个高质量的伪训练语料库，然后在一系列设置下验证语料库的有效性。
我们利用多语言上下文词表示，并使用 PGNBiLSTM 模型加强多语言模型训练。

2 相关工作

了解语义角色标注SRL（Semantic Role Labeling）

语义角色标注(Semantic Role Labelling)

3 SRL Translation（SRL 翻译）

我们通过完全翻译从goldstandard源数据中提取自动目标数据，然后通过对齐（如何对齐的？—投影）将SRL谓词和参数投影到相应的单词中，自动生成目标语言的最终翻译SRL语料库。该方法已被证明对跨语言依赖分析有效（Tiedeman等人，2014年；Tiedeman，2015年；Tiedeman和Agic，2016年；Zhang等人，2019年）。与标注投影相比，我们可以在源端保证标注质量，因此也期望更高质量的目标语料库。此外，基于依赖关系的SRL可以通过这种方法受益更多，因为只需要将谓词词及其参数投影到目标端，而依赖关系解析应该涉及所有句子词。整个过程由两个步骤完成：翻译和投影。

上面那个翻译自动对齐的意思就是说，我们通过自动标注源语言的SRL，翻译的话，原来的是什么样的谓词，翻译过来应该保持不变，也就是原来是主语翻译过来他还是主语，原来是名词翻译过来还是名词。

Translating。首先，我们使用最先进的翻译系统为源SRL数据的句子生成目标翻译。给出一个源语句e1··en，我们将其翻译成目标语言的f1··fm。值得注意的是，最近在NMT方面取得的令人印象深刻的进展（Bahdanaau等人，2015年；Wu等人，2016年）极大地促进了我们的工作，这使我们的方法具有高质量的翻译。

Projecting. 然后，我们将源语句e1··en的相应谓词或参数增量投射到目标语句f1··fm（这个投影到目标语句是如何实现的？）。我们采用两种信息来辅助投影：（1）从源词ei到fj的对齐概率a（fj | ei），这可以通过单词对齐工具来计算；（2）词性标签分布p（t∗|fj）的目标句子词，可以从受监督的目标语言词性标记中派生，其中∈ [1，n]，j∈ [1，m]和t∗ 表示任意的POS标记。

我们只关注源句中与SRL相关的词，并在谓词层面逐步执行该过程。对于句子中的每个谓语，我们收集谓语词及其角色词，然后将它们的角色标签投射到目标句子中。

从形式上讲，对于这些单词中的每一个（即ei），我们都有SRL角色标记rei及其POS标记tei，它们都已经在UPB中进行了注释。首先，我们找到对齐概率最高的目标词fj，将该词fj视为承载语义角色rei的对应投影。然后，我们通过以下公式计算该预测的置信度得分：

是词对齐对应和词性标签一致性的联合概率。

一对一的目标-源对齐 2(a) 是投影的理想条件。但是，给定单词可能存在多对一的情况，从而导致目标语言单词的语义角色冲突。对于这些情况，我们优先考虑谓词预测，否则只保留最高置信度的预测。图 2(b) 显示了一个谓词-参数冲突示例，其中保留了谓词投影，图 2© 显示了一个参数-参数冲突示例，其中保留了具有较高置信度分数的投影。

最后，我们设置一个阈值α来去除低置信度的投影。如果谓词投影的置信度分数低于α，则该谓词的所有角色也将被删除。对于置信度低于α的参数投影，我们直接删除单个参数，而不影响其他投影。

4 The SRL Model

在这项工作中，我们关注基于依赖关系的SRL，识别给定谓词的语义角色（He等人，2017）。这项任务可以被视为一个标准的序列标记问题，这里利用了一个简单的多层BiLSTM CRF模型，该模型利用上下文化的单词表示法（He et al.，2018b；Xia et al.，2019；He et al.，2019）存档了最先进的性能。特别是，我们通过在BiLSTM上使用PGN模块（这是个啥？）（Hochreiter和Schmidhuber，1997），调整了模型，以更好地支持多语言输入。图3显示了总体架构。

SRL模型的总体架构
谓词指示符嵌入+POS表示词性标记+词表征经过一个PGN-LSTM，传入CRFs

（下面这俩具体的东西还没看）

PGN为了提升seq2seq模型预测出的Unknown Words的能力，我们引入PGN（指针生成网络，Pointer Generator Network），作用是来针对UNK问题中的OOV（超出词表外的词，Out of Vocabulary）进行处理，能够通过拷贝输入的词进行填充以满足句意的需要[1]。

CRFs条件随机场是一种用于序列预测的判别模型。

4.1 Word Representation（词语表征）

给定特定语言的输入句子s=w1···wn，并且wp（p表示位置）是谓语词，我们使用三种特征来源来表示每个词：（1）词形，（2）词性标记和（3）谓语指示符：
（就是根据这三个来表示一个句子）

其中t1··tn是输入句子的通用词性标记序列。对于词性标记和谓词指示符，我们使用嵌入方法获得它们的向量表示。我们比较了跨语言 SRL 的三种词形表示：(1) 多语言词嵌入，(2) 多语言 ELMo 表示 (Peters et al., 2018)，以及 (3) 多语言 BERT 表示 (Devlin et al., 2019) ）。请注意，我们使用来自 BERT 输出的内部单词片段表示的平均向量作为完整的单词表示。

4.2 Encoding Layer

我们采用 PGN-BiLSTM (Platanios et al., 2018; Jia et al., 2019) 对输入序列 x1···xn 进行编码，这是首次引入用于跨域迁移学习以捕获域差异。在这里，我们将其用于旨在对语言特征进行建模的多语言设置。

与 vanilla BiLSTM 模块相比，PGN-BiLSTM 动态选择 BiLSTM 的语言感知参数。设 V 是 BiLSTM 单元的所有参数的扁平化向量，语言感知 VL 由以下公式产生：

其中 WPGN 表示 PGN-BiLSTM 中 vanilla BiLSTM 部分的参数，包括输入、遗忘、输出门和单元模块的权重，eL 是语言 L 的嵌入表示。 PGN-BiLSTM 的参数生成机制如图 4 所示。接下来，我们从 VL 导出模块参数以计算 BiLSTM 输出。整个过程可以形式化为：

它与普通 BiLSTM 的不同之处在于 eL 是获得 BiLSTM 参数的一个额外输入。具体来说，我们采用三层双向 PGNLSTM 作为编码器。

4.3 Output Layer

给定句子 s = w1 · · · wn 的编码器输出 h1 · · · hn，我们使用 CRF (Lafferty et al., 2001) 计算每个候选输出 y = y1 · · · yn 的概率：

其中 W 和 T 是 CRF 的参数，Z 是概率计算的归一化因子。 Viterbi 算法用于搜索最高概率的输出 SRL 标签序列。

5 Experiments

5.1 Universal Proposition Bank

我们的实验基于 Universal Proposition Bank (UPB, v1.0) 2，它建立在 Universal Dependency Treebank (UDT, v1.4)3 和 Proposition Bank (PB, v3.0)4 之上。在 UPB 中，跨所有语言构建一致的基于依赖关系的通用 SRL 注释。特别是，我们基于来自 UDT v1.4 的英语 EWT 子集和 PB v3.0 中的英语语料库组装了英语 SRL 数据集。最后，我们选择了总共七种语言作为我们的数据集，包括 IE 的英语 (EN) 和德语 (DE)。德语家族、法语 (FR)、意大利语 (IT)、西班牙语 (ES)5 和葡萄牙语 (PT) IE.Romance 家族和 Uralic 家族的芬兰语 (FI)。表1详细显示了数据统计。

表 1：UPB 的统计数据，其中 Fam。表示语言家族，IE.Ge 指印欧日耳曼语，IE.Ro 指印欧罗曼语，Ura 表示乌拉尔语。

5.2 SRL Translation

我们专注于无监督的跨语言SRL，假设没有黄金标准的目标语言SRL语料库可用。我们的目标是从黄金标准的源语言SRL数据集中通过语料库翻译来构建伪训练数据集。句子翻译采用谷歌翻译系统，并使用FastAlign工具包(Dyer等人，2013)来获得单词对齐。为了获得准确的词对齐，我们收集了一组平行的语料库来扩充fast Align7的训练数据集。翻译句子的通用词性标签是由有监督的单语词性标记器产生的，分别在相应的UDT v1.4数据集上进行训练。

5.3 Settings

Multi-lingual word representations. ：正如4.1节中提到的，我们调查了三种多语种单词的表征：

(1)单词嵌入(EMB)：利用MUSE将所有单一语言的快速文本单词嵌入到通用空间中(Lample等人，2018年)。

(2)Elmo：使用七种语言的混合数据集来训练多语言Elmo(Mulcaire等人，2019年)。

（3）BERT：直接使用官方发布的多语种BERT（base, cased version）（Devlin et al., 2019）.

Hyperparameters. 超参数 ：对于 SRL 翻译，只有一个超参数，即投影置信度阈值α，用于过滤低质量的翻译 SRL 句子。图 5 显示了在不同α 下每种语言在初步实验中的表现。因此，我们将所有语言的 α 普遍设置为 0.4。对于神经 SRL 模型，多语言词嵌入、ELMo 和 BERT 的维度大小分别为 300、1024 和 768。 POS 标记、谓词指示符和语言 ID 嵌入大小分别为 100、100 和 32。 LSTM 的隐藏大小设置为 650。我们利用批量大小为 50 的在线训练，并使用 Adam 算法优化模型参数，初始速率为 0.0005。训练在整个训练数据集上执行，双语迁移 80 次迭代和多语言迁移 300 次迭代，没有提前停止。

Baselines. ：为了测试我们的 PGN 模型的有效性，我们还将它与几个基线进行了比较。首先，我们使用 vanilla BiLSTM 代替 BASIC 来表示我们的模型，特别是，在整个工作中，该模型被用于所有单语训练。此外，我们采用了两个更强的基线，即郭等人提出的 MoE 模型。（2018）和Chen等人提出的MAN-MoE模型。（2019），分别。这两个模型都旨在基于多种语言的语料库有效地训练模型，类似于我们的 PGN 模型。

Evaluation ：我们使用 F1 分数作为衡量每种目标语言模型性能的主要指标。每个模型训练五次并报告平均值。我们使用 Dan Bikel 的随机解析评估比较器进行显着性检验。

5.4 Cross-Lingual Transfer from English

我们首先分别进行了从英语源到其他六种目标语言的跨语言迁移实验，这一直是跨语言调查的典型设置（Wang et al., 2019）。结果总结在表2中。我们仅使用源语料库（SRC），仅使用翻译的目标语料库（TGT）和源和目标的混合语料库（SRC＆TGT）列出了F-scores，比较了性能不同的多语言单词表示以及不同的多语言 SRL 模型。

Multilingual word representations.（多语言单词表示） ：首先，我们评估了三种不同的多语言单词表示的有效性。我们分别使用 SRC 和 TGT 语料库比较它们在两种设置下的表现。根据结果，我们发现多语言上下文化词表示（即 BERT 和 ELMo）在两种设置下都更好，这与之前的研究一致（Mulcaire 等人，2019；Schuster 等人，2019）。有趣的是，多语言 BERT 的表现比 ELMo 差，这可以解释为 ELMo 表示是基于涉及重点七种语言的语料库进行预训练的。这表明官方发布的多语种 BERT 可以进一步改进，因为单语种 BERT 已被证明比 ELMo 产生更好的性能。

Translated target. ：接下来，我们考虑将翻译后的目标仅作为训练数据来检查伪数据集的有效性。如表 2 所示，我们发现翻译后的数据集可以带来明显优于源基线整体语言的性能，导致平均 F1 得分增加 51.1− 44.4 = 6.7。结果表明，语料库翻译是跨语言SRL的一种有效方法。该观察结果与之前的跨语言依赖解析工作一致（Tiedemann 和 Agic，2016；Zhang 等人，2019）。通过直接的金标准语料库翻译，生成的伪训练数据不仅可以保持高质量的 SRL 注释，还可以有效地捕捉语言差异，从而获得比源基线模型更好的性能。

Combining source and pseudo target. ** ：进一步，我们将伪翻译的目标语料库和源语言语料库结合在一起来训练目标SRL模型。根据表2中的数字，我们看到所有语言都可以实现进一步的改进**，平均改进为55.8-51.1=4.7(BASIC用于公平比较)。注意，由于几个源句在翻译过程中被过滤，这可能是获得收益的原因，我们通过设置α=0(即，不过滤句子)来进行更公平的线下比较。类似的收益仍然可以实现。考虑到翻译的句子在语义上与金本位源中的对应句子在语义上是相等的，可能的原因有两方面：(1)由于数据驱动的翻译模式，翻译的句子可能在语言表达上存在偏见；(2)语料库翻译中丢弃的冲突注释是重要的，这是对我们模型的补充。

Language-aware encoder. ：最后，我们考察了PGN-BiLSTM模块在使用源和目标数据集的混合语料库进行训练时捕获特定语言信息的有效性。如表2所示，我们可以看到，PGN的语言感知编码器可以显著提高F1成绩，平均提高60.355.8=4.5。此外，我们还分别报告了MOE和MAN-MOE的结果，这两种方法也利用了语言信息。所有的结果都证明了特定语言信息的有效性，并且我们的PGN模型是最有效的。

5.5 Multi-Source Transfer（多源传输）

此外，我们研究了多源迁移学习的设置，其中除给定目标语言之外的所有其他语言都用作源语言，旨在全面研究我们基于翻译的方法的有效性。

（消融实验）
Overall performances.（整体表现） ：多源 SRL 迁移的结果如表 3 所示。通常，结果与源英语的单源跨语言迁移具有相似的趋势，其中多语言 ELMo 表现最好，在翻译目标上训练的 SRL 模型数据集显示出比使用源数据集训练的更好的性能，源语言和目标语言数据集的混合语料库带来了最好的性能，这可以通过我们最终的 PGN 模型和语言感知编码器进一步改进。我们还将 PGN 模型与 MoE 和 MAN-MoE 进行了比较，显示出稍好的性能，这表明了 PGN-BiLSTM 模块的有效性。此外，我们可以看到多源模型在所有情况下都优于单源模型，这与之前的研究（Lin et al., 2019）直观且一致。

Fine-grained bilingual transfer（细粒度的双语迁移） ：接下来，我们通过检查每个源目标语言对的性能来研究单个双语 SRL 迁移，旨在发现哪种语言对目标语言最有利，并试图回答是否所有源语言都对目标语言有用。表 4 显示了结果，其中跨语言模型在源数据集和翻译目标数据集的混合语料库上进行训练。首先，我们可以看到属于一个家族的语言可以相互受益，在大多数情况下（即 EN-DE、FR-IT-ES-PT）带来比其他语言更好的性能。其次，All 表示的多源迁移能够在所有语言中获得更好的性能，这进一步证明了它相对于单源迁移的优势。

此外，我们详细研究了 PGN 模型，旨在了解它们对特定语言信息进行建模的能力。我们通过简单地可视化每个源-目标语言对的语言 ID 嵌入 eL 来检查它，其中描述了它们的欧几里得距离。直观地说，如果目标语言和源语言之间的距离更近，则可以获得更好的性能。图 6 显示了热图矩阵。我们可以看到整体趋势与表 4 的结果高度相似，这与我们的直觉是一致的。

5.6 Analysis

在这里，我们进行详细分析以了解翻译后的目标数据集的收益。我们选取三种有代表性的语言进行分析，包括德语（DE）、法语（FR）和芬兰语（FI），每个家庭一种语言，主要比较四种模型，包括三种模型（即SRC、TGT和SRC&TGT） PGN) 的英语单源迁移和多源迁移的最终 PGN 模型。

Performances by the SRL roles. ：首先，我们根据 SRL 角色研究跨语言的 SRL 性能。我们选择四个具有代表性的角色进行比较，包括 A0（代理）、A1（患者）、A2（工具、有益、属性）和 AM-TMP（时间），并报告它们的 F1 分数。图 7 显示了结果。整体来看，角色A0在所有语言和所有模型中取得了最好的F1分数，A1排名第二，A2和AM-TMP稍差。这种趋势可以通过这些标签的分布来解释，其中 A0 是最频繁的，A2 和 AM-TMP 的频率低于 A0 和 A1。第二个可能的原因可能是由于大多数 A0 和 A1 词是概念词，可以更容易地被跨语言模型转移。

此外，我们可以看到，所有三种语言和所有标签的不同模型的趋势都是相同的，其中多源传输表现最好，单源 SRC+TGT 排名第二，我们的基线模型是最后一个。观察结果与整体趋势一致，证明了稳定性，也进一步验证了我们提出的模型的有效性。

Performances by the distances to the predicate.（通过到谓词的距离来表现） ：其次，我们根据与谓词的距离来研究 SRL 的性能。直观地说，长距离关系更加困难，因此我们预计 SRL 性能会随着距离的增加而下降，因为 SRL 实际上检测了角色词与其谓词之间的关系。图 8 显示了 F1 分数。首先，对于所有设置，我们可以看到 SRL 性能随着距离的增加而下降，这证实了我们的直觉。此外，不同模型之间的趋势与整体结果相同，证明了我们方法的有效性。

6 Conclusion

我们提出了一种基于翻译的跨语言 SRL 替代方案。关键思想是通过语料库翻译从源语言的黄金标准 SRL 注释构建目标语言的高质量数据集。此外，我们将黄金标准源 SRL 语料库和伪翻译目标语料库结合在一起，以增强跨语言 SRL 模型。我们研究了具有不同类型的多语言单词表示的跨语言 SRL 模型。此外，我们提出了一种 PGN-BiLSTM 编码器，以更好地利用不同语言的混合语料库。在 UPB v1.0 数据集上的实验结果表明，基于翻译的方法是一种有效的跨语言 SRL 迁移方法。通过使用所有选定语言的翻译数据集（包括单源和多源传输）可以实现显着改进。提供实验分析以深入了解所提出的方法。

Python中的条件语句：if-else使用指南 AI软件改变生活 Python 数据库前端 python
在编程中，条件语句是控制程序流程的核心工具之一，它允许程序根据不同的条件执行不同的代码块。Python提供了简洁而强大的条件语句语法，其中最常用的就是if-else语句。本文将详细介绍Python中if-else的使用方法、常见用法以及一些高级技巧。1.基本语法if-else语句的基本结构如下：Python复制if条件表达式:#如果条件表达式为True，执行这里的代码块passelse:#如果条件
这么简单的从零到一做HTML 网页，你确定不来看看吗？ paid槮 html 服务器前端
HTML网页的介绍HTML(HypertextMarkupLanguage,超文本标记语言)是一种用于创建网页的标准标记语言,是一种与Python不同的编程语言。网页文件的扩展名通常为,html或.htm,这两种扩展名都可使用,并不会影响文件内容简单的HTML网页框架每一个HTML网页都包含一个基础框架，其他的内容都是在基础框架内进行扩充的。示例代码:这里是标题在这里填入正文这是一个较为基础的HT
Python 2和Python 3的区别？山禾家的猫
Python社区，有这么个怪问题：“学Python到底是学2还是学3？”这个问题就像月经一样每隔断时间就出现在你面前，也成了很多初学者的选择困惑，这个问题的“始作俑者”当然是Python它爹，大家众说纷纭，有说Python2是主流，大公司都在用，你应该学2。也有说Python3才是未来主流，大多数第三方框架已基本支持Python3。个人看法是Python2还会存在很长一段时间（只要那些用Pytho
Python基础和高级【抽取复习】斟的是酒中桃 python 学习
1.Python的深拷贝和浅拷贝有什么区别？浅拷贝【ls.copy()】：将列表的不可变对象【值】复制一份，同时引用其中的可变对象【列表】，共用一个内存地址深拷贝【ls=copy.deepcopy(list)】：完全的复制原可变对象，生成新的可变对象，两个对象互相独立2.列表和元组的区别是什么？1.列表概念：有序序列，使用[]定义，元素之间用，隔开有序序列增删改操作：可以增删改列表的任意元素不可变
[Python]Python中if-else的语法，用法示例 LN花开富贵 Python python 学习笔记嵌入式单片机 opencv
Python中多条件判断通过if-elif-else结构实现，elif是elseif的缩写。一、基础语法结构if条件1:#条件1为真时执行的代码块elif条件2:#条件2为真时执行的代码块elif条件3:#条件3为真时执行的代码块else:#所有条件均不满足时执行的代码块顺序判断，当第一个条件满足时其对应的代码块会被执行，后续elif的条件不在检查，如果都是if语句，那么执行完第一个if后后面的i
python源码下载
python源码下载(2010-12-1823:11)不知道python.org一直被堵在墙外…1、http://ftp.python.org/ftp/python/2、http://www.python.org/ftp/python/
Python接地气入门。
欢迎来到"鑫哆哆"编程角世界上最好的语言PYTHON?鑫哆哆跟python的机缘为什么选择python合理的设计学习计划，有助于攻略的成功合理驯服自己脑子合理骗过自己脑子合理安排反馈鑫哆哆的学习python计划基础语法缩进语句规则控制语句规则表达式规则函数规则对象规则类型规则数学运算直接觉醒！鑫哆哆的课程选取迈出第一步恭喜大家成功入门python！总结世界上最好的语言PYTHON?新的一年祝大家心
Python镜像源染诗 python
https://www.cnblogs.com/songzhixue/p/11296720.html
python设置国内源 twilightdream python
mkdir.pipcd.piptouchpip.confnanopip.conf贴上[global]trusted-host=mirrors.aliyun.comindex-url=http://mirrors.aliyun.com/pypi/simple
华为OD机考 2025C卷 - 围棋的气 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试2025C卷华为OD机考2025C卷华为OD2025C卷
围棋的气华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述围棋棋盘由纵横各19条线垂直相交组成，棋盘上一共19x19=361个交点，对弈双方一方执白棋，一方执黑棋，落子时只能将棋子置于交点上。“气”是围棋中很重要的一个概念，某个棋子有几口气，是指其上下左右方向四个相邻的交叉点中，有几个交叉点没有棋子，由此可知：在棋
华为OD机考 2025C卷 - 对称美学 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试2025C卷华为OD2025C卷华为OD机考2025C卷
对称美学华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述对称就是最大的美学，现有一道关于对称字符串的美学。已知：第1个字符串：R第2个字符串：BR第3个字符串：RBBR第4个字符串：BRRBRBBR第5个字符串：RBBRBRRBBRRBRBBR相信你已经发现规律了，没错！就是第i个字符串=第i-1号字符串取反+第
华为OD机试 2025 B卷 - We are a Team (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD2025B卷华为OD机考2025B卷华为OD机试2025B卷华为OD机试
WeareaTeam华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：消息构成为abc，整数a、b分别代表两个人的标号，整数c代表指令c==0代表a和b在一个团队内c==1
Python中if-else判断语句、while循环语句以及for循环语句的使用总结 bentou_
1.if-esle流程判断语句我们来直接看一个例子，如下，判断我们定义的用户名和用户输入的用户名是否一致。代码当中有几个注意点：判断的时候用双等号表示判断是否一致（三个等号表示赋值）你有没有注意到这里不是用的大括号而是用的冒号！python3对父级和子级的写法是极为严格的，就像这里的if跟else，都是父级，需要顶格写；下面的两个子级（print那里）就需要缩进一个tab。_username="b
Python库安装国内源奔跑的石头_ python python AI编程
关注公众号“码字读书会”，了解最新消息。Python国内源包括企业和高校机构打不得开源软件包资源。著名的有阿里云、华为云、清华。个人常用的有清华源临时使用命令如下：pipinstall-ittps://pypi.tuna.tsinghua.edu.cn/simple包名
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
Python从入门到荒废-配置国内下载源 zrhsmile Python python
为提升Python包安装速度，配置国内下载源是常见需求。以下是主流方法汇总，结合稳定性和易用性推荐：一、pip永久配置国内源（推荐）通过修改配置文件实现“一次配置，长期生效”：创建/修改配置文件Windows：路径：%APPDATA%\pip\pip.ini（如C:\Users\用户名\AppData\Roaming\pip\pip.ini）内容：[global]index-url=https:/
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
《精雕细琢 Python 对象：深入理解 __slots__ 的性能魔法与实战应用》
《精雕细琢Python对象：深入理解slots的性能魔法与实战应用》引言：探索Python的对象管理机制在Python中，一切皆对象。然而，每一个对象背后都隐藏着复杂的运行机制。尤其在类设计中，我们往往忽略了对象属性的存储方式。今天，我们将深入剖析一个常被高级开发者使用的“利器”——__slots__，它能有效减少内存占用、提升性能，但也伴随着一些权衡和陷阱。本文旨在回答三个核心问题：__slot
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
LeetCode第337题_打家劫舍III @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习
LeetCode第337题：打家劫舍III文章摘要本文详细解析LeetCode第337题"打家劫舍III"，这是一道中等难度的二叉树动态规划问题。文章提供了基于深度优先搜索和动态规划的解法，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合想要提升二叉树和动态规划能力的程序员。核心知识点：二叉树、动态规划、深度优先搜索难度等级：中等推荐人群：具有基础数据结构知识，想要提
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
python：numpy分享（保姆级教程）苏苏susuus python numpy 开发语言
目录一、概念二、相关属性三、ndarray及其实例创建（一）ndarray介绍（二）zeros（）、ones（）、empty（）函数（三）**arange(),**类似python的range()，创建一个一维ndarray数组。（四）**matrix()**,是ndarray的子类，只能生成2维的矩阵（五）rand（）、randn（）、randint（）、uniform（）（都是numpy.ra
Gin框架路由 TZX_0710
介绍Gin是一个golang的微框架，封装比较优雅，API友好，源码注释比较明确，具有快速灵活，容错方便等特点对于golang而言，web框架的依赖要远比Python，Java之类的要小。自身的net/http足够简单，性能也非常不错借助框架开发，不仅可以省去很多常用的封装带来的时间，也有助于团队的编码风格和形成规范安装1.安装Gingoget-ugithub.com/gin-gonic/gin2
学习日志15 python im_AMBER 学习 python
1filter()函数filter(function,iterable)filter函数是python中的高阶函数,第一个参数是一个筛选函数,第二个参数是一个可迭代对象,返回的是一个生成器类型,可以通过next获取值。filter()函数是Python内置的高阶函数，其主要功能是对可迭代对象中的每个元素运用筛选函数进行判断，然后把符合条件的元素以生成器的形式返回。下面为你详细介绍它的用法和特性：基
Python爬虫热点项目之实现代理IP池（IP proxy pool）薛定谔的猫96 Python 爬虫
代理池概述代理池就是由多个稳定可用代理IP组成的池子。用来应对ip反爬，而网上的免费代理稳定可用的极少，更有甚者连收费的也不都是稳定可用。开发环境：windous，python3，sublimetext使用的主要模块：requests，lxml，pymongo，Flask完整源码请前往我的github仓库查看：https://github.com/R2h1/ProxyPool欢迎star哦！！！代
大模型格式
目录大模型格式：ollma可以加载ggufChatGPT说：什么是GGUF？大模型格式：Ollama模型格式只能运行已打包成.gguf格式的模型，或通过其Modelfile方式构建ModelScope模型格式大多使用HuggingFaceTransformers格式，如.bin、.safetensors，与Ollama不兼容模型加载方式不同Ollama自带封装推理引擎（ggml/llama.cpp
python基础练习题：超市收银系统不爱说话的分院帽 python 开发语言
这个超市收银系统包含以下功能：商品管理：支持添加和显示商品信息（ID、名称、价格、库存）购物车功能：可以添加、移除商品，查看购物车和计算总价结算功能：生成收据、处理支付、计算找零并更新库存数据模型：使用面向对象设计，包含商品、购物车和超市类系统运行后会显示菜单，用户可以通过数字选择不同操作，整个流程不需要图形界面，通过命令行交互完成购物和结算过程。importdatetimeclassProduc
Python零基础入门：魔法方法详解
一、什么是魔法方法？魔法方法（MagicMethods）是Python中一种特殊的方法，它们以双下划线(__)开头和结尾（如__init__、__str__等）。魔法方法允许你定义类在特定情况下的行为，例如初始化、字符串表示、运算符重载等。二、常见的魔法方法分类1.构造和初始化__new__(cls,[...]):创建实例时调用的第一个方法__init__(self,[...]):实例初始化方法_
Python文件与流处理：高效读写数据的艺术不爱说话的分院帽 python快速入门 python 数据库开发语言
引言作为一名程序员，我们每天都需要与文件打交道——无论是读取配置文件、处理日志文件，还是存储程序生成的数据。Python提供了强大而灵活的文件处理能力，让这些操作变得简单高效。本文将深入探讨Python中的文件与流处理，帮助你掌握这一核心技能。、一、文件操作基础1.打开文件Python使用内置的open()函数来打开文件：#基本语法file=open('example.txt','r')#打开文件
Python 计算月头月尾一本正经胡说八道的猫
一本正经胡说八道的猫#!/usr/bin/envpython#-*-coding:utf-8-*-importdatetimeimportcalendartime=datetime.date(2022,1,20)#年，月，日#求该月第一天first_day=datetime.date(time.year,time.month,1)print('该月第一天:%s'%(first_day))#求前一个
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&