PaperWeekly

对话系统有哪些最新进展？这17篇EMNLP 2021论文给你答案

©原创 · 作者 | 王馨月

学校 | 四川大学

研究方向 | 自然语言处理

Neural Path Hunter

论文标题：

Neural Path Hunter: Reducing Hallucination in Dialogue Systems via Path Grounding

论文链接：

https://arxiv.org/abs/2104.08455

项目地址：

https://github.com/nouhadziri/Neural-Path-Hunter

基于大型预训练语言模型的对话系统天然能够提供流畅自然的响应，但这些模型通常会生成事实上不正确的陈述，从而阻碍了它们的广泛采用。这篇论文中，作者专注于提高响应真实性（faithfulness）的任务，从而减少神经对话系统对知识图谱（KG）提供的已知事实的幻觉。作者提出了 Neural Path Hunter ，它遵循先生成再优化的策略，即使用 KG 的 k 跳子图修改生成的响应。

Neural Path Hunter 利用一个单独的 token 级事实评论家来识别可能的幻觉来源，然后是一个由两个神经 LM 组成的链的细化阶段，该阶段通过制作在 k 跳子图上传播的查询信号来检索正确的实体。论文提出的模型可以轻松应用于任何对话生成的响应，而无需重新训练模型。作者在 OpenDialKG 数据集上进行了验证，相比于基于 FeQA 的对话响应将真实性相对提高了 20.35% 。

上图是 Neural Path Hunter 的概览。NPH 遵循先生成再优化的方法，通过增加传统对话生成和额外的优化阶段，使对话系统能够通过查询 KG 来纠正潜在的幻觉。NPH 通过限制由 KG 上的有效路径支持的保护流来建立对话生成。为此，该模块结合了一个 token 级别的幻觉评论家，该评论家屏蔽了话语中关注的实体。

然后是一个预先训练的非自回归 LM，它为每个被屏蔽的实体规定了上下文表示，然后将其顺序馈送到自回归 LM 以获得输出表示。然后，这些输出表示可用于有效地启动对 KG 的查询——有效地将对话建模为在局部 k 跳子图上传播的信号，从而通过对话历史强制执行局部性——返回事实正确的实体。

上表是在应用 Neural Path Hunter 之前和之后，基于 GPT2-KG 测试响应的选定响应。红色表示幻觉实体提及，绿色表示检索到的正确实体提及。

DIALKI

论文标题：

DIALKI: Knowledge Identification in Conversational Systems through Dialogue-Document Contextualization

论文链接：

https://arxiv.org/abs/2109.04673

项目地址：

https://github.com/ellenmellon/DIALKI

确定在基于长文档的对话系统中使用的相关知识对于有效生成响应至关重要。这篇论文引入了一种知识识别模型 DIALKI，该模型利用文档结构来提供对话上下文化的段落编码，以更好地定位与对话相关的知识。与之前的工作相比，DIALKI 在开放式问答中扩展了多段阅读器模型，以获得基础文档中多段不同跨度的密集编码，并将它们与对话历史联系起来。

具体来说，DIALKI 通过将给定的长文档分成段落或部分来提取知识，并使用对话上下文将它们单独上下文化。然后通过首先选择与对话上下文最相关的段落，然后选择所选段落中的最终知识串来提取知识。处理每个段落而不是整个文档大大缩短了知识上下文，同时保留了足够的用于推理的话语上下文。

DIALKI 还使用多任务目标来识别下一回合的知识，以及先前回合使用的知识，通过捕获下一个代理话语、先前话语和基础之间的相互依赖关系，帮助改进对话和文档表示的学习文档。作者证明了模型在两个基于文档的对话数据集上的有效性，并提供了分析，显示了对看不见的文档和长对话上下文的泛化。

上图是 DAILKI 模型的概览。模型应用 BERT 和知识上下文化机制来获得对话上下文和知识表示（左），用于执行下一个（主要）和历史（辅助）回合知识识别任务（右）。对于每一轮，DIALKI 通过选择相关段落以及段落中的开始/结束跨度来识别知识。

作者在 Doc2Dial 和 WoW 对话数据集上进行实验，在知识识别任务上相较于之前的工作提升了60%和20% 。

TransferQA

论文标题：

Zero-Shot Dialogue State Tracking via Cross-Task Transfer

论文链接：

https://arxiv.org/abs/2109.04655

对话状态跟踪（DST）的 zero-shot 迁移学习使我们能够处理各种面向任务的对话域，而无需收集域内数据。这篇论文中，作者提出了 TransferQA，这是一种可迁移的生成 QA 模型，它通过文本到文本转换器框架无缝地结合了提取 QA 和多选 QA，并在 DST 中跟踪分类槽和非分类槽。此外，还引入了两种构建无法回答的问题的有效方法，即否定问题采样和上下文截断，这使得模型能够处理零样本 DST 设置中的“none”值槽。

实验表明，本文提出的方法大大改善了 MultiWoz 上现有的零样本和少样本结果。此外，与 Schema-Guided Dialogue 数据集上的 baseline 相比，本文的方法在看不见的领域显示出更好的泛化能力。

上图是零样本 DST 的跨任务传输的高级表示。在 QA 训练阶段（上图），统一生成模型（T5）在 QA 对提取问题（蓝色）、多项选择题（紫色）和否定提取问题（绿色）上进行预训练。在零样本 DST 的推理时间（下图），模型将槽值预测为综合制定的提取问题（对于非分类槽）和多项选择题（对于分类槽）的答案。

上图是用于在训练中添加无法回答的问题的负抽样策略。给定一个段落，从其他段落中随机抽取一个问题，并训练 QA 模型（T5）来预测“none”。

上图是用于生成 none 值的上下文截断策略。截断文章以确保上下文中不存在答案跨度，因此 QA 模型（T5）学会预测“none”。

KAT-TSLF

论文标题：

A Three-Stage Learning Framework for Low-Resource Knowledge-Grounded Dialogue Generation

论文链接：

https://arxiv.org/abs/2109.04096

项目地址：

https://github.com/neukg/KAT-TSLF

通过引入外部背景知识，神经对话模型可以在生成流畅和信息丰富的响应方面显示出巨大的潜力。然而，构建这种以知识为基础的对话很费力，而且现有模型在迁移到训练样本有限的新领域时通常表现不佳。因此，在资源匮乏的环境下构建知识型对话系统仍然是一个至关重要的问题。

这篇论文中，作者提出了一种基于弱监督学习的新型三阶段学习框架 TSLF，该框架受益于大规模无根据的对话和非结构化知识库。为了更好地与这个框架合作，作者还设计了一种带有解耦解码器的 Transformer 变体，它促进了响应生成和知识整合的分离学习。两个 baseline 的评估结果表明，论文中的方法可以在训练数据较少的情况下优于其他最先进的方法，即使在零资源场景中，仍然表现良好。

上图是论文中的 TSLF 流程的概览，共分三个阶段。

图中的 KAT，是 Knowledge-Aware Transformer。其架构如下图所示：

CG-nAR

论文标题：

Thinking Clearly, Talking Fast: Concept-Guided Non-Autoregressive Generation for Open-Domain Dialogue Systems

论文链接：

https://arxiv.org/abs/2109.04084

项目地址：

https://github.com/RowitZou/CG-nAR

人类对话包含不断发展的概念，说话者自然而然地将多个概念联系起来以组成一个回应。然而，目前采用 seq2seq 框架的对话模型缺乏有效管理概念转换的能力，并且很难以顺序解码的方式将多个概念引入到响应中。为了提升对话的连贯性，复旦大学张奇老师团队设计了一个概念引导的非自回归模型（CG-nAR）来生成开放域对话。

模型包括一个多概念规划模块，该模块学习从概念图中识别多个相关概念，以及一个定制的插入变换器，执行概念引导的非自回归生成以完成响应。在两个公共数据集上的实验结果表明，CG-nAR 可以产生多样且连贯的响应，在自动和人工评估中均优于最先进的 baseline ，推理速度大大加快。

上图是 CG-nAR 框架的概览。(a) 多概念规划模块以之前的概念流和对话上下文为条件，从概念图中仔细选择多个相关概念。(b) 所选概念用于初始化后续非自回归生成的部分响应。

上图是来自不同系统的输出响应的对话案例。蓝色是对话流中观察到的概念，红色表示输出响应中与上下文相关的概念。可以看出 CG-nAR 具有不错的效果。

DAMS

论文标题：

Low-Resource Dialogue Summarization with Domain-Agnostic Multi-Source Pretraining

论文链接：

https://arxiv.org/abs/2109.04080

项目地址：

https://github.com/RowitZou/DAMS

随着日常生活中对话数据量的快速增长，对于对话摘要的需求越来越大。然而，由于带有注释摘要的对话数据不足，训练大型摘要模型通常是不可行的。复旦大学张奇老师团队提出了一种多源预训练范式（DAMS），以更好地利用外部摘要数据。

作者利用大规模域内非摘要数据来分别预训练对话 encoder 和摘要 decoder。然后使用对抗性评论对域外摘要数据对组合的 encoder-decoder 模型进行预训练，来促进与域无关的摘要。在两个公共数据集上的实验结果表明，在只有有限的训练数据的情况下，模型实现了有竞争力的性能，并且在不同的对话场景中具有很好的泛化能力。

上图是 DAMS 的概览。DAMS 包括：(i) 使用对话的 encoder 预训练（绿色）；(ii) 使用短文本的 decoder 预训练（黄色）；(iii) 使用带有相应摘要（橙色）的通用文章进行联合预训练。

上图是用 SAMSum 测试集的对话例子生成的摘要，加*的表明使用了外部总结数据。

TUCORE-GCN

论文标题：

Graph Based Network with Contextualized Representations of Turns in Dialogue

论文链接：

https://arxiv.org/abs/2109.04008

项目地址：

https://github.com/BlackNoodle/TUCORE-GCN

基于对话的关系提取（RE）旨在提取对话中出现的两个参数之间的关系。由于对话具有人称代词出现次数高、信息密度低的特点，并且对话中的大部分关系事实都没有任何一个句子来支持，因此基于对话的关系抽取需要对于对话有全面的理解。

在这篇论文中，作者提出了通过关注人们理解对话的方式来建模的转向上下文感知图卷积网络（TUrn COntext awaRE Graph Convolutional Network, TUCORE-GCN）。此外，作者提出了一种新方法，将对话中的情绪识别（ERC）任务视为基于对话的 RE。基于对话的 RE 数据集和三个 ERC 数据集的实验表明，本文提出的模型在各种基于对话的自然语言理解任务中非常有效。

上图是 TUCORE-GCN 的整体架构。首先，通过将输入对话提供给上下文编码器来获得每个标记的上下文化表示。接下来，应用使用周围轮 mask 的 Masked Multi-Head Attention 来获得增强每个轮含义的表示。然后，TUCORE-GCN 构建对话图并应用 GCN 机制结合 BiLSTM。最后，分类模块使用来自前一个模块的信息来预测关系。

作者在 DialogRE、MELD、EmoryNLP 数据集上进行了实验，取得了很好的效果。

Unsupervised Conversation Disentanglement

论文标题：

Unsupervised Conversation Disentanglement through Co-Training

论文链接：

https://arxiv.org/abs/2109.03199

项目地址：

https://github.com/LayneIns/Unsupervised_dialo_disentanglement

对话解耦旨在将混合的消息分成分离的会话，这是理解多方对话的一项基本任务。在这篇论文中，作者探索在不参考任何人工注释的情况下训练对话解耦模型。

本文的方法建立在深度协同训练算法之上，该算法由两个神经网络组成：消息对分类器和会话分类器。前者负责检索两个消息之间的本地关系，而后者通过捕获上下文感知信息将消息分类为会话。两个网络分别使用从未注释语料库构建的伪数据进行初始化。在深度协同训练过程中，使用会话分类器作为强化学习组件，通过最大化消息对分类器给出的局部奖励来学习会话分配策略。

对于消息对分类器，通过从会话分类器预测的解耦会话中以高置信度检索消息对来丰富其训练数据。在大型电影对话数据集上的实验结果表明，与之前的监督方法相比，本文提出的方法实现了有竞争力的性能。

上图是本文提出的协同训练框架的示意图。一个消息对分类器（蓝色），可以检索两个消息之间的关系。关系分数将用作协同训练期间更新会话分类器的奖励。一个会话分类器（绿色），它可以通过检索消息和会话之间的关系来执行端到端的对话解耦。预测结果将用于构建新的伪数据，以在协同训练期间训练消息对分类器。

GOLD

论文标题：

GOLD: Improving Out-of-Scope Detection in Dialogues using Data Augmentation

论文链接：

https://arxiv.org/abs/2109.03079

项目地址：

https://github.com/asappresearch/gold

实用的对话系统需要强大的方法来检测范围外（out-of-scope, OOS）的话语，以避免对话中断和相关的失败。用标记的 OOS 示例直接训练模型会产生合理的性能，但获取此类数据是一个资源密集型过程。为了解决数据有限的问题，以前的方法侧重于更好地对范围内（in-scope, INS）示例的分布进行建模。

这篇文章引入了 GOLD（Generating Out-of-scope Labels with Data augmentation）作为一种正交技术，可以增强现有数据以训练在低数据状态下运行的更好的 OOS 检测器。GOLD 使用来自辅助数据集的样本生成伪标记候选者，并通过新颖的过滤机制仅保留最有益的候选者进行训练。

在三个目标基准的实验中，顶级 GOLD 模型在所有关键指标上都优于所有现有方法，相对于中值 baseline 性能实现了 52.4%、48.9% 和 50.3% 的相对收益。作者还分析了 OOS 数据的独特属性，以确定最佳应用 GOLD 方法的关键因素。

上图是 GOLD 增强数据的示意图。GOLD 通过从源数据集中提取话语并将这些句子与目标数据集中的已知 OOS 样本合并以生成伪标记的 OOS 示例来执行数据增强。

上图是完整的 GOLD 过程：（1）从未标记的目标数据中采样和注释一个小的种子集。(2) 从源数据集中提取相似匹配。(3) 通过将种子数据中的话语与匹配句子交换来生成候选词。(4) 选出最优秀的候选者成为伪标记的 OOS 示例。(5) 聚合所有选出的标签，形成最终的 OOS 训练集。

SPD

论文标题：

Detecting Speaker Personas from Conversational Texts

论文链接：

https://arxiv.org/abs/2109.01330

项目地址：

https://github.com/jasonforjoy/spd

角色 persona 对于对话响应预测很有用。然而，当前研究中使用的角色是预先定义的，很难在对话之前获得。为了解决这个问题，这篇文章研究了一项名为说话人角色检测（Speaker Persona Detection, SPD）的新任务，该任务旨在基于纯对话文本检测说话人角色。

在此任务中，从给定对话文本的候选人中搜索出最匹配的角色。这是一个多对多的语义匹配任务，因为 SPD 中的上下文和角色都由多个句子组成。这些句子之间的长程依赖和动态冗余增加了这项任务的难度。作者为 SPD 构建了一个数据集，称为 Persona Match on Persona-Chat（PMPC）。

此外，作者评估了通过分别连接两组句子以粗粒度建立的上下文到角色（context-to-persona, C2P）匹配网络的基线模型。并为此任务提出了话语到配置文件（utterance-to-profile, U2P）匹配网络。U2P 模型以精细的粒度运行，将上下文和角色都视为多个序列的集合。然后，对每个序列对进行评分，并通过聚合为上下文-角色对获得可解释的总分。评估结果表明，U2P 模型显着优于其基线模型。

上图是 SPD 任务的示意图，匹配网络判断 persona 候选者是否与说话者的对话文本匹配。

上图是论文提出的 PMPC 数据集的数据规模。

上图分别是 C2P、U2P 结合 BOW、transformer、ESIM、BERT 的模型架构。

CSA-NCT

论文标题：

Towards Making the Most of Dialogue Characteristics for Neural Chat Translation

论文链接：

https://arxiv.org/abs/2108.13990

这篇论文中中，作者从预训练目标以及上下文表示的格式的角度研究了 Seq2Seq 模型用于对话状态跟踪任务。作者证明了预训练目标的选择对状态跟踪质量有显着影响。特别是，掩码跨度预测比自回归语言建模更有效。

作者还探索将 Pegasus（一种基于跨度预测的文本摘要预训练目标）用于状态跟踪模型，结果显示，摘要任务的预训练对于对话状态跟踪也有很好的效果。此外，虽然循环状态上下文表示也能很好地工作，但模型可能很难从早期的错误中恢复过来。作者在 MultiWOZ 2.1-2.4、WOZ 2.0 和 DSTC2 数据集上进行了实验，观察结果一致。

论文中得出的发现如下：

涉及掩码跨度预测的预训练程序始终优于自回归语言建模目标。
摘要的预训练对于 DST 的效果出奇地好，尽管它似乎是一项无关紧要的任务。
通过包含先前预测的状态和恒定长度的对话历史，循环模型工作得相当好。然而，他们可能会遇到无法从早期错误中恢复的问题。

GME

论文标题：

Transferable Persona-Grounded Dialogues via Grounded Minimal Edits

论文链接：

https://arxiv.org/abs/2109.07713

落地对话模型生成基于某些概念的响应。受落地对话数据分布的限制，在此类数据上训练的模型在数据分布和落地概念类型方面面临可迁移性挑战。为了应对这些挑战，作者提出了基于给定概念的最小编辑框架，该框架最小化编辑现有响应。

专注于 persona，作者提出了落地最小编辑器（Grounded Minimal Editor, GME），它通过解耦和重新组合响应中与角色相关和与角色无关的部分来学习编辑。为了评估以角色为基础的最小编辑，作者引入了 PersonaMinEdit 数据集，实验结果表明 GME 大大优于 baseline。

为了评估可转移性，作者在 BlendedSkillTalk 的测试集上进行了实验，并表明 GME 可以编辑对话模型的响应，以在很大程度上提高他们的角色一致性，同时保留知识和同理心的使用。

上图是基于 persona 的最小编辑。

上图所示算法是 GME 的完整过程。在推理时，GME 首先通过屏蔽原始响应中与角色相关的跨度来创建响应模板，然后将模板、persona ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍和‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍对话历史重新组合成编辑后的响应。设计模板来近似未观察到的变量，这将 GME 与以前基于检索的对话模型区分开来。再使用来表示训练和推理的模板。

在训练期间，学习了两个模块：1）用于上述重组的生成器和；2）帮助在推理时创建响应模板的掩码分类器。注意，除了 persona 之外，GME 还可以应用于其他基本概念。

上图中，左边是训练示例和输入格式，右边是推理示例和输入格式。

DST-as-Prompting

论文标题：

Dialogue State Tracking with a Language Model using Schema-Driven Prompting

论文链接：

https://arxiv.org/abs/2109.07506

项目地址：

https://github.com/chiahsuan156/DST-as-Prompting

面向任务的对话系统通常使用对话状态跟踪来表示用户的意图，这涉及填充预定义槽的值，通常使用具有专用分类器的特定于任务的架构。最近，使用基于预训练语言模型的更通用的架构获得了良好的结果。

这篇文章，作者介绍了语言建模方法的一种新变体，它使用模式驱动的提示来提供用于分类和非分类槽的任务感知历史编码。我们通过使用模式描述（一种自然发生的域内知识来源）增强 prompting 来进一步提高性能。纯生成系统在 MultiWOZ 2.2 上实现 SOTA。

上图是多领域域场景的生成 DST 方法概述。前三张图说明了本文考虑的三种不同的生成方法，下图包括对话历史、域名、插槽名称、插槽的自然语言描述（类型、有效值集等）的具体示例。子图 (b)(c) 展示了提出的两个基于提示的 DST 模型，其中 (c) 中的方法包括考虑用于跟踪的插槽的额外自然语言描述。

Confirm-it

‍‍‍‍‍论文标题：

Looking for Confirmations: An Effective and Human-Like Visual Dialogue Strategy

论文链接：

https://arxiv.org/abs/2109.05312

在视觉对话任务中生成面向目标的问题是一个具有挑战性且长期存在的问题。最先进的系统被证明会产生问题，虽然语法上是正确的，但通常缺乏有效的策略，而且听起来对人类来说很不自然。受关于信息搜索和跨情境单词学习的认知文献的启发，作者设计了 Confirm-it，这是一个基于波束搜索重排序算法的模型，通过提出问题来确认模型对参照物的推测。将 GuessWhat?! 游戏作为案例研究，结果表明，Confirm-it 生成的对话比不重新排序的波束搜索解码更自然、更有效。

上图描述了 Confirm-it 使用的波束搜索重排序算法，以促进有效对话策略的生成。给定一个图像、一组候选对象、一个目标对象和 B 的波束大小，在给定当前对话历史的每个对话回合中，模型预测候选对象集的概率分布。获得最高概率的候选者被认为是模型的假设。QGen 输出 B 个问题，按概率排序。

这些问题中的每一个都由模型的内部 Oracle 回答，该 Oracle 接收作为目标对象。在这 B 个问题中，Confirm-it 选择问题 Q，与内部 Oracle 提供的答案配对，增加模型对的置信度，以 Guesser 分配的概率来衡量。外部 Oracle（知道真实目标对象的人）回答 Q，并将这个新的问答对附加到对话历史中。

上图是 Confirm-it 的具体运作方式。

OneCommon

论文标题：

Reference-Centric Models for Grounded Collaborative Dialogue

论文链接：

https://arxiv.org/abs/2109.05042

项目地址：

https://github.com/dpfried/onecommon

在这篇文章中，作者提出了一个落地的神经对话模型，该模型在部分可观察的参考游戏中成功地与人们合作。基于一个设置，两个代理各自观察世界上下文的重叠部分，并且需要识别并商定他们共享的某个对象。因此，代理应该汇集他们的信息并准确地交流以解决任务。对话代理使用结构化参考解析器从合作伙伴的话语中准确地确定所指对象，使用循环记忆对这些所指对象设置条件，并使用实用的生成程序来确保合作伙伴能够解析代理产生的参考。

作者在 OneCommon 空间基础对话任务进行评估，其中涉及排列在板上的多个点，这些点的位置、大小和阴影不断变化。代理在任务方面的表现大大优于之前的技术水平，在自我对弈评估中成功完成任务的相对提高了 20%，在人类评估的成功上获得了 50% 的相对提高。

上图是本文的系统 (A) 与人类伙伴 (P) 生成的示例对话。参与者对共享板有不同但重叠的视图，其中包含不同形状和大小的点。合作伙伴必须通过对话进行协作，以便找到并选择一个对双方都可见的点。

上图是模型的模块间的关系。在给定的回合中，代理首先使用参考检测器 (1) 识别其伙伴话语中的参考表达。然后使用参考解析模块 (2) 解析每个参考，该模块使用参考段和世界上下文的编码表示。

然后使用所指对象来更新所指对象内存，并与代理自己的点进行交叉引用，以确认代理是否也可以看到它们（3）。给定所指内存和确认变量，预测模块 (4) 生成一系列点配置给参考。最后，话语生成模块 (5) 使用对话历史、确认变量以及所选提及和世界上下文的参与表示来生成响应。

上图是在对话系统的人工评估期间收集的示例对话。作者为每个系统展示了一个不成功（左）和一个成功（右）的例子。

ConDigSum

论文标题：

Topic-Aware Contrastive Learning for Abstractive Dialogue Summarization

论文链接：

https://arxiv.org/abs/2109.04994

项目地址：

https://github.com/Junpliu/ConDigSum

与新闻报道和百科全书文章等结构良好的文本不同，对话内容通常来自两个或多个对话者，彼此交换信息。在这种情况下，对话的主题可能会随着进展而变化，并且某个主题的关键信息通常分散在不同说话者的多个话语中，这对抽象地总结对话提出了挑战。

为了捕获对话的各种主题信息并概述捕获主题的显着事实，这篇文章提出了两个主题感知对比学习目标，即一致性检测和子摘要生成目标，它们有望隐式地对主题变化进行建模并处理对话摘要任务的信息分散挑战。提出的对比目标被设计为主要对话摘要任务的辅助任务，通过替代参数更新策略联合起来。大量实验表明，这篇文章所提出的简单方法明显优于 baseline，并实现了新的最先进性能。

上图是对话及其配对摘要的示例。、和分别代表参考主题片段、当前情况、到达时间和吃的食物。相应的摘要由三个句子、和组成。每个对应一个片段（i = 1, 2, 3）。和是主题间片段。

上图是具有对比目标的模型结构。这项工作提出通过以对比的方式对话语连贯性进行建模来隐式捕获对话主题信息。构建连贯性检测目标是为了推动模型更多地关注更连贯且可能包含来自相同主题的显着信息的片段。此外，由于目标是为对话中的每个主题生成更好的摘要，作者还引入了小结生成目标，这有望迫使模型识别最显着的信息并生成相应的摘要。

请注意，这两个目标都是以对比方式构建的，不需要额外的人工注释或额外的算法。这两个对比目标可以通过交替参数更新策略与主要对话摘要任务相结合，从而形成最终模型 CONDIGSUM。

PCR

论文标题：

Exophoric Pronoun Resolution in Dialogues with Topic Regularization

论文链接：

https://arxiv.org/abs/2109.04787

项目地址：

https://github.com/hkust-knowcomp/exo-pcr

将代词解析为其所指对象长期以来一直被研究为一个基本的自然语言理解问题。以前关于代词共指解析（pronoun coreference resolution, PCR）的工作主要侧重于将代词解析为文本中的提及，而忽略了外部场景。

外显代词在日常交流中很常见，说话者可能会直接使用代词来指代环境中存在的某些物体，而无需先介绍物体。虽然对话文本中没有提到这些对象，但它们通常可以通过对话的一般主题来消除歧义。论文作者建议共同利用对话的本地上下文和全局主题来解决文本外 PCR 问题。大量实验证明了添加主题正则化以解析外显代词的有效性。

上图是在有（绿）和没有（红）对话主题的帮助下解决日常对话中的外显代词的例子。

上图是本文任务的一个例子。代词与其文本内和文本外的所指对象相关联，黄色是外显代词，绿色是内指代词。

上图是这篇文章提出的模型，共包含三个主要组成部分：局部相似性得分计算、全局相关性得分计算和主题预测。局部评分模块根据它们的文本表示计算代词 p 和候选跨度 d 之间的相似性。全局评分模块衡量它们与全局对话主题的相关性。为了帮助主题嵌入更好地捕捉主题信息，主题预测模块使用对话嵌入来拟合 LDA 预测的主题向量作为辅助任务。

上图是文本外 PCR 的案例研究。目标代词（黄）和正确的文本外对象（绿）及其提示用不同的颜色标记。

你可能感兴趣的:(大数据,编程语言,python,计算机视觉,机器学习)

Gin框架路由 TZX_0710
介绍Gin是一个golang的微框架，封装比较优雅，API友好，源码注释比较明确，具有快速灵活，容错方便等特点对于golang而言，web框架的依赖要远比Python，Java之类的要小。自身的net/http足够简单，性能也非常不错借助框架开发，不仅可以省去很多常用的封装带来的时间，也有助于团队的编码风格和形成规范安装1.安装Gingoget-ugithub.com/gin-gonic/gin2
学习日志15 python im_AMBER 学习 python
1filter()函数filter(function,iterable)filter函数是python中的高阶函数,第一个参数是一个筛选函数,第二个参数是一个可迭代对象,返回的是一个生成器类型,可以通过next获取值。filter()函数是Python内置的高阶函数，其主要功能是对可迭代对象中的每个元素运用筛选函数进行判断，然后把符合条件的元素以生成器的形式返回。下面为你详细介绍它的用法和特性：基
Python爬虫热点项目之实现代理IP池（IP proxy pool）薛定谔的猫96 Python 爬虫
代理池概述代理池就是由多个稳定可用代理IP组成的池子。用来应对ip反爬，而网上的免费代理稳定可用的极少，更有甚者连收费的也不都是稳定可用。开发环境：windous，python3，sublimetext使用的主要模块：requests，lxml，pymongo，Flask完整源码请前往我的github仓库查看：https://github.com/R2h1/ProxyPool欢迎star哦！！！代
python基础练习题：超市收银系统不爱说话的分院帽 python 开发语言
这个超市收银系统包含以下功能：商品管理：支持添加和显示商品信息（ID、名称、价格、库存）购物车功能：可以添加、移除商品，查看购物车和计算总价结算功能：生成收据、处理支付、计算找零并更新库存数据模型：使用面向对象设计，包含商品、购物车和超市类系统运行后会显示菜单，用户可以通过数字选择不同操作，整个流程不需要图形界面，通过命令行交互完成购物和结算过程。importdatetimeclassProduc
Python零基础入门：魔法方法详解
一、什么是魔法方法？魔法方法（MagicMethods）是Python中一种特殊的方法，它们以双下划线(__)开头和结尾（如__init__、__str__等）。魔法方法允许你定义类在特定情况下的行为，例如初始化、字符串表示、运算符重载等。二、常见的魔法方法分类1.构造和初始化__new__(cls,[...]):创建实例时调用的第一个方法__init__(self,[...]):实例初始化方法_
Python文件与流处理：高效读写数据的艺术不爱说话的分院帽 python快速入门 python 数据库开发语言
引言作为一名程序员，我们每天都需要与文件打交道——无论是读取配置文件、处理日志文件，还是存储程序生成的数据。Python提供了强大而灵活的文件处理能力，让这些操作变得简单高效。本文将深入探讨Python中的文件与流处理，帮助你掌握这一核心技能。、一、文件操作基础1.打开文件Python使用内置的open()函数来打开文件：#基本语法file=open('example.txt','r')#打开文件
Python 计算月头月尾一本正经胡说八道的猫
一本正经胡说八道的猫#!/usr/bin/envpython#-*-coding:utf-8-*-importdatetimeimportcalendartime=datetime.date(2022,1,20)#年，月，日#求该月第一天first_day=datetime.date(time.year,time.month,1)print('该月第一天:%s'%(first_day))#求前一个
python学生成绩管理系统【完整版】，Python开发基础面试题
name=self.username.get()password=self.password.get()ifname==‘hacker707’andpassword==‘admin’:self.page.destroy()MenuPage(self.root)else:showinfo(title=‘错误’,message=‘账号或密码错误！’)db.pyimportjsonclassStuden
【深度强化学习】MIP-DQN 实现案例（完整Python代码）
目录MIP-DQN算法概述建模基础训练阶段（Training）部署阶段（OnlineExecution）DNN网络转化为MIP表达式性能指标完整Python代码实现主函数：random_generator_battery模型函数：MIP_DQN基础/专用库包安装模型运行（完整Python代码）参数设置函数：Parameters参考本博客根据论文《Optimalenergysystemschedul
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
Go与Python在数据管道与分析项目中的抉择：性能与灵活性的较量真智AI 人工智能 python go
你正在设计一个全新数据管道或启动一个分析项目，此时你或许正在思考该选择Python还是Go。五年前，这甚至不是个值得讨论的问题——你会毫不犹豫地选择Python，故事到此为止。然而，近年来Go在数据领域，尤其是在数据基础设施和实时处理方面，正逐渐被更多人采用。实际上，这两种语言都已在现代数据技术栈中找到了各自的定位。Python依然非常适合机器学习和数据分析，而Go则逐步成为高性能数据基础设施的首
Redis-py 实战指南：从安装到向量索引，Python 操作 Redis 全解析佑瞻数据库与知识图谱 redis python 数据库人工智能
在Python开发中，操作Redis数据库是很多场景下的刚需，而redis-py作为Redis官方推荐的Python客户端，更是我们绕不开的工具。但你是否在安装时踩过版本兼容的坑？是否在连接集群或配置TLS时犯过难？甚至想尝试向量索引却不知从何下手？今天我们就从基础到进阶，手把手带你玩转redis-py，让Python操作Redis变得简单又高效。一、redis-py安装：避坑指南首先，我们需要安
Python返回函数完全指南：从基础到高级应用 Python_trys python 数据库开发语言 Python教程 Python技巧 Python入门 Python基础
包含编程籽料、学习路线图、爬虫代码、安装包等！【点击领取】前言在Python编程中，函数不仅可以执行操作，还可以作为返回值，这种特性为编程带来了极大的灵活性和强大的表达能力。本文将全面介绍Python中的返回函数，从基础概念到高级应用场景，帮助开发者掌握这一重要特性。一、返回函数的基本概念1.1什么是返回函数？返回函数指的是一个函数可以返回另一个函数作为其结果。在Python中，函数是一等对象，可
Python爬虫实战：从新浪财经爬取股票新闻的完整实现 Python爬虫项目 python 爬虫开发语言数据分析 php
第一部分：爬虫概述1.1什么是爬虫？爬虫是指通过程序模拟浏览器的行为，自动化地抓取网络上的数据。通过爬虫技术，能够从各种网站上提取信息，广泛应用于数据采集、数据分析、机器学习等领域。1.2新浪财经简介新浪财经是中国最大的财经信息平台之一，提供股票、基金、债券、外汇等多方面的财经新闻和数据。在股票领域，新浪财经提供了大量的股票行情、实时数据、新闻报道等信息，因此爬取新浪财经的股票新闻对于投资分析和决
AutoGen C#三步变强：比Python还野的多AI协作实战！墨瑾轩一起学学C#【四】c#python 人工智能
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣一、第一步：环境搭建——给AutoGen装上"AI乐高积木"目标：用C#搭建AutoGen基础环境，像组装乐高一样准备工具。步骤：克隆AutoGen项目：访问AutoGenGitHub仓库，克隆到本地：gitclonehttps://github.com/mi
C#进行串口应用开发如何处理串口的异常情况 openwin_top c#串口应用开发问题系列 c#开发语言串口通讯上位机
python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位C#视觉应用开发问题系列c#串口应用开发问题系列microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析在C#中进行串口应用开发时，处理串口的异常情况是非常重要的。常见的串口异常包括端口不可用、数据传输错误、超时等
AI 智能运维，重塑大型企业软件运维：从自动化到智能化的进阶实践 AI、少年郎人工智能运维自动化
一、引言：企业软件运维的智能化转型浪潮在数字化转型加速的背景下，大型企业软件架构日益复杂，微服务、多云环境、分布式系统的普及导致传统运维模式面临效率瓶颈。AI技术的渗透催生了智能运维（AIOps）的落地，通过机器学习、大模型、智能Agent等技术，实现从"人工救火"到"智能预防"的范式转变。本文结合头部企业实践，解析AI在运维领域的核心应用场景、技术架构及未来趋势，特别针对基础运维中流程重构、技术
Spring AI 概述与功能简介 drebander AI 编程 spring 人工智能 java
SpringAI是一个由Spring团队开发的开源框架，旨在为人工智能（AI）和机器学习（ML）提供一个成熟且高效的开发平台。它将Spring生态系统的设计理念应用于AI开发，尤其强调模块化、可移植性以及简洁的集成。SpringAI提供了丰富的功能，涵盖从AI模型的调用到与数据库的集成等多个方面，帮助开发者构建和管理AI驱动的应用程序。1.SpringAI背景SpringAI的背景源于Spring
python包管理神器【uv】详解若叶. python uv 开发语言 pip virtualenv
目录1uv简介与安装1.1uv作用1.2安装方式一：github/release页下载。方式二：命令行安装(win)方式三：pypi安装确认安装成功1.3卸载2命令帮助3uv管理python版本3.1`uvpython--参数`3.2`uvpythonlist`3.3`uvpythoninstall`4uv运行单个脚本4.1`uvrun.py文件`4.2`uvinit--script`4.3`uv
python爬虫从入门到精通大模型猫叔 python 爬虫数据库
目录一、正确认识Python爬虫二、了解爬虫的本质1.熟悉Python编程2.了解HTML3.了解网络爬虫的基本原理4.学习使用Python爬虫库三、了解非结构化数据的存储1.本地文件2.数据库四、掌握各种技巧，应对特殊网站的反爬措施1.User-Agent2.Cookies3.IP代理五、学习爬虫框架，搭建工程化的爬虫1.创建Scrapy项目2.创建Spider3.编写Spider4.运行Spi
在二分类任务中如何处理包含中文的类别特征 Dush32 分类数据挖掘人工智能机器学习数据分析
在机器学习中，处理类别特征（CategoricalFeatures）是常见的任务，特别是在中文数据中，很多类别特征如省份、城市等都是字符串类型。如何将这些类别变量转换为模型可以理解的数值格式，是每个数据科学家都必须面对的挑战。在这篇文章中，我们将探讨两种常见的类别特征编码方法：astype('category')和LabelEncoder，并比较它们在二分类任务中的效果。我们以“省份”这一类别特征
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
从 C# 转 Python 第三天：文件操作、异常处理与错误日志实践 AI、少年郎 java 前端数据库 c#文件操作异常处理
在软件开发的广阔领域中，Python和C#作为两种备受瞩目的编程语言，各自凭借独特的特性和强大的功能，在不同的应用场景中展现出卓越的性能。对于开发者而言，深入理解并熟练掌握这两门语言的核心技能，如文件操作与异常处理，不仅是提升个人编程能力的关键，更是在复杂多变的项目开发中应对各种挑战、确保程序稳定运行的必备条件。在日常的编程工作中，文件操作是实现数据持久化存储、读取配置信息以及处理各种数据文件的基
python爬虫入门（小白五分钟从入门到精通）一百天成为python专家 python 爬虫开发语言网络爬虫 python3.11 ipython
网络爬虫的介绍本节主要介绍Pytbon语言中支持网络爬虫的库,此外还将介绍如何获取网站的爬取规则，读者在学习和践过程中一定要严格遵守网站提供的爬取规则。网络爬虫网络爬虫通俗来讲就是使用代码将HTML网页的内容下载到本地的过程。爬取网页主要是为了获取网中的关键信息，例如网页中的数据、图片、视频等。Python语言中提供了多个具有爬虫功能的库，下面将具urHIib库:是Python自带的标准库，无须下
Python 虚拟环境管理工具 UV：从安装到高级用法的详细教程 Dush32 python uv 开发语言人工智能机器学习分类
前言在Python开发中，管理不同项目的依赖包和Python版本是开发者常常遇到的问题。不同项目可能依赖不同版本的库，甚至同一个库在不同版本下的行为可能不同。为了避免这些问题，使用虚拟环境成为了解决方案。虚拟环境通过隔离每个项目的依赖，避免了版本冲突问题。在Python中，常用的虚拟环境管理工具有virtualenv、venv和一些第三方工具，如UV。本文将详细介绍如何使用UV虚拟环境管理工具，从
python并发执行_Python的并发并行[0] -> 基本概念 weixin_39940253 python并发执行
基本概念/BasicConcept快速跳转0简介与动机/WhyMulti-Thread/Multi-Process/Coroutine在多线程(multithreaded,MT)编程出现之前，计算机程序的执行是由单个步骤序列组成的，该序列在主机的CPU中按照同步顺序执行。即无论任务多少，是否包含子任务，都要按照顺序方式进行。然而，假定子任务之间相互独立，没有因果关系，若能使这些独立的任务同时运行，
python线程嵌套线程_Python中的嵌套并行性 weixin_39923262 python线程嵌套线程
1)WhatamImissinghere;whyshouldn’taPoolbesharedbetweenprocesses?并不是所有的对象/实例都是可挑选的/可序列化的,在这种情况下,池使用的是不可挑剔的thread.lock：>>>importthreading,pickle>>>pickle.dumps(threading.Lock())Traceback(mostrecentcallla
移除 GIL，可显著提升 Python 多线程性能么？ AIGC开发者 python 1024程序员节 python 开发语言
近日，一位名叫SamGross的开发者提出了一个对全局解释器锁（GIL）进行重大修改的设想。其目标在于移除CPython中的GIL，以使得多线程能够并行执行Python代码。目前，该项目已经引起了Python核心开发团队的关注。我一直在对CPython进行修改，使其能够在没有全局解释器锁的情况下运行。我想与大家分享一个可以在没有GIL的情况下运行的概念验证。这个概念验证涉及到对CPython内部的
InfluxDB 数据模型：桶、测量、标签与字段详解（一）计算机毕设定制辅导-无忧 #InfluxDB db
一、引言**在大数据和物联网蓬勃发展的当下，时间序列数据的处理需求呈爆发式增长。InfluxDB作为一款高性能的开源时序数据库，凭借其卓越的特性，在时序数据库领域占据了重要地位，被广泛应用于各种场景。InfluxDB专为时间序列数据设计，拥有高效的存储和查询性能。它采用独特的存储引擎，能够快速写入大量带有时间戳的数据，并支持灵活的查询操作。其核心设计针对时间序列数据的特点进行了优化，包括时间索引、
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name