腾讯AI实验室

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文

感谢阅读腾讯AI Lab微信号第67篇文章。人工智能顶级国际会议AAAI即将举办，腾讯AI Lab第2次参与，共27篇文章入选。针对实验室关注自然语言处理领域的三大研究热点：知识库与文本理解、对话和文本生成、和机器翻译，本文将进行详细解读。Enjoy！

美国人工智能年会（the Association for the Advance of Artificial Intelligence），简称AAAI，是人工智能领域的顶级国际会议。会议由AAAI协会主办，今年是第33届，于1月27日-2月1日在美国夏威夷举行。腾讯AI Lab第2次参与会议，共27篇文章入选，涵盖自然语言处理、计算机视觉、机器学习等领域。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第1张图片

其中，腾讯AI Lab在自然语言处理领域，主要关注知识库与文本理解、对话和文本生成、和机器翻译这三大方向。以下为详细解读。

知识库与文本理解

在自然语言处理研究中，各种类型的知识（Knowledge，包括语义知识、实体关系知识、常识知识）已成为文本理解和下游任务中不可或缺的数据资源。腾讯AI Lab的多篇AAAI 2019论文关注了知识库的建模，及其在文本理解上的应用。

知识库与短文本理解

1.基于Lattice CNN的中文问答匹配方法

Lattice CNNs for Matching Based Chinese Question Answering

问答系统是普通用户使用知识库最直接的渠道。匹配用户问题这种短文本，通常面临相同语义的单词和表达方式不唯一的挑战。中文这种还需要额外分词的语言中，这种现象尤为严重。在论文《基于Lattice CNN的中文问答匹配方法（Lattice CNNs for Matching Based Chinese Question Answering）》中，研究者提出一个基于Lattice CNN的模型，利用在单词语义中多粒度的信息来更好地处理中文问答的匹配。在基于文本问答和知识库问答的实验中，实验结果表明提出的模型可以显著超过目前最好的匹配模型。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第2张图片

基于Lattice CNN模型理解短文本的框架

涉及新实体的知识库嵌入

2.基于逻辑注意力邻域聚集的归纳知识图谱嵌入方法

Logic Attention Based Neighborhood Aggregation for Inductive Knowledge Graph Embedding

知识库嵌入的目的是用低维向量建模实体和关系，用于下游任务。已有方法大多要求所有实体在训练时可见，这在每天更新的知识库中是不切实际的。在论文《基于逻辑注意力邻域聚集的归纳知识图谱嵌入方法（Logic Attention Based Neighborhood Aggregation for Inductive Knowledge Graph Embedding）》中，研究者使用同时训练邻域聚集模型的方式来去除这种限制，并提出一种基于规则和注意力机制的聚集模型，即逻辑注意力网络（LAN）。在两个知识图谱补全任务上，LAN被证明优于传统聚集模型。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第3张图片

涉及新实体（Emerging Entity）的链接预测任务

常识知识库与故事补全

3.结构化常识在故事补全中的应用

Incorporating Structured Commonsense Knowledge in Story Completion

为故事选择恰当的结尾可以视作通往叙述型文本理解的第一步。这不仅需要显式的线索，还需要常识知识，而绝大多数已有工作都没有显式的使用常识。在论文《结构化常识在故事补全中的应用（Incorporating Structured Commonsense Knowledge in Story Completion）》中，研究者提出一个整合了叙述线索、情感演变以及常识知识的神经网络模型。这个模型在公共数据集ROCStory Cloze Task上取得了最好的性能。实验结果同时显示，引入常识知识带来了显著的性能增益。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第4张图片

故事和结尾中的关键词在常识知识库中的联系

对话和文本生成

近年来，随着端到端的深度神经网络的流行，对话生成及更多场景的文本生成逐渐成为自然语言处理中一个热点研究领域。其中，对话生成技术正逐渐广泛地应用于智能对话系统，帮助实现更为智能的人机交互，也可以通过自动生成新闻、财报及其它类型的文本，提高撰文者的工作效率。

在对话生成问题上，通过迁移神经机器翻译的序列到序列模型等，对话生成的效果取得了显著的进展。然而，现有的对话生成模型仍存在较多问题。首先，目前的模型大多模拟的是输入到回复一对一的映射，而实际对话数据经常是一对多的关系的训练方式，因此模型容易输出通用回复，欠缺回复多样性。其次，目前的回复生成模型缺乏对于用户背景、通用常识等知识的理解，因此如何挖掘更多有用的知识来指引回复生成是一个重要的研究问题。再次，目前多数的研究工作重点在提升单轮回复的生成之类，而缺乏对多轮对话生成的改进，多轮回复生成的质量仍较差。

在文本生成问题中，根据不同的输入类型，现有的研究任务大致划分为三大类：文本到文本的生成，数据到文本的生成以及图像、视频、音频到文本的生成。每一类的文本生成技术都极具挑战性，在近年来的自然语言处理及人工智能领域的顶级会议中均有相当多的研究工作。

腾讯AI Lab在对话生成及文本生成技术均有相关的论文被AAAI2019接收。

短文本中生成回复

4.短文本对话中的多样性回复

Generating Multiple Diverse Responses for Short-Text Conversation

短文本生成任务之前的工作，主要聚焦在如何学习一个模型为输入及其回复建立一个一对一的映射关系。但在实际场景中，一个输入往往有多种回复。因此，研究者提出了一种新的回复生成模型，在训练过程中考虑了一个提问同时具有多个回复的情况。具体来说，假设每个输入可以推断出多个潜在词，不同的回复是围绕着不同的潜在词而产生的。研究者设计了一个基于强化学习算法的对话生成模型。如下图所示，所提出的框架主要有两个核心部分：（1）潜在词推断网络：其根据输入的提问来选择合适的潜在词作为生成网络输入的一部分；（2）生成网络，根据潜在词推断网络选择的潜在词以及输入的提问来生成回复。基于强化学习的训练过程中，使用F1值来计算潜在词推断网络的奖赏并更新推断网络参数，并选取这多个回复中损失最小的一项来更新生成网络参数。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第5张图片

模型框架图

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第6张图片

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第7张图片

微博(左)和Twitter(右)数据集人工评测结果

研究者分别在微博和Twitter两个数据集上进行大量实验，人工评测的结果表明所提出的模型相比多个之前的模型，在提升回复信息量的同时保证了回复的多样性。以下是基线模型MultiMech和我们所提出的模型在微博数据集上的生成样例。方括号内为潜在词推断网络选择的潜在词。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第8张图片

微博数据集生成样例

多选干扰项生成

5.阅读理解问题的干扰选项生成

Generating Distractors for Reading Comprehension Questions from Real Examinations

本文探究了考试中为多选阅读理解题型生成干扰项的任务。和之前工作不同，研究者不以生成单词或短语类型的干扰项为目的，趋向生成更长并含有丰富语义信息的干扰项，从而生成的干扰项和真实考试中阅读理解题目的干扰项尽可能接近。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第9张图片

模型框架概览

如图所示，以阅读理解文章，问题和正确的答案选项作为输入，目标是生成多个与答案有关联，和问题语义上连贯并能在文章中找到蛛丝马迹的干扰项。研究者提出了一个层次编码器-解码器模型，辅之以静态与动态注意力机制来解决这个任务。具体来说，动态注意力机制可以融合句子级别和词级别的注意力信息，并在解码的每一个步骤会有所变化，从而生成一个可读性更强的序列。静态注意力机制可以调制动态注意力机制，打压与当前问题无关的句子或者包含正确答案的句子。

通过第一个阅读理解问题干扰项生成数据集上的实验，本文提出的模型超过了多个基线模型。人工评测中与一些基线模型生成的干扰项相比，其模型生成的干扰项更加容易迷惑标注者。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第10张图片

实验结果

新闻摘要生成

6.考虑读者评论的生成式文本摘要

Abstractive Text Summarization by Incorporating Reader Comments

在基于神经网络的生成式文本摘要研究领域中，传统的基于序列到序列的模型对文档主题的建模经常出错。为解决这个问题，研究者提出了读者感知的摘要生成任务，它利用读者的评论来帮助生成符合文档主题的更好的摘要。与传统的生成式摘要任务不同，读者感知型摘要面临两个主要挑战：（1）评论是非正式的，有噪音的; （2）联合建模新闻文档和读者评论具有一定挑战性。

为解决上述问题，本文设计了一个基于对抗学习的读者感知型摘要生成模型（RASG），它由四个部分组成：（1）基于序列到序列的摘要生成模块; （2）读者注意力建模模块来捕捉读者关注的主题; （3）督导建模模块来描述生成的摘要和读者关注主题之间的语义差距; （4）目标跟踪模块来产生每个生成步骤的目标。督导和目标定位模块以对抗学习的方式来指导我们框架的训练。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第11张图片

模型框架概览

研究者在自行收集的文摘数据集进行大量实验，结果表明RASG在自动评测和人工评测方面都取得了最好的效果。实验结果还证明了该框架中每个模块的有效性，同时研究人员发布了一个大规模数据集供进一步研究。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第12张图片

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第13张图片

自动评测结果（左）和人工评测结果

机器翻译

机器翻译是人工智能的终极目标之一，其核心语言理解和语言生成是自然语言处理的两大基本问题，极具挑战性。近几年来，随着深度学习技术的发展，神经网络机器翻译取得了巨大进展，其生成的译文接近自然句子，成为了主流模型。但是由于当前神经网络的不可解释性，无法保证原文内容完整传递到译文，使得神经网络翻译模型存在译文忠实度问题（即“达而不信”）。腾讯AI Lab专注于解决该核心问题，在AAAI2019会议上发表的多篇论文通过改进模型架构和训练框架，提升模型对源句理解和目标句生成的能力，从而改善神经网络翻译模型忠实度低的问题。

自注意力模型

7.上下文增强的自注意力神经网络

Context-Aware Self-Attention Networks

自注意力模型通过直接计算任意两个词的向量表示，得到它们的关联性强弱（图(a)）。由于其极佳的并行性运算及捕获长距离依赖的能力，自注意力模型成为当前主流翻译模型（如Transformer）的核心组件。在本工作中，通过改进自注意力模型的全局上下文建模能力，从而更好地计算词间的关联性。研究者使用不同策略来建模全局上下文信息，如顶层全局信息（图(b)）、深层信息（图(c)）及深层全局信息（图(d)）。为保持自注意力模型的并行性及简易性，研究者将上下文信息引入注意力模型输入（如Query和Key）的转化函数中。该论文是改进自注意力模型的第二个工作，前续工作（Modeling Localness for Self-Attention Networks, EMNLP2018）改进了自注意力模型的局部建模能力。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第14张图片

深层模型

8.基于动态层融合的神经网络机器翻译

Dynamic Layer Aggregation for Neural Machine Translation

主流的翻译模型都是深层网络结构，比如Transformer模型的编码器和解码器都是由多层自注意力网络组成。近期多个工作表明不同层表示可以捕获输入句子不同级别的语言学信息，但主流模型只利用了编码器和解码器的最上层表示信息，而忽视了其余层包含的有用信息。本研究使用胶囊网络中的迭代路径 (iterative routing)算法融合所有层的表示，从而更好地利用不同层捕获的不同语言学信息。该论文为利用深层表示的第二个工作，前续工作（Exploiting Deep Representations for Neural Machine Translation, EMNLP2018）使用深层连接改进深层网络中信息和梯度的传递路径（Information and Gradient Flow），而本工作更关注于直接融合不同层表示（Representation Composition）。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第15张图片

忠实度导向的训练框架

9.基于译文忠实度训练的神经网络机器翻译

Neural Machine Translation with Adequacy-Oriented Learning

当前翻译模型的训练通常是基于最大化词的似然概率的框架。该框架有三个缺陷：（1）训练/测试不一致，训练时是基于正确的目标序列而测试时是由于包含错误的生成序列；（2）基于词级别的目标函数，而在实际场景中评判译文质量的指标通常是基于句子级别的；（3）最大似然估计更多是关注译文的流利度而不是忠实度，这也是导致模型偏好短译文的重要原因。

本研究尝试在统一框架中同时解决上述三个缺陷。如图1所示，将翻译建模成强化学习中的随机策略（Stochastic Policy）问题，而学习奖励则是基于模型生成的完整序列评估的。为了更好地评估译文的忠实度，本文提出了一种新的标准 – 覆盖差异率（Coverage Difference Ratio, CDR），通过比较生成译文和人工译文对源端词的覆盖程序，以评估有多少源端词被遗漏翻译。在图2展示的例子中，译文的 CDR=4/7，其中4和7分别是生成译文和人工译文中覆盖的源端词个数。该论文中的覆盖率思想也是延续作者的前续工作（Modeling Coverage for Neural Machine Translation），在训练框架中验证该策略的普适性，实验同时证明两种方法具有一定互补性，同时使用可进一步提升翻译效果。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第16张图片

图 1 训练框架

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第17张图片

图 2 CDR示例

除了改进基本的翻译模型，研究者同时探索辅助翻译，从而使当前神经网络机器翻译系统更好地为真实用户服务。围绕最近推出的辅助翻译产品TranSmart，腾讯AI Lab发表在AAAI2019的论文（Graph Based Translation Memory for Neural Machine Translation）将用户提供的或者自动检索的翻译记忆融入神经翻译模型，从而改善翻译质量。不同于现有的翻译记忆方法，本文将翻译记忆组织成一个压缩图并采用基于图的注意力机制来构建翻译的上下文。其优势是，既可以保证计算的有效性，又可以充分地建模翻译记忆中全局信息比如长距离的调序，因而获得了更好的翻译质量。

入选论文

精彩一览

10. MOBA游戏AI的多层次宏观策略模型

Hierarchical Macro Strategy Model for MOBA Game AI

该论文由腾讯AI Lab独立完成，在通用AI研究中，可解决部分可观测、团队协作、博弈等复杂AI问题。即时战略游戏是游戏AI的下一个挑战。即时战略游戏给AI研究提供了一个部分可观测的游戏环境，智能体在这样的环境中基于比围棋大的多的操作空间产生交互。攻克即时战略游戏需要同时具备强大的宏观策略及精准的微观执行。最近，研究人员在微观执行层面取得了巨大突破，然而宏观策略层面仍然缺乏完整有效的解决方案。该论文创新提出了基于机器学习的多层宏观策略模型以提升智能体在多人在线格斗游戏（MOBA）游戏 - 即时战略游戏的一个子类 - 中的宏观策略能力。经过多层次宏观策略模型训练的智能体显示的进行宏观策略决策以指导微观操作。更进一步的，每一个智能体在做决策的同时，通过本文创新设计的模仿跨智能体通信机制与其他智能体进行配合。研究者在一款风靡的5v5 MOBA游戏（王者荣耀）上充分验证了多层次宏观策略模型的效果。研究团队的5 AI战队在与前1%的人类战队的对战测试中，取得了48%的胜率。

11. 意见目标抽取以及目标情感预测的统一模型

A Unified Model for Opinion Target Extraction and Target Sentiment Prediction

该论文由腾讯AI Lab主导，与香港中文大学合作完成，该研究通过改进基本的序列标注模型来提升端到端抽取用户评论中的意见目标和相应的情感倾向的性能。基于意见目标的情感分析(TBSA)涉及到了意见目标抽取和目标情感预测两个子任务。目前的工作主要是将他们作为两个单独的任务来研究，对于实际应用的贡献是非常有限的。这篇文章的目标在于以一种端到端的方式来解决完整的TBSA任务。为了实现这个目标，本文提出了一个新的统一模型并在模型中采用了一种联合的标注方案。整个模型用到了两层循环神经网络(RNN)：上层的RNN用来预测联合的标签，这些标签会作为主要任务TBSA的输出；为了引导上层的RNN更好的完成TBSA任务，本文引入了下层的RNN来同时解决辅助任务--意见目标实体的边界检测。RNN产生的边界特征表示可以直接用于提升目标情感预测的质量。为了探索任务之间的依赖，本文提出显式地对目标边界到目标情感极性的转换进行约束。本文也设计了一个组件对同一个意见目标内的情感一致性进行维持，这个组件主要基于门控制机制来对上一个时刻的特征和当前时刻的特征之间的关系进行建模。本文在三个标准数据集上进行了大量实验，结果表明本文的方法都比现有的方法更好。

12. 通过样本加权进行更好地微调文本分类模型

Better Fine-tuning via Instance Weighting for Text Classification

该论文由腾讯AI Lab主导，与南京大学合作完成。深度神经网络中使用迁移学习在许多文本分类应用中取得了巨大成功。一种简单而有效的迁移学习方法是对预训练的模型参数进行微调。之前的微调工作主要集中在预训练阶段，并且研究如何预训练一组对目标任务最有帮助的参数。本文提出了一种基于样本加权的微调（IW-Fit）方法，对于微调阶段进行了改进以提高分类器在目标域的最终性能。 IW-Fit动态调整每个微调时期的样本权重，以实现两个目标：1）有效地识别和学习目标域的特定知识; 2）很好地保留源域和目标域之间的共享知识。 IW-Fit中使用的样本加权计算指标与模型无关，对于基于DNN的通用分类器而言易于实现。实验结果表明，IW-Fit可以持续提高模型在目标域的分类精度。

13. 深层特征结构学习方法

Learning (from) Deep Hierarchical Structure among Features

该论文由香港科技大学与腾讯 AI Lab合作完成，提出了多种层次结构特征学习方法。数据中的特征通常存在着复杂的层次结构。大多数现有的研究侧重于利用已知的层次结构来帮助监督学习提高学习的精度，而且通常仅能够处理层次深度为2的简单结构。本文提出了一种深度层次特征学习方法（DHS），用于学习任意深度的特征层次结构，并且学习目标是凸函数。DHS方法依赖于结构中边上的权重的指数系数，然而这些指数系数需要提前人为给定，这会导致学习出的特征表达是次优的。基于DHS方法，本文又提出了可以自动学习这些指数系数的方法。进一步的，本文考虑层次结构未知的情况，并且在DHS的基础上又提出一种深度特征层次结构学习方法（LDHS）。不同于以往的方法，LDHS不需要知道关于层次结构的先验知识，而是通过fused-lasso技术和一种特定的序列约束条件直接从数据中学习出特征的层次结构。上述所有提出的模型的优化方法都可以通过近似梯度的方式求解，并且本文给出了求解过程中每个子问题的高效解答算法。本文在多种人工和真实数据集上进行了实验，结果表明了本文提出方法的有效性。

14. DDFlow：通过无监督数据蒸馏学习光流

DDFlow:Learning Optical Flow with Unlabeled Data Distillation

这项研究由腾讯AI Lab主导，与香港中文大学合作完成，提出一种无监督的数据蒸馏方法学习光流——DDFlow。该方法由一个教师模型中提取出预测结果，并用这些结果来指导学生模型学习光流。以往的无监督学习方法是通过一些人工设定的能量函数来处理被遮挡的区域，这篇论文的不同之处是通过数据来自动学习和预测被遮挡区域的光流。通过该方法，模型只需使用一个非常简单的目标函数，就能取得更高的准确率。本文在Flying Chairs, MPI Sintel, KITTI 2012 和 KITTI 2015四个数据集上做了详尽的实验。实验表明，本文提出的方法超过所有无监督的光流预测方法，并且可以实时运行。

15. 类间角度损失用于卷积神经网络

Inter-Class Angular Loss for Convolutional Neural Networks

这项研究由南京理工大学与腾讯AI Lab合作完成。卷积神经网络在各种分类任务中表现出强大的力量，并且在实际应用中取得了显着的成果。然而，现有网络在很大程度上忽略了不同类别对的区分学习难题。例如，在CIFAR-10数据集中，区分猫和狗通常比区分马和船更难。通过仔细研究卷积神经网络模型在训练过程中的行为，研究者观察到两类的混淆程度与它们在特征空间中的角度可分性密切相关。也就是说，类间角度越大，混淆度越低。基于这一观察，研究者提出了一种新的损失函数，称为“类间角度损失”(ICAL)。它明确地模拟了类相关性，可以直接应用于许多现有的深度网络。通过最小化ICAL，网络可以通过扩大它们对应的类向量之间的角度来有效地区分相似类别中的示例。对一系列视觉和非视觉数据集的全面实验结果证实，ICAL极大地提高了各种代表性深度神经网络的辨别能力，并为传统的softmax损失产生了优于原始网络的性能。

16. 基于最大化后验估计的词嵌入模型

Word Embedding as Maximum A Posteriori Estimation

这项研究由肯特大学与腾讯AI Lab合作完成。词嵌入模型GloVe可以被重构成一个最大似然估计问题，再通过优化的方式进行求解。该论文通过考虑基于GloVe的参数化方法，同时结合先验分布来对GloVe词嵌入模型进行泛化。本文提出了一个新的词嵌入模型，该模型对每个上下文词的变化进行建模，来表示这个词的信息重要性。论文中提出的框架可以统一学习词向量和每个词的变化。实验表明本文提出词向量模型优于GloVe和它的其他变种。

17.可控的图像到视频转换：关于人脸表情生成的案例分析

Controllable Image-to-Video Translation: A Case Study on Facial Expression Generation

这项研究由腾讯AI lab主导，与麻省理工学院（MIT）合作完成。深度学习的最新进展使得利用神经网络生成如照片般逼真的图像成为可能，甚至可以从视频过去几帧推断出未来几帧——某种意义上，实现了从过去视频到未来视频的生成。为了进一步深化这种探索，同时也出于对实际应用的兴趣，我们研究了图像到视频的转换，特别关注面部表情的视频。与图像到图像的转换相比，该问题通过一个额外的时间维度来挑战深度神经网络；此外，这里的单张输入图像使大多数视频到视频转换的方法无法应用。为了解决这个新问题，研究者提出了一种用户可控制的方法，以便从单个人脸图像生成各种长度的表情视频剪辑，用户可控制视频的长度和表情的类型。因此，我们设计了一种新颖的神经网络架构，可将用户输入作用到网络的跳层连接上；同时，提出对神经网络的对抗训练方法的若干改进。通过实验和用户研究验证了该方法的有效性。尤其值得强调的是，即使随机的网络图像和作者自己的图像相对于训练数据有较大的差异，本文的模型也可以生成高质量的面部表情视频，其中约50％被用户认为是真实采集的视频。

18. 利用考虑偏好的损失学习实现任务迁移

Task Transfer by Preference-Based Cost Learning

这项研究由清华大学与腾讯AI Lab合作完成。强化学习中的任务迁移旨在把智能体在源任务中的策略迁移到目标任务。尽管当前方法取得了一定成功，但是他们依赖于两个很强的假设：1）专家演示和目标任务精确相关以及 2）目标任务中的损失函数需要显式定义。在实际中这两个假设都是难以满足。该论文提出了一个新颖的迁移框架减少对这两个假设的依赖，为此，研究者使用了专家偏好作为迁移的指导。具体而言，研究者交替进行以下两个步骤：首先，研究者通过预定义的专家偏好从源任务鸿挑选与目标任务相关的演示；然后，基于这些挑选的演示，研究者通过利用增强版的对抗最大熵模型来同时学习目标损失函数以及状态-操作的轨迹分布。该论文的理论分析证明了方法的收敛性。大量的仿真实验也验证了该论文方法的有效性。

19. 超越RNN：面向视频问答的具有位置特性的自注意力和交互注意力模型

Beyond RNNs: Positional Self-Attention with Co-Attention for Video Question Answering

这项研究由电子科技大学与腾讯AI Lab合作完成。当前，大部分实现视频问答的方法都是基于考虑注意力的递归神经网络（RNN）。虽然取得一些进展，但是RNN的局限性导致了这些方法往往需要花费大量训练时间却难以捕捉长时间关联。该论文提出了一种新的架构，具有位置属性的自注意力和交互注意力结合（PSAC），这个框架不再需要RNN来实现视频问答。具体而言，研究者从机器翻译中自注意力的成功得到启发，提出了一种具有位置属性的自主力模型来计算同一个序列中每个位置自身的激活以及其与其他位置的相关激活。因此，PASC能利用问题与视频的全局依赖，并且使得问题和视频编码能并行进行。除了利用视频自注意力，研究者更进一步查询问题中“哪些单词需要注意”来设置交互注意力机制。据研究者所知，这是视频问答领域中首次尝试去抛开RNN而只用注意力模型。在三个公开的数据集上，本文的方法显著优于当前最好，并且在另外一个数据集上取得了接近当前最好的结果。与RNN模型相比，本文的方法在更短的运算时间取得了更高的精度。此外，本文还进行了若干对比实验来验证方法每个组件的有效性。

20. 置信加权多任务学习

Confidence Weighted Multitask Learning

这项研究由阿卜杜拉国王科技大学与腾讯AI Lab合作完成。为了缓解传统在线多任务学习仅利用了数据流的一阶信息的问题，我们提出置信加权多任务学习的算法。对于每个任务，它都维护了一个高斯分布来引导在线学习过程。高斯分布的均值向量（协方差矩阵）是一个局部成分和全局成分的和，其中全局成分是在所有任务间共享的。此外，本文也解决了在线多任务学习场景下主动学习的挑战。不同于索要所有样本的标签，所提算法可以基于相关任务的预测置信度来决定是否索要相应的标签。理论结果显示，后悔上界可以被显著的减小。经验结果表明，所提算法可以获得很高的学习性能，且同时可以减小标注成本。

21. 旨在提升asepct-level情感分类的、从粗粒度到细粒度的迁移学习

Exploiting Coarse-to-Fine Task Transfer for Aspect-level Sentiment Classification

这项研究由香港科技大学与腾讯AI Lab合作完成。Aspect-level的情感分类旨在找出句子里针对具体aspect的情感倾向，其中aspect可以是一个泛类（AC-level），比如食品、服务，也可以是一个具体的项（AT-level），比如三文鱼、时速。然而，由于极其耗时耗力的标注成本，当前AT-level的公开数据集都相对较小。受限于这些小规模的数据集，当前大多数方法依赖于复杂的结构，从而限制了神经网络模型的有效性。该论文提出了一个新的解决方案，即从数据相对充足的粗粒度任务（AC-level）到数据稀疏的细粒度任务（AT-level）进行迁移学习。为了解决两个领域在aspect粒度以及特征上的不一致，本文提出了一个多粒度对齐网络（MGAN）。在MGAN中，一个全新的Coarse2Fine注意力机制可以帮助AC-level的任务也可以建模同AT-level相似的细粒度。同时，一个对比的特征对齐方法用来语义对齐两个领域的特征表示。另外，本文提供了一个AC-level的大规模多领域情感分类数据集。大规模的实验证明了MGAN的有效性。

22. 基于属性仓库的表亲网络引导的素描图识别

Cousin Network Guided Sketch Recognition via Latent Attribute Warehouse

这项研究由腾讯AI Lab主导，与澳洲国立大学合作完成，本论文对扫描图片识别的问题进行研究。由于两个原因导致该问题难度较高：1）素描图片相对自然图片比较稀缺，2）素描图片与自然图片之间存在较大的鸿沟。为了克服这些困难，研究者提出了利用自然图像训练好的网络（表亲网络）来引导素描图片识别网络的学习过程。表亲网络将引导素描图片识别网络学习更多与自然图像相关的特征（通过对抗学习）。为加强分类模型的可迁移能力，一个连接自然图像和素描图像的属性仓库建立起来，以逼近自然图像和素描图像的域间差。实验证明本文提出的方法取得了当前最优的识别性能。

23. 层级化的照片场景编码器用于相册故事生成

Hierarchical Photo-Scene Encoder for Album Storytelling

这项研究由腾讯AI Lab主导，与山东大学合作完成。本文提出了一种用于相册故事生成的新型模型，该新型模型使用了层级相片-场景编码器和重构器。其中，相片-场景编码器包含两个子模块，分别是相片编码器和场景编码器，它们重叠在一起，以分层的形式充分利用相册中照片的结构信息。具体来说，相片编码器利用相册中相片的时序关系的同时，为每一张照片生成语义表示。场景编码器依赖于生成的相片语义表示，负责检测相册的场景变化并生成场景特征。接着，解码器动态地、有选择性地总结这些编码的相片和场景语义表示，用以生成相册表示序列。基于此，一个含有多个一致性句子的故事就产生了。为了充分提取和利用相册中有效的语义信息，重构器被引入到该模型中，来重构那些基于解码器的隐藏状态而被动态总结了的相册表示。本文提出的模型以一种端到端的形式进行训练，在公开的visual storytelling数据集（VIST）上得到了更好的性能。对比研究实验进一步论证了本文所提出的层级相片-场景编码器和解码器的有效性。

24. 结构化常识在故事补全中的应用

Incorporating Structured Commonsense Knowledge in Story Completion

这项研究由加州大学戴维斯分校与腾讯AI Lab合作完成。为一个给定的故事选择恰当的结尾，被认为是通往叙述型文本理解的第一步。故事结尾预测不仅需要显式的线索，还得需要一些隐式的知识（如常识）。之前绝大多数方法都没有明显地使用各种背景常识。该论文提出一个基于神经网络的故事结尾预测模型，这个模型整合了三种不同类型的信息来源：叙述线索、情感演变以及常识知识。实验结果表明本文的模型在一个公共数据机ROCStory Cloze Taks上取得了最好的性能。同时，实验结果表明引入常识知识带来了显著的性能增益。

25. 一种针对多模态数据的高效特征提取方法

An Efficient Approach to Informative Feature Extraction from Multimodal Data

这项研究由腾讯AI Lab主导，与清华大学、清华-伯克利深圳学院、麻省理工学院（MIT）合作完成。多模态特征提取的一个研究重点在于如何找到每个模态中相关度最大的特征表达。作为一种常用的相关度度量方式，HGR最大相关度因较好的理论性质，经常被作为优化的目标函数。然而，HGR最大相关度中对于白化的严格约束，部分限制了其应用。为解决这一问题，本文提出了Soft-HGR的新框架，以解决从多个数据模态中提取有效特征的问题。具体来说，本方法在优化HGR最大相关度的过程中，避免了严格白化约束，同时也能保持特征的集合特性。Soft-HGR的优化目标仅包含两个内积项，可以保证优化过程的求解效率和稳定性。研究者进一步将该方法泛化，用于解决超过两个数据模态以及部分模态缺失的问题。对于数据中仅有部分标注信息的情况，研究者可以通过半监督适应的方法，使得所提取的特征更具有判别力。实验结果表明，本文的方法可以学习到更有信息量的特征映射，同时优化过程也更为高效。

26. Plan-And-Write: 更好的自动故事写作

Plan-And-Write: Towards Better Automatic Storytelling

这项研究由北京大学、南加州大学与腾讯AI Lab合作完成。自动故事生成的目标是用更长、更流畅的语句来描述一个有意义的事件序列，这是一个极具挑战的任务。尽管已有许多工作在研究自动故事生成，但是先前的研究要么局限于plot planning，要么只能生成特定领域的故事。该论文探索了开放领域的基于给定故事题目的故事生成任务。研究者提出了plan-and-write的层级生成框架，先生成故事线，再基于此生成整个故事。研究者对比了两种planning的策略：动态模式是将故事线的planning和故事的文本生成交替进行，而静态模式是先确定好故事线再生成故事。实验结果表明，在显式的故事线planning作用下，系统能生成更多样、更连贯、更切题的故事，在自动指标和人工评测结果中，都优于没有planning的对比方法。

27. 翻译记忆图的神经机器翻译

Graph based translation memory for neural machine translation

该论文由腾讯AI Lab主导，与卡内基梅隆大学合作完成，可有效地利用翻译记忆构建翻译模型。翻译记忆对提高统计机器翻译很有帮助，随着统计机器翻译向神经机器翻译的进化，将翻译记忆融入到神经翻译框架已经引起了很多关注。现有的工作中，有的为了保证效率，仅利用了翻译记忆中的局部信息；也有工作利用了翻译记忆中的全局信息，但是降低了效率。该论文提出了一个有效的方法，它可以充分利用翻译记忆的全局信息。它的基本思想是，将包括冗余词的序列化翻译记忆压缩成一个结构紧凑的图，然后计算一个基于图的注意力模型。在6个翻译任务上的实验表明，本文提出的方法是有效的：它获得了比基线系统Transformer更好的效果，而且也比现有的基于翻译记忆的模型更好。

AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文_第18张图片

你可能感兴趣的:(AAAI2019 | 腾讯AI Lab详解自然语言处理领域三大研究方向及入选论文)

Java SE入门及基础（62）& 线程池 & 执行器卷到起飞的数分 Java SE java 开发语言
线程池1.执行器Inallofthepreviousexamples,there'sacloseconnectionbetweenthetaskbeingdonebyanewthread,asdefinedbyitsRunnableobject,andthethreaditself,asdefinedbyaThreadobject.Thisworkswellforsmallapplications
动手实践OpenHands系列学习笔记17：构建自定义OpenHands应用
笔记17：构建自定义OpenHands应用一、引言OpenHands作为可扩展的AI驱动软件开发代理平台，不仅提供了丰富的内置功能，还允许开发者构建自定义应用和扩展。通过基于OpenHands的核心能力，开发者可以创建针对特定领域或工作流的专用AI代理应用。本笔记将探讨OpenHands的可扩展架构，分析自定义应用的设计模式，并通过实践构建一个专门的代码重构助手应用。二、OpenHands扩展性架
动手实践OpenHands系列学习笔记15：无头模式架构 JeffWoodNo.1 笔记架构
笔记15：无头模式架构一、引言无头模式(HeadlessMode)是现代软件系统中的重要架构模式，允许应用程序在没有图形界面的情况下运行，特别适用于自动化场景、CI/CD流水线和系统集成。OpenHands作为先进的AI驱动开发代理平台，提供了强大的无头模式支持。本笔记将探讨无头架构设计原则，分析OpenHands的无头模式实现，并通过实践构建一个使用无头模式API的自动化工作流。二、无头架构设计
动手实践OpenHands系列学习笔记8：后端服务开发 JeffWoodNo.1 笔记
笔记8：后端服务开发一、引言后端服务是AI代理系统的技术基础，负责处理业务逻辑、状态管理和外部集成。本笔记将探讨API设计与服务架构理论，分析OpenHands的后端设计特点，并通过实践构建一个模拟OpenHands核心功能的后端服务模块。二、API设计与服务架构理论2.1API设计原则RESTful设计:资源化URL设计、HTTP方法语义GraphQL:声明式数据查询、减少请求次数API版本控制
动手实践OpenHands系列学习笔记3：LLM集成基础 JeffWoodNo.1 笔记人工智能
笔记3：LLM集成基础一、引言大型语言模型(LLM)是OpenHands代理系统的核心驱动力。本笔记将深入探讨LLMAPI调用的基本原理，以及如何在实践中实现与Claude等先进模型的基础连接模块，为构建AI代理系统奠定基础。二、LLMAPI调用基础知识2.1LLMAPI基本概念API密钥认证:访问LLM服务的身份凭证提示工程:构造有效请求以获取预期响应推理参数:控制模型输出的各种参数流式响应:增
触发器设计美国VPS：优化数据库性能的关键策略 cpsvps oracle 数据库
在当今数字化时代，美国VPS（虚拟专用服务器）因其高性能和稳定性成为众多企业和开发者的首选。本文将深入探讨触发器设计在美国VPS中的应用，分析其优势、实现方法以及最佳实践，帮助您充分利用VPS资源，提升系统效率和响应速度。触发器设计美国VPS：优化数据库性能的关键策略美国VPS与触发器设计的完美结合美国VPS作为云计算领域的重要基础设施，为触发器设计提供了理想的运行环境。触发器（数据库中的自动执行
1963. 使字符串平衡的最小交换次数 Joyner2018 python 算法 leetcode python 开发语言
如何使字符串变成平衡括号串？——最小交换次数问题详解题目描述给定一个字符串s，字符串长度为偶数n，且恰好由n/2个开括号'['和n/2个闭括号']'组成。我们称字符串为平衡字符串，当且仅当它满足以下条件之一：空字符串是平衡字符串；若字符串A和B是平衡字符串，则它们的拼接AB也是平衡字符串；若字符串C是平衡字符串，则用括号包裹起来的字符串[C]也是平衡字符串。你可以交换字符串中任意两个位置的括号任意
IDEA运行java博客项目halo报错笔记（一）叶卡 halo博客项目 java
1、关于JDK版本在导入项目时查看日志CHANGELOG.md，里面有关于jkd版本适用版本的描述，1.4.3及以后版本不再支持JRE1.8，只能是jdk11及以上的版本，不然导入项目会出错！除此之外，也应该看看其他更新的信息。2、‘fetchBranch(java.lang.String,java.lang.String)’isdeprecatedandmarkedforremoval问题描述：
创客匠人深度剖析：家庭教育赛道创始人 IP 打造与知识变现的破局之道创小匠 tcp/ip 网络协议网络
在知识付费领域，家庭教育赛道的竞争日益激烈，如何从0-1打造创始人IP并实现高效拓客，成为创业者的核心难题。创客匠人服务的慈航德教育创始人陈向杰老师，通过视频号运营、产品矩阵设计与社群生态构建，实现单月拓客1.6万+，其背后的IP打造逻辑为行业提供了可复用的方法论。从慈航德教育的案例来看，创始人IP的定位需要锚定赛道本质需求。陈向杰老师将“慈、航、德”的品牌理念融入IP人设，以“帮助孩子减负”的教
创客匠人视角下：创始人 IP 打造与知识变现的深度耦合路径创小匠 tcp/ip 大数据人工智能
在知识经济蓬勃发展的当下，创始人IP打造与知识变现的融合已成为行业破局关键。创客匠人作为深耕知识付费赛道多年的服务平台，其创始人老蒋提出的“土壤构建能力”理论，为理解这一融合逻辑提供了独特视角。从本质来看，创始人IP并非简单的个人品牌包装，而是企业价值观与专业能力的人格化投射。以创客匠人服务的众多知识创业者为例，成功的创始人IP往往具备三大特征：专业领域的深度沉淀、用户需求的精准洞察，以及价值输出
mysql和neo4j组合使用_Neo4j学习大禹昆仑 mysql和neo4j组合使用
NEO4J基本命令1.CREATECREATE(NODE_NAME:LABEL_NAME>,{PROPERTY1:VALUE1,PROPERTY2:VALUE2,})示例create(person:zhanglisheng,{age:43,height:174})注意点：当属性值是字符串时候，必须加单引号或双引号，否则报错invalidliteralnumber(line1,column44(of
apt-get install E: 无法定位软件包问题欧阳秦穆
在etc/apt的sources.list添加镜像源debhttp://archive.ubuntu.com/ubuntu/trustymainuniverserestrictedmultiverse然后sudoapt-getupdate接着安装就可以了
Typora快速上手Markdown编写 TT-Kun Mine markdown typora
文章目录Markdown编写指南（以Typora为例）==前言：==一、标题快捷键二、段落1、换行/段2、分割线三、文字显示1、字体2、上下角标3、转义\解决解析冲突问题四、列表1、无序列表代码及效果：2、有序列表**代码及效果**：3、任务列表（方框，带勾方框）**代码及效果**五、Quote区块显示六、Code代码显示1、行内代码2、代码块及高亮（1）直接创建高亮代码块（2）设置不在代码块中的
【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation AustinCyy 论文笔记论文阅读
论文信息论文标题：RAGLAB:AModularandResearch-OrientedUnifiedFrameworkforRetrieval-AugmentedGeneration-EMNLP24论文作者：XuanwangZhang-NanjingUniversity论文链接：https://arxiv.org/abs/2408.11381代码链接：https://github.com/fat
SIMULINK开发项目实例 1000 例专栏之第663例：基于simulink的SVPWM技术的研究的三相电压源逆变器建模仿真 xiaoheshang_123 MATLAB 开发项目实例 1000 例专栏手把手教你学 MATLAB 专栏 matlab simulink
目录准备工作步骤详解第一步：创建Simulink项目第二步：选择并添加合适的库组件第三步：构建基本的三相电压源逆变器模型第四步：实现SVPWM算法第五步：仿真与调试第六步：结果分析第七步：优化与改进第八步：导出与部署总结三相电压源逆变器（VoltageSourceInverter,VSI）在电力电子中是将直流电转换为交流电的一种重要设备，广泛应用于电机驱动、不间断电源（UPS）、可再生能源系统等领
Node.js v22.5+ 官方 SQLite 模块全解析：从入门到实战红衣大叔 nodejs帮助文档 node.js sqlite 数据库
在Node.jsv22.5.0及更高版本中，node:sqlite模块作为内置模块被引入，为开发者提供了与SQLite数据库交互的官方支持。以下是关于node:sqlite模块的详细介绍：一、模块启用与导入启用方式：node:sqlite模块目前处于活跃开发阶段，需要通过--experimental-sqliteCLI标志来启用。导入方式：使用import语句从node:sqlite模块中导入所需
DeepFM算法原理及应用场景
DeepFM（DeepFactorizationMachine）是一种结合了因子分解机（FactorizationMachines,FM）和深度神经网络（DNN）的混合模型，主要用于处理高维稀疏数据（如推荐系统中的点击率预测）。其核心思想是同时捕捉低阶（线性）和高阶（非线性）特征交互。1.算法原理模型结构如下：FM部分：负责捕捉低阶特征交互（如一阶和二阶特征组合）。一阶项：线性特征权重。二阶项：通
巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
大模型 AI智能体Coze知识库从使用到实战详解非著名架构师大模型知识文档人工智能 Coze知识库
一、Coze知识库核心价值解析1.1知识库技术架构创新Coze知识库采用四层混合架构设计，在2025年大模型应用中展现出独特优势：存储层：支持向量数据库（Qdrant）+图数据库（Neo4j）双引擎处理层：集成PDF/PPT/Excel等23种文件解析器检索层：混合检索算法（BM25+稠密检索+语义路由）应用层：RAG（检索增强生成）优化接口与传统方案相比，查询准确率提升42%，特别擅长处理：专业
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
搬运机器人系列编程：Fanuc M-20iA_20.搬运机器人系统的集成与安装 zhubeibei168 机器人及导航机器人数据挖掘人工智能
20.搬运机器人系统的集成与安装20.1系统集成概述在汽车制造行业中，搬运机器人系统的集成是一个复杂而多步骤的过程，涉及机械、电气、软件等多个方面的专业知识。FanucM-20iA搬运机器人以其高效、精准的特点，在这一领域中得到了广泛应用。本节将详细介绍如何将FanucM-20iA机器人集成到汽车制造生产线中，包括硬件安装、软件配置、系统调试等关键步骤。20.1.1机器人系统集成的重要性机器人系统
0代码改动实现应用运行时数据库密码无损轮转阿里-于怀 oracle 数据库 nacos
作者：柳遵飞一.敏感数据的安全风险在应用程序中，访问数据库几乎是必须的，是实现业务功能的基础普遍场景，应用程序访问数据库，需要设置数据库的地址，端口，账号及密码。密码的安全性非常重要，业界密码泄漏导致资损的事件时有发生，根据相关统计，单次泄漏事件的发生平均导致488万美元（约合人民币3542万元），每条泄漏的数据记录平均导致169美元（约合人民币1226元），除了直观的资金损失外，对企业的形象和舆
【C#】MVVM基础知识及基本应用 Mike_Wuzy c#
以下是一些关于C#中MVVM（Model-View-ViewModel）模式的基础知识：1.模型(Model)模型负责表示数据和业务逻辑，通常包括数据库访问、文件操作等。它不包含任何用户界面相关的代码。publicclassPerson{publicintId{get;set;}publicstringName{get;set;}publicDateTimeBirthDate{get;set;}/
Assistant API 流式传输中的事件流原理细节上有晨光大模型Agent开发人工智能算法大模型 OpenAI Agent
一、AssistantAPI流式传输事件流基础OpenAIAssistantAPI的流式输出在特定操作时会生成新事件，每个事件由event和data构成。data存放如大模型回复等关键数据，event则表明大模型的处理阶段，像运行、排队、完成等状态信息。二、事件流核心流程整体流程：从创建assistant对象、thread对象并追加message开启run状态（即start模式）起，到获取模型回复
Assistant API 进阶应用方法介绍上有晨光大模型Agent开发人工智能算法大模型 Agent OpenAI
一、课程回顾之前博客内容围绕OpenAIAssistantAPI展开，详细讲解了其基本原理、构建对话或代理的完整生命周期，以及Assistant、Thread、Message和Run这四个抽象概念之间的关系。在此基础上，搭建了用户与大模型对话的基础通路，不过这只是该API最基础的应用形式。二、AssistantAPI概述（一）优势与特点AssistantAPI在性能和易用性方面表现卓越，超越了市面
基于 LibreTV 代码库开发安卓应用的全面技术策略与实施指南
1.LibreTVWeb平台解构分析为了基于现有LibreTV项目成功构建一个原生安卓应用，首先必须对其现有Web平台的架构、核心逻辑及数据流进行一次彻底的技术解构。尽管自动化工具未能成功解析其部分源代码，但通过对其文件结构、命名规范以及行业内成熟的Web应用模式进行专家级推断分析，我们仍能精确地描绘出其内部工作机制。1.1.架构概览与技术栈推断LireTV是一个轻量级的视频聚合平台，其架构采用了
python中使用pyinstaller将python项目打包为exe可执行文件不吃西红柿丿 python windows
1、安装pyinstallerpipinstallpyinstaller-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、打包应用2.1、使用命令行直接打包pyinstaller-F-w-iyour_path/log.icomain.py命令：-F将项目打包为单个exe文件，没有其它文件-D将项目打包为一个文件夹里面又有一个exe文件以及其它依赖，启动速度比-
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
Java+Python智能化云盘【Day5-1】关沐吖 Java+Python Ai智能云盘项目开发专栏 python java 开发语言
RAG系统链路和数据加载Loaders技术OK啊昨天Day4-2，最后提及了很多的一些Loader加载器，有文档类型、数据库类型、网页加载器类型等等，它们其实都是属于langchain_community.document_loaders这个包下的类。今天来先复习一下都有哪些，再讲讲其中的代码运行的基本框架，和文档中有图片的处理方式。Loader的分类与常见类型文件加载器（FileLoaders）
Java+Python智能化云盘【Day3】关沐吖 Java+Python Ai智能云盘项目开发专栏 java python 开发语言
提示词工程Prompt简介：大模型必备Prompt提示词工程讲解什么是PromptEngineering提示词工程通过特定格式的文本输入引导AI模型生成期望输出的技术，明确地告诉模型你想要解决的问题或完成的任务也是大语言模型理解用户需求并生成相关、准确回答或内容的基础类比：给Java程序员的任务需求文档（越清晰明确，结果越符合预期）为什么需要学习？大模型就是你的员工，你可以有多个助手，OpenAI
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D