喜欢打酱油的老鸟

一文看尽2020上半年阿里、腾讯、百度入选AI顶会论文

2020年已过近半，人工智能学术界的顶级会议也举行了不少。在今年已经举行的顶会中，腾讯、百度、阿里等国内科技巨头被收录论文在数量和质量上均有所突破，涉及机器学习、自然语言处理、计算机视觉等多个领域。下面，本文整理出这些科技公司在今年顶会中被录入的部分已分享的论文以飨读者，欢迎大家收藏。

AAAI 2020

腾讯

在2020年的AAAI上，腾讯优图实验室共有10篇论文入选，以下是已分享的部分论文：

1、Rethinking Temporal Fusion for Video-based Person Re-identification on Semantic and Time Aspect（Oral）

推荐：本文提出了一种新的通用时间融合框架，在语义和时间两个方面对帧特征进行融合。在语义方面，探索了多阶段融合网络，在多个语义层次上融合更丰富的帧特征，有效地减少了传统单阶段融合带来的信息损失。同时，针对时间轴，对现有的帧内注意方法进行了改进，增加了一个新的帧间注意模块，通过考虑帧间关系，有效地减少了时间融合中的信息冗余。

论文地址：
https://arxiv.org/abs/1911.12512

2、Fast Learning of Temporal Action Proposal via Dense Boundary Generator

推荐：本文提出了提出一种快速的、端到端的稠密边界动作生成器(Dense Boundary Generator，DBG)。该生成器能够对所有的动作提名（proposal）估计出稠密的边界置信度图。并引入额外的时序上的动作分类损失函数来监督动作概率特征(action score feature，asf)，该特征能够促进动作完整度回归(Action-aware Completeness Regression，ACR)。此外，还设计一种高效的动作提名特征生成层(Proposal Feature Generation Layer，PFG)，该Layer能够有效捕获动作的全局特征，方便实施后面的分类和回归模块。

论文地址：
https://arxiv.org/abs/1911.04127

3、TEINet: Towards an Efficient Architecture for Video Recognition

推荐：本文提出了一个有效的时间模块，称为时间增强和交互（TEI模块），它可以插入到现有的2dcnn中（用TEINet表示）。TEI模块通过分离信道相关和时间交互的建模，提出了一种不同的学习时间特征的范式。首先，它包含一个运动增强模块（MEM），该模块在抑制无关信息（例如背景）的同时增强与运动相关的特征。然后，介绍了一个时态交互模块（TIM），它以信道方式补充时态上下文信息。该两阶段建模方案不仅能够灵活有效地捕捉时间结构，而且能够有效地进行模型推理。

论文地址：
https://arxiv.org/abs/1911.09435v1

4、Revisiting Image Aesthetic Assessment via Self-Supervised Feature Learning

推荐：本文从自监督特征学习的角度对图像审美评价问题进行了研究。作者设计了两个新的接口任务来识别应用于合成实例的编辑操作的类型和参数。然后，将我们的前托词任务中的特征应用于一层线性分类器，以二元审美分类的方式评估其性能。我们在三个基准数据集上进行了大量的定量实验，证明我们的方法能够忠实地提取美学感知特征，并优于其他的接口方案。此外，我们还获得了与使用ImageNet 1000万个标签的最新监督方法相当的结果。

论文地址：
https://arxiv.org/abs/1911.11419v1

5、Asymmetric Co-Teaching for Unsupervised Cross-Domain Person Re-Identification

推荐：人的再识别（re-ID）是一项具有挑战性的工作，因为身份样本和成像条件的高度差异。尽管近年来在深层学习领域的研究取得了显著的成果，但很少有研究能够很好地推广到不可见的目标领域。一种流行的解决方案是通过聚类给未标记的目标图像分配伪标记，然后再对模型进行再训练。然而，聚类方法往往会引入噪声标签，并将低置信度样本作为离群点丢弃，这可能会阻碍再训练过程，从而限制泛化能力。在这项研究中，我们认为，通过在聚类之后显式地添加一个样本过滤过程，挖掘出的样本可以更有效地使用。为此，我们设计了一个非对称的协同教学框架，该框架通过协同两个模型选择彼此可能有干净标签的数据来抵抗噪声标签。同时，其中一个模型接收尽可能纯净的样本，而另一个模型接收尽可能多样的样本。此过程鼓励所选训练样本既干净又杂，并且这两个模型可以迭代地相互促进。大量的实验表明，该框架能够始终如一地提高大多数基于聚类的方法的适应精度。

地址：
https://arxiv.org/abs/1912.01349

6、Viewpoint-Aware Loss with Angular Regularization for Person Re-Identification

推荐：近年来有监督的行人重识别（ReID）取得了重大进展，但是行人图像间巨大朝向差异，使得这一问题仍然充满挑战。大多数现有的基于朝向的特征学习方法，将来自不同朝向的图像映射到分离和独立的子特征空间当中。这种方法只建模了一个朝向下人体图像的身份级别的特征分布，却忽略了朝向间潜在的关联关系。为解决这一问题，本文提出了一种新的方法，叫带角度正则的朝向敏感损失（VA-ReID）。相比每一个朝向学习一个子空间，该方法能够将来自不同朝向的特征映射到同一个超球面上，这样就能同时建模身份级别和朝向级别的特征分布。在此基础上，相比传统分类方法将不同的朝向建模成硬标签，本文提出了朝向敏感的自适应标签平滑正则方法（VALSR）。这一方法能够给予特征表示自适应的软朝向标签，从而解决了部分朝向无法明确标注的问题。大量在Market1501和DukeMTMC数据集上的实验证明了本文的方法有效性，其性能显著超越已有的最好有监督ReID方法。

论文地址：
https://arxiv.org/abs/1912.01300

7、Robust Conditional GAN from Uncertainty-Aware Pairwise Comparisons

推荐：CGAN往往需要大量标注。为了解决这个问题，现有方法大多基于无监督聚类，比如先用无监督学习方法得到伪标注，再用伪标注当作真标注训练CGAN。然而，当目标属性是连续值而非离散值时，或者目标属性不能表征数据间的主要差异，那么这种基于无监督聚类的方法就难以取得理想效果。本文进而考虑用弱监督信息去训练CGAN，在文中我们考虑成对比较这种弱监督。成对比较相较于绝对标注具有以下优点：1.更容易标注；2.更准确；3.不易受主观影响。

论文地址：
https://arxiv.org/abs/1911.09298

8、An Adversarial Perturbation Oriented Domain Adaptation Approach for Semantic Segmentation

推荐：如今神经网络借助大量标注数据已经能够达到很好的效果，但是往往不能很好的泛化到一个新的环境中，而且大量数据标注是十分昂贵的。因此，无监督领域自适应就尝试借助已有的有标注数据训练出模型，并迁移到无标注数据上。对抗对齐(adversarial alignment)方法被广泛应用在无监督领域自适应问题上，全局地匹配两个领域间特征表达的边缘分布。但是，由于语义分割任务上数据的长尾分布(long-tail)严重且缺乏类别上的领域适配监督，领域间匹配的过程最终会被大物体类别（如：公路、建筑）主导，从而导致这种策略容易忽略尾部类别或小物体（如：红绿灯、自行车）的特征表达。本文提出了一种生成对抗扰动并防御的框架。首先该框架设计了几个对抗目标（分类器和鉴别器），并通过对抗目标在两个领域的特征空间分别逐点生成对抗样本。这些对抗样本连接了两个领域的特征表达空间，并蕴含网络脆弱的信息。然后该框架强制模型防御对抗样本，从而得到一个对于领域变化和物体尺寸、类别长尾分布都更鲁棒的模型。

论文地址：
https://arxiv.org/pdf/1912.08954.pdf

百度

本届AAAI大会，百度共有28篇论文被收录，较去年的15篇入选成绩提升近一倍，入选论文涉及机器学习、自然语言处理、计算机视觉等多个领域，以下是已分享的部分论文：

1、Distributed Primal-Dual Optimization for Online Multi-task Learning

推荐：传统的在线多任务学习算法有两个重要的局限性：1.由于向中央机器传送高速度的顺序数据而导致通信量大；2.建立任务关联性的运行时复杂度昂贵。为了解决这些问题，在本文中，我们考虑一个设置，其中多个任务位于不同的地理位置，其中一个任务可以与其他任务同步数据，以利用相关任务的知识。具体地说，我们提出了一种自适应的原始-对偶算法，该算法不仅能捕获对抗学习中的任务特定噪声，而且能以运行时效率执行无投影更新。此外，由于该模型允许能量不足或带宽受限的任务延迟更新，因此非常适合于分散的周期连接任务。理论结果证明了我们的分布式算法的收敛性保证，并且有一个最优的遗憾。实证结果表明，该模型对各种真实数据集都是有效的。

论文地址：
https://arxiv.org/abs/2004.01305

2、Meta-CoTGAN: A Meta Cooperative Training Paradigm for Improving Adversarial Text Generation

推荐：本文提出了一种新的方法，旨在通过有效地减缓对抗训练的模式崩溃来提高对抗文本生成的性能。为此，我们引入了一种协同训练范式，即语言模型与生成器协同训练，并利用该语言模型有效地塑造生成器的数据分布以防模式崩溃。此外，我们没有原则性地参与生成器的协同更新，而是建立了一个元学习机制，将生成器的协同更新作为一个高层次的元任务，直觉地确保在对抗性更新之后生成器的参数能够抵抗模式崩溃。在实验中，我们证明我们提出的方法可以有效地减缓对抗性文本生成器的模式崩溃速度。总的来说，我们提出的方法无论是在生成质量还是在验证域的多样性方面，都能优于具有显著裕度的基线方法。

论文地址：
https://arxiv.org/abs/2003.11530v1

3、IVFS: Simple and Efficient Feature Selection for High Dimensional Topology Preservation

推荐：特征选择是处理高维数据的重要工具。在无监督的情况下，许多流行的算法都是为了保持原始数据的结构。本文提出了一种简单有效的特征选择算法，从计算拓扑上下文的持久图表示的拓扑保持的角度来增强样本的相似度保持。该方法是在一个统一的特征选择框架IVFS的基础上设计的，该框架受到随机子集方法的启发。该算法能够很好地保持完整数据的成对距离和拓扑模式。结果表明，该算法在亚采样率较低的情况下，能够提供令人满意的性能，从而支持了该方法在大规模数据集上的有效实现。大量实验验证了所提出的特征选择方案的有效性。

论文地址：
https://arxiv.org/abs/2004.01299

4、ERNIE 2.0: A Continual Pre-training Framework for Language Understanding

推荐：近年来，预训练模型在各种语言理解任务中取得了最新的成果，这表明大规模语料库的预训练在自然语言处理中可能起着至关重要的作用。目前的预训练程序通常集中在几个简单任务的模式训练上，以掌握单词或句子的共现。然而，除了共现外，在训练语料库中还存在其他有价值的词汇、句法和语义信息，如命名实体、语义贴近度和话语关系。为了从训练语料库中最大限度地提取词汇、句法和语义信息，我们提出了一个名为ERNIE 2.0的连续预训练框架，该框架通过不断的多任务学习，逐步构建和学习预训练任务。实验结果表明，ERNIE 2.0在16个任务上均优于BERT和XLNet，其中包括基于GLUE基准的英语任务和几种常见的汉语任务。

论文地址：
https://arxiv.org/abs/1907.12412?context=cs.CL

5、Synchronous Speech Recognition and Speech-to-Text Translation with Interactive Decoding

推荐：近年来，将源语翻译成目的语的语篇转换（ST）受到了广泛的关注。与传统的流水线系统相比，端到端ST模型具有低延迟、较小模型尺寸和较少错误传播的潜在优点。然而，众所周知，如果没有作为中间产物的转录，很难实现这样一个模型。现有的研究一般采用多任务学习的方法，结合自动语音识别（ASR）技术对端到端ST进行联合训练，以提高翻译质量。然而，该方法中不同的任务不能充分利用彼此的信息，限制了改进。另一些工作提出了一个两阶段模型，其中第二个模型可以使用第一个模型的隐藏状态，但是它的级联方式极大地影响了训练和推理过程的效率。本文提出了一种新的交互注意机制，使ASR和ST能够在单一模型中同步、交互地进行。具体来说，转录和翻译的生成不仅依赖于它以前的输出，而且还依赖于在其他任务中预测的输出。在TED语音翻译语料库上的实验表明，该模型在语音翻译质量上优于强基线，并取得了较好的语音识别性能。

论文地址：
https://arxiv.org/abs/1912.07240

6、Multi-Label Classification with Label Graph Superimposing

推荐：近年来，图卷积网络（GCN）被用来提高多标签识别的性能。然而，什么是标签相关建模的最佳方法，以及如何通过标签系统感知来改进特征学习，目前还不清楚。本文从以下两个方面对传统的GCN+CNN多标签识别框架进行了改进，提出了一种标签图叠加框架。首先，将统计共现信息生成的标签图叠加到由标签的知识先验构成的图中，建立标签相关性模型，然后对最终的重叠图进行多层图卷积，实现标签嵌入抽象。其次，我们建议利用整个标签系统的嵌入来更好地进行表示学习。在特征学习过程中，通过在浅层、中层和深层增加GCN和CNN之间的横向连接，将标签系统的信息注入主干CNN中，实现标签感知。在MS-COCO和Charades数据集上进行了大量的实验，

论文地址：

https://arxiv.org/pdf/1911.09243v1.pdf

7、Cross-Modality Attention with Semantic Graph Embedding for Multi-Label Classification

推荐：多标签图像和视频分类是计算机视觉中的基础性任务，也是一项具有挑战性的任务。主要的挑战在于捕获标签之间的空间或时间依赖关系，并发现每个类的区别特征的位置。为了克服这些困难，我们提出了将跨模态注意与语义图嵌入相结合的多标签分类方法。在构造标签图的基础上，提出了一种基于邻接关系的相似度图嵌入方法来学习语义标签嵌入，该方法可以显式地利用标签关系。然后在学习标签嵌入的指导下生成了新的跨模态注意图。在两个多标签图像分类数据集（MS-COCO和NUS-WIDE）上的实验表明，这个方法优于其他现有技术。此外，在一个大型多标签视频分类数据集（YouTube-8M片段）上验证了该方法的有效性，评价结果证明了该方法的泛化能力。

论文地址：
https://arxiv.org/abs/1912.07872

8、Dynamic Instance Normalization for Arbitrary Style Transfer

推荐：在本文中，作者提出了一个新的广义规范化模块，称为动态实例规范化（DIN），它允许灵活和更有效的任意样式传输。由实例规范化和动态卷积组成，DIN将样式图像编码为可学习卷积参数，在此参数上对内容图像进行样式化。与使用共享的复杂编码器对内容和样式进行编码的传统方法不同，所提出的DIN引入了一个复杂的样式编码器，同时还提供了一个紧凑和轻量级的内容编码器，用于快速推断。实验结果表明，所提出的方法在具有挑战性的样式模式上产生了非常不错的结果。

论文地址：
https://arxiv.org/abs/1911.06953

9、SetRank: A Setwise Bayesian Approach for Collaborative Ranking from Implicit Feedback

推荐：在线推荐系统的最新发展集中在用户点击和购买等隐性反馈的协同排名上。与反映分级用户偏好的显式评分不同，隐式反馈只生成正面和不明显的标签。虽然在这方面已经作出了相当大的努力，但众所周知的成对和列表方法仍然受到各种挑战的限制。具体地说，对于成对方法，独立成对偏好的假设在实践中并不总是成立的。此外，由于整个列表排列的先决条件，列表方法不能有效地容纳“关系”。为此，本文提出了一种新的协同排序方法SetRank，以内在地适应推荐系统中隐含反馈的特点。具体来说，SetRank的目标是最大化新的setwise偏好比较的后验概率，并且可以通过矩阵分解和神经网络来实现。

论文地址：
https://arxiv.org/pdf/2002.09841

10、Semi-Supervised Hierarchical Recurrent Graph Neural Network for City-Wide Parking Availability Prediction

推荐：预测全市停车可用性的能力对于停车诱导和信息（PGI）系统的成功开发至关重要。事实上，有效预测全市停车场的可用性，可以提高停车效率，有助于城市规划，最终缓解城市拥堵。然而，预测城市停车场的可用性是一项非常重要的工作，主要面临三大挑战：1.停车场之间的非欧氏空间自相关；2.停车场内部和停车场之间的动态时间自相关；3.实时传感器（如摄像机、超声波传感器、GPS）获取的实时停车可用性信息不足。为此，我们提出了半监督递阶递归图神经网络（SHARE）来预测城市停车场的可用性。

论文地址：
https://arxiv.org/abs/1911.10516v1

11、Learning Conceptual-Contextual Embeddings for Medical Text

推荐：外部知识通常对自然语言理解任务有用。我们引入了一个上下文文本表示模型，称为概念上下文（CC）嵌入，它将结构化知识整合到文本表示中。与实体嵌入方法不同，我们的方法将知识图编码为上下文模型。CC嵌入可以像预先训练的语言模型一样，轻松地重用于各种任务。我们的模型通过利用语义泛化有效地对庞大的UMLS数据库进行编码。对电子健康记录（EHRs）和医学文本处理基准的实验表明，我们的模型大大提高了有监督的医学NLP任务的性能。

论文地址：
https://arxiv.org/abs/1908.06203

12、Ultrafast Photorealistic Style Transfer via Neural Architecture Search.

推荐：真实感风格转换的关键挑战在于，算法应该忠实地将参考照片的风格转换为内容照片，而生成的图像应该看起来像是由相机捕获的图像。虽然已经提出了几种真实感风格的图像传输算法，但它们需要依赖于后期和/或预处理才能使生成的图像看起来真实。如果我们禁用额外的处理，这些算法将无法在细节保存和照片真实感方面产生合理的照片真实感样式化。在这项工作中，我们提出了解决这些问题的有效办法。我们的方法包括一个构建步骤（C-step）来构建真实感风格化网络和一个修剪步骤（P-step）来加速。在C-step中，我们在仔细设计预分析的基础上，提出了一种密集型自动编码器PhotoNet。PhotoNet集成了特征聚合模块（BFA）和实例规范化跳过链接（INSL）。为了产生忠实的样式化，我们在解码器和INSLs中引入了多个样式转换模块。PhotoNet在效率和有效性方面都明显优于现有算法。在P-step中，我们采用了一种神经结构搜索方法来加速光网络。提出了一种基于师生学习的真实感风格化自动网络剪枝框架。搜索得到的名为PhotoNAS的网络架构在保持样式化效果几乎不变的情况下，比PhotoNet实现了显著的加速。

论文地址：
https://arxiv.org/abs/1912.02398

13、Symbiotic Attention with Privileged Information for Egocentric Action Recognition

推荐：以自我为中心的视频识别是进行多种交互推理的自然实验平台。由于以自我为中心的视频数据集中有大量的动作词汇，最近的研究通常采用两个分支结构进行动作识别，即一个分支用于动词分类，另一个分支用于名词分类。然而，动词与名词分支之间的关联性研究却大多被忽视。此外，由于缺乏位置感知注意机制，这两个分支未能挖掘出局部特征。在本文中，我们提出了一个利用特权信息（SAP）进行自我中心视频识别的共生注意框架。更精细的位置感知目标检测特性有助于理解参与者与目标的交互。我们在动作识别中引入这些特征，并将它们视为特权信息。我们的框架允许动词分支、名词分支和特权信息之间的相互通信。这种通信过程不仅将局部细节注入到全局特征中，而且利用了对正在进行的动作的时空位置的隐含指导。我们引入新的共生注意（SA）来实现有效的交流。

论文地址：
https://arxiv.org/pdf/2002.03137.pdf

14、GBCNs: Genetic Binary Convolutional Networks for Enhancing the Performance of 1-bit DCNNs

推荐：二值卷积神经网络（BCNNs）被广泛应用于移动和人工智能芯片应用中，以提高深卷积神经网络（DCNNs）的存储和计算效率。然而，目前的BCNNs还不能完全探索其相应的全精度模型，导致它们之间的性能差距很大。本文提出了一种改进的二值卷积网络（RBCNs），将全精度核函数和特征映射相结合，在统一的框架下对二值化过程进行改进，以达到优化BCNNs的目的。特别地，我们使用GAN在其相应的全精度模型的指导下对1位二进制网络进行训练，显著提高了BCNNs的性能。校正后的卷积层具有通用性和灵活性，可以很容易地并入现有的dcnn，如WideResNets和ResNets。大量实验表明，与最新的BCNNs相比，所提出的RBCNs具有更好的性能。特别地，我们的方法对目标跟踪任务具有很强的泛化能力。

论文地址：
https://arxiv.org/abs/1908.07748

15、AutoRemover: Automatic Object Removal for Autonomous Driving Videos

推荐：基于自动驾驶中对真实感仿真的需要，本文提出了一种视频修复算法emph{AutoRemover}，该算法专为生成无运动物体的街景视频而设计。在我们的设置中，我们有两个挑战：第一个是阴影，阴影通常没有标记，但与移动对象紧密耦合。第二个是视频中巨大的自我运动。为了处理阴影，我们建立了一个自动驱动阴影数据集，并设计了一个深度神经网络来自动检测阴影。为了处理大的自我运动，我们利用多源数据，特别是三维数据，进行自主驾驶。更具体地说，帧之间的几何关系被合并到修补深度神经网络中，以产生高质量的结构一致的视频输出。实验表明，该方法优于其他最新的目标去除算法，使RMSE降低了19%以上。

论文地址：
https://arxiv.org/abs/1911.12588

16、CSPN++: Learning Context and Resource Aware Convolutional Spatial Propagation Networks for Depth Completion

推荐：深度完成是指给定相应的彩色图像，将稀疏的深度图转换为稠密的深度图。卷积空间传播网络（CSPN）是目前最先进的深度完成方法之一，它可以恢复场景的结构细节。本文提出了CSPN++，通过学习自适应卷积核大小和传播迭代次数，进一步提高了CSPN++的有效性和效率，从而可以根据请求动态分配每个像素所需的上下文和计算资源。

论文地址：
https://arxiv.org/abs/1911.05377

17、ZoomNet：Part-Aware Adaptive Zooming Neural Network for 3D Object Detection

推荐：3D目标检测是自动驾驶和机器人技术中的一项重要任务。虽然已经取得了很大的进展，但在估计远距离和遮挡物体的三维姿态方面仍然存在挑战。本文提出了一种新的基于立体图像的三维检测框架ZoomNet。ZoomNet的流水线是从一个普通的二维目标检测模型开始的，该模型用于获取左右边界框对。为了进一步利用RGB图像中丰富的纹理线索进行更精确的视差估计，我们引入了一个概念上的直接模块——自适应缩放，它同时将2D实例边界框调整为统一的分辨率，并相应地调整相机的内部参数。通过这种方法，我们可以从调整大小的方块图像中估计更高质量的视差图，然后为附近和远处的物体构建密集的点云。此外，我们引入学习零件位置作为互补特征，以提高抗遮挡能力，并提出三维拟合分数，以更好地估计三维检测质量。

论文地址：
https://arxiv.org/abs/2003.00529

ICLR 2020

ICLR 2020 上出现了多达 34 篇满分论文（8 分），以下是来自华为、字节跳动、腾讯等企业的满分论文。

华为

Causal Discovery With Reinforcement Learning

推荐：在此论文中，华为诺亚方舟实验室因果研究团队将强化学习应用到打分法的因果发现算法中，通过基于自注意力机制的 encoder-decoder 神经网络模型探索数据之间的关系，结合因果结构的条件，并使用策略梯度的强化学习算法对神经网络参数进行训练，最终得到因果图结构。在学术界常用的一些数据模型中，该方法在中等规模的图上的表现优于其他方法，包括传统的因果发现算法和近期的基于梯度的算法。同时该方法非常灵活，可以和任意的打分函数结合使用。

论文地址：
https://arxiv.org/pdf/1906.04477.pdf

字节跳动

1、Mirror-Generative Neural Machine Translation

推荐：本文研究者提出了一个镜像生成式的机器翻译模型（MGNMT），可以更好地利用非平行语料提高NMT的效果。MG-NMT使用生成式的方法，同时优化两个方向的翻译器和语言模型，从而能从两个角度得到提升。实验表明了这种方法的有效性。

论文地址：
https://openreview.net/pdf?id=HkxQRTNYPH

2、Sparse Coding with Gated Learned ISTA

推荐：本文研究了求解稀疏编码问题的迭代收缩阈值学习算法。在前人工作的假设下，作者首先发现其估计中的码成分可能低于预期，即需要增益，为了解决这个问题，一个适合于对该机制进行理论分析的门机制，因此其有效性可以形式化地保证。在除了增益门，我们进一步引入超调门来补偿LISTA。广泛实证结果证实了我们的理论发现，并验证了我们方法的有效性。

论文地址：
https://openreview.net/forum?id=BygPO2VKPH

腾讯

Watch the Unobserved: A Simple Approach to Parallelizing Monte Carlo Tree Search

推荐：蒙特卡罗树搜索（MCTS）算法在许多具有挑战性的基准上取得了巨大的成功。然而，它们通常需要大量的发布，这使得它们的应用程序成本高昂。此外，由于MCT固有的顺序性，并行化MCT也极具挑战性：每次推出都严重依赖于从以前的模拟中估计的统计数据（例如，节点访问计数），以实现有效的勘探开发权衡。尽管有这些困难，我们还是开发了一个算法WU-UCT来有效地并行化MCTS，该算法实现了线性加速，并且随着工人数量的增加，性能损失有限。WU-UCT的关键思想是我们引入一组统计信息来跟踪正在进行但不完整的模拟查询（称为未观测样本）的数量。这些统计数据用于在选择步骤中原则性地修改UCT树策略，以便在并行化最耗时的扩展和模拟步骤时保持有效的勘探开发权衡。在专有基准和Atari游戏基准上的实验表明，与现有技术相比，WU-UCT具有线性加速和优越的性能。

论文地址：
https://arxiv.org/abs/1810.11755?context=stat.ML

ACL 2020

腾讯

在ACL 2020的论文收录名单中，腾讯共有30篇论文入选，入选论文数刷新国内企业记录，领跑国内业界AI研究第一梯队，研究方向涵盖对话及文本生成、机器翻译及对话、多模信息抽取多个自然语言处理的重点领域。

1、Generate, Delete and Rewrite: A Three-Stage Framework for Improving Persona Consistency of Dialogue Generation

推荐：在对话过程中保持一致的角色属性信息对人类来说是很容易的，但对机器来说，这仍然是一项有待探索的任务。近几年，基于角色属性的对话生成任务被提出来，旨在通过在对话生成模型中加入显式的角色文本来解决属性一致性问题。虽然现有的基于角色的对话生成模型在生成类似人类的回复上取得了成功，但是它们的单阶段解码框架很难避免生成不一致的角色词。在这项工作中，作者提出了一个三阶段的对话生成框架。该框架使用生成-删除-重写机制从生成的原型回复中删除不一致的词语，然后进一步将其改写为属性信息一致的回复。通过人工评价和自动指标进行了评估。在PersonaChat数据集上的实验表明，这个方法获得了非常好的性能。

论文地址：暂无

2、How Does Selective Mechanism Improve Self-Attention Networks?

推荐：近年来，在自注意力网络引入选择机制使得模型关注其中重要的输入元素已经取得很好的效果。但是，对于选择机制取得这样结果的原因尚不清楚。本文提出一个通用的基于选择机制的自注意力网络。传统的自注意力网络在顺序编码以及结构信息建模能力存在一些不足，而本文针对其提出相应的假设，并在实验中验证假设的正确性。实验分析发现，将选择机制引入自注意力网络的好处在于：1.其更多关注周围词的信息，从而对周围词序的变化比较敏感，使得其更好对顺序进行编码；2.其对于树结构重要成分关注度更高，从而其拥有更强的捕捉结构信息的能力。

论文地址：暂无

阿里巴巴

阿里巴巴有22篇论文入选ACL 2020，内容覆盖跨领域分词、细颗粒度情感分析、多领域对话系统、文本生成、知识蒸馏等诸多NLP领域的热点和前沿研究方向。

1、Structure-LevelKnowledge Distillation For Multilingual SequenceLabeling

推荐：多语种序列标记是一项使用单一的多语种统一模型预测标签序列的任务。与依赖于多个单语模型相比，使用多语言模型具有模型规模小、在线服务容易和对低资源语言通用的优点。然而，由于模型容量的限制，目前的多语种模型仍然远远低于单独的单语模型。本文提出将多个单语模型（教师）的结构知识提取到统一的多语言模型（学生）中，以缩小单语模型与统一的多语言模型之间的差距。我们提出了两种基于结构层次信息的知识发现方法：1.近似地最小化学生和教师的结构层次概率分布之间的距离；2.将结构层次知识聚合为局部分布，并最小化两个局部概率分布之间的距离。我们对4个多语种任务和25个数据集的实验表明，我们的方法优于几种强基线，并且比基线模型和教师模型具有更强的零炮概化能力。

论文地址：
https://arxiv.org/abs/2004.03846

2、Slot-consistent NLG for Task-oriented Dialogue System with Iterative Rectiﬁcation Network

推荐：基于神经网络的方法在 NLG 任务上已经取得了不错的效果。然而，数据驱动类型的模型无法保证鲁棒性，例如忽略了一个输入槽位或生成了多余的槽位。前人的工作将这个问题称为幻视现象。在这个工作中，我们研究如何通过保证槽位一致性提高 NLG 模型的可靠性。所谓槽位一致性是指模型生成的模板应该和输入表示语义一致，即具有相同的槽位集合。针对这个问题，我们提出迭代改写器，它能保证 NLG 模型生成正确而且流利的句子。它包含两个模块：1.基于检索的自举抽样，用于抽样伪错数据；2.策略梯度学习，用于融入离散奖励，例如不一致惩罚度。我们在 4 个数据集上验证了模型的有效性，结果显示我们大大降低了所有基线模型的槽位错误率 (ERR) 并达到了目前最好的效果，并且BLEU 的提升和人工校验的结果也显示了我们模型提高了生成句子的顺畅度。

论文地址：暂无

百度

本届ACL大会中，百度被收录的11篇论文，覆盖了对话与交互系统、情感分析/预训练表示学习、NLP 文本生成与摘要、机器翻译/同声翻译、知识推理、AI辅助临床诊断等诸多自然语言处理界的前沿研究方向。

1、Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation

推荐：我们提出用图的形式捕捉对话转移规律作为先验信息，用于辅助开放域多轮对话策略学习。基于图，我们设计策略学习模型指导更加连贯和可控的多轮对话生成。首先，我们从对话语料库中构造一个对话图（CG），其中顶点表示“what to say”和“how to say”，边表示对话当前句与其回复句之间的自然转换。然后，我们提出了一个基于CG的策略学习框架，该框架通过图形遍历进行对话流规划，学习在每轮对话时从CG中识别出哪个顶点和如何从该顶点来指导回复生成。我们可以有效地利用CG来促进对话策略学习，具体而言：1.可以基于它设计更有效的长期奖励；2.它提供高质量的候选操作；3.它让我们对策略有更多的控制。我们在两个基准语料库上进行了实验，结果证明了本文所提框架的有效性。

论文地址：暂无

2、PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable

推荐：研发开放领域（Open-Domain）的对话机器人，使得它能用自然语言与人自由地交流，一直是自然语言处理领域的终极目标之一。对话系统的挑战非常多，其中有两点非常重要，一是大规模开放域多轮对话数据匮乏；二是对话中涉及常识、领域知识和上下文，一个对话的上文（Context），往往可以对应多个不同回复（Response）的方向。PLATO首次提出将离散的隐变量结合Transformer结构，应用到通用对话领域。通过引入离散隐变量，可以对上文与回复之间的“一对多”关系进行有效建模。同时，通过利用大规模的与人人对话类似的语料，包括Reddit和Twitter，进行了生成模型的预训练，后续在有限的人人对话语料上进行微调，即可以取得高质量的生成效果。PLATO可以灵活支持多种对话，包括闲聊、知识聊天、对话问答等等。而文章最终公布的在三个公开对话数据集上的评测，PLATO都取得了新的最优效果。

论文地址：暂无

3、Towards Conversational Recommendation over Multi-Type Dialogs

推荐：真实人机对话，涉及多类型对话(闲聊、任务型对话、问答等)，如何自然的融合多类型对话是一个重要的挑战。为应对这个挑战，作者提出一个新的任务——多类型对话中的对话式推荐，期望Bot能够主动且自然地将对话从非推荐对话(比如『问答』)引导到推荐对话，然后基于收集到的用户兴趣及用户实时反馈通过多次交互完成最终的推荐目标。为便于研究这个任务，我们标注了一个包含多种对话类型、多领域和丰富对话逻辑(考虑用户实时反馈)的人－人对话式推荐数据集DuRec(1万个对话和16.4万个utterance)。针对每个配对：推荐寻求者(user)和推荐者(bot)，存在多个序列对话，在每个对话中，推荐者使用丰富的交互行为主动引导一个多类型对话不断接近推荐目标。这个数据集允许我们系统地考察整个问题的不同部分，例如，如何自然地引导对话，如何与用户交互以便于推荐。最后，我们使用一个具有多对话目标驱动策略机制的对话生成框架在DuRec上建立基线结果，表明了该数据集的可用性，并为将来的研究设定了基线。

论文地址：暂无

4、SKEP: Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis

推荐：作者提出了一种情感知识增强的语言模型预训练方法，在通用预训练的基础上，设计了面向情感知识建模的Masking策略和情感多目标学习算法，融合了情感词、极性、主体评论关系等多层情感知识，首次实现了情感任务统一的文本预训练表示学习。该算法在情感分类、观点抽取等情感分析任务中相对主流预训练模型RoBERTa有显著的提升，同时刷新了多个情感分析标准测试集的世界最好水平。

论文地址：暂无

5、Cross-Lingual Unsupervised Sentiment Classification with Multi-View Transfer Learning

推荐：本文针对无标签资源的目标语言，提出了一种无监督的跨语言情感分析模型。

论文地址：暂无

6、Leveraging Graph to Improve Abstractive Multi-Document Summarization

推荐：本论文提出基于图表示的多文档生成式摘要方法GraphSum，在神经网络模型中融合多文档语义关系图例如语义相似图、篇章结构图等，建模多篇章输入及摘要内容组织过程，从而显著提升多文档摘要效果。GraphSum 基于端到端编解码框架，其中图编码器利用语义关系图对文档集进行编码表示，图解码器进一步利用图结构组织摘要内容并解码生成连贯的摘要文本。GraphSum 还可以非常容易地与各种通用预训练模型相结合，从而进一步提升摘要效果。在大规模多文档摘要数据集WikiSum 和MultiNews 上的实验表明，GraphSum 模型相对于已有的生成式摘要方法具有较大的优越性，在自动评价和人工评价两种方式下的结果均有显著提升。

论文地址：暂无

7、Exploring Contextual Word-level Style Relevance for Unsupervised Style Transfer

推荐：无监督风格转换是指在无平行语料的情况下，把输入的句子改成目标风格，同时尽可能保持其原义。本文提出了一种全新的序列到序列的生成模型，可以动态地根据生成词的风格相关性进行风格转换。本文有两个主要的创新点，一是用层级相关性传播算法计算风格分类器中每个输入词的风格相关性信息，并以此作为指导信号来训练生成器，让生成器在生成的同时可以预测下一个词的风格相关性。二是设计了以词级别风格相关性和语义信息作为输入的风格转换解码器，并通过多个损失项进行finetune训练，从而实现风格转换的功能。实验表明，本文提出的方法在情感风格转换和口语化风格转换的任务上都达到了领先效果。

论文地址：暂无

8、Opportunistic Decoding with Timely Correction for Simultaneous Translation

推荐：在本论文中，百度首次提出了一种具有及时纠错能力的解码技术，它总是在每一步产生一定数量的额外单词，以保持观众对最新信息的跟踪，同时，它也在观察更多的上下文时，对前一个过度生成的单词提供及时的纠错，以确保高翻译质量。本文还首次提出了对这种纠错场景下的延迟指标。实验表明，我们的技术提高了延迟和质量：延迟减少了2.4，BLEU增加了3.1，中英翻译和中英翻译的修改率低于8%。本系统可用于任何语音到文本的同传系统中。

论文地址：暂无

9、Simultaneous Translation Policies: from Fixed to Adaptive

推荐：本文提出一种简单的启发式算法，根据翻译模型输出的概率分布，可以将几种精简的固定“读写”策略组合成一种灵活的策略。本文进一步将该算法与集成方法相结合，既提高了翻译质量，又降低了翻译过程的时延。这种简单的算法不需要训练策略模型，使得其更易于在产品中使用。

论文地址：暂无

10、Learning Interpretable Relationships between Entities, Relations and Concepts via Bayesian Structure Learning on Open Domain Facts

推荐：本文通过贝叶斯结构学习建立了开放领域的关系与概念(Concept)之间的关联，使得实体为何属于某个概念的原因得到了很好的解释。

论文地址：暂无

11、Towards Interpretable Clinical Diagnosis with Bayesian Network Ensembles Stacked on Entity-Aware CNNs

推荐：本研究提出一种新的诊断算法框架，该框架针对EMR具有无结构化文本和结构化信息并存的特点，结合医疗NLU，以深度学习模型实现EMR的向量化表示、诊断预分类和概率计算。结合医疗知识图谱增强的多种贝叶斯网络的组合模型，实现具有可解释性的诊断推理。该框架能同时兼顾高诊断准确率和强可解释性的特点，并可应用于面向基层医师的辅助临床诊断产品中。

论文地址：暂无

IJCAI 2020

腾讯

Deep Feedback Network for Recommendation

推荐：在本文中，作者初步研究了推荐系统中的多种显式/隐式和正/负反馈之间的协同合作机制。DFN模型能够基于多种反馈信息即时学习到用户的无偏的正负向兴趣，在点击预估和不感兴趣预估等多个任务上均有提升效果。直观而有效的模型也使得DFN能成功在工业级推荐系统中得到部署和验证。

论文地址：暂无

编辑：文婧

校对：洪舒越

—完—

你可能感兴趣的:(人工智能)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
解锁企业潜能，Vatee万腾平台引领智能新纪元自媒体经济说其他
在数字化转型的浪潮中，企业正站在一个前所未有的十字路口，面对着前所未有的机遇与挑战。解锁企业内在潜能，实现跨越式发展，已成为众多企业的共同追求。而Vatee万腾平台，作为智能科技的先锋，正以其强大的智能赋能能力，引领企业步入一个全新的智能纪元。Vatee万腾平台，是一个集成了人工智能、大数据、云计算等前沿技术的综合性智能服务平台。它不仅仅是一个技术工具，更是企业转型升级的加速器，能够深入企业运营的
LiteBee Wing测评：走进中小学课堂，合适的编程无人机非常重要！ song_bcbd
“国务院在《新一代人工智能发展规划》中明确，要广泛开展人工智能科普活动，实施全民智能教育项目，要在中小学阶段设置人工智能相关课程，逐步推广编程教育，鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广，而且要进行人工智能竞赛。”作为从事创客教育多年的老师，感谢在这个大环境，让学生能够了解人工智能，接触到前沿科技，同时也鼓励更多学生学习编程，因为没有学编程，可能就会像现在的我们后悔以前没有学习好
释放“AI+”新质生产力，深算院如何“把大数据变小”？ YashanDB YashanDB 国产数据库数据库数据库大数据
近期，南都·湾财社推出《新质·中国造》栏目，深入千行百业，遍访湾区企业，解锁湾区新质生产力，共探高质量发展之道。本期对话深圳计算科学研究院YashanDB首席技术官陈志标，探讨国产数据库如何实现创新突围，抢抓数字经济时代的新机遇。以下是专访内容：如何应对AI时代所面临的算力挑战？南都·湾财社：数据、算力和算法是发展人工智能的三要素，深算院做了怎样的前瞻性布局？陈志标：今年，政府工作报告中首次提及开
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?