机器学习算法与Python学习-公众号

牛逼！一文看尽2020上半年阿里、腾讯、百度入选AI顶会论文

（给机器学习算法与Python学习加星标，提升AI技能）

本文来自数据派THU

2020年已过近半，人工智能学术界的顶级会议也举行了不少。在今年已经举行的顶会中，腾讯、百度、阿里等国内科技巨头被收录论文在数量和质量上均有所突破，涉及机器学习、自然语言处理、计算机视觉等多个领域。下面，本文整理出这些科技公司在今年顶会中被录入的部分已分享的论文以飨读者，欢迎大家收藏。

AAAI 2020

腾讯

在2020年的AAAI上，腾讯优图实验室共有10篇论文入选，以下是已分享的部分论文：

1、Rethinking Temporal Fusion for Video-based Person Re-identification on Semantic and Time Aspect（Oral）

推荐：本文提出了一种新的通用时间融合框架，在语义和时间两个方面对帧特征进行融合。在语义方面，探索了多阶段融合网络，在多个语义层次上融合更丰富的帧特征，有效地减少了传统单阶段融合带来的信息损失。同时，针对时间轴，对现有的帧内注意方法进行了改进，增加了一个新的帧间注意模块，通过考虑帧间关系，有效地减少了时间融合中的信息冗余。

论文地址：https://arxiv.org/abs/1911.12512

2、Fast Learning of Temporal Action Proposal via Dense Boundary Generator

推荐：本文提出了提出一种快速的、端到端的稠密边界动作生成器(Dense Boundary Generator，DBG)。该生成器能够对所有的动作提名（proposal）估计出稠密的边界置信度图。并引入额外的时序上的动作分类损失函数来监督动作概率特征(action score feature，asf)，该特征能够促进动作完整度回归(Action-aware Completeness Regression，ACR)。此外，还设计一种高效的动作提名特征生成层(Proposal Feature Generation Layer，PFG)，该Layer能够有效捕获动作的全局特征，方便实施后面的分类和回归模块。

论文地址：https://arxiv.org/abs/1911.04127

3、TEINet: Towards an Efficient Architecture for Video Recognition

推荐：本文提出了一个有效的时间模块，称为时间增强和交互（TEI模块），它可以插入到现有的2dcnn中（用TEINet表示）。TEI模块通过分离信道相关和时间交互的建模，提出了一种不同的学习时间特征的范式。首先，它包含一个运动增强模块（MEM），该模块在抑制无关信息（例如背景）的同时增强与运动相关的特征。然后，介绍了一个时态交互模块（TIM），它以信道方式补充时态上下文信息。该两阶段建模方案不仅能够灵活有效地捕捉时间结构，而且能够有效地进行模型推理。

论文地址：https://arxiv.org/abs/1911.09435v1

4、Revisiting Image Aesthetic Assessment via Self-Supervised Feature Learning

推荐：本文从自监督特征学习的角度对图像审美评价问题进行了研究。作者设计了两个新的接口任务来识别应用于合成实例的编辑操作的类型和参数。然后，将我们的前托词任务中的特征应用于一层线性分类器，以二元审美分类的方式评估其性能。我们在三个基准数据集上进行了大量的定量实验，证明我们的方法能够忠实地提取美学感知特征，并优于其他的接口方案。此外，我们还获得了与使用ImageNet 1000万个标签的最新监督方法相当的结果。

论文地址：https://arxiv.org/abs/1911.11419v1

5、Asymmetric Co-Teaching for Unsupervised Cross-Domain Person Re-Identification

推荐：人的再识别（re-ID）是一项具有挑战性的工作，因为身份样本和成像条件的高度差异。尽管近年来在深层学习领域的研究取得了显著的成果，但很少有研究能够很好地推广到不可见的目标领域。一种流行的解决方案是通过聚类给未标记的目标图像分配伪标记，然后再对模型进行再训练。然而，聚类方法往往会引入噪声标签，并将低置信度样本作为离群点丢弃，这可能会阻碍再训练过程，从而限制泛化能力。在这项研究中，我们认为，通过在聚类之后显式地添加一个样本过滤过程，挖掘出的样本可以更有效地使用。为此，我们设计了一个非对称的协同教学框架，该框架通过协同两个模型选择彼此可能有干净标签的数据来抵抗噪声标签。同时，其中一个模型接收尽可能纯净的样本，而另一个模型接收尽可能多样的样本。此过程鼓励所选训练样本既干净又杂，并且这两个模型可以迭代地相互促进。大量的实验表明，该框架能够始终如一地提高大多数基于聚类的方法的适应精度。

地址：https://arxiv.org/abs/1912.01349

6、Viewpoint-Aware Loss with Angular Regularization for Person Re-Identification

推荐：近年来有监督的行人重识别（ReID）取得了重大进展，但是行人图像间巨大朝向差异，使得这一问题仍然充满挑战。大多数现有的基于朝向的特征学习方法，将来自不同朝向的图像映射到分离和独立的子特征空间当中。这种方法只建模了一个朝向下人体图像的身份级别的特征分布，却忽略了朝向间潜在的关联关系。为解决这一问题，本文提出了一种新的方法，叫带角度正则的朝向敏感损失（VA-ReID）。相比每一个朝向学习一个子空间，该方法能够将来自不同朝向的特征映射到同一个超球面上，这样就能同时建模身份级别和朝向级别的特征分布。在此基础上，相比传统分类方法将不同的朝向建模成硬标签，本文提出了朝向敏感的自适应标签平滑正则方法（VALSR）。这一方法能够给予特征表示自适应的软朝向标签，从而解决了部分朝向无法明确标注的问题。大量在Market1501和DukeMTMC数据集上的实验证明了本文的方法有效性，其性能显著超越已有的最好有监督ReID方法。

论文地址：https://arxiv.org/abs/1912.01300

7、Robust Conditional GAN from Uncertainty-Aware Pairwise Comparisons

推荐：CGAN往往需要大量标注。为了解决这个问题，现有方法大多基于无监督聚类，比如先用无监督学习方法得到伪标注，再用伪标注当作真标注训练CGAN。然而，当目标属性是连续值而非离散值时，或者目标属性不能表征数据间的主要差异，那么这种基于无监督聚类的方法就难以取得理想效果。本文进而考虑用弱监督信息去训练CGAN，在文中我们考虑成对比较这种弱监督。成对比较相较于绝对标注具有以下优点：1.更容易标注；2.更准确；3.不易受主观影响。

论文地址：https://arxiv.org/abs/1911.09298

8、An Adversarial Perturbation Oriented Domain Adaptation Approach for Semantic Segmentation

推荐：如今神经网络借助大量标注数据已经能够达到很好的效果，但是往往不能很好的泛化到一个新的环境中，而且大量数据标注是十分昂贵的。因此，无监督领域自适应就尝试借助已有的有标注数据训练出模型，并迁移到无标注数据上。对抗对齐(adversarial alignment)方法被广泛应用在无监督领域自适应问题上，全局地匹配两个领域间特征表达的边缘分布。但是，由于语义分割任务上数据的长尾分布(long-tail)严重且缺乏类别上的领域适配监督，领域间匹配的过程最终会被大物体类别（如：公路、建筑）主导，从而导致这种策略容易忽略尾部类别或小物体（如：红绿灯、自行车）的特征表达。本文提出了一种生成对抗扰动并防御的框架。首先该框架设计了几个对抗目标（分类器和鉴别器），并通过对抗目标在两个领域的特征空间分别逐点生成对抗样本。这些对抗样本连接了两个领域的特征表达空间，并蕴含网络脆弱的信息。然后该框架强制模型防御对抗样本，从而得到一个对于领域变化和物体尺寸、类别长尾分布都更鲁棒的模型。

论文地址：https://arxiv.org/pdf/1912.08954.pdf

百度

本届AAAI大会，百度共有28篇论文被收录，较去年的15篇入选成绩提升近一倍，入选论文涉及机器学习、自然语言处理、计算机视觉等多个领域，以下是已分享的部分论文：

1、Distributed Primal-Dual Optimization for Online Multi-task Learning

推荐：传统的在线多任务学习算法有两个重要的局限性：1.由于向中央机器传送高速度的顺序数据而导致通信量大；2.建立任务关联性的运行时复杂度昂贵。为了解决这些问题，在本文中，我们考虑一个设置，其中多个任务位于不同的地理位置，其中一个任务可以与其他任务同步数据，以利用相关任务的知识。具体地说，我们提出了一种自适应的原始-对偶算法，该算法不仅能捕获对抗学习中的任务特定噪声，而且能以运行时效率执行无投影更新。此外，由于该模型允许能量不足或带宽受限的任务延迟更新，因此非常适合于分散的周期连接任务。理论结果证明了我们的分布式算法的收敛性保证，并且有一个最优的遗憾。实证结果表明，该模型对各种真实数据集都是有效的。

论文地址：https://arxiv.org/abs/2004.01305

2、Meta-CoTGAN: A Meta Cooperative Training Paradigm for Improving Adversarial Text Generation

推荐：本文提出了一种新的方法，旨在通过有效地减缓对抗训练的模式崩溃来提高对抗文本生成的性能。为此，我们引入了一种协同训练范式，即语言模型与生成器协同训练，并利用该语言模型有效地塑造生成器的数据分布以防模式崩溃。此外，我们没有原则性地参与生成器的协同更新，而是建立了一个元学习机制，将生成器的协同更新作为一个高层次的元任务，直觉地确保在对抗性更新之后生成器的参数能够抵抗模式崩溃。在实验中，我们证明我们提出的方法可以有效地减缓对抗性文本生成器的模式崩溃速度。总的来说，我们提出的方法无论是在生成质量还是在验证域的多样性方面，都能优于具有显著裕度的基线方法。

论文地址：https://arxiv.org/abs/2003.11530v1

3、IVFS: Simple and Efficient Feature Selection for High Dimensional Topology Preservation

推荐：特征选择是处理高维数据的重要工具。在无监督的情况下，许多流行的算法都是为了保持原始数据的结构。本文提出了一种简单有效的特征选择算法，从计算拓扑上下文的持久图表示的拓扑保持的角度来增强样本的相似度保持。该方法是在一个统一的特征选择框架IVFS的基础上设计的，该框架受到随机子集方法的启发。该算法能够很好地保持完整数据的成对距离和拓扑模式。结果表明，该算法在亚采样率较低的情况下，能够提供令人满意的性能，从而支持了该方法在大规模数据集上的有效实现。大量实验验证了所提出的特征选择方案的有效性。

论文地址：https://arxiv.org/abs/2004.01299

4、ERNIE 2.0: A Continual Pre-training Framework for Language Understanding

推荐：近年来，预训练模型在各种语言理解任务中取得了最新的成果，这表明大规模语料库的预训练在自然语言处理中可能起着至关重要的作用。目前的预训练程序通常集中在几个简单任务的模式训练上，以掌握单词或句子的共现。然而，除了共现外，在训练语料库中还存在其他有价值的词汇、句法和语义信息，如命名实体、语义贴近度和话语关系。为了从训练语料库中最大限度地提取词汇、句法和语义信息，我们提出了一个名为ERNIE 2.0的连续预训练框架，该框架通过不断的多任务学习，逐步构建和学习预训练任务。实验结果表明，ERNIE 2.0在16个任务上均优于BERT和XLNet，其中包括基于GLUE基准的英语任务和几种常见的汉语任务。

论文地址：https://arxiv.org/abs/1907.12412?context=cs.CL

5、Synchronous Speech Recognition and Speech-to-Text Translation with Interactive Decoding

推荐：近年来，将源语翻译成目的语的语篇转换（ST）受到了广泛的关注。与传统的流水线系统相比，端到端ST模型具有低延迟、较小模型尺寸和较少错误传播的潜在优点。然而，众所周知，如果没有作为中间产物的转录，很难实现这样一个模型。现有的研究一般采用多任务学习的方法，结合自动语音识别（ASR）技术对端到端ST进行联合训练，以提高翻译质量。然而，该方法中不同的任务不能充分利用彼此的信息，限制了改进。另一些工作提出了一个两阶段模型，其中第二个模型可以使用第一个模型的隐藏状态，但是它的级联方式极大地影响了训练和推理过程的效率。本文提出了一种新的交互注意机制，使ASR和ST能够在单一模型中同步、交互地进行。具体来说，转录和翻译的生成不仅依赖于它以前的输出，而且还依赖于在其他任务中预测的输出。在TED语音翻译语料库上的实验表明，该模型在语音翻译质量上优于强基线，并取得了较好的语音识别性能。

论文地址：https://arxiv.org/abs/1912.07240

6、Multi-Label Classification with Label Graph Superimposing

推荐：近年来，图卷积网络（GCN）被用来提高多标签识别的性能。然而，什么是标签相关建模的最佳方法，以及如何通过标签系统感知来改进特征学习，目前还不清楚。本文从以下两个方面对传统的GCN+CNN多标签识别框架进行了改进，提出了一种标签图叠加框架。首先，将统计共现信息生成的标签图叠加到由标签的知识先验构成的图中，建立标签相关性模型，然后对最终的重叠图进行多层图卷积，实现标签嵌入抽象。其次，我们建议利用整个标签系统的嵌入来更好地进行表示学习。在特征学习过程中，通过在浅层、中层和深层增加GCN和CNN之间的横向连接，将标签系统的信息注入主干CNN中，实现标签感知。在MS-COCO和Charades数据集上进行了大量的实验，

论文地址：

https://arxiv.org/pdf/1911.09243v1.pdf

7、Cross-Modality Attention with Semantic Graph Embedding for Multi-Label Classification

推荐：多标签图像和视频分类是计算机视觉中的基础性任务，也是一项具有挑战性的任务。主要的挑战在于捕获标签之间的空间或时间依赖关系，并发现每个类的区别特征的位置。为了克服这些困难，我们提出了将跨模态注意与语义图嵌入相结合的多标签分类方法。在构造标签图的基础上，提出了一种基于邻接关系的相似度图嵌入方法来学习语义标签嵌入，该方法可以显式地利用标签关系。然后在学习标签嵌入的指导下生成了新的跨模态注意图。在两个多标签图像分类数据集（MS-COCO和NUS-WIDE）上的实验表明，这个方法优于其他现有技术。此外，在一个大型多标签视频分类数据集（YouTube-8M片段）上验证了该方法的有效性，评价结果证明了该方法的泛化能力。

论文地址：https://arxiv.org/abs/1912.07872

8、Dynamic Instance Normalization for Arbitrary Style Transfer

推荐：在本文中，作者提出了一个新的广义规范化模块，称为动态实例规范化（DIN），它允许灵活和更有效的任意样式传输。由实例规范化和动态卷积组成，DIN将样式图像编码为可学习卷积参数，在此参数上对内容图像进行样式化。与使用共享的复杂编码器对内容和样式进行编码的传统方法不同，所提出的DIN引入了一个复杂的样式编码器，同时还提供了一个紧凑和轻量级的内容编码器，用于快速推断。实验结果表明，所提出的方法在具有挑战性的样式模式上产生了非常不错的结果。

论文地址：https://arxiv.org/abs/1911.06953

9、SetRank: A Setwise Bayesian Approach for Collaborative Ranking from Implicit Feedback

推荐：在线推荐系统的最新发展集中在用户点击和购买等隐性反馈的协同排名上。与反映分级用户偏好的显式评分不同，隐式反馈只生成正面和不明显的标签。虽然在这方面已经作出了相当大的努力，但众所周知的成对和列表方法仍然受到各种挑战的限制。具体地说，对于成对方法，独立成对偏好的假设在实践中并不总是成立的。此外，由于整个列表排列的先决条件，列表方法不能有效地容纳“关系”。为此，本文提出了一种新的协同排序方法SetRank，以内在地适应推荐系统中隐含反馈的特点。具体来说，SetRank的目标是最大化新的setwise偏好比较的后验概率，并且可以通过矩阵分解和神经网络来实现。

论文地址：https://arxiv.org/pdf/2002.09841

10、Semi-Supervised Hierarchical Recurrent Graph Neural Network for City-Wide Parking Availability Prediction

推荐：预测全市停车可用性的能力对于停车诱导和信息（PGI）系统的成功开发至关重要。事实上，有效预测全市停车场的可用性，可以提高停车效率，有助于城市规划，最终缓解城市拥堵。然而，预测城市停车场的可用性是一项非常重要的工作，主要面临三大挑战：1.停车场之间的非欧氏空间自相关；2.停车场内部和停车场之间的动态时间自相关；3.实时传感器（如摄像机、超声波传感器、GPS）获取的实时停车可用性信息不足。为此，我们提出了半监督递阶递归图神经网络（SHARE）来预测城市停车场的可用性。

论文地址：https://arxiv.org/abs/1911.10516v1

11、Learning Conceptual-Contextual Embeddings for Medical Text

推荐：外部知识通常对自然语言理解任务有用。我们引入了一个上下文文本表示模型，称为概念上下文（CC）嵌入，它将结构化知识整合到文本表示中。与实体嵌入方法不同，我们的方法将知识图编码为上下文模型。CC嵌入可以像预先训练的语言模型一样，轻松地重用于各种任务。我们的模型通过利用语义泛化有效地对庞大的UMLS数据库进行编码。对电子健康记录（EHRs）和医学文本处理基准的实验表明，我们的模型大大提高了有监督的医学NLP任务的性能。

论文地址：https://arxiv.org/abs/1908.06203

12、Ultrafast Photorealistic Style Transfer via Neural Architecture Search.

推荐：真实感风格转换的关键挑战在于，算法应该忠实地将参考照片的风格转换为内容照片，而生成的图像应该看起来像是由相机捕获的图像。虽然已经提出了几种真实感风格的图像传输算法，但它们需要依赖于后期和/或预处理才能使生成的图像看起来真实。如果我们禁用额外的处理，这些算法将无法在细节保存和照片真实感方面产生合理的照片真实感样式化。在这项工作中，我们提出了解决这些问题的有效办法。我们的方法包括一个构建步骤（C-step）来构建真实感风格化网络和一个修剪步骤（P-step）来加速。在C-step中，我们在仔细设计预分析的基础上，提出了一种密集型自动编码器PhotoNet。PhotoNet集成了特征聚合模块（BFA）和实例规范化跳过链接（INSL）。为了产生忠实的样式化，我们在解码器和INSLs中引入了多个样式转换模块。PhotoNet在效率和有效性方面都明显优于现有算法。在P-step中，我们采用了一种神经结构搜索方法来加速光网络。提出了一种基于师生学习的真实感风格化自动网络剪枝框架。搜索得到的名为PhotoNAS的网络架构在保持样式化效果几乎不变的情况下，比PhotoNet实现了显著的加速。

论文地址：https://arxiv.org/abs/1912.02398

13、Symbiotic Attention with Privileged Information for Egocentric Action Recognition

推荐：以自我为中心的视频识别是进行多种交互推理的自然实验平台。由于以自我为中心的视频数据集中有大量的动作词汇，最近的研究通常采用两个分支结构进行动作识别，即一个分支用于动词分类，另一个分支用于名词分类。然而，动词与名词分支之间的关联性研究却大多被忽视。此外，由于缺乏位置感知注意机制，这两个分支未能挖掘出局部特征。在本文中，我们提出了一个利用特权信息（SAP）进行自我中心视频识别的共生注意框架。更精细的位置感知目标检测特性有助于理解参与者与目标的交互。我们在动作识别中引入这些特征，并将它们视为特权信息。我们的框架允许动词分支、名词分支和特权信息之间的相互通信。这种通信过程不仅将局部细节注入到全局特征中，而且利用了对正在进行的动作的时空位置的隐含指导。我们引入新的共生注意（SA）来实现有效的交流。

论文地址：https://arxiv.org/pdf/2002.03137.pdf

14、GBCNs: Genetic Binary Convolutional Networks for Enhancing the Performance of 1-bit DCNNs

推荐：二值卷积神经网络（BCNNs）被广泛应用于移动和人工智能芯片应用中，以提高深卷积神经网络（DCNNs）的存储和计算效率。然而，目前的BCNNs还不能完全探索其相应的全精度模型，导致它们之间的性能差距很大。本文提出了一种改进的二值卷积网络（RBCNs），将全精度核函数和特征映射相结合，在统一的框架下对二值化过程进行改进，以达到优化BCNNs的目的。特别地，我们使用GAN在其相应的全精度模型的指导下对1位二进制网络进行训练，显著提高了BCNNs的性能。校正后的卷积层具有通用性和灵活性，可以很容易地并入现有的dcnn，如WideResNets和ResNets。大量实验表明，与最新的BCNNs相比，所提出的RBCNs具有更好的性能。特别地，我们的方法对目标跟踪任务具有很强的泛化能力。

论文地址：https://arxiv.org/abs/1908.07748

15、AutoRemover: Automatic Object Removal for Autonomous Driving Videos

推荐：基于自动驾驶中对真实感仿真的需要，本文提出了一种视频修复算法emph{AutoRemover}，该算法专为生成无运动物体的街景视频而设计。在我们的设置中，我们有两个挑战：第一个是阴影，阴影通常没有标记，但与移动对象紧密耦合。第二个是视频中巨大的自我运动。为了处理阴影，我们建立了一个自动驱动阴影数据集，并设计了一个深度神经网络来自动检测阴影。为了处理大的自我运动，我们利用多源数据，特别是三维数据，进行自主驾驶。更具体地说，帧之间的几何关系被合并到修补深度神经网络中，以产生高质量的结构一致的视频输出。实验表明，该方法优于其他最新的目标去除算法，使RMSE降低了19%以上。

论文地址：https://arxiv.org/abs/1911.12588

16、CSPN++: Learning Context and Resource Aware Convolutional Spatial Propagation Networks for Depth Completion

推荐：深度完成是指给定相应的彩色图像，将稀疏的深度图转换为稠密的深度图。卷积空间传播网络（CSPN）是目前最先进的深度完成方法之一，它可以恢复场景的结构细节。本文提出了CSPN++，通过学习自适应卷积核大小和传播迭代次数，进一步提高了CSPN++的有效性和效率，从而可以根据请求动态分配每个像素所需的上下文和计算资源。

论文地址：https://arxiv.org/abs/1911.05377

17、ZoomNet：Part-Aware Adaptive Zooming Neural Network for 3D Object Detection

推荐：3D目标检测是自动驾驶和机器人技术中的一项重要任务。虽然已经取得了很大的进展，但在估计远距离和遮挡物体的三维姿态方面仍然存在挑战。本文提出了一种新的基于立体图像的三维检测框架ZoomNet。ZoomNet的流水线是从一个普通的二维目标检测模型开始的，该模型用于获取左右边界框对。为了进一步利用RGB图像中丰富的纹理线索进行更精确的视差估计，我们引入了一个概念上的直接模块——自适应缩放，它同时将2D实例边界框调整为统一的分辨率，并相应地调整相机的内部参数。通过这种方法，我们可以从调整大小的方块图像中估计更高质量的视差图，然后为附近和远处的物体构建密集的点云。此外，我们引入学习零件位置作为互补特征，以提高抗遮挡能力，并提出三维拟合分数，以更好地估计三维检测质量。

论文地址：https://arxiv.org/abs/2003.00529

ICLR 2020

ICLR 2020 上出现了多达 34 篇满分论文（8 分），以下是来自华为、字节跳动、腾讯等企业的满分论文。

华为

Causal Discovery With Reinforcement Learning

推荐：在此论文中，华为诺亚方舟实验室因果研究团队将强化学习应用到打分法的因果发现算法中，通过基于自注意力机制的 encoder-decoder 神经网络模型探索数据之间的关系，结合因果结构的条件，并使用策略梯度的强化学习算法对神经网络参数进行训练，最终得到因果图结构。在学术界常用的一些数据模型中，该方法在中等规模的图上的表现优于其他方法，包括传统的因果发现算法和近期的基于梯度的算法。同时该方法非常灵活，可以和任意的打分函数结合使用。

论文地址：https://arxiv.org/pdf/1906.04477.pdf

字节跳动

1、Mirror-Generative Neural Machine Translation

推荐：本文研究者提出了一个镜像生成式的机器翻译模型（MGNMT），可以更好地利用非平行语料提高NMT的效果。MG-NMT使用生成式的方法，同时优化两个方向的翻译器和语言模型，从而能从两个角度得到提升。实验表明了这种方法的有效性。

论文地址：https://openreview.net/pdf?id=HkxQRTNYPH

2、Sparse Coding with Gated Learned ISTA

推荐：本文研究了求解稀疏编码问题的迭代收缩阈值学习算法。在前人工作的假设下，作者首先发现其估计中的码成分可能低于预期，即需要增益，为了解决这个问题，一个适合于对该机制进行理论分析的门机制，因此其有效性可以形式化地保证。在除了增益门，我们进一步引入超调门来补偿LISTA。广泛实证结果证实了我们的理论发现，并验证了我们方法的有效性。

论文地址：https://openreview.net/forum?id=BygPO2VKPH

腾讯

Watch the Unobserved: A Simple Approach to Parallelizing Monte Carlo Tree Search

推荐：蒙特卡罗树搜索（MCTS）算法在许多具有挑战性的基准上取得了巨大的成功。然而，它们通常需要大量的发布，这使得它们的应用程序成本高昂。此外，由于MCT固有的顺序性，并行化MCT也极具挑战性：每次推出都严重依赖于从以前的模拟中估计的统计数据（例如，节点访问计数），以实现有效的勘探开发权衡。尽管有这些困难，我们还是开发了一个算法WU-UCT来有效地并行化MCTS，该算法实现了线性加速，并且随着工人数量的增加，性能损失有限。WU-UCT的关键思想是我们引入一组统计信息来跟踪正在进行但不完整的模拟查询（称为未观测样本）的数量。这些统计数据用于在选择步骤中原则性地修改UCT树策略，以便在并行化最耗时的扩展和模拟步骤时保持有效的勘探开发权衡。在专有基准和Atari游戏基准上的实验表明，与现有技术相比，WU-UCT具有线性加速和优越的性能。

论文地址：https://arxiv.org/abs/1810.11755?context=stat.ML

ACL 2020

腾讯

在ACL 2020的论文收录名单中，腾讯共有30篇论文入选，入选论文数刷新国内企业记录，领跑国内业界AI研究第一梯队，研究方向涵盖对话及文本生成、机器翻译及对话、多模信息抽取多个自然语言处理的重点领域。

1、Generate, Delete and Rewrite: A Three-Stage Framework for Improving Persona Consistency of Dialogue Generation

推荐：在对话过程中保持一致的角色属性信息对人类来说是很容易的，但对机器来说，这仍然是一项有待探索的任务。近几年，基于角色属性的对话生成任务被提出来，旨在通过在对话生成模型中加入显式的角色文本来解决属性一致性问题。虽然现有的基于角色的对话生成模型在生成类似人类的回复上取得了成功，但是它们的单阶段解码框架很难避免生成不一致的角色词。在这项工作中，作者提出了一个三阶段的对话生成框架。该框架使用生成-删除-重写机制从生成的原型回复中删除不一致的词语，然后进一步将其改写为属性信息一致的回复。通过人工评价和自动指标进行了评估。在PersonaChat数据集上的实验表明，这个方法获得了非常好的性能。

论文地址：暂无

2、How Does Selective Mechanism Improve Self-Attention Networks?

推荐：近年来，在自注意力网络引入选择机制使得模型关注其中重要的输入元素已经取得很好的效果。但是，对于选择机制取得这样结果的原因尚不清楚。本文提出一个通用的基于选择机制的自注意力网络。传统的自注意力网络在顺序编码以及结构信息建模能力存在一些不足，而本文针对其提出相应的假设，并在实验中验证假设的正确性。实验分析发现，将选择机制引入自注意力网络的好处在于：1.其更多关注周围词的信息，从而对周围词序的变化比较敏感，使得其更好对顺序进行编码；2.其对于树结构重要成分关注度更高，从而其拥有更强的捕捉结构信息的能力。

论文地址：暂无

阿里巴巴

阿里巴巴有22篇论文入选ACL 2020，内容覆盖跨领域分词、细颗粒度情感分析、多领域对话系统、文本生成、知识蒸馏等诸多NLP领域的热点和前沿研究方向。

1、Structure-LevelKnowledge Distillation For Multilingual SequenceLabeling

推荐：多语种序列标记是一项使用单一的多语种统一模型预测标签序列的任务。与依赖于多个单语模型相比，使用多语言模型具有模型规模小、在线服务容易和对低资源语言通用的优点。然而，由于模型容量的限制，目前的多语种模型仍然远远低于单独的单语模型。本文提出将多个单语模型（教师）的结构知识提取到统一的多语言模型（学生）中，以缩小单语模型与统一的多语言模型之间的差距。我们提出了两种基于结构层次信息的知识发现方法：1.近似地最小化学生和教师的结构层次概率分布之间的距离；2.将结构层次知识聚合为局部分布，并最小化两个局部概率分布之间的距离。我们对4个多语种任务和25个数据集的实验表明，我们的方法优于几种强基线，并且比基线模型和教师模型具有更强的零炮概化能力。

论文地址：https://arxiv.org/abs/2004.03846

2、Slot-consistent NLG for Task-oriented Dialogue System with Iterative Rectiﬁcation Network

推荐：基于神经网络的方法在 NLG 任务上已经取得了不错的效果。然而，数据驱动类型的模型无法保证鲁棒性，例如忽略了一个输入槽位或生成了多余的槽位。前人的工作将这个问题称为幻视现象。在这个工作中，我们研究如何通过保证槽位一致性提高 NLG 模型的可靠性。所谓槽位一致性是指模型生成的模板应该和输入表示语义一致，即具有相同的槽位集合。针对这个问题，我们提出迭代改写器，它能保证 NLG 模型生成正确而且流利的句子。它包含两个模块：1.基于检索的自举抽样，用于抽样伪错数据；2.策略梯度学习，用于融入离散奖励，例如不一致惩罚度。我们在 4 个数据集上验证了模型的有效性，结果显示我们大大降低了所有基线模型的槽位错误率 (ERR) 并达到了目前最好的效果，并且BLEU 的提升和人工校验的结果也显示了我们模型提高了生成句子的顺畅度。

论文地址：暂无

百度

本届ACL大会中，百度被收录的11篇论文，覆盖了对话与交互系统、情感分析/预训练表示学习、NLP 文本生成与摘要、机器翻译/同声翻译、知识推理、AI辅助临床诊断等诸多自然语言处理界的前沿研究方向。

1、Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation

推荐：我们提出用图的形式捕捉对话转移规律作为先验信息，用于辅助开放域多轮对话策略学习。基于图，我们设计策略学习模型指导更加连贯和可控的多轮对话生成。首先，我们从对话语料库中构造一个对话图（CG），其中顶点表示“what to say”和“how to say”，边表示对话当前句与其回复句之间的自然转换。然后，我们提出了一个基于CG的策略学习框架，该框架通过图形遍历进行对话流规划，学习在每轮对话时从CG中识别出哪个顶点和如何从该顶点来指导回复生成。我们可以有效地利用CG来促进对话策略学习，具体而言：1.可以基于它设计更有效的长期奖励；2.它提供高质量的候选操作；3.它让我们对策略有更多的控制。我们在两个基准语料库上进行了实验，结果证明了本文所提框架的有效性。

论文地址：暂无

2、PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable

推荐：研发开放领域（Open-Domain）的对话机器人，使得它能用自然语言与人自由地交流，一直是自然语言处理领域的终极目标之一。对话系统的挑战非常多，其中有两点非常重要，一是大规模开放域多轮对话数据匮乏；二是对话中涉及常识、领域知识和上下文，一个对话的上文（Context），往往可以对应多个不同回复（Response）的方向。PLATO首次提出将离散的隐变量结合Transformer结构，应用到通用对话领域。通过引入离散隐变量，可以对上文与回复之间的“一对多”关系进行有效建模。同时，通过利用大规模的与人人对话类似的语料，包括Reddit和Twitter，进行了生成模型的预训练，后续在有限的人人对话语料上进行微调，即可以取得高质量的生成效果。PLATO可以灵活支持多种对话，包括闲聊、知识聊天、对话问答等等。而文章最终公布的在三个公开对话数据集上的评测，PLATO都取得了新的最优效果。

论文地址：暂无

3、Towards Conversational Recommendation over Multi-Type Dialogs

推荐：真实人机对话，涉及多类型对话(闲聊、任务型对话、问答等)，如何自然的融合多类型对话是一个重要的挑战。为应对这个挑战，作者提出一个新的任务——多类型对话中的对话式推荐，期望Bot能够主动且自然地将对话从非推荐对话(比如『问答』)引导到推荐对话，然后基于收集到的用户兴趣及用户实时反馈通过多次交互完成最终的推荐目标。为便于研究这个任务，我们标注了一个包含多种对话类型、多领域和丰富对话逻辑(考虑用户实时反馈)的人－人对话式推荐数据集DuRec(1万个对话和16.4万个utterance)。针对每个配对：推荐寻求者(user)和推荐者(bot)，存在多个序列对话，在每个对话中，推荐者使用丰富的交互行为主动引导一个多类型对话不断接近推荐目标。这个数据集允许我们系统地考察整个问题的不同部分，例如，如何自然地引导对话，如何与用户交互以便于推荐。最后，我们使用一个具有多对话目标驱动策略机制的对话生成框架在DuRec上建立基线结果，表明了该数据集的可用性，并为将来的研究设定了基线。

论文地址：暂无

4、SKEP: Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis

推荐：作者提出了一种情感知识增强的语言模型预训练方法，在通用预训练的基础上，设计了面向情感知识建模的Masking策略和情感多目标学习算法，融合了情感词、极性、主体评论关系等多层情感知识，首次实现了情感任务统一的文本预训练表示学习。该算法在情感分类、观点抽取等情感分析任务中相对主流预训练模型RoBERTa有显著的提升，同时刷新了多个情感分析标准测试集的世界最好水平。

论文地址：暂无

5、Cross-Lingual Unsupervised Sentiment Classification with Multi-View Transfer Learning

推荐：本文针对无标签资源的目标语言，提出了一种无监督的跨语言情感分析模型。

论文地址：暂无

6、Leveraging Graph to Improve Abstractive Multi-Document Summarization

推荐：本论文提出基于图表示的多文档生成式摘要方法GraphSum，在神经网络模型中融合多文档语义关系图例如语义相似图、篇章结构图等，建模多篇章输入及摘要内容组织过程，从而显著提升多文档摘要效果。GraphSum 基于端到端编解码框架，其中图编码器利用语义关系图对文档集进行编码表示，图解码器进一步利用图结构组织摘要内容并解码生成连贯的摘要文本。GraphSum 还可以非常容易地与各种通用预训练模型相结合，从而进一步提升摘要效果。在大规模多文档摘要数据集WikiSum 和MultiNews 上的实验表明，GraphSum 模型相对于已有的生成式摘要方法具有较大的优越性，在自动评价和人工评价两种方式下的结果均有显著提升。

论文地址：暂无

7、Exploring Contextual Word-level Style Relevance for Unsupervised Style Transfer

推荐：无监督风格转换是指在无平行语料的情况下，把输入的句子改成目标风格，同时尽可能保持其原义。本文提出了一种全新的序列到序列的生成模型，可以动态地根据生成词的风格相关性进行风格转换。本文有两个主要的创新点，一是用层级相关性传播算法计算风格分类器中每个输入词的风格相关性信息，并以此作为指导信号来训练生成器，让生成器在生成的同时可以预测下一个词的风格相关性。二是设计了以词级别风格相关性和语义信息作为输入的风格转换解码器，并通过多个损失项进行finetune训练，从而实现风格转换的功能。实验表明，本文提出的方法在情感风格转换和口语化风格转换的任务上都达到了领先效果。

论文地址：暂无

8、Opportunistic Decoding with Timely Correction for Simultaneous Translation

推荐：在本论文中，百度首次提出了一种具有及时纠错能力的解码技术，它总是在每一步产生一定数量的额外单词，以保持观众对最新信息的跟踪，同时，它也在观察更多的上下文时，对前一个过度生成的单词提供及时的纠错，以确保高翻译质量。本文还首次提出了对这种纠错场景下的延迟指标。实验表明，我们的技术提高了延迟和质量：延迟减少了2.4，BLEU增加了3.1，中英翻译和中英翻译的修改率低于8%。本系统可用于任何语音到文本的同传系统中。

论文地址：暂无

9、Simultaneous Translation Policies: from Fixed to Adaptive

推荐：本文提出一种简单的启发式算法，根据翻译模型输出的概率分布，可以将几种精简的固定“读写”策略组合成一种灵活的策略。本文进一步将该算法与集成方法相结合，既提高了翻译质量，又降低了翻译过程的时延。这种简单的算法不需要训练策略模型，使得其更易于在产品中使用。

论文地址：暂无

10、Learning Interpretable Relationships between Entities, Relations and Concepts via Bayesian Structure Learning on Open Domain Facts

推荐：本文通过贝叶斯结构学习建立了开放领域的关系与概念(Concept)之间的关联，使得实体为何属于某个概念的原因得到了很好的解释。

论文地址：暂无

11、Towards Interpretable Clinical Diagnosis with Bayesian Network Ensembles Stacked on Entity-Aware CNNs

推荐：本研究提出一种新的诊断算法框架，该框架针对EMR具有无结构化文本和结构化信息并存的特点，结合医疗NLU，以深度学习模型实现EMR的向量化表示、诊断预分类和概率计算。结合医疗知识图谱增强的多种贝叶斯网络的组合模型，实现具有可解释性的诊断推理。该框架能同时兼顾高诊断准确率和强可解释性的特点，并可应用于面向基层医师的辅助临床诊断产品中。

论文地址：暂无

IJCAI 2020

腾讯

Deep Feedback Network for Recommendation

推荐：在本文中，作者初步研究了推荐系统中的多种显式/隐式和正/负反馈之间的协同合作机制。DFN模型能够基于多种反馈信息即时学习到用户的无偏的正负向兴趣，在点击预估和不感兴趣预估等多个任务上均有提升效果。直观而有效的模型也使得DFN能成功在工业级推荐系统中得到部署和验证。

论文地址：暂无

推荐阅读
面试AI算法岗，你被要求复现顶会论文了嘛？

奇异值分解, 这一篇就够了

就是这么流弊！三行Python代码，让数据处理速度提高2到6倍

重温这几个屌爆的Python技巧！

Heartrate：一个牛逼的工具，Python执行实时可视化

你可能感兴趣的:(牛逼！一文看尽2020上半年阿里、腾讯、百度入选AI顶会论文)

Level2逐笔成交逐笔委托毫秒记录：今日分享优质股票数据20250115 2401_89140926 金融 python 数据库数据库开发大数据
逐笔成交逐笔委托下载链接:https://pan.baidu.com/s/1uRCmUTFoUZShauQ0gJYFiw?pwd=f837提取码:f837--------------------Level2逐笔成交逐笔委托数据分享下载采用Level2逐笔成交与逐笔委托的详细记录，这种毫秒级别的数据能揭露众多关键信息，如庄家意图、虚假交易，使所有交易行为透明化。这对交易大师分析主力习性大有裨益，对人
AI如何帮助电商企业进行数据分析 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
电商数据分析，人工智能，机器学习，深度学习，推荐系统，预测模型，客户画像1.背景介绍在当今数字化时代，电商行业蓬勃发展，数据成为企业最重要的资产。电商企业每天都会产生海量的数据，包括用户行为、商品信息、交易记录等。如何有效地分析这些数据，挖掘其中的价值，对于电商企业的运营、营销和发展至关重要。传统的数据分析方法往往难以应对海量数据的处理和复杂分析需求，而人工智能（AI）技术的出现为电商数据分析带来
python爬虫根据需要查找某个链接并保存快乐小运维 python 爬虫开发语言
importreimportosfromurllib.parseimporturlparse,quoteimportasyncioimportaiohttpfrombs4importBeautifulSoup#所有下载文件file_name=“1.txt”asyncdeffetch_url(session,url):try:#首先尝试HTTPSasyncwithsession.get(url,ti
DNS介绍（5）：DNS 劫持及解决方案 thinking-fish 基础设施 dns劫持网络 dns 网络安全
DNS劫持分析DNS劫持，亦称为域名重定向或DNS篡改，是一种网络攻击技术。其核心在于攻击者通过篡改DNS系统的域名解析结果，将用户本意访问的域名指向攻击者所掌控的IP地址。这种攻击不仅可能使用户无法顺利访问所需网站，还可能让用户面临多种网络安全风险。DNS（DomainNameSystem）是互联网的一项基础设施，负责将人们易于记忆的域名转换为计算机能够识别的IP地址。当DNS系统被攻击者篡改时
Oracle SQL每日一问之ORA-01723:zero-length columns are not allowed yan han ORACLE SQL oracle sql 数据库
我：CREATETABLETABLE_1PARALLEL8ASSELECT/*+parallel(8)*/t1.emp_no,NULLemp_nameFROMtemp1t1;[AI机器人bot:]在你的SQL语句中，错误"zero-lengthcolumnsarenotallowed"可能是由于在创建表时没有为`NULLemp_name`指定数据类型。即使在`CREATETABLE...ASSEL
【机器学习：十五、神经网络的编译和训练】 KeyPan 机器学习机器学习神经网络人工智能深度学习 pytorch ubuntu linux
1.TensorFlow实现代码TensorFlow是深度学习中最为广泛使用的框架之一，提供了灵活的接口来构建、编译和训练神经网络。以下是实现神经网络的一个完整代码示例，以“手写数字识别”为例：importtensorflowastffromtensorflow.kerasimportlayers,models#加载MNIST数据集(x_train,y_train),(x_test,y_test)
【AIcoding技术必知必会】11问--CI/CD流水线是什么？ srzxy42 AI coding技术必知必会 ai 产品经理学习
基础介绍软件开发生命周期（SDLC）由下面这几个关键阶段组成：开发、测试、部署和运维。CI/CD将这些阶段自动化并整合起来，实现更快更可靠的发布。当代码提交到git仓库，便会触发自动的构建和测试流程。其中会运行端到端测试用例来验证代码。如果测试通过，代码就会自动部署到预发或生产环境。如果发现问题，代码就打回开发阶段进行修复。这种自动化过程为开发者提供了快速反馈，减少了生产环境中出问题的概率。CI/
如何最小改变架构，快速实现流控的？（第34讲） 58沈剑架构
《架构师之路：架构设计中的100个知识点》34.快速流控传统架构，为何不是默认流控的？站点与服务，服务与服务上下游之间，一般如何采用两种通讯模式：其一，RPC直接调用。其二，MQ推送模式。画外音：这也是MQ的默认模式。这两种模式，都可能造成流量冲击：流量从端到站点，到服务，到数据库，流量会一路透传下来，引发雪崩。举个秒杀业务的栗子。1.上游：端上发起抢购操作；2.下游：完成秒杀业务逻辑（库存检查，
【Python Tips】多线程池加速独立运行程序——ThreadPoolExecutor 机器白学 Python python
在处理数量庞大的数据集或者大批量的循环操作时，程序如果单一运行往往会十分缓慢。假如硬件设备内存足够，CPU性能够好，同时每次循环内的任务都独立（如访问一个文件夹内大量文件）。这种时间复杂度的问题可以尝试使用多线程来处理加速。下面记录使用Python标准库中的高级接口——concurrent.futures.ThreadPoolExecutor来实现多线程加速。以一个写入txt文件的操作为例，假如有
当下是否入行AI ? 一场关于未来的赌注与机遇 dami_king 随笔人工智能
当下是否入行AI：一场关于未来的赌注与机遇在科技的浪潮中，人工智能（AI）无疑是最为汹涌的一波。它不仅改变了我们与机器互动的方式，还重塑了各行各业的面貌。面对这样的变革，许多人站在十字路口犹豫不决——现在进入AI领域还来得及吗？这个问题的答案，并非简单的“是”或“否”。今天，让我们一起深入探讨这个话题，看看对于想要投身AI的人来说，当下是不是一个好的时机。AI行业的现状与发展2024年，AI已经从
c++单例设计模式一定会升职加薪设计模式 c++设计模式
文章目录1.单例模式2.饿汉模式3.懒汉模式（线程安全，加锁）4.懒汉模式（c++11线程安全:call_once）1.单例模式单例模式有两种1.1懒汉模式（线程不安全）需要用到对象的时候才开始创建，多个线程调用的时候可能会创建多个对象1.2饿汉模式（线程安全）一开始就创建一个对象将构造函数私有化，不允许外部构造，声明一个静态的类指针，和静态的getInstance()函数，通过域名调用getIn
Airflow：深入理解Airflow Sensor 梦想画家数据分析工程 #Airflow #python 数据集成数据工程 Airflow
ApacheAirflowSensors是实现特定感知的任务，它可以持续监控外部条件或事件，并阻止下游任务的执行，直到满足指定的条件。它们对于编排复杂的工作流是必不可少的，在这些工作流中，任务需要在继续之前等待外部依赖关系变得可用。在这个全面的指南中，我们将详细探讨ApacheAirflowSensors，包括它们的类型，工作原理和常见的用例。关于具体每个内置Sensor应用实例，读者可以参考之前
python3安装教程 @小左 python 开发语言
1.下载python百度网盘下载python-3.12.3-amd64.exe链接：https://pan.baidu.com/s/1MV3kvVdjCdS_G-_KgefwLw?pwd=pgzu提取码：pgzu官网下载：WelcometoPython.org有很多版本，选择需要的版本下载2.安装python双击python-3.12.3-amd64.exeNext安装成功3.检查pythonwi
C语言数据结构编程练习-用指针创建顺序表，进行创销和增删改查操作墨楠。 #C 语言数据结构研习汇 C c语言数据结构数据库
使用多文件进行编程main.c文件#include"02.h"intmain(){fn2();return0;}02.h头文件#pragmaonce#define_CRT_SECURE_NO_WARNINGS#include#include#include#defineMAX_NUMBER100typedefintelememtType;//elememt:元素typedefstructorder
华为OD机试E卷 - 空栈压数（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 python 华为od java javascript c语言 c++华为od机考e卷
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述向一个空栈压入正整数，每当压入一个整数时，执行以下规则（设:栈顶至栈底整数依次编号为n1,n2,…,nx，其中n1为最新压入的整数)如果n1=n2，则n1、n2全部出栈，压入新数据m(m=2*n1)如果n1=n2+…+ny(y的范围为[3,x])，则n1,n2,…,ny全部出栈，压入新数据m(m=2*n1)。如果上述规
阿里云通义开源首个推理步骤评估标准，探索AI推理模型新路径量子位
1月16日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型；在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时，通义团队还开源首个步骤级的评估标准ProcessBench，填补了大模型推理过程错误评估的空白。在当前大模型推理过程中，不时存在逻辑错误或编造看似合理的推理步
AI代码生成器赋能软件原型快速构建：吴恩达的最佳实践指南前端
快速构建软件原型对于验证想法、迭代产品至关重要。而随着人工智能技术的飞速发展，AI代码生成器等AI辅助编程工具的出现，为开发者提供了前所未有的效率提升。本文将结合吴恩达教授的观点，探讨如何利用AI工具，高效构建软件原型。吴恩达教授强调选择合适的技术栈并有效利用AI工具是关键，这将帮助开发者在短时间内完成原型开发，快速验证其想法。选择并精通“有主见”的技术栈：效率为王吴恩达教授推荐的技术栈——Pyt
风险防不胜防？看YashanDB如何守护你的数据库安全（下）安全数据库运维
前言上一篇文章，咱们主要讲了数据库安全机制中的访问管理~今天继续深入聊聊威胁监测以及数据保护。(二)威胁监测•安全审计YashanDB语法上支持权限审计、行为审计和角色审计，逻辑上包括了系统级、语句级、对象级进行审计，支持对指定用户或所有用户进行审计，并支持对系统权限进行审计。审计记录保存在物理表中，拥有AUDIT_ADMIN或AUDIT_VIEWER角色权限的用户可以通过审计视图UNIFIED_
MiniMax开源，突破传统Transformer架构，震撼业界人工智能模型
就在昨天，AI领域迎来了一项重大突破——MiniMax发布并开源了新一代01系列模型。国产大模型市场再掀巨浪，传统Transformer架构或许将不再是唯一选择。MiniMax-Text-01模型：https://huggingface.co/MiniMaxAI/MiniMax-Text-01MiniMax-VL-01模型：https://huggingface.co/MiniMaxAI/Mini
mindspeed-llm源码解析（一）preprocess_data 人工智能
mindspeed-llm是昇腾模型套件代码仓，原来叫"modelLink"。这篇文章带大家阅读一下数据处理脚本preprocess_data.py（基于1.0.0分支），数据处理是模型训练的第一步，经常会用到。文章中贴的源码加了相关注释，同学们可以把源码和注释结合起来看。首先来看一下main函数defmain():#获取入参，通过后面的代码可以知道有哪些关键参数args=get_args()#参
大数据新视界 --大数据大厂之AI 与大数据的融合：开创智能未来的新篇章青云交大数据新视界 AI&人工智能大数据人工智能智能环保智能教育智能农业 ChatGPT 智能能源数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
从RNN到Transformer：生成式AI技术演变与未来展望非著名架构师人工智能 rnn transformer
生成式人工智能（GenerativeAI）近年来取得了令人瞩目的进展，其背后的核心技术是自回归模型的不断演进。从传统的递归神经网络（RNN）到革命性的Transformer架构，本文将全面剖析这一技术发展历程。一、RNN：生成式模型的起点1.RNN的基本原理递归神经网络（RecurrentNeuralNetwork,RNN）是一种专为处理序列数据设计的神经网络架构。其核心思想是通过循环连接的隐藏状
移动终端基带芯片的基本架构介绍之二（移动终端中的基带芯片） a1809032425 网络通信学习
移动终端基带芯片的基本架构介绍之二（移动终端中的基带芯片）参考链接：https://blog.csdn.net/lxl584685501/article/details/46771429http://m.blog.csdn.net/blog/suipingsp/35280465http://m.blog.csdn.net/blog/suipingsp/35574959http://www.bubu
开源多模态推理模型QVQ：视觉推理能力的突破与未来展望前端
近年来，AI代码生成器等人工智能技术飞速发展，多模态推理模型作为其中一个重要分支，正展现出越来越强大的能力。它能够理解和处理多种类型的数据，例如图像、文本、音频等，并进行复杂的推理和决策。阿里云通义千问团队近日发布的QVQ-72B-Preview模型，就是一个极具代表性的例子。该模型开源且在视觉推理方面表现突出，为多模态模型的发展树立了新的里程碑。QVQ模型的核心能力与突破QVQ-72B-Prev
PyTorch建模与应用：从深度学习到大模型屿小夏书籍推荐深度学习 pytorch 人工智能
文章目录一、内容简介二、值得一读1.从基础到深入，适合不同层次的读者2.丰富的实战案例3.全面的数据处理与模型构建三、适用人群1.AI技术初学者2.在校学生和从业者3.培训机构和高校教学四、总结一、内容简介《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。全书共11章，内容涵盖了从深度学习的基础概念到大语言模型的应用。第1章介绍了深度
debian最小安装后，从零安装GUI界面（gnome）翻滚吧键盘 debian 腾讯云 javascript
安装命令（顺序执行即可）aptinstallsudonala默认普通用户是无法执行sudo命令的，修改使其可以执行sudo命令（不过我看了一下/etc/sudoer文件并没有被修改，先埋个坑）adduser[你的用户名]sudo选择最快的镜像sudonalafetch开始安装GUI（gnome）sudonalainstallgdm3gnome-shellgnome-terminalgnome-te
会捡垃圾、能干家务，元萝卜“视觉+机械臂”技术扫地机器人首秀量子位
在2025开年科技盛宴CES（国际消费电子展）上，AI机器人无疑成为全场焦点，而其中来自中国科技企业展示和发布的仿生多关节机械手技术在扫地机器人产品上的应用，更获得了全球媒体的高度关注。通过将视觉感知与机械臂技术相结合，能够自主完成拾取垃圾入桶等任务，不仅展示了家用机器人发展的未来形态，也让大众看到了具身智能机器人融入家庭生活的广阔前景。随着大模型技术和具身智能浪潮汹涌而至，家用机器人正迎来全新发
论文翻译：A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly CSPhD-winston-杨帆论文翻译 LLMs-鲁棒性语言模型人工智能自然语言处理
Asurveyonlargelanguagemodel(LLM)securityandprivacy:TheGood,TheBad,andTheUglyhttps://www.sciencedirect.com/science/article/pii/S266729522400014X文章目录关于大型语言模型（LLM）安全性和隐私的调查：好的、坏的和丑陋的摘要1.引言2.背景2.1大型语言模型（L
Java基础：Iterator迭代器重生之Java开发工程师 java 开发语言
一、什么是Iterator：迭代器(Iterator)是一个对象，它的工作是遍历并目标序列中的对象，它提供了一种访问一个容器(container)对象中的各个元素的方法，把访问逻辑从不同类型的集合类中抽象出来，又不必暴露该对象内部细节。通过迭代器，开发人员不需要了解容器底层的结构，就可以实现对容器的遍历。由于创建迭代器的代价小，因此迭代器通常被称为轻量级的容器。常常使用JDK提供的迭代接口进行Ja
全局变量的定义和使用 Alvin's Tech Blog c++
定义全局变量：全局变量在一个源文件中定义，分配内存空间。定义时不需要任何特殊关键字，直接写在函数外部即可。声明全局变量：在其他源文件中使用该全局变量时，需要用extern关键字声明。extern告诉编译器：“这个变量在其他地方定义，这里只是引用。”示例代码文件1:main.c#include#include"global.h"//包含全局变量的声明intmain(){printf("Globalv
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比