敲代码的胖虎

综述：基于深度学习的情感分析

近年来，深度学习有了突破性发展，NLP 领域里的情感分析任务逐渐引入了这种方法，并形成了很多业内最佳结果。本文中，来自领英与伊利诺伊大学芝加哥分校的研究人员对基于深度学习的情感分析研究进行了详细论述。

一、摘要

作为一项学习数据的多层特征或表征的强大机器学习技术，深度学习的出现实现了当前最优的结果预测。伴随着在诸多应用领域的成功，深度学习近年来也被广泛应用于情感分析。本论文首先概述深度学习，接着全面调研深度学习在情感分析领域的应用现状。

二、介绍

情感分析或观点挖掘是对人们对产品、服务、组织、个人、问题、事件、话题及其属性的观点、情感、情绪、评价和态度的计算研究。该领域的开始和快速发展与社交媒体的发展相一致，如评论、论坛、博客、微博、推特和社交网络，因为这是人类历史上第一次拥有如此海量的以数字形式记录的观点数据。早在 2000 年，情感分析就成为 NLP 中最活跃的研究领域之一。它在数据挖掘、Web 挖掘、文本挖掘和信息检索方面得到了广泛的研究。实际上，因其对商业和社会的整体重要性，它已经从计算机科学扩展到管理学和社会学，如营销、金融、政治学、传播学、健康科学，甚至历史学。这种发展原因在于观点是几乎所有人类活动的核心，是人类行为的重要影响因素。我们的信念、对现实的感知，以及我们所做的决策在很大程度上依赖于别人看到和评价世界的方式。因此，我们在做决策的时候，通常会寻求别人的意见。

现在，如果您想购买一种消费产品，就不再局限于向朋友和家人征求意见，因为在Web的公共论坛上有许多关于该产品的用户评论和讨论。对于组织而言，可能不再需要进行调查，民意调查和焦点人群来收集公众意见，因为有大量此类信息可以公开获得。近年来，我们见证了在社交媒体上发表有见地的言论，有助于重塑企业，影响公众的情绪和情感，这对我们的社会和政治体系产生了深远的影响。这些帖子也动员了民众参与政治变革，例如2011年在某些阿拉伯国家发生的政治变革。因此，收集和研究观点成为了必要。

然而，由于各种网站的激增，在网上查找和监测意见网站并提取其中的信息仍然是一项艰巨的任务。每个站点通常包含大量的意见文本，且在长博客和论坛帖子中不易被破译，普通读者很难识别相关的网站，也很难提取和总结其中的观点。因此需要自动情绪分析系统。正因为如此，许多公司都专注于提供情绪分析服务，这些实际应用和行业兴趣为情绪分析的研究提供了强大的动力。

现有研究已经产生了可用于情感分析多项任务的大量技术，包括监督和无监督方法。在监督方法中，早期论文使用所有监督机器学习方法（如支持向量机、最大熵、朴素贝叶斯等）和特征组合。无监督方法包括使用情感词典、语法分析和句法模式的不同方法。

大约十年前，深度学习成为强大的机器学习技术，在很多应用领域产生了当前最优的结果，包括计算机视觉、语音识别、NLP 等。近期将深度学习应用到情感分析也逐渐变得流行。本文首先概述深度学习，然后对基于深度学习的情感分析进行综述。

三、神经网络

深度学习是人工神经网络（简称神经网络）在多层网络学习任务中的应用，它可以充分发挥神经网络的学习（表示）能力，以前人们认为神经网络只有一层或两层，数据量很小。

受生物大脑结构的启发，神经网络由大量的信息处理单元（称为神经元）组成，这些信息处理单元层层组织、协同工作。可以通过调整神经元之间的连接权重来学习执行任务（例如分类），类似于生物大脑的学习过程。

图1：前馈神经网络

基于网络拓扑结构，神经网络一般可以分为前馈神经网络和递归神经网络，它们也可以混合和匹配，我们稍后将描述循环神经网络。图1给出了一个前反馈神经网络的简单例子，有 $L_{1}$ ， $L_{2}$ 和 $L_{3}$ 三层组成。 $L_{1}$ 为输入层，对应于输入向量 $\left ( x_{1},x_{2},x_{3} \right )$ 和截距。 $L_{3}$ 是输出层，对应于输出向量 $\left ( s_{1} \right )$ 。 $L_{2}$ 为隐藏层，其输出作为网络输出不可见。 $L_{1}$ 中的节点代表的是输入向量中的元素， $L_{2}$ 或 $L_{3}$ 中的节点代表的是神经元，是神经网络的基本计算单元，我们还称之为激活函数。两个神经元之间的线表示信息流的连接。每个连接都与权重相关联，权重是一个值，用于控制两个神经元之间的信号。神经网络的学习是通过调整神经元之间的权值来实现的。神经元读取前一层神经元的输出作为输入，进行详细的处理，然后输出到下一层神经元。如图1所示，神经网络根据训练示例 $\left ( x^{\left ( i \right )} ,y^{\left ( i \right )}\right )$ 调整权重，当训练过程结束，将会得到一个适合数据的复杂假设 $h_{w,b}\left ( x \right )$ 。

在隐藏层中，我们可以看到每个神经元的输入都为 $x_{1},x_{2},x_{3}$ 和截距+1，并通过激活函数输出一个值： $f\left ( W^{t}x \right ) = f\left ( \sum_{i=1}^{3}w_{i}x_{i}+b \right )$ ， $w_{i}$ 为连接权重；为截距或偏置；通常为非线性激活函数。一般可选sigmoid函数、双曲正切函数(tanh)、ReLU函数。

Sigmoid函数接受一个实值，并将其映射到0到1之间。这个函数十分常见，因为它很好地解释了神经元的放电率：0表示不放电，1表示放电。但Sigmoid的非线性也有不足，因为它的激活很容易在0或1的尾部饱和，那里梯度几乎为零，信息流将被切断。此外，它的输出不是零中心的，这可能会在训练中对连接权值的梯度更新中引入不希望的曲折动力学。因此，由于tanh函数的输出范围是以零为中心的，[-1，1]而不是[0，1]，因此它在实际中通常更受青睐。ReLu函数最近也很流行，当输入小于0时，其激活仅在0处设置阈值。与Sigmoid函数和tanh函数相比，ReLu计算简单，训练收敛快，在神经网络中的性能更好。

在 $L_{3}$ 输出层，我们可以用Softmax函数作为神经元，它是Logistic函数的一般化，将任意实数值的k维向量映射至 $\left ( 0,1 \right )$ 范围内的实值的k维向量(它们的和为1)。函数定义如下：

通常，在前馈神经网络的最后一层使用softmax进行最终分类。

通过连接所有的神经元，图1的神经网络参数为 $\left ( W,b \right ) = \left ( W^{(1)},b^{(1)},W^{(2)},b^{(2)} \right )$ ，其中 $W_{ij}^{(l)}$ 表示层中神经元与层神经元之间的连接权重， $b_{i}^{(l)}$ 表示与中神经元相关的偏置。

通常采用反向传播随机梯度下降来最小化交叉熵损失的方法来训练神经网络。首先计算损失函数相对于最后一个隐藏层到输出层的权重的梯度，然后通过反向方式应用链式规则来递归计算表达式相对于上层网络层之间权重的梯度。利用这些梯度，相应的调整层之间的权重，直到满足某些停止条件，这是一个反复优化的过程，图1中训练神经网络的伪代码如下。

表1：训练图1中的神经网络伪代码

上述算法可推广到具有多个隐藏层的一般前馈神经网络的训练中。随机梯度下降估计每个训练实例的参数，而不是批量梯度下降。因此参数更新具有较高的方差，有助于发现新的且可能更好的局部最小值。

四、深度学习

20世纪90年代末，研究界对神经网络失去了兴趣，主要是因为它们被认为只适用于“浅层”神经网络（具有一层或两层的神经网络），因为训练“深层”神经网络（具有更多层的神经网络）是复杂的，并且计算非常昂贵。

然而，在过去的10年里，深度学习在许多应用领域取得了突破性进展，并产生了最新的成果，从计算机视觉到语音识别，再到最近的nlp。神经网络的复兴可以归因于许多因素。最重要的因素包括：

硬件（如gpu）的进步带来的计算能力的可用性；
大量训练数据的可用性；
学习中间表示的能力和灵活性。

简言之，深度学习使用多层非线性处理单元的级联来进行特征提取和转换。靠近数据输入的较低层学习简单的特征，而较高层学习从较低层特征派生的更复杂的特征。体系结构形成了一个层次化的、功能强大的特征表示。图2显示了通过人脸图像分类中的深度学习从左（较低层）到右（较高层）的特征层次。我们可以看到，学习的图像特征的复杂性增长，从斑点/边缘，然后鼻子/眼睛/脸颊、脸。

图2：深度学习的特征层次

近年来，深度学习模型在非线性规划领域得到了广泛的应用，显示出巨大的潜力。在接下来的几节中，我们将简要介绍应用于NLP任务的主要深度学习体系结构和相关技术。

五、词嵌入

NLP中的许多深度学习模型都需要将词嵌入的结果作为输入特征。词嵌入是一种用于语言建模和特征学习的技术，它将词汇中的单词转换为连续实数的向量(例如：词)。该技术通常涉及从高维稀疏向量空间（例如，one-hot编码向量空间，其中每个单词都具有维）的数学嵌入到低维密集向量空间。嵌入向量的每个维度表示单词的一个潜在特征，向量可以编码语言的规律和模式。

可以使用神经网络或矩阵分解来学习词嵌入。一种常用的词嵌入系统是Word2Vec，它本质上是一种计算效率高的神经网络预测模型，可从文本中学习词嵌入，它包含连续词袋模型(CBOW)和Skip-Gram模型(SG)。CBOW模型根据其上下文词（“男孩是_帽子”，其中“ _”表示目标词）预测目标词（例如“穿着”），而SG模型进行反演，给定目标词来预测上下文词。从统计上讲，CBOW模型通过将整个上下文视为一个观察值，从而平滑了大量分布信息，对较小的数据集有效。而SG模型将每个上下文目标对视为新的观察结果，并且对于较大的数据集而言更好。另一种常用的学习方法是全局向量（GloVe），它在全局词-词共现矩阵的非零条目上进行训练。

图4：CBOW模型图5： Skip-Gram模型

六、自动编码器和去噪自动编码器

自编码器神经网络是一个三层神经网络，它将目标值设置为等于输入值。图6显示了自动编码器体系结构的示例。

图6：自编码器神经网络

给定输入向量 $x\in [0,1]^{d}$ 。首先，自编码器通过编码函数 $h(\cdot )$ (例如Sigmoid函数)将其映射到潜在表示 $y\in [0,1]^{d}$ 。其次，潜在表示由解码函数 $g(\cdot )$ 映射回重构。通常对自动编码器进行训练，以最大程度地减少重构误差。自动编码器的目的是学习输入的表示形式，即隐藏层的激活。由于具有非线性函数 $h(\cdot )$ $ℎ(\cdot )$ 和 $g(\cdot )$ ，自动编码器能够学习非线性表示，这使其比线性表示具有更多的表达能力，例如主成分分析（PCA）或潜在语义分析（LSA）。

若我们将自编码器以层级的形式堆叠，那么高层的自编码器就使用低层自编码器的输出作为输入。这种堆叠的自编码器与受限玻尔兹曼机（RBM）是构建深度神经网络的早期方法。一旦我们以无监督的方式训练自编码器，那么描述（中间表示）多级表征的参数就可以用来初始化一个有监督的深层神经网络，这种神经网络在实验上已经证明要比随机初始化更好。

去噪自动编码器（DAE）是自动编码器的扩展，其中输入向量被随机转换为向量 $\tilde{x}$ 。并且训练模型去噪，即最小化去噪重建误差。DAE背后的思想是驱使隐藏层发现更健壮的特性，并防止它简单地学习恒等变换。即使在存在噪声的情况下，模型也应该能够很好地重构输入。例如，从文档中删除或添加一些单词不应更改文档的语义。

七、卷积神经网络

卷积神经网络（CNN）是一种特殊类型的前馈神经网络，最初用于计算机视觉领域。它的设计灵感来自人类视觉皮层，这是动物大脑中的一种视觉机制。视觉皮层包含许多细胞，这些细胞负责检测视野中小的重叠的分支中的光，这些分支称为感受野。这些单元格充当输入空间上的局部过滤器。 CNN由多个卷积层组成，每个卷积层都执行由视觉皮层中的细胞处理的功能。

图7显示了用于识别交通标志的CNN。输入为32x32x1像素图像（32 x 32表示图像宽度x高度； 1表示输入通道，彩色RGB通道为3）。第一阶段，使用卷积核或滤波器（尺寸为5x5x1）扫描图像。卷积核或滤波器投影到的输入图像中的每个区域都是一个接收场。滤波器实际上是一个数字数组（称为权重或参数）。当窗口滑动（或卷积）时，它会将其权重值与图像的原始像素值相乘（逐元素乘法）。乘法全部加起来为一个数字，代表接收场，每个接受领域都会产生一个数字。滤波器完成对图像的扫描后，我们可以获得一个数组（大小为28x28x1），称为激活图或特征图。在CNN中，我们需要使用不同的滤波器来扫描输入。在图4中，我们应用了108种滤波器，因此在第一阶段具有108个堆叠的特征图，该图由第一卷积层组成。在卷积层之后，通常使用子采样（或池化）层来逐渐减少表示的空间大小，从而减少特征的数量和网络的计算复杂度。例如，在第一阶段进行子采样后，卷积层尺寸减小为（14x14x108）。注意，虽然每个特征映射的维数降低，但子采样步骤保留最重要的信息，常用的子采样操作是最大池。然后，第一级的输出变为第二级的输入，并使用新的滤波器。新的滤波器大小是5x5x108，其中108是最后一层的特征图大小。在第二阶段之后，CNN使用完全连接层，然后使用带有输出类的SoftMax读出层进行分类。

卷积层在CNN中起到了特征提取的作用，由于卷积层限制了隐藏层的接收场是局部的，所以卷积层可以提取局部特征。这意味着CNN通过增强相邻层神经元之间的局部连接模式，具有特殊的空间局部相关性，这种特征对于MLP中的分类是有用的，在NLP中我们期望找到关于类成员的强局部线索，但是这些线索可以出现在输入中的不同位置。例如，在文档分类任务中，单个关键字短语（或N-Gram）可以帮助确定文档的主题。我们希望了解，某些单词序列是主题的良好指标，不一定关心它们在文档中的位置。卷积层和池化层允许CNN学习寻找这样的局部指标，而不管它们的位置如何。

图7：卷积神经网络

为了理解卷积层，下图展示了卷积核或滤波器（filter）将当前层级上的一个子结点张量转化为下一层神经网络上的一个长和宽都为 1，深度不限的结点矩阵。下图输入是一个 32×32×3 的张量，中间的小长方体为卷积核，一般可以为 3×3 或 5×5 等，且因为要计算乘积，那么卷积核的第三个维度必须和其处理的图像深度（即输入张量第三个维度 3）相等。最右边的矩形体的深度为 5，即前面使用了五个卷积核执行卷积操作。这五个卷积核有不同的权重，但每一个卷积层使用一个卷积核的权重是一样的，所以下图五层特征中每一层特征都是通过一个卷积核得出来的，也就是该层共享了权重。

图8：卷积核

八、循环神经网络

循环神经网络（RNN）是一种神经元之间形成有向循环的神经网络。与前馈神经网络不同，RNN可以利用其内部的“存储器”来处理一系列输入，这使得它在处理序列信息方面很受欢迎。“内存”是指RNN对序列中的每个元素执行相同的任务，每个输出都依赖于先前的所有计算，这就像“记住”到目前为止所处理的信息一样。

一个典型的RNN结构如下：

图9：RNN结构

图10展示了RNN的示例，其中左图是一个带有循环折叠网络，而右图是带有三个时间步长的折叠序列网络。时间步长取决于输入的长度。例如，如果要处理的单词序列是六个单词的句子，则RNN将展开为具有六个时间步长或层的神经网络，一层对应一个单词。

图10：循环神经网络

在图10中， $x_{t}$ 是时间序列上的输入向量， $h_{t}$ 是时间序列的隐藏状态，它是根据先前的隐藏状态和当前时间步长的输入计算得出的。我们看到重复作用于不同时间步上的隐藏状态，并将它传入下一个时间步中，这就是 RNN特有的方式。基本上，你能输入句子中的词或者甚至是像 $x_{t}$ 这样的字符串中的字符，然后通过该循环神经网络它会得出一个 $y_{t}$ 。

在等式(5)中，激活函数通常是tanh函数或ReLu函数。其中， $w^{hx}$ 是用于调节输入 $x_{t}$ 的权重矩阵， $w^{hh}$ 是用于调节先前隐状态 $h_{t-1}$ 的权重矩阵。

在等式(6)中， $y_{t}$ 是步骤词汇表上的输出概率分布。例如：如果我们要预测句子中的下一个单词，那么它将是整个单词词汇量的概率向量。 $h_{t}$ 被看作整个神经网络的“记忆”，它捕获先前所有步中发生的信息。 $y_{t}$ 由在时间时的“记忆”—— $h_{t}$ 与相应的权重矩阵 $w^{hx}$ 计算得出。目标是用 $y_{t}$ 作为输出，并将它与你的测试数据（通常是原始数据的一个小子集）比较。然后你会得出你的误差率。比较完之后，有了误差率，你就能使用一种叫随时间反向传播（BPTT）的技术。BPTT 返回检查这个网络，并基于误差率调整权重。这样也调整了这个网络，并让它学习去做得更好。

前馈神经网络在每一层使用不同的参数，而RNN在所有步骤中共享相同的参数 $\left ( W^{hx} ,W^{hh},W^{yh}\right )$ ，即参数共享。这意味着每个步骤执行相同的任务，只是输入不同，学习参数大大减少。

从理论上讲，RNN可以按任意长序列使用信息，但是在实践中，由于梯度消失或梯度梯度问题，标准RNN仅限于回溯有限序列。

图11：双向RNN（左）和深度双向RNN（右）

研究人员基于RNN已经开发了更复杂的循环神经网络，以弥补标准RNN模型的不足：双向RNN、深度双向RNN和长短期记忆网络(LSTM)。双向RNN思想：每次的输出不仅取决于序列中的前一个元素，而且还取决于序列中的下一个元素。例如，要预测序列中的遗漏单词，我们可能需要查看上下文信息。双向RNN由两个RNN组成，一个RNN按原始顺序处理输入，另一个RNN按相反的顺序处理输入，然后根据两个RNN的隐状态计算输出。深度双向RNN与双向RNN相似。唯一的区别是，每个时间序列具有多个层次，这提供了更高的学习能力，但需要大量的训练数据。图11分别显示了双向RNN和深度双向RNN（具有两层）的示例。

九、LSTM网络

长-短期记忆网络（LSTN）25是一种特殊类型的RNN，能够学习长期依赖关系。

所有RNN都具有重复模块链的形式。在标准RNN中，此重复模块通常具有简单的结构。但是，用于LSTM的重复模块更加复杂。而不是只有一个神经网络层，而是有四个以特殊方式交互的层。此外，它具有两种状态：隐藏状态和单元状态。

图12：长-短期记忆网络

如图12所示，在时间t，LSTM首先确定从单元状态转储哪些信息，由Sigmoid函数/ $\sigma$ 层来实现，称之为“遗忘门”。该函数由 $h_{t-1}$ (上一隐藏层的输出)和 $x_{t}$ (当前输入)以及参数矩阵组成，计算结果为0或1。其中等式（7）中1表示“完全保留”，0表示“完全转储”。

然后，LSTM决定要在单元状态下存储哪些新信息，可分为两个步骤：

被称为“输入门”的Sigmoid函数/层（如公式（8））决定LSTM将更新哪些值。
tanh函数/层创建新候选向量 $\tilde{C_{t}}$ ，这将被添加到单元状态， LSTM将这两者结合更新状态。

对于单元状态 $C_{t}$ 的更新，如等式(10)所示。我们可以通过控制“忘记门”的渐变，并允许“memory”的删除和更新，这可以缓解标准RNN中的梯度消失或梯度爆炸问题。

最后，LSTM根据单元状态决定输出。如等式(11)所示，通过 $\sigma$ 层决定输出单元状态的哪些部分，称之为“输出门”。如等式(12)所示，再通过tanh函数与Simoid层的输出相乘，得到隐状态 $h_{t}$ 。

LSTM通常应用于序列化数据，但也可以用于树状数据。 Tai等引入了标准LSTM到树型LSTM（Tree-LSTM）的泛化，并显示了比标准LSTM更好的表示句子含义的性能。

门控循环单元（GRU）它将“忘记”和“输入”门合并为一个更新，还合并了单元状态和隐藏状态，并进行了其他一些更改。生成的模型比标准LSTM模型更简单，并且已经越来越流行。

十、基于注意力机制的循环神经网络

一般来说，我们可能会认为双向 RNN 与 LSTM 就能处理数据中的长期依赖性。但是在实践中，时序数据的长期依赖性问题仍然很难处理。因此，Bahdanau 等人提出了注意力机制。

神经网络中的注意力机制受到人类视觉中注意力的启发，即人类视觉注意力能够聚焦到图像的特定区域，并在这个区域有非常高的分辨率，而在其它区域有较低的分辨率。在自然语言处理中，注意力机制允许模型根据输入文本以及它到目前为止已经生成的隐藏状态来学习要注意什么，而不像标准 RNN 与 LSTM 那样将全部原文本编码成固定长度的向量。

下图13展示了在双向 RNN 中使用注意力机制的方法。其中每个解码器输出的序列 $y_{t}$ 取决于所有输入状态的加权组合，而不只是如标准情况那样选择最后一个隐藏状态。 $a_{t,T}$ 是权重，用于定义应为每个输出对每个输入状态中的多少进行加权。例如， $a_{2,2}$ 有较大的值，那么它就代表着在生成目标句子的第二个时间步上，解码器会将更多注意力放在原语句中的第二个隐藏状态。所有的权重 $a_{t,T}$ 和为 1，因此能保证输出值的归一化。

图13：基于注意力机制的双向RNN

十一、记忆网络

Weston 等人介绍了记忆网络（MemNN）这个概念，它能用于问答系统。记忆网络通过结合多个推断组件和长期记忆而执行任务，这些组件可以是多个神经网络，而长期记忆充当着动态知识库的角色。记忆网络基本的四个可学习或推断组件分别为：I 组件将输入数据转化为内部特征表示；G 组件在给定新的输入下更新旧的记忆；O 组件生成输出（同样是在特征表示空间中完成）；R 组件将输出特征转化为响应格式。

例如，给定问答系统一系列语句和问题，MemNN 会从这些语句中抽取特征并生成答案。在推断的过程中，I组件一次只读取一条语句，并将它编码为向量表征。然后G组件基于当前的语句表征更新一小块记忆，在所有语句都处理完后，记忆网络就生成了一个记忆矩阵（每一行表示一个语句），该矩阵储存了从语句中抽取的语义。对于问题，记忆网络会将它编码为向量表征，然后 O组件使用向量从记忆中选择一些相关的证据，并生成一个输出向量。最后R组件将输出向量作为输入，并输出最终响应。

Sukhbaatar等基于MemNN提出了End-to-End存储网络（MemN2N），它是一种神经网络体系结构，在长期存储组件上具有循环注意力机制，可以通过标准反向传播以端到端的方式对其进行训练。它证明了O组件中的多个计算层（跳数）比单个层可以发现更多的抽象证据，并为问题回答和语言建模提供了改进的结果。值得注意的是，每个计算层都可以是基于内容的注意力模型。因此，MemN2N在某种程度上完善了注意力机制。还应注意类似的想法是Graves等报道的神经图灵机。

十二、递归神经网络

递归神经网络(RecNN)是一种特殊的神经网络，通常用于从数据中学习有向无环图结构(如：树形结构)。

递归神经网络可以看作是循环神经网络的概括。给定句子的结构表示形式（例如，语法分析树），RecNN通过结合标记以生成短语的表示形式（最终是整个句子），以自下而上的方式递归生成父代表示形式，句子级别表示然后可以用于给定输入句子进行最终分类（例如，情感分类）。RecNN中向量合成的示例过程如图9 33所示，节点“very interesting”的向量由节点“very”和节点“interesting”的向量组成。类似地，节点“is very interesting”由短语节点“very interesting”和单词节点“is”组成。

图14：卷积神经网络

词嵌入是将单词表示成低维的稠密的实数向量。自从词向量技术的提出，到目前为止已经有很多方法来得到句法和语义方面的向量表示，这种技术在 NLP 领域发挥着重要的作用。

如何用稠密的向量表示短语，这是使用词向量的一个难题。在成分分析中，我们一般使用递归神经网络 (Recursive Neural Network) 来解决这个问题。递归神经网络是一种通用的模型，用来对句子进行建模。句子的语法树中的左右子节点通过一层线性神经网络结合起来，根节点的这层神经网络的参数就表示整句句子。递归神经网络能够给语法树中的所有叶子节点一个固定长度的向量表示，然后递归地给中间节点建立向量的表示。

十三、情感分析

我们现在开始概述情感分析中的深度学习应用。但在此之前，我们首先简单介绍主要的情感分析任务。若想了解更多细节，请参考 Liu 写的关于情感分析的书。

研究者主要在三个粒度级别上研究情感分析：文档级、语句级和方面级。文档级情感分类将观点鲜明的文档（例如，产品评论）分类为整体积极的或消极的观点。它将整个文档当做基本的信息单元，并假定文档是观点鲜明的，包含对单个实体（例如，某个型号的手机）的观点。语句级情感分类对文档内单独的语句进行分类。然而，单独的语句不能假定为观点鲜明的。

传统上，人们首先将一个语句分类为观点鲜明的（或相反），即主观性分类。然后观点鲜明的语句进一步被分类为积极的或消极的。语句级情感分类可以被形式化为三类分类问题，即判断某语句是中性的、积极的或消极的。和文档级、语句级情感分类相比，方面级情感分析或基于方面的情感分析更加细粒化。它的任务是提取和总结人们对某实体的观点以及实体（也被称为目标）的特征。。例如一篇产品评论，方面级情感分析的目的是分别总结对产品不同方面的积极和消极观点，虽然对产品的总体情感可能是倾向积极的或消极的。

基于方面级的情感分析由多个子任务构成，例如方面提取、实体提取和方面情感分类。例如，句子「the voice quality of iPhone is great, but its battery sucks」的实体提取应该识别「iPhone」作为实体，而 aspect 提取需要识别「voice quality」和「battery」作为两个 aspect。aspect level 情感分类需要将对音质的评论分类为积极的，将对电池续航的评论分类为消极的。出于简洁性，大多数算法将 aspect 提取和实体提取结合起来，称为 aspect 提取或情感/观点目标提取。

除了这些核心任务，情绪分析还研究情绪分析，嘲讽检测，多模态情感分析等。有关更多详细信息，请参见Liu的书。在以下各节中，我们将调查深度学习在所有这些情绪分析任务中的应用。

十四、文档级情感分类

文档级情感分类是指为观点型文档标记整体的情感倾向或极性，即确定文档整体上传达的是积极的还是消极的观点。因此，这是一个二元分类任务，也可以形式化为回归任务，例如为文档按 1 到 5 星评级，一些研究者也将其看成一个五类分类任务。

情感分类通常被当做文档分类的特殊案例。在这种分类任务中，文档表征是很重要的部分，需要反映出文档字里行间所传达的原始信息。传统上，词袋模型（BoW）通过将文档看成其中单词的袋装形式，被用于在 NLP 和文本挖掘中生成文本表征。通过 BoW，文档被转换成固定长度的数值特征向量，其中每个元素可能代表词的存在（没出现或出现）、词频或 TF-IDF 分数。向量的维度等于词汇量大小。用 BoW 表征的文档向量通常是很稀疏的，因为单个文档仅包含少量的词汇。早期的神经网络使用的基本是这种特征设定。

虽然 BoW 很常用，它也有一些缺点。首先，BoW 模型忽略词的顺序，这意味着包含相同单词的两个文档的表征是完全相同的。BoW 的扩展版本 Bag-of-N-Grams 在短文本（n-gram）中考虑词序，但仍然存在数据稀疏性和高维度的缺陷。其次，BoW 几乎不能编码词的语义。例如，在 BoW 中，单词「smart」、「clever」和「book」之间的距离是相同的，但在语义上，相比「book」、「smart」应该更接近于「clever」。

为了克服 BoW 的缺陷，人们提出了基于神经网络的词嵌入技术以生成密集向量（或低维向量）用于词表征，从而在某种程度上可以编码单词的某些语义和句法属性。以词嵌入作为词的输入，可以利用神经网络得到文档的密集向量（或称为密集文档向量）表征。

请注意，除了以上两种方法（即使用BoW并通过词嵌入来学习文档的密集向量）之外，还可以直接从BoW中学习密集文档向量。我们在表2中区分了相关研究中使用的不同方法。

当文档被适当地表征时，我们可以通过传统的监督学习方式，用多种神经网络模型进行情感分类。在某些案例中，神经网络可能只被用于提取文本特征或文本表征，然后这些特征被馈送到其它非神经网络的分类器（如 SVM），以获得最终的全局最优分类器。神经网络和 SVM 的特性以某种方式彼此互补，从而能结合各自的优势。

除了复杂的文档/文本表征之外，研究者还利用数据特征（如产品评论）进行情感分类。一些研究者发现产品评论对情感和其它附加信息（例如，用户信息和产品信息）进行联合分类建模很有帮助。此外，由于文档通常包含长期依赖关系，注意力机制也经常用于文档级情感分类。我们在表 2 中总结了已有的技术。

表2：文档级情感分类的深度学习方法

下面，我们还简要介绍了这些现有的代表性作品。

Moraes等对文档级别的情感分类在支持向量机（SVM）和人工神经网络（ANN）之间进行了实证比较，这表明ANN在大多数情况下都比SVM结果理想。
为了克服BoW的缺点，Le和Mikolov提出了Paragraph Vector，这是一种无监督的学习算法，用于学习可变长度文本（例如句子，段落和文档）的矢量表示。通过在从段落中采样的上下文中预测周围的单词来学习矢量表示。
Glorot等研究了用于情感分类的领域适应问题。他们提出了一种基于带有稀疏整流器单元的堆叠式降噪自动编码器的深度学习系统，该系统可以使用标记和未标记的数据执行无监督的文本特征/表示提取。这些功能对于情感分类器的域适应非常有益。
Zhai和Zhang引入了一种半监督自动编码器，该编码器在学习阶段进一步考虑了情感信息，以便获得更好的文档矢量进行情感分类。更具体地，该模型通过将自动编码器中的损失函数放宽到Bregman发散并从标签信息中导出判别损失函数来学习文本数据的特定于任务的表示。
Johnson和Zhang提出了一个名为BoW-CNN的CNN变体，该变体在卷积层中采用了词袋转换。他们还设计了一种称为Seq-CNN的新模型，该模型通过将多个单词的one-hot向量进行级联来保留单词的顺序信息。
Tang等提出了一个神经网络来学习文档表示，并考虑了句子之间的关系。它首先从单词嵌入中学习使用CNN或LSTM的句子表示。然后，使用GRU对文档表示中的句子语义及其固有关系进行自适应编码，以进行情感分类。
Tang等在评论分类中应用了用户表示形式和产品表示形式。想法是，这些表示可以捕获重要的全球线索，例如用户的个人喜好和产品的整体质量，从而可以提供更好的文本表示。
Chen等人还结合了用户信息和产品信息以进行分类，但要注意单词和句子级别，这可以考虑单词级别和语义级别的全局用户偏好和产品特性。同样，Dou使用深层内存网络来捕获用户和产品信息。提议的模型可以分为两个单独的部分。在第一部分中，LSTM用于学习文档表示。在第二部分中，由多个计算层（跃点）组成的深度存储网络用于预测每个文档的审阅等级。
Xu等人提出了一种缓存的LSTM模型，以捕获长文本中的整体语义信息。模型中的内存分为具有不同遗忘率的几组。直觉是使遗忘率低的内存组捕获全局语义特征，而遗忘率高的内存组学习局部语义特征。
Yang等人提出了一种层次化的注意力网络，用于评价评论的文档级情感等级。该模型包括两个级别的注意力机制：一个在单词级别，另一个在句子级别，这使模型在构建文档表示时可以或多或少地关注单个单词或句子。
Yin等人将文档级别的方面情感评分预测任务制定为机器理解问题，并提出了一种基于交互注意的分层模型。具体而言，将文档和伪方面的问题交织在一起，以学习可识别方面的文档表示。
Zhou等人设计了基于注意力的LSTM网络，用于在文档级别进行跨语言情感分类。该模型由两个用于双语表示的基于注意力的LSTM组成，每个LSTM也是层次结构的。在这种情况下，它可以有效地将情感信息从资源丰富的语言（英语）调整为资源贫乏的语言（中文），并有助于提高情感分类性能。
Li等人提出了一种在转移学习环境中用于跨域情感分类的对抗性存储网络，其中来自源域和目标域的数据被一起建模。它联合训练两个网络进行情感分类和领域分类（即文档来自源域还是目标域）。

十五、语句级情感分类

句子级别的情感分类是确定单个给定句子中表达的情感。如前所述，可以用主观性分类和极性分类来推断句子的情感，其中前者对句子是主观还是客观进行分类，而后者则判定主观句子是表达消极或积极的情感。在现有的深度学习模型中，句子情感分类通常会形成一个联合的三类别分类问题，即预测句子为积极、中立或消极。

与文档级的情感分类相同，神经网络生成的语句表征对于语句级的情感分类也非常重要。另外由于句子相对文档而言较短，因此可以使用一些语法和语义信息（如解析树、观念词典和词性标签）来帮助分类。其他一些信息如评测打分、社会关系和跨域信息也可以考虑在内。例如，社会关系已被用于探索社交媒体数据中（如Twitter）的情感

在早期的研究中，解析树（提供了一些语义和语法信息）与原始词一同用作神经模型的输入，这意味着我们可以更好地推断情感构成。但在那之后，CNN 和 RNN 成为主流，它们不需要利用解析树从句子中提取特征。取而代之的是，CNN 与 RNN 使用词嵌入（已经编码了一些语义和语法信息）作为输入。此外，CNN 和 RNN 模型架构也可以帮助我们学习语句内词间的固有联系。

下面，我们还简要介绍了这些现有的代表性作品。

Socher等人首先提出了一种半监督递归自动编码器网络（RAE），用于句子级别的情感分类，从而获得了句子的降维矢量表示。后来，Socher等人提出了矩阵向量递归神经网络（MV-RNN），其中每个单词还与树结构中的矩阵表示（除了矢量表示）相关联。树结构是从外部解析器获得的。在Socher等人中，作者进一步介绍了递归神经张量网络（RNTN），其中基于张量的合成函数用于更好地捕获元素之间的相互作用。 Qian等人提出了两个更高级的模型，即标签指导的递归神经网络（TG-RNN），该模型根据短语的词性标签选择合成函数；以及嵌入标签的递归神经网络/递归神经Tenser。网络（TE-RNN / RNTN），它学习标签嵌入，然后将标签和单词嵌入组合在一起。
Kalchbrenner等人提出了一种动态CNN（称为DCNN），用于句子的语义建模。 DCNN使用动态K-Max池化运算符作为非线性子采样函数。网络诱导的特征图能够捕获单词关系。 Kim还建议使用CNN进行句子级情感分类，并尝试了几种变体，例如CNN-rand（随机嵌入单词嵌入），CNN静态（其中单词嵌入经过预训练和固定），CNN非静态（其中对词嵌入进行了预训练和微调）和CNN多通道（其中使用了多组词嵌入）。
Dos Santos和Gatti提出了“从句到句子”的CNN（CharSCNN）模型。 CharSCNN使用两个卷积层从任意大小的单词和句子中提取相关特征，以对短文本进行情感分析。 Wang等通过在撰写过程中模拟单词的交互作用，将LSTM用于Twitter情感分类。与简单循环神经网络中的加性运算相比，通过门结构在词嵌入之间进行乘法运算可提供更大的灵活性并产生更好的构图结果。与双向RNN相似，通过允许隐藏层中的双向连接，可以将单向LSTM扩展为双向LSTM。
Wang等人提出了一种区域CNN-LSTM模型，该模型由两部分组成：区域CNN和LSTM，以预测文本的价位激发等级。
Wang等人描述了CNN和RNN的联合架构，用于短文本的情感分类，它利用了CNN生成的粗粒度局部特征和通过RNN学习的长距离依赖性。
Guggilla等人提出了一种基于LSTM和CNN的深度神经网络模型，该模型利用word2vec和语言嵌入进行索赔分类（将句子分类为事实还是感觉）。
Huang等人建议在树型LSTM中编码语法知识（例如，词性标签），以增强短语和句子的表示能力。
Akhtar等人提出了几种基于多层感知器的集成模型，用于对金融微博和新闻进行精细的情感分类。
Guan等人将弱监督的CNN用于句子（以及方面）级别的情感分类。它包含两个步骤的学习过程：首先学习由总体评论评分弱监督的句子表示形式，然后使用句子（和方面）级别标签进行微调。
Teng等人基于简单的加权和模型，提出了一种基于上下文敏感词典的情感分类方法，该方法使用双向LSTM学习在组合句子的情感值时的情感强度，强化和否定。
Yu和Jiang研究了学习通用句子嵌入以进行跨域句子情感分类的问题，并设计了一个包含两个分离的CNN的神经网络模型，该模型从标记和未标记的数据中共同学习两个隐藏的特征表示。
Zhao等人通过利用用户发布的推文及其社交关系的深层语义表示，介绍了一种针对随机发推文的情感分类的递归随机游走网络学习方法。
Mishra等人利用CNN从阅读文字的人类读者的眼动（或注视）数据中自动提取认知特征，并将其用作丰富的特征以及用于情感分类的文本特征。
Qian等人针对此任务提出了一种语言正则化的LSTM。所提出的模型将诸如情感词典，否定词和强度词之类的语言资源结合到LSTM中，以便更准确地捕获句子中的情感效果。

十六、方面级分类

与文档级别和句子级别的情感分类不同，方面级别的情感分类会同时考虑情感和目标信息，因为情感始终具有目标。如前所述，目标通常是实体或实体方面。为简单起见，实体和方面通常都只称为方面。给定一个句子和一个目标方面，方面级别的情感分类旨在推断句子对目标方面的情感极性/方向。例如，在句子“屏幕非常清晰，但电池寿命太短”中。如果目标方面为“屏幕”，则情绪为肯定，而目标方面为“电池寿命”，则为否定。我们将在下一节中讨论方面提取或目标提取。

方面级情感分类很有难度，因为建模目标与上下文的语境词的语义相关性很难。不同的语境词对句子在目标特征的情感极性有不同的影响。因此，使用神经网络构建学习模型时，捕捉目标词和语境词之间的语义关系非常必要。

使用神经网络的 aspect level 情感分类有三个重要任务。第一个任务是表示目标的语境词。该问题可以使用前两节提到的文本表示方法来解决。第二个任务是生成目标表示，其可与语境词进行恰当地互动。通常的解决方案是学习目标嵌入（与词嵌入类似）。第三个任务是识别特定目标的重要情感语境词。例如，在句子「the screen of iPhone is clear but batter life is short」中，「clear」是「screen」的重要语境词，「short」是「battery life」的重要语境词。近期该任务通过注意力机制得到解决。尽管很多深度学习技术可用于处理 aspect level 情感分类，但文献中仍然没有主导性技术。

Dong等人针对目标相关的Twitter情感分类提出了一种自适应递归神经网络（AdaRNN），该方法学会根据上下文和句法结构向目标传播单词的情感。它将根节点的表示形式用作特征，并将其馈入softmax分类器以预测各个类的分布。
Vo和Zhang通过利用丰富的自动功能研究了基于方面的Twitter情感分类，这是使用无监督学习方法获得的其他功能。该论文表明，多个嵌入，多个池化功能和情感词典可以提供丰富的特征信息来源，并有助于提高性能。
由于LSTM可以更灵活地捕获目标与其上下文词之间的语义关系，因此Tang等人提出了目标相关LSTM（TD-LSTM）和目标连接LSTM（TC-LSTM）来通过考虑目标来扩展LSTM。他们将给定的目标视为特征，并将其与上下文特征进行关联，以进行方面情感分类。
Ruder等人提出将分层和双向LSTM模型用于方面级别的情感分类，该模型能够利用句子内和句子间的关系。评论中对句子及其结构的唯一依赖使所提出的模型与语言无关。单词嵌入被输入到句子级别的双向LSTM中。向前和向后LSTM的最终状态与目标嵌入一起串联在一起，并馈入双向查看级别的LSTM。在每个时间步，将向前和向后LSTM的输出连接起来并馈入最后一层，最后一层输出情绪上的概率分布。
考虑到Dong等人和Vo和Zhang的工作局限性，Zhang等人提出了一个句子级神经模型来解决池化功能的弱点，该模型没有明确地对推文级语义进行建模。为此，提出了两个门控神经网络。首先，双向门控神经网络用于在推文中连接单词，以便可以在隐藏层而不是单词上应用合并功能，以更好地表示目标及其上下文。其次，使用三向门控神经网络结构来建模目标提及与其周围环境之间的交互，通过使用门控神经网络结构来建模封闭推文的语法和语义以及两者之间的交互来解决局限性。周围的环境和目标。闸门神经网络已被证明可以通过更好地传播梯度来减少标准循环神经网络对序列末端的偏见
Wang等人提出了一种基于目标嵌入的基于注意力的LSTM方法，该方法被证明是一种有效的方法，可以使神经模型参与句子的相关部分。注意机制用于响应特定方面而强制模型关注句子的重要部分。同样，Yang等人提出了两种基于注意力的双向LSTM，以提高分类性能。 Liu和Zhang通过区分从给定目标/方面的左上下文和右上下文获得的注意力来扩展注意力模型。他们通过添加多个门进一步控制了他们的注意力贡献。
Tang等人介绍了一种用于方面级别情感分类的端到端存储网络，该网络使用带有外部存储器的注意力机制来捕获每个上下文单词相对于给定目标方面的重要性。当推断方面的情感极性时，此方法明确捕获每个上下文单词的重要性。这种重要程度和文本表示是通过多个计算层来计算的，每个计算层都是外部存储器上的神经注意模型。
Lei等人建议使用神经网络方法来提取输入文本片段，作为评论评分的依据（原因）。该模型由一个生成器和一个解码器组成。生成器指定可能的基本原理（提取文本）的分布，编码器将任何此类文本映射到特定于任务的目标向量。对于多方面情感分析，目标向量的每个坐标表示与相关方面有关的响应或等级。Li等人将目标识别任务整合到情感分类任务中，以更好地建模方面与情感的交互。他们表明，情绪识别可以通过端到端的机器学习架构解决，该架构中的两个子任务由一个深度内存网络交错。这样，在目标检测中产生的信号为极性分类提供了线索，相反，预测的极性为目标的识别提供了反馈。
Ma等人提出了一个交互式注意力网络（IAN），该网络同时考虑了对目标和上下文的关注。也就是说，它使用两个注意力网络交互地检测目标表达/描述的重要单词及其整个上下文的重要单词。
Chen等人提出利用循环注意力网络更好地捕捉复杂情境的情绪。为此，他们提出的模型使用了循环/动态注意力结构，并学习了GRU中注意力的非线性组合。
Tay等人设计了一个Dyadic内存网络（DyMemNN），该模型通过使用神经张量组合或全息组合来进行内存选择操作，从而对方面和上下文之间的二元交互进行建模。

十七、方面提取和分类

为了执行方面级的情感分类，需要手动指定或自动提取方面（或目标）。在本节中，我们讨论使用深度学习模型从句子或文档中自动进行方面提取（或方面术语提取）的现有工作。让我们用一个例子来说明问题。例如，在句子“图像非常清晰”中，单词“ image”是一个方面术语（或情感目标）。方面分类的关联问题是将相同的方面表达式分组到一个类别中。例如，方面术语“image”，“photo”和“picture”可以分组为一个名为“Image”的方面类别。在下面的评论中，我们包括与观点相关的方面和实体的提取。

深度学习模型可以帮助完成此任务的原因之一是，深度学习本质上擅长于学习（复杂的）特征表示。当某个方面在某个特征空间中（例如，在一个或多个隐藏层中）正确表征时，一个方面及其上下文之间的语义或相关性可以通过它们相应的特征表示之间的相互作用来捕获。换句话说，深度学习为自动特征工程提供了一种可能的方法，而无需人工参与。

Katiyar和Cardie研究了使用深度双向LSTM联合提取意见实体以及将实体连接的IS-FORM和IS-ABOUT关系。 Wang等。 83进一步提出了一个结合RNN和条件随机场（CRF）的联合模型，以共同提取方面和观点术语或表达。所提出的模型可以同时学习高级判别特征和方面和观点术语之间的双重传播信息。 Wang等人进一步提出了一种耦合多层注意力模型（CMLA），用于共同提取方面和观点术语。该模型由使用GRU单元的方面关注和意见关注组成。 Li和Lam报告了一种改进的基于LSTM的方法，专门用于方面术语提取。它由三个LSTM组成，其中两个LSTM用于捕获外观和情感交互。第三个LSTM将使用情感极性信息作为附加指导。
他等人提出了一种基于注意力的无监督方面提取模型。与自动编码器框架类似，主要的直觉是利用注意力机制将更多的注意力放在与方面相关的单词上，同时在学习方面嵌入过程中不强调与方面无关的单词。
Zhang等人使用神经网络扩展了CRF模型，以共同提取方面和相应的情感。提出的CRF变体用连续的单词嵌入替换了CRF中的原始离散特征，并在输入和输出节点之间添加了神经层。
Zhou等人提出了一种半监督的词嵌入学习方法，以在带有噪声标签的大量评论上获得连续的词表示。通过学习单词向量，可以通过神经网络将单词向量堆叠在一起，从而学习到更深层次的混合特征。最后，使用经过混合特征训练的逻辑回归分类器来预测方面类别。
Yin等人首先通过考虑连接单词的依赖路径来学习单词嵌入。然后，他们设计了一些嵌入功能，这些功能考虑了基于CRF的方面项提取的线性上下文和依赖上下文信息。
Xiong等人提出了一种基于注意力的深度距离度量学习模型来对方面短语进行分组。基于注意力的模型是学习上下文的特征表示。方面短语嵌入和上下文嵌入都用于学习K均值聚类的深度特征子空间度量。
Poria等人建议使用CNN进行长宽比提取。他们开发了一个七层的深度卷积神经网络，以将带意见的句子中的每个单词标记为方面或非方面单词。一些语言模式也已集成到模型中以进一步改进。
Ying等人提出了两个基于RNN的模型用于跨域方面提取。他们首先使用基于规则的方法为每个句子生成辅助标签序列。然后，他们使用真实标签和辅助标签对模型进行了训练，这显示出令人鼓舞的结果。

十八、意见表达提取

在本节和接下来的几节中，我们将讨论深度学习应用程序与其他一些与情绪分析相关的任务。本节重点讨论意见表达提取（或意见术语提取或意见识别）问题，该问题旨在识别句子或文档中的情感表达。

与方面提取相似，使用深度学习模型的意见表达提取是可行的，因为它们的特征也可以在某些特征空间中识别出来。

Irsoy和Cardie探索了深度双向RNN在此任务上的应用，该应用优于具有相同数量参数和以前CRF方法的传统浅RNN。
Liu等人提出了基于RNN体系结构和词嵌入的一般判别模型。作者使用来自三个外部源的预训练词嵌入，这些词源来自不同的RNN架构，包括Elman型，Jordan型，LSTM及其变体。
Wang等人提出了一个将递归神经网络和CRF集成在一起的模型，以共同提取方面和观点。还建议使用前述CMLA来共同提取方面和观点术语。

十九、情感组成

情感成分定义：意见表达的情感取向是由其成分的含义以及语法结构决定的。由于其特殊的树状结构设计，RecNN自然适合此任务。 Irsoy和Cardie报告说，具有深层架构的RecNN可以更准确地捕获语言组成方面的不同方面，这有利于情感组成。 Zhu等人提出了一种将情感成分合成过程中的成分情感和非成分情感整合在一起的神经网络。

二十、意见来源提取

意见持有人（或来源）提取是识别谁持有意见（或意见来自谁/来自何处）的任务。例如，在句子“约翰讨厌他的车”中，意见持有者是“约翰”。通常将此问题表述为诸如意见表达提取或方面提取之类的序列标记问题。请注意，如Yang和Cardie所示，观点持有人可以是显式的（来自句子中的名词短语）或隐式的（来自作者）。 Deng和Wiebe建议使用观点表达的词嵌入作为识别参与者观点和非参与者观点的来源的特征，其中来源可以是名词短语或作者。

二十一、时态意见挖掘

时间也是情感分析问题定义中的一个重要维度（参见Liu的书1）。随着时间的流逝，人们可能会保持或改变主意，甚至给出新的观点。因此，预测未来观点在情感分析中很重要，最近已经报道了一些使用神经网络的研究来解决这个问题。

Chen等人提出了一种基于内容的社会影响力模型（CIM），以对Twitter用户进行意见行为预测。也就是说，它使用过去的推文来预测用户的未来意见。它基于神经网络框架，对用户内容和社会关系因素（用户对目标的看法受朋友的影响）进行编码。
Rashkin等人将LSTM用于社交媒体环境下的目标情感预测。他们引入了多语言含义框架，旨在预测参与框架的世界事件参与者之间的隐含情绪。

二十二、基于词嵌入的情感分析

词嵌入在深度学习情感分析模型中扮演了重要角色。研究也表明，即使不使用深度学习模型，词嵌入也可以在不同任务中用作非神经网络学习模型的特征。因此，该部分特别强调了词嵌入对情感分析的贡献。

我们首先介绍情感编码词嵌入的工作。对于情感分析，直接使用常规的单词方法（例如CBOW或Skip-gram）从上下文中学习单词嵌入可能会遇到问题，因为上下文相似但情感极性相反（例如，“好”或“坏”）的单词可能会映射到附近嵌入空间中的向量。因此，已经提出了情感编码的单词嵌入方法。

Mass el al学习了可以捕捉语义和情感信息的词嵌入。
Bespalov et al表明，n-gram 模型结合潜在表征将为情感分类提供更合适的嵌入。通过把语句的情感监督作为正则化项。
Labutov and Lipson 将带有 logistic 回归的现有词嵌入进行重嵌入。
Le和Mikolov提出了段落向量的概念，以首先学习可变长度文本（包括句子，段落和文档）的定长表示形式。他们在句子和文档级别的情感分类任务上进行了实验，并获得了性能提升，这证明了段落向量在捕获语义以帮助情感分类方面的优点。 Tang等人提出了用于学习特定于情感的词嵌入（SSWE）的模型，其中不仅语义而且情感信息都嵌入在所学习的词向量中。 Wang和Xia开发了一种神经体系结构，通过集成文档和单词级别的情感监督来训练带有情感的单词嵌入。 Yu等人采用了一种细化策略来获得带有语义情感的联合词向量。
还研究了特征丰富和多义词嵌入以进行情感分析。 Vo和Zhang通过利用丰富的自动功能研究了基于方面的Twitter情感分类，这是使用无监督学习技术获得的其他功能。 Li和Jurafsky在各种NLP任务上尝试了使用多义词嵌入。实验结果表明，尽管此类嵌入确实可以提高某些任务的性能，但对情感分类任务却几乎没有帮助。 Ren等人提出了一种方法，用于学习用于Twitter情感分类的主题丰富的多原型单词嵌入。
多语言单词嵌入也已应用于情感分析。 Zhou等人报道了双语情感词嵌入（BSWE）模型用于跨语言情感分类。它通过使用带标签的语料库及其翻译，而不是大规模的并行语料库，将情感信息整合到英汉双语嵌入中。 Barnes等人比较了几种类型的双语单词嵌入和神经机器翻译技术，用于基于跨语言方面的情感分类。
Zhang等人将词嵌入与矩阵分解集成在一起，用于基于个性化评论的评分预测。具体而言，作者使用情感词典来精炼现有的面向语义的单词向量（例如，word2vec和GloVe）。 Sharma等人提出了一种半监督技术，该方法使用带有情感的词嵌入来对形容词的情感强度进行排名。词嵌入技术也已被利用或改进，以帮助解决许多其他近期研究中的各种情感分析任务。

二十三、嘲讽检测

嘲讽是一种形式的语言讽刺，是与情感分析密切相关的概念。最近，人们对NLP社区的嘲讽检测越来越感兴趣。由于在许多其他NLP问题中取得了令人瞩目的成功，研究人员已尝试使用深度学习技术来解决该问题。

Zhang等人构建了一个用于讽刺检测的深度神经网络模型。他们的网络首先使用双向GRU模型在推文上本地捕获语法和语义信息，然后使用池化神经网络从历史推文中自动提取上下文特征以检测讽刺性推文。
Joshi等人研究了基于单词嵌入的特征以进行讽刺检测。他们尝试了过去四种具有增强词嵌入功能的讽刺检测算法，并显示出令人鼓舞的结果。
Poria等人通过共同模拟训练前的情绪，情感和个性特征以及推文中的文字信息，开发了基于CNN的讽刺检测模型（讽刺或非讽刺推文分类）。
Peled和Reichart建议基于RNN神经机器翻译模型来解释讽刺推文。
Ghosh和Veale提出了CNN和双向LSTM混合体，用于在推文中检测讽刺，该模型可同时对语言和心理环境进行建模。
Mishra等人利用CNN从眼睛运动（或注视）数据中自动提取认知特征，以丰富信息以进行讽刺检测。单词嵌入还用于英语推文120中的反讽识别以及辩论中的有争议单词识别。

二十四、情感分析

情感是人类的主观感受和思想。主要的情感包括爱，喜悦，惊奇，愤怒，悲伤和恐惧。情感的概念与情感密切相关。例如，情绪的强度可以与诸如喜悦和愤怒之类的某些情绪的强度相关联。因此，许多深度学习模型也按照情感分析的方式应用于情感分析。

Wang等人建立了双语注意力网络模型，用于代码转换的情绪预测。 LSTM模型用于构建每个帖子的文档级表示，并且注意机制用于从单语和双语语境中捕获翔实的单词。
Zhou等人提出了一种情感聊天机，用于基于GRU建模大规模对话生成中的情感影响。该技术也已在其他论文中应用
Abdul-Mageed和Ungar首先通过使用远程监督自动构建了一个大型的情绪检测数据集，然后使用GRU网络进行细粒度的情绪检测。
Felbo等人在社交媒体中使用了数以百万计的表情符号，用于神经模型的预训练，以便更好地表达情感环境。
提出了一种使用深度存储网络进行情感原因提取的问题解答方法。情感原因提取旨在识别文本中表达的某种情感背后的原因。

二十五、用于情感分析的多模态数据

多模态数据（例如，携带文本，视觉和听觉信息的数据）可帮助情感分析，因为它为传统文本功能提供了额外的情感信号。由于深度学习模型可以将输入映射到某个潜在空间以进行特征表示，因此也可以同时投影多模态数据的输入以学习多模态数据融合，例如通过使用特征级联，联合潜在空间或其他更复杂的融合方法。现在，将多模态数据与深度学习技术结合使用的趋势正在增长。

Poria等人提出了一种基于CNN内层的激活值从短文本中提取特征的方法。该论文的主要新颖之处在于，它使用了深层的CNN从文本中提取特征，并使用了多核学习（MKL）对异构的多峰融合特征向量进行分类。
Bertero等人描述了一种CNN模型，用于在来自交互式对话系统的声音数据中进行情绪和情感识别。
Fung等人演示了一种虚拟交互对话系统，该系统结合了由深度学习模型训练的情感，情感和个性识别功能。
Wang等人报道了一种CNN结构化的深度网络，称为深度耦合形容词和名词（DCAN）神经网络，用于视觉情感分类。 DCAN的关键思想是利用形容词和名词文本描述，将它们视为两个（弱）监督信号，以学习两个中间情感表示。然后将那些学习到的表示连接起来，并用于情感分类。
Yang等人开发了两种基于条件概率神经网络的算法来分析图像的视觉情感。
Zhu等人提出了用于视觉情感识别的统一CNN-RNN模型。该体系结构利用多层的CNN在多任务学习框架内提取不同级别的特征（例如颜色，纹理，对象等）。并提出了一种双向RNN来整合CNN模型中来自不同层的学习特征。
ypu等人采用了注意力机制进行视觉情感分析，可以共同发现相关的本地图像区域，并在这些本地区域的顶部构建情感分类器。
Poria等人提出了一种深度学习模型，用于对视频数据进行多模式情感分析和情感识别。特别是，提出了一种基于LSTM的模型，用于话语级情感分析，该模型可以从同一视频的周围环境中捕获上下文信息。
Tripathi等人在多模式数据集DEAP上使用了基于深度和CNN的情感分类模型，该模型包含脑电图以及周围的生理和视频信号。
Zadeh等。 136提出了将多模态情感分析问题建模为模态内部和模态间动力学的模型，并引入了一个名为Tensor Fusion Network的新神经模型来解决。
Long等人提出了一种以认知为基础的眼动数据训练的注意力神经模型，用于句子级情感分类。建立了基于认知的注意（CBA）层用于神经情感分析。
Wang等人提出了一种选择加性学习（SAL）方法，以解决多模态情感分析中的混杂因素问题，该方法消除了神经网络（例如CNN）学习到的单个特定潜在表示。为此，涉及两个学习阶段，即用于混淆因子识别的选择阶段和用于混淆因子去除的去除阶段。

二十六、资源匮乏的语言和多语言情感分析

最近，由于使用了深度学习模型，资源贫乏的语言（与英语相比）的情感分析也取得了重大进展。此外，多语言功能也可以像多数模态据一样帮助情感分析。同样，深度学习已应用于多语言情感分析设置。

Akhtar等人报道了一种基于CNN的混合架构，用于将资源贫乏的语言印地语用于句子和方面级别的情感分类。
Dahou等人在句子层使用单词嵌入和基于CNN的阿拉伯语情感分类模型。
Singhal和Bhattacharyya设计了一种用于复审/句子级别的多语言情感分类的解决方案，并尝试了多种语言，包括印地语，马拉地语，俄语，荷兰语，法语，西班牙语，意大利语，德语和葡萄牙语。作者使用机器翻译工具将这些语言翻译成英语，然后使用英语单词嵌入，情感词典中的极性和CNN模型进行分类。
Joshi等人在LSTM体系结构中引入了一个子词级别的表示形式，用于对印地语-英语代码混合句子进行情感分类。

二十七、其他相关任务

深度学习在其他一些与情绪分析相关的任务中也有应用。

情感主体间性：Gui等人在情感分析中解决了主体间性问题，该问题是研究语言的表面形式与相应抽象概念之间的差距，并将主体间性建模纳入拟议的CNN中。

词典扩展：Wang等人提出了一种基于PU学习的神经方法，用于意见词典扩展。

金融波动性预测：Rekabsaz等人使用金融公开情绪和基于词嵌入的信息检索模型进行了波动性预测，其中词嵌入用于类似的词集扩展中。

意见建议：Wang和Zhang介绍了意见建议任务，该任务旨在生成特定用户可能会给出的产品的自定义评论评分，以及在特定情况下用户将为目标产品撰写的自定义评论。用户已经查看过该产品。提出了一种多注意记忆网络来解决
问题，其中考虑了用户的评论，产品的评论以及用户的邻居（相似的用户）。

政治主张检测：Augenstein等人提出了带有条件编码机制的双向LSTM，用于政治推特数据中的政治主张检测。 Du等人设计了一种针对特定目标的神经注意力模型来进行政治主张分类。

二十八、结论

将深度学习应用于情感分析已成为最近流行的研究主题。在本文中，我们介绍了各种深度学习架构及其在情感分析中的应用。这些深度学习技术中的许多技术已经显示出用于各种情感分析任务的最新结果。随着深度学习研究和应用的发展，我们相信在不久的将来会有更多激动人心的深度学习研究用于情感分析。

你可能感兴趣的:(深度学习)

高性能计算:GPU加速与分布式训练 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的飞速发展，深度学习模型的规模和复杂度不断提升，对计算能力的需求也越来越高。传统的CPU架构已经难以满足深度学习模型训练的需求，因此，GPU加速和分布式训练成为了高性能计算领域的研究热点。1.1.深度学习与计算挑战深度学习模型通常包含数百万甚至数十亿个参数，训练过程需要进行大量的矩阵运算和梯度更新，对计算资源的需求非常高。传统的CPU架构虽然具有较强的通用性，但其并行计
使用 MistralAI 平台进行开源模型托管与调用 VYSAHF python
MistralAI是一个提供开放源码模型托管的平台，致力于帮助开发者更轻松地使用和管理开源模型。通过该平台，你可以方便地调用强大的深度学习模型，并将其集成到你的应用中。本文将带你了解如何利用MistralAI提供的服务来进行模型的托管和调用。技术背景介绍MistralAI的服务包括了如聊天模型和嵌入模型等，这些模型适用于聊天机器人、文本嵌入等各种场景。使用这些模型需要注册并获取一个有效的API密钥
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
金融风控算法透明度与可解释性优化智能计算研究中心其他
内容概要金融风控算法的透明化研究面临模型复杂性提升与监管合规要求的双重挑战。随着深度学习框架在特征提取环节的广泛应用，算法可解释性与预测精度之间的平衡成为核心议题。本文从联邦学习架构下的数据协作机制出发，结合特征工程优化与超参数调整技术，系统性分析逻辑回归、随机森林等传统算法在召回率、F1值等关键指标上的表现差异。研究同时探讨数据预处理流程对风控决策鲁棒性的影响，并提出基于注意力机制的特征权重可视
H800核心性能优化技术智能计算研究中心其他
内容概要作为新一代AI加速卡的核心创新载体，H800通过异构计算架构与动态能效管理技术的协同设计，实现了从硬件底层到应用层的系统性优化。其技术突破聚焦于张量核心重构带来的计算密度提升、混合精度运算对资源利用率的增强，以及智能散热方案在复杂负载场景下的稳定性保障。这些创新不仅显著提升了30%以上的能效比，更通过精细化任务调度机制，解决了深度学习训练中高并发数据处理与模型参数同步的效率瓶颈。值得关注的
TikTokenizer 项目常见问题解决方案齐飞锴Timothea
TikTokenizer项目常见问题解决方案tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目基础介绍TikTokenizer是一个开源项目，主要用于文本处理，特别是将文本转化为可用于深度学习的格式。该项目是基于TensorFlow和Keras开发
DeepSeek混合专家架构赋能智能创作智能计算研究中心其他
内容概要在人工智能技术加速迭代的当下，DeepSeek混合专家架构（MixtureofExperts）通过670亿参数的动态路由机制，实现了多模态处理的范式突破。该架构将视觉语言理解、多语言语义解析与深度学习算法深度融合，构建出覆盖文本生成、代码编写、学术研究等场景的立体化能力矩阵。其核心优势体现在三个维度：精准化内容生产——通过智能选题、文献综述自动生成等功能，将学术论文写作效率提升40%以上；
YOLO11改进-模块-引入频率谱动态聚合模块FSDA 去除噪声一勺汤 YOLOv11模型改进系列目标检测魔改模块 YOLO YOLOv11 YOLOv11改进改进
在图像去雾领域，深度学习在白天图像去雾方面成果显著，但夜间雾图研究较少。夜间雾图面临诸多挑战，其中包括雾、辉光和噪声因多个低强度有源彩色光源而具有复杂特性，以及模拟与真实数据的域差异导致的亮度问题。为解决这些，我们使用FSDA模块，处理频率不一致特性。FSDA先对频谱信息聚合，再计算通道权重并应用，最后映射回空间域，以此优化频谱信息，使模型更好处理复杂干扰。本文将其与YOLOv11相结合，增强YO
基于多头注意机制的多尺度特征融合的GCN的序列数据（功率预测、故障诊断）模型及代码详解清风AI 深度学习算法详解及代码复现人工智能神经网络深度学习 python conda pip pandas
GCN基础在深度学习领域中，图卷积网络(GCN)是一种强大的图数据处理工具。它将卷积操作扩展到图结构上，能够有效捕捉图中节点之间的关系信息。GCN的核心思想是通过聚合邻居节点的特征来更新目标节点的表示，这种局部聚合机制使得GCN能够学习到图的拓扑结构和节点属性。GCN的主要构成要素包括节点特征矩阵、邻接矩阵和卷积核。通过多次迭代，GCN可以逐步学习到图中节点的高阶表示，为后续的分类、预测等任务提供
YOLO魔改之频率分割模块（FDM）清风AI YOLO算法魔改系列 YOLO 人工智能计算机视觉目标检测 python 深度学习
目标检测原理目标检测是一种将目标分割和识别相结合的图像处理技术，旨在从图像中定位并识别特定目标。深度学习方法，如FasterR-CNN和YOLO系列，已成为主流解决方案。这些方法通常采用两阶段或单阶段策略，通过卷积神经网络(CNN)提取特征并进行分类和定位。在小目标检测中，为克服分辨率低和特征不明显的问题，模型设计中会特别注重特征融合和多尺度处理，以增强对小目标的感知能力。YOLOv8基础YOLO
PyTorch模型训练实战指南：掌握动态图特性与工业级部署技巧 lmtealily pytorch 人工智能 python
前言在深度学习领域，PyTorch凭借其动态计算图、高效的自动微分系统及高度Pythonic的设计哲学，已成为学术界与工业界的主流框架。其即时执行模式大幅简化了模型调试流程，而灵活的模块化设计则为复杂模型的构建提供了坚实基础。然而，从实验原型到工业级部署的全链路实践中，开发者仍需系统性掌握框架核心特性与工程化技巧。本文以实战为导向，深入剖析PyTorch动态图机制与自动微分原理，详解从数据预处理、
PyTorch 深度学习实战（19）：离线强化学习与 Conservative Q-Learning (CQL) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们探讨了分布式强化学习与IMPALA算法，展示了如何通过并行化训练提升强化学习的效率。本文将聚焦离线强化学习（OfflineRL）这一新兴方向，并实现ConservativeQ-Learning(CQL)算法，利用Minari提供的静态数据集训练安全的强化学习策略。一、离线强化学习与CQL原理1.离线强化学习的特点无需环境交互：直接从预收集的静态数据集学习数据效率高：复用历史经验
一切皆是映射：DQN训练加速技术：分布式训练与GPU并行 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度强化学习的兴起近年来，深度强化学习（DeepReinforcementLearning，DRL）在游戏、机器人控制、自然语言处理等领域取得了令人瞩目的成就。作为一种结合深度学习和强化学习的强大技术，DRL能够使智能体在与环境交互的过程中学习最优策略，从而实现自主决策和控制。1.2DQN算法及其局限性深度Q网络（DeepQ-Network，DQN）是DRL的一种经典算法，它利用
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
深度学习-130-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(一) 皮皮冰燃深度学习深度学习人工智能 RAG
文章目录1AnythingLLM的本地知识库1.1本地知识库应用场景1.2效果对比及思考1.3本地体现在哪些方面1.3.1知识在本地1.3.2分割后的文档在本地1.3.3大模型部署运行在本地2问错问题带来的问题2.1常见的问题2.2原因分析3为什么LLM不使用我的文件？3.1LLM不是万能的【omnipotent】3.2LLM不会自省【introspect】3.3AnythingLLM是如何工作的
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb