前行follow

读论文——EMNLP2021 Aspect-based sentiment analysis 精读第一篇

第一遍

标题

To be Closer: Learning to Link up Aspects with Opinions

作者

摘要

依赖解析树有助于发现基于方面的情感分析中的意见词。（aspect-based sentiment analysis, ABSA），但是从off-the-shelf的解析依赖器获得的树是静态的，在ABSA中可能是次优的。因为句法树的设计不是为了捕捉意见词和方面词之间的相互作用。
本文中，通过缩短aspect和对应的意见词之间的距离，学习一个aspect-centric的树。在模型学习过程中，允许树状结构自适应地关联aspect和意见词，能够更好的识别ABSA中的极性。
结果：在五个aspect-based情感数据集上，本文模型明显优于最近的强基线；在SemEval Restaurant 14 数据集上，aspect和意见词之间的平均距离缩短了19%。

结论

通过定性和定量分析，该模型加入了根约束，提高了aspect词变成句子的根的可能性。
在SemEval Restaurant 14 数据集上，缩短了aspect词和观点词之间的平均距离19%。
未来可能用于三重态提取(aspect triplet extraction)

介绍

ABSA判断句子中对特定目标的情感极性，例如：“The battery life of this laptop is very long, but the price is too high”，aspect词battery life是正向的，aspect词price是负向的。
之前的工作，使用注意力机制在aspect词和上下文词之间建模，但是这种方法会过多关注出现频率较高的词，忽视低频的词。
最近的工作发现，语法树能够帮助识别aspect词相关的情感特征，但是存在两个问题：
1. 从现成的依赖解析器获得的树是静态的，因此不能自适应地模拟多个aspect词和意见词之间的复杂关系。
2. 不准确的解析树可能会导致错误在pipeline中向下游传播
本文是针对aspect词为root定制生成语法树（ACLT, Aspect-Centric Latent Trees），通过注意力机制和MTT实现。加入一个软约束，通过MTT激励aspect词作为语法树的根节点。
本文贡献点：
1. 通过ACLT来连接aspect词和观点词
2. ACLT学习的解析树更利于aspect词和观点词联系起来

第二遍

模型

模型框架

整体流程：

通过句子编码器（BERT）获取上下文表示
使用一个树偏置器，产生所有潜在树的分布（将树结构作为一个潜变量）
一旦获取到潜在树分布后，采用根求精过程，获得aspect-centric潜在树
用一个图或者树编码潜在树，利用树编码器的结构化表示情感分类

2.1 句子编码器

这里采用BERT作为句子编码器
输入： $x = ([CLS] w_1,...,w_n [SEP] w_i,...,w_j [SEP])$ ，包括句子和方面词
输出：H = BERT(x) , $H = [h_1,..,h_n]$

2.2 Aspect-centric Tree Inducer

本文想解决，语法树根节点和方面词不一致问题
通过前馈神经网络（FNN）计算两个节点（ $h_i \in H$ ）边的分数

公式： $e_{ij} = (\mathbf{tanh}(W_ph_i))^TW_b(\mathbf{tanh}(W_ch_j))$

$W_p,W_c \in \mathbb{R}^{d \times d}$ 分别表示两个FNN

$W_b$ 表示Bilinear的权重

$e_{ij} \in \mathbb{R}^{d \times d}$ ，可以看作一个加权的邻接矩阵，其中每个节点对应句子中的一个词。

感觉这里维度有问题
计算根节点分数 $r_i$ ，表示作为根节点的非非标准化（可能没有归一化）概率

$r_i = W_rh_i$

$W_r \in \mathbb{R}^{1 \times d}$ 表示线性变化层权重
计算潜在结构的依赖边的边际概率
$\begin{aligned} \boldsymbol{A}_{i j} &= \begin{cases}0 & \text { if } i=j \\ \exp \left(\boldsymbol{e}_{i j}\right) & \text { otherwise }\end{cases} \\ \boldsymbol{L}_{i j} &= \begin{cases}\sum_{i^{\prime}=1}^{n} \boldsymbol{A}_{i^{\prime} j} & \text { if } i=j \\ -\boldsymbol{A}_{i j} & \text { otherwise }\end{cases} \\ \overline{\boldsymbol{L}}_{i j} &= \begin{cases}\boldsymbol{L}_{i j}+\exp \left(\boldsymbol{r}_{i}\right) & \text { if } i=j \\ \boldsymbol{L}_{i j} & \text { otherwise }\end{cases} \end{aligned}$
$\in \mathbb{R}^{n \times n}$ 表示两个节点之间边的权重

$\in \mathbb{R}^{n \times n}$ 表示图G的拉普拉斯矩阵

$\overline L \in \mathbb{R}^{n \times n}$ 考虑根节点为了进一步计算
使用 $P_{ij}$ 表示节点 $i, j$ 的边缘概率分布， $P_i^r$ 表示节点 $i$ 表示为根节点的边缘概率
$\begin{aligned} \boldsymbol{P}_{i j}=&\left(1-\delta_{1, j}\right) \boldsymbol{A}_{i j}\left[\overline{\boldsymbol{L}}^{-1}\right]_{j j} -\left(1-\delta_{i, 1}\right) \boldsymbol{A}_{i j}\left[\overline{\boldsymbol{L}}^{-1}\right]_{j i} \\ \boldsymbol{P}_{i}^{r} &=\exp \left(\boldsymbol{r}_{i}\right)\left[\overline{\boldsymbol{L}}^{-1}\right]_{i 1}, \end{aligned}$
$\delta$ 表示 Kronecker delta
Root Refinement

在没有结构监督的情况下，MTT仍然会产生任意的树，而这些树不适合具体的任务。因此，在这样的假设下，诱导树结构的根是在方面词里面，能够让模型更好的关联方面词和观点词。
$\begin{aligned} \mathcal{L}_{a}=&-\sum_{i=1}^{L}\left(t_{i} \log \left(\boldsymbol{P}_{i}^{r}\right)\right.\left.+\left(1-t_{i}\right) \log \left(1-\boldsymbol{P}_{i}^{r}\right)\right) \end{aligned}$
$t_i \in \{ 0,1\}$ 表示是否第 $i$ 个token是否方面词

由于信息主要在相邻节点之间传播，所以在训练的早期迭代过程中，树诱导器模块直观地产生随机结构。由于根部被调整为方面词，而且当损失较小时，结构变得更加精细，树诱导器更有可能产生一个以方面为中心的潜在结构。我们在3.4节的实验表明，根细化损失能够成功地引导潜在树的生成，其中主体词与根一致。

2.3 Tree Encoder 树编码器

给定上下文表示 $h$ 和对应的方面中心图 $P$ ，通过注意力机制去编码
$\begin{aligned} \boldsymbol{s}_{i}^{p} &=\sum_{k=1}^{n} \boldsymbol{P}_{k i} \boldsymbol{h}_{k}+\boldsymbol{P}_{i}^{r} \boldsymbol{h}_{a} \\ \boldsymbol{s}_{i}^{c} &=\sum_{k=1}^{n} \boldsymbol{P}_{i k} \boldsymbol{h}_{i} \\ \boldsymbol{s}_{i} &=\tanh \left(\boldsymbol{W}_{s}\left[\boldsymbol{s}_{i}^{p}, \boldsymbol{s}_{i}^{c}, \boldsymbol{h}_{i}\right]\right), \end{aligned}$
$s_i^p$ 表示从可能的父节点 $h_i$ ，聚集到的信息

$s_i^c$ 表示从可能的子节点 $h_i$ ，聚集到的信息

$h_a$ 表示根节点

$s_i$ 表示第 $i$ 个词的结构化表示

2.4 分类器

$s_o$ 表示每个句子结构化aspect-aware表示
$y_{p}=\operatorname{softmax}\left(\boldsymbol{W}_{p} \boldsymbol{s}_{0}+\boldsymbol{b}_{p}\right)$
分类器的目标函数
$\mathcal{L}_{s} = -\mathrm{log}P(y|\mathbf{x}) \\ y \in \{positive, negative, neutral\}$
最终的目标函数是一个多任务学习目标函数
$\mathcal{L} = \alpha \mathcal{L}_a + (1-\alpha)\mathcal{L}_s$

$\alpha$ 是超参数，根据最后验证集结果进行调整

实验

3.2 baselines

最先进的模型主要分类三类：1. 无语法信息模型（TNet-AS、BERT-PT、BERT-PAIR、BERT-SRC） 2. 依赖解析树模型（ASGCN、CDT、BiGCN、ASGCN+BERT、R-GAT+BERT）3. 潜在树模型（KumaGCN + BERT）

3.3 主要结果

结果表明，Aclt 可以诱导更多信息的特定任务的潜伏结构，建立有效的连接之间的方面词和上下文。

为什么ACLT可以降低方面词和观点词之间的距离？

表中给出依赖解析（Parser）、矩阵树理论（MTT, Matrix Tree Theory）、ACLT中方面词和观点词之间的平均距离（两个词之间的交互次数，the number of interaction hops）。
这些结果证实了我们的假设，诱导树结构的根部在方面词内，使模型能够比标准的解析树更好地关联方面和意见词。

3.4 模型分析

不同树表示的作用

不论是aspect-centric潜在树、潜在矩阵树还是标准的依赖解析树都是用来表示一个句子的结构。
语法信息在ABSA任务中很重要，这一点在其他NLP任务中也比较常见。
在ABSA任务中，aspect-centric树确实可以有效地建立方面词和上下文词之间的关系
在Twitter数据集中，证明GCN也能提升一定性能。

root refinement 是否工作？

从图3中可以看出，ACLT模型将方面词作为根节点的比例明显提高了

修剪树的作用

从表5中可以看出，完整的树结构对于ACL是非常重要的，树结构只要发生修剪，F1值都会下降；而反观R-GA T+BERT和KumaGCN+BERT模型，对树结构进行修剪后，F1值反而还会上升。因此，从某种程度上表明，ACLT模型对ABSA任务中，关联方面词和观点词更加紧密；而其他两种模型的这种能力是受制于它们的树结构了的。

消融实验

root refinement对结果提升很大
固定根节点，模型性能下降，表明计算各方面词成为根的概率是获得良好性能的关键。

3.5 案例研究

如图4，可以发现Aspect-centric的树相较于依赖解析树，关联方面词和观点词的路径更短。

相关工作

ABSA，Sun et al.(2019a)，利用aspect词构建辅助句子，将ABSA转化为句子对分类任务；Huang and Carley(2019）将意见特征从语法邻域词传播到方面词；ABSA 的另一项工作是利用显式依赖解析树来为上下文和方面词之间的关系建模。
Latent variable induction. chen 通过开发 gate 机制动态地组合解析树信息和 hardkuma 结构，构造任务特定的结构。
首先，我们构造特定于特定区域的树，以便在不依赖外部解析器的情况下进行推理。其次，我们通过引入明确的监督，以端到端的方式自适应地调整方面，从而促进目标与意见之间的互动。第三，通过计算各目标词的概率作为根，使模型在训练过程中减少了对 mtt 的推理根的搜索空间。

本文小结

本文观察到在ABSA任务中，方面词和语法解析树的根节点不一致（依赖解析树一般以谓语作为根节点），因此导致方面词和观点词之间的路径变长了，不利于方面词和观点词联系起来。
因此，本文首先使用句子编码器，将句子和方面词一起送入BERT进行编码得到句子表示；然后计算语法树的边权重以及计算将方面词作为根节点的概率；构造两个目标函数，最大化方面词成为根节点、最小化方面词情感分类误差，综合这两个目标函数得到最后的语法树。
结果发现ACLT模型的语法树，方面词和观点词具有更短的距离，有利于提升ABSA任务表现。

欢迎各位一起讨论，交流

你可能感兴趣的:(#,自然语言处理,nlp,情感分析)

UNDERSTANDING HTML WITH LARGE LANGUAGE MODELS liferecords LLM 语言模型人工智能自然语言处理
UNDERSTANDINGHTMLWITHLARGELANGUAGEMODELS相关链接：arXiv关键字：大型语言模型、HTML理解、Web自动化、自然语言处理、机器学习摘要大型语言模型（LLMs）在各种自然语言任务上表现出色。然而，它们在HTML理解方面的能力——即解析网页的原始HTML，对于自动化基于Web的任务、爬取和浏览器辅助检索等应用——尚未被充分探索。我们为HTML理解模型（经过微调
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
【循环神经网络rnn】一篇文章讲透 CX330的烟花 rnn 人工智能深度学习算法 python 机器学习数据结构
目录引言二、RNN的基本原理代码事例三、RNN的优化方法1长短期记忆网络（LSTM）2门控循环单元（GRU）四、更多优化方法1选择合适的RNN结构2使用并行化技术3优化超参数4使用梯度裁剪5使用混合精度训练6利用分布式训练7使用预训练模型五、RNN的应用场景1自然语言处理2语音识别3时间序列预测六、RNN的未来发展七、结论引言众所周知，CNN与循环神经网络（RNN）或生成对抗网络（GAN）等算法结
ChatGPT神技：AI成为你的编程良友 2401_83481083 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT神技：AI成为你的编程良友近年来，人工智能技术的发展迅猛，ChatGPT作为其中一项创新技术，正逐渐走进我们的生活。在编程领域，AI不仅可以助力我们提高效率，还能成为我们的良友，帮助解决各种编程难题。一、ChatGPT简介ChatGPT是一种基于自然语言处理技术的人工智能模型，它能够生成类人对话。ChatGPT通过深度学习模型，能够理解输入的文本并生成
智合同如何助力建筑行业合同智能化管理智合同（小智）合同智能应用 AI技术降本增效提质人工智能自然语言处理知识图谱深度学习大数据
#建筑行业#人工智能#AI#合同智能应用#深度学习#自然语言处理技术#知识图谱智合同-采用深度学习、自然语言处理技术、知识图谱等人工智能技术，为企业提供专业的合同相关的智能服务。其主要服务包含：合同智能审查、合同要素智能提取、合同版本对比、合同智能起草、ICR智能识别、合同履约追踪、文本一致性对比、广告审查、合同范本库等服务。智合同在助力建筑行业合同智能化管理方面具有显著的优势。首先，智合同利用A
2021-02-07 NLP心理实操作线上课 day7（16讲、17讲）海洋7606
#前提假设（上）（下）【学习内容】：第十六讲：前提假设（上）1、前提假设A.对人的前提假设【看人】：（1）没有两个人是一样的（2）沟通的效果取决于对方的回应【每当做出一个沟通需要向对方做出一个核对】（3）一个人不能改变另外一个人（4）每一个人都选择给自己最佳利益的行为(5）每人都已经具备使自己成功快乐的资源和能力（6）动机和情绪总不会错，只是行为没有效果而已第十七讲：前提假设（下）B.对事的前提假
GEE在灾害预警中的遥感云大数据应用及GPT模型辅助分析 AIzmjl GPT 生态遥感大数据 gpt gee 灾害预警水体湿地遥感
随着遥感技术的快速发展，云大数据在灾害、水体与湿地领域的应用日益广泛。通过遥感云大数据，我们能够实时获取灾害发生地的影像信息，为灾害预警、应急响应提供有力支持。同时，在水体与湿地监测方面，遥感云大数据也发挥着重要作用，帮助我们了解水体的分布、变化以及湿地的生态状况。近年来，GPT模型在自然语言处理领域取得了显著成果，其强大的文本生成和理解能力为遥感云大数据的应用提供了新的可能。通过将GPT模型与遥
自然语言处理概念以及发展黑夜照亮前行的路自然语言处理
自然语言概念总结自然语言处理（NaturalLanguageProcessing，简称NLP）是计算机科学领域与人工智能领域的一个重要方向，它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理旨在帮助计算机理解和处理自然语言，使计算机能够像人类一样处理和生成语言。从概念上讲，自然语言处理融合了语言学、计算机科学和数学等多学科的知识。它并不仅仅是一般地研究自然语言，而是侧重
什么是分布式搜索引擎罗彬桦分布式搜索引擎搜索引擎分布式
什么是分布式搜索引擎搜索引擎所谓搜索引擎，就是根据用户需求与一定算法，运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术，如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等，为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等，同时可添加其他一系列辅助模块，以为用户创造更好的网络使用环境。分布
读《重塑心灵》，悟个人与企业系统关系猫咪06
系统动力派NLP的创始人李中莹先生在他的《重塑心灵》中写到：一个人生于宇宙之间，不可能脱离其它人事物的影响，也不可能完全不影响其他人，因此只有充分尊重这种系统性才能摆正自己的位置，达到天人合一，内外和谐的境界，理解事物，如果越能从系统的整体平衡的角度出发，站在系统的高度理解事物，他就越能照顾全局，越能更好地解决问题，NLP12条前提假设中的“凡事照顾了三赢，不会有后遗症”也是系统的观念。在任何一个
自然语言处理（NLP）技术的概念及优势刘小董学习心得自然语言处理
自然语言处理（NLP）是人工智能领域的一个重要分支，其目标是使计算机能够理解、处理和生成人类自然语言的形式和含义。NLP技术的优势包括：实现人机交互：NLP技术可以使计算机与人类之间实现自然的语言交互，使人们可以通过语音识别、语义理解等方式与计算机进行交流。大规模文本处理：NLP技术可以对大规模文本进行自动化处理和分析，提取关键信息和知识，从而实现文本分类、情感分析、信息检索等任务。自动化翻译：N
今日无更新我的昵称违规了
学校的一个会忙得昏天黑地。明天有自己的一个发表，还要准备PPT，根据原来的改改就好……这周真的是有点繁杂了，搞定之后连着四五月份要写两篇论文，再加上五月底的课程论文还有紧接着的文献综述，看样子要疯……现在梳理一下自己手里的锤子：转到Pytorch，使用AllenNLP了解Transformer、了解LSTM了解jieba等分词工具了解Gensim等NLP处理工具接下来要做的：基于AllenNLP搞
大型语言模型RAG（检索增强生成）：检索技术的应用与挑战 in_tsz 语言模型人工智能自然语言处理
摘要检索增强生成（RAG）系统通过结合传统的语言模型生成能力和结构化数据检索，为复杂的问题提供精确的答案。本文深入探讨了RAG系统中检索技术的工作原理、实现方式以及面临的挑战，并对未来的发展方向提出了展望。随着大型预训练语言模型（LLMs）如GPT-3和BERT的出现，自然语言处理（NLP）领域取得了显著进展。然而，这些模型在处理知识密集型任务时仍存在局限性，特别是在需要最新或特定领域知识的情况下
(done) NLP “bag-of-words“ 方法（带有二元分类和多元分类两个例子）词袋模型、BoW shimly123456 NLP 相关杂谈自然语言处理 c#人工智能
一个视频：https://www.bilibili.com/video/BV1mb4y1y7EB/?spm_id_from=333.337.search-card.all.click&vd_source=7a1a0bc74158c6993c7355c5490fc600这里有个视频，讲解得更加生动形象一些总得来说，词袋模型(Bow,bag-of-words)是最简单的“文本—>矢量”(把文本转为矢量
AI人工智能小程序系统开发修行者对666 安卓gradle android adb
开发AI人工智能小程序系统需要以下步骤：1.确定需求：了解客户对人工智能小程序的期望，并分析系统的实际应用场景。2.设计架构：选择合适的技术框架和人工智能算法，进行小程序系统架构的设计。3.数据采集和处理：收集必要的数据，并进行预处理和特征提取，为人工智能算法提供支持。4.开发算法模型：根据需求和设计，开发相应的算法模型，如自然语言处理、图像识别等。5.实现小程序功能：将算法模型集成到小程序系统中
NLP技术小天才dhsb 网络其他
自然语言处理（NLP）技术可以应用在多个领域，例如机器翻译、情感分析、文本分类等。以下是几个例子：1.机器翻译：NLP技术可以将一种语言的文本自动翻译成另一种语言。例如，谷歌翻译就是应用了NLP技术，它可以将英语的文本翻译成其他语言，如法语、西班牙语等。2.情感分析：NLP技术可以分析文本中的情感倾向。例如，通过分析社交媒体上用户的评论和推文，可以判断用户对某个产品或事件的情感态度是正面的、负面的
小白看得懂的 Transformer zy_zeros python 开发语言
1.导语谷歌推出的BERT模型在11项NLP任务中夺得SOTA结果，引爆了整个NLP界。而BERT取得成功的一个关键因素是Transformer的强大作用。谷歌的Transformer模型最早是用于机器翻译任务，当时达到了SOTA效果。Transformer改进了RNN最被人诟病的训练慢的缺点，利用self-attention机制实现快速并行。并且Transformer可以增加到非常深的深度，充分
【AI视野·今日NLP 自然语言处理论文速览第八十二期】Tue, 5 Mar 2024 hitrjj LLM NLP Papers 人工智能自然语言处理 NLP 预训练模型文本摘要情绪识别推理训练
AI视野·今日CS.NLP自然语言处理论文速览Tue,5Mar2024(showingfirst100of175entries)Totally100papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersKey-Point-DrivenDataSynthesiswithitsEnhancementonMathematicalReasoningAut
每日荐书：《语言的魔力》在育儿的旅途中，建议一定要学习的一本书！殷老师认知心理教育说
每日荐书：《语言的魔力》在育儿的旅途中，建议一定要学习的一本书！本书作者：罗伯特•迪尔茨，NLP（神经语言程式学）大师，被公认为现今对NLP贡献最多的人。整理和开发了系统NLP、理解层次、重塑印记法、矛盾整合等许多著名的心理学技巧。NLP权威罗伯特•迪尔茨说：改变语言模式，就能转变信念，转变信念就能转变心情！作为实战心理学经典，本书讲解了很多技巧去破除限制性的语言框架，比如换框法、顺序法、替代法、
Transformer、BERT和GPT 自然语言处理领域的重要模型 Jiang_Immortals 人工智能自然语言处理 transformer bert
Transformer、BERT和GPT都是自然语言处理领域的重要模型，它们之间有一些区别和联系。区别：架构：Transformer是一种基于自注意力机制的神经网络架构，用于编码输入序列和解码输出序列。BERT（BidirectionalEncoderRepresentationsfromTransformers）是基于Transformer架构的双向编码模型，用于学习上下文无关的词向量表示。GP
大语言模型可信性浅谈 MarkHD 语言模型人工智能自然语言处理
大语言模型可信性的研究摘要：随着人工智能技术的快速发展，大语言模型在自然语言处理领域的应用越来越广泛。然而，大语言模型的可信性一直是人们关注的焦点。本文将从多个维度探讨大语言模型的可信性问题，包括模型性能、数据质量、隐私保护等方面，并提出相应的解决方案。一、引言大语言模型是指能够处理大规模文本数据的深度学习模型，如BERT、GPT等。这些模型在自然语言处理任务中取得了显著的成果，包括文本分类、情感
计算机设计大赛深度学习的智能中文对话问答机器人 iuerfee python
文章目录0简介1项目架构2项目的主要过程2.1数据清洗、预处理2.2分桶2.3训练3项目的整体结构4重要的API4.1LSTMcells部分：4.2损失函数：4.3搭建seq2seq框架：4.4测试部分：4.5评价NLP测试效果：4.6梯度截断，防止梯度爆炸4.7模型保存5重点和难点5.1函数5.2变量6相关参数7桶机制7.1处理数据集7.2词向量处理seq2seq7.3处理问答及答案权重7.4训
ChatGPT介绍程序媛9688 gpt
ChatGPT概述ChatGPT是一种前沿的大型语言模型（LargeLanguageModel,LLM），由人工智能研究组织OpenAI研发并推出。它基于Transformer架构，这是一种在自然语言处理（NLP）领域取得突破的深度学习方法。通过在海量的互联网文本数据上进行预训练，ChatGPT获得了强大的语言理解和生成能力。语言理解能力ChatGPT能够理解和分析复杂的自然语言文本。无论是用户提
基于ERNIR3.0文本分类的开发实践 wangqiaowq 人工智能
参考：基于ERNIR3.0文本分类：(KUAKE-QIC)意图识别多分类(单标签)-飞桨AIStudio星河社区(baidu.com)https://zhuanlan.zhihu.com/p/574666812?utm_id=0遇到的问题：如下采用paddleNLP下文本分类实例进行分类训练后发现生成的模型分类不准。打算自己开发脚本进行分类计算再进行服务化部署。基于ERNIR3.0文本分类任务模型
Python中的自然语言处理和文本挖掘 api77 电商api api python 自然语言处理 easyui 开发语言网络前端 java
在Python中，自然语言处理（NLP）和文本挖掘通常涉及对文本数据进行清洗、转换、分析和提取有用信息的过程。Python有许多库和工具可以帮助我们完成这些任务，其中最常用的包括nltk（自然语言处理工具包）、spaCy、gensim、textblob和scikit-learn等。以下是一个简单的例子，展示了如何使用Python和nltk库进行基本的自然语言处理和文本挖掘。安装必要的库首先，确保你
Transformer结构介绍和Pyotrch代码实现肆十二 Pytorch语法 transformer 深度学习人工智能
Transformer结构介绍和Pyotrch代码实现关注B站查看更多手把手教学：肆十二-的个人空间-肆十二-个人主页-哔哩哔哩视频(bilibili.com)基本结构介绍Transformer结构是近年来自然语言处理（NLP）领域的重要突破，它完全基于注意力机制（AttentionMechanism）来实现，克服了传统RNN模型无法并行计算以及容易丢失长距离依赖信息的问题。Transformer
【探索AI】四：AI（人工智能）自然语言处理（NLP）美少女战士1@ 学习笔记 AI 人工智能自然语言处理
自然语言处理（NLP）的概念自然语言处理（NaturalLanguageProcessing，NLP）是一门交叉学科，涉及人工智能、计算机科学和语言学等领域，旨在让计算机能够理解、分析、生成和处理人类语言。NLP技术致力于使计算机能够与人类以自然语言进行交流，从而实现更加智能、便捷的人机交互。在自然语言处理中，常见的任务包括但不限于：文本分类：将文本按照预定义的类别进行分类，如垃圾邮件分类、新闻分
ChatGPT 4.0：革新文献检索与推荐体验 chatgpt
ChatGPT4.0：革新文献检索与推荐体验随着信息时代的到来，学术文献的数量急剧增加，如何快速而准确地检索到所需的文献，以及发现潜在有价值的研究，成为了学术界的一大挑战。ChatGPT4.0作为最新一代的自然语言处理模型，不仅在文献检索方面展现出强大的能力，更是在文献推荐领域发挥着越来越重要的作用。文献检索：精准、快速、深入ChatGPT4.0在文献检索方面的优势主要体现在三个方面：精准性、速度
Phoncent：开启AI创作与学习的新时代庄泽峰人工智能 gpt AIGC AI写作
随着人工智能技术的飞速发展，我们生活中的许多方面都正在经历着深刻的变革。在这个大背景下，Phoncent平台的出现，无疑为我们提供了一个全新的、一站式的AI创作与学习体验。Phoncent的核心优势在于其深度整合了GPT技术。GPT，作为一种先进的大型语言模型，已经在自然语言处理领域展现出了惊人的能力。它能够理解并生成人类语言，为我们提供了与机器进行自然、流畅交流的可能性。在Phoncent平台上
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他