iKang_dlut

UniCOQE: Unified Comparative Opinion Quintuple Extraction as A Set

作者：Zinong Yang, Feng Xu, Jianfei Yu, and Rui Xia

单位：School of computer science and engineering

Nanjing University of Science and Technolog, Nanjing, China

School of Accountancy

Nanjing University of Finance and Economics, China

1{znyang, jfyu, rxia}@njust.edu.cn, [email protected]

摘要

比较意见五元组提取(COQE)旨在识别产品评论中的比较意见句子，提取句子中的比较意见元素，然后将其纳入五元组。现有的方法将COQE任务分解为多个主子任务，然后以管道的方式解决它们。然而，这些方法忽略了子任务之间的内在联系和阶段之间的错误传播。为了一次性解决COQE任务，本文提出了一种统一的生成模型UniCOQE。我们设计了一个生成模板，其中所有比较元组被连接作为目标输出序列。然而，多个元组本质上不是有序序列，而是无序集合。预先定义的顺序会迫使生成模型学习错误的顺序偏差，从而影响模型的训练。为了减轻这种偏见，我们引入了一种新的“预测-分配”训练范式，将黄金元组建模为一个集合。具体来说，我们利用集合匹配策略来找到元组的最优顺序。多个基准测试的实验结果表明，我们的统一生成模型明显优于SOTA方法，烧蚀实验证明了集合匹配策略的有效性。

简单来说，就是现有的方法将五元组提取任务分解为多个子任务，以pipeline也就是首尾相接的方式去解决，忽视了子任务之间存在的练习，造成前一阶段的错误传播到后一阶段。也是一种信息抽取任务。

本文提出一种统一的生成模型，使用一个生成模版去链接所有被比较元素，作为目标输出序列。

导言

比较意见挖掘是意见挖掘的一个重要分支，其目的是挖掘产品评论中的比较信息。Jindal和Liu (2006b)首先提出了比较意见挖掘的概念，并引入了两个主要子任务:比较句子识别(CSI)和比较元素提取(CEE)。前者的目的是识别给定句子是否为比较句，后者的目的是提取给定比较句中的所有比较元素。Panchenko et al(2019)进一步提出比较偏好分类(CPC)任务，该任务旨在预测提供的比较句的比较偏好(更好，更差或无)。

图1:比较意见五元组抽取(COQE)任务的一个示例。给定一个产品评论句子，COQE的目的是识别它是否是比较句子，提取所有比较元素(如果存在)，并将它们合并到五元组中。

提出比较偏好分类(CPC)任务，该任务旨在预测提供的比较句的比较偏好(更好，更差或无)。

为了整合比较意见挖掘的各个子任务，Liu et al(2021)首先提出了比较意见五元抽取(COQE)任务(如图1所示)。COQE旨在识别产品评论中的比较意见句子，并提取句子中的五个比较意见元素，即比较主语(sub)、比较宾语(obj)、比较方面(ca)、比较意见(co)和比较偏好(cp)。然后将它们合并到一个五元组(sub, obj, ca, co, cp)中。刘等人(2021)采用多阶段模型，将COQE任务分解为主要子任务(前文提到的CSI、CEE和CPC)，然后以流水线方式逐个求解。然而，管道模型忽略了比较意见挖掘的多个子任务之间的内部联系，并且每个阶段之间的误差传播严重影响了模型的性能。

为此，我们首次在COQE任务上使用了一种称为UniCOQE的生成提取模型。我们利用T5 (rafael et al, 2020)作为主干，并提出了一个生成模板来适应COQE任务，识别比较语句和一劳永逸地提取所有五元组。

在生成范式中，我们将所有黄金比较元组连接在一起作为模型的目标输出序列。然而，多个元组本质上不是有序序列，而是无序集合。如果施加预定义的顺序，则会引入顺序偏差，迫使生成模型学习该偏差，从而阻碍模型的训练。以图1为例，有t1、t2、t3、t4四个目标元组。理论上，A4 = 24种目标元组的排列都是正确的。在训练过程中，模型会感到“困惑”:为什么t1;t2;t3;t4是正确的，而t4;t3;t2;t1是不可接受的?

批注：识别出文章中的比较句子，提取所有比较元素。存在的问题是，多个元组本质上不是有序的，而是无序的。在生成序列中强制规定顺序，太过死板，会造成模型只认为一种答案是正确的。

为了缓解这种顺序偏差问题，我们在生成模型中引入了“预测-分配”训练范式。在训练阶段，我们首先让模型自回归预测给定句子中的比较元组。随后，我们将金元组建模为一个集合，并使用匈牙利算法(Kuhn, 1955)将金元组集合与预测序列进行匹配，以找到金元组的最优顺序。

最后，我们在三个COQE基准上验证了我们的方法的性能。实验结果表明，我们的模型明显优于SOTA方法，并通过烧蚀实验验证了集合匹配策略的有效性。

本文的贡献可以概括为以下几点:

为了解决以往多阶段模型的误差传播问题，提出了一种生成式比较意见五元抽取模型。
我们引入了基于集合匹配策略的“预测-分配”训练范式，以减轻生成模型在训练过程中的顺序偏差。
我们的模型明显优于以前的SOTA模型，烧蚀实验验证了集合匹配策略的有效性。

2. 相关工作

比较意见挖掘任务作为意见挖掘的一个重要子任务，最早由Jindal和Liu (2006a,b)提出，旨在识别产品评论中的对比句，提取所有对比意见元素(实体、特征、对比关键词)。具体而言，它使用类顺序规则(Hu and Liu, 2006)来识别比较句，并使用标记顺序规则来提取比较元素。

随后的一些研究集中在比较句子识别(CSI)任务上。Huang et al .(2008)使用多种特征(如关键词和顺序模式)来识别比较句。Park和Blake(2012)利用语义和语法特征来探索识别科学文本中比较句的任务。Liu et al .(2013)基于关键词、句子模板和依赖分析对中文文档的比较句进行识别。

在比较元素提取(CEE)任务上，Hou and Li(2008)使用语义角色标注(semantic role labeling, SRL)分析比较句子的结构，并训练条件随机场(conditional random field, CRF)提取比较特征。一些研究(Song et al .， 2009;Huang et al .， 2010;Wang et al .， 2015a)也使用了CRF作为提取模型。

语义角色标注（Semantic Role Labeling，简称SRL）是一种自然语言处理技术，用于分析句子中谓词（如动词、形容词等）与句子中其他成分（如名词、短语等）之间的语义关系，并将这些关系标注出来。这种标注可以帮助计算机更好地理解句子的语义结构，从而提高自然语言处理的性能。

在语义角色标注中，谓词被视为句子的中心，而其他成分则被视为与谓词有关的角色。这些角色可以是主语、宾语、定语、状语等。通过对句子进行语义角色标注，可以得到一个包含谓词和各个角色之间关系的语义结构图，这个图可以被用于各种自然语言处理任务中，如信息抽取、问答系统、文本摘要等。

条件随机场（Conditional Random Field，简称CRF）是一种常用的序列标注模型，用于处理序列数据（如文本、语音等）中的标注问题。在自然语言处理中，CRF常被用于各种序列标注任务，如分词、词性标注、命名实体识别等。

在比较元素提取（Comparative Element Extraction，简称CEE）任务中，CRF被用作提取模型，用于从比较句子中提取比较特征。具体来说，通过对比较句子进行语义角色标注，可以得到句子中各个成分之间的语义关系。然后，利用CRF模型对这些语义关系进行建模，从而提取出比较特征。这种方法可以有效地处理各种复杂的比较句子，提高比较元素提取的准确性和效率。

考虑到早期的比较意见挖掘任务不包含作者的比较偏好，Ganapathibhotla和Liu(2008)首次提出了比较偏好分类(CPC)任务，目的是在给定比较句及其比较要素的情况下，预测哪个实体更受欢迎。它利用基于关键字的方法来确定比较偏好。Panchenko等(2019)使用预训练编码器对句子进行编码，并基于XGBoost对句子的比较偏好进行分类(Chen and Guestrin, 2016)。Ma等人(2020)采用图注意网络对比较句的句法解析信息进行建模，以更好地预测比较偏好。然而，CPC任务的前提是要比较的两个实体是预先标注的，这在现实场景中应用起来很有挑战性。

Liu et al .(2021)首次引入了比较意见五元抽取(COQE)任务。

图2:UniCOQE框架的概述。我们利用T5作为生成模型的主干，并采用“预测-分配”训练范式来减轻vallina生成模型的顺序偏差。在训练过程中，我们暂时关闭模型的梯度，让模型自回归预测元组。然后，我们将金元组建模为一个集合，并使用匈牙利算法将金元组集合与预测序列进行匹配，以分配金元组的最优顺序。

其目的是提取五元组(比较主体，比较客体，比较方面，比较意见，比较偏好)。具体来说，它使用了一个基于BERT的多阶段模型(Devlin et al .， 2019)，在每个阶段执行CSI、CEE和CPC任务。虽然该方法以管道的方式序列化比较意见挖掘的多个子任务，但错误在多个阶段的传播会影响模型的性能。

除了CSI、CEE、CPC、COQE等子任务外，一些研究方向也与比较意见挖掘密切相关。比较问答系统(Alhamzeh et al, 2021;Chekalina等人，2021)允许机器自动回答“相对于Z, X比Y好吗?”的比较问题。

意见元组提取(Jian et al .， 2016;传统的基于方面的情感分析中的Peng et al .， 2020)和四重提取(Cai et al .， 2021)旨在提取文本中的细粒度意见信息。

一些研究还探讨了生成模型的集匹配策略的使用。在关键词提取任务中，Ye等人(2021)将所有关键短语连接为Transformer的目标输出(Vaswani等人，2017)，而无需预定义顺序。在事件参数提取任务中，Ma等人(2022)引入了BART的最佳跨度分配方案(Lewis等人，2020)。这些研究证明了集合匹配策略在生成模型中的有效性，突出了它们在提高生成lm性能方面的潜力。

3 Methodology

本节详细介绍了UniCOQE框架(如2所示)。在该框架中，我们将COQE任务建模为自然语言生成任务。我们使用生成式预训练语言模型T5 (rafael et al, 2020)作为主干模型，采用生成模板直接识别比较句子，并端到端输出比较五元组。为了进一步缓解生成模型的顺序偏差问题，我们引入了“预测-分配”训练范式。

3.1 任务表述

首先将COQE任务表述如下，给定一个产品评审句子 $X = \left \{ {x_{1}, ..., x_{n}} \right \}$ COQE包含n个标记，旨在识别它是否是比较句，如果是，则提取其中的所有比较五元组：

$\begin{aligned} S_{X}= & \left\{t u p_{1}, \ldots, t u p_{k}\right\} \\ = & \left\{\left(s u b_{1}, o b j_{1}, c a_{1}, c o_{1}, c p_{1}\right), \ldots,\right. \\ & \left.\left(s u b_{k}, o b j_{k}, c a_{k}, c o_{k}, c p_{k}\right)\right\} \end{aligned}$

其中k是从比较句X中提取的比较五元组的个数。

Tup = (sub, obj, ca, co, cp)是一个抽取的五元组，其中sub是主体实体，obj是客体实体，ca是被比较的方面，co是作者反映比较偏好的意见。cp∈{WORSE, EQUAL, BETTER, DIFFERENT}是作者的比较偏好。

3.2 生成范式的COQE

在本节中，我们将介绍COQE任务的生成范例。我们设计了一个T5生成模板，用于端到端抽取五元组。示例如下:

输入:佳能的光学和电池比索尼和尼康的更可靠。

目标:(佳能，索尼，光学，更可靠，更好);(佳能，索尼，电池，更可靠，更好);(佳能，尼康，光学，更可靠，更好);(佳能，尼康，电池，更可靠，更

输入：佳能的光学和电池太棒了。

目标:(未知，未知，未知，未知，未知）

在生成范式中，k个黄金五元组与“;作为模型的目标序列。如果比较元素不存在，则用单词“unknown”填充。如果目标序列为“(unknown, unknown, unknown, unknown, unknown, unknown)”，则将相应的输入句子X视为非比较句。我们称这种方法为Vallina生成范式

然而，Vallina生成范式存在一个问题:k个目标元组本质上是一个无序集合，而不是有序序列。生成模型的训练基本上是基于交叉熵损失，严重依赖于目标文本序列的顺序。在许多情况下，人为地预定义顺序可能会在训练期间引入错误的顺序偏差，从而破坏模型的性能。

待预测的元组实际上是无序的集合，例如预测元组列表为[(1,a), （2，b）,(3,c)]，真实标签列表为[(2,b), (1,a), (3,c)]，这时预测的正确率为100%。

人为定义真实标签列表为[(2,b), (1,a), (3,c)]顺序，会使得模型感到困扰，生成能力受限于去生成[(2,b), (1,a), (3,c)]，实际上生成[(2,b), (1,a), (3,c)]中任意一种元组排列都是可以的。

3.3 Improving Generative COQE with Predict-and-Assign Paradigm

为了解决顺序偏差问题，我们引入了“预测-分配”训练范式。该范式包括两个步骤:预测步骤和分配步骤。

3.3.1 预测阶段

对于输入句子 $X = \left \{{x_{1}, ..., x_{n}} \right \}$ ，在训练阶段，我们暂时关闭模型的梯度反向传播，将X发送到t5编码器中，得到句子的潜在表示：

$h^{enc} = \mathbf{Encoder}\left ( X \right )$

然后，我们使用t5解码器自回归预测所有比较五元组。在解码器的第c个时刻，henc和之前的输出令牌:t1:c−1被用作解码器的输入:

$h_{c}^{dec} = \mathbf{Decoder}\left ( h^{enc}, t_{1:c-1} \right )$

令牌tc的条件概率定义如下:

$P(t_{c}|t_{1:c-1}, X)=Softmax(h_{c}^{dec}W+b)$

3.2.2 分配阶段

给定两个元组:p和g，我们定义p和g之间的相似度得分如下:

其中n是元组中元素的个数。在我们的例子中，n = 5，因为我们有5个元素(即。(sub, obj, ca, co，和cp)在比较五元组中。这里的IoU指的是两个令牌序列的“交于并”，k指的是元素的索引(例如，对于ca, k = 3)。因此，IoU(p (k)， g(k))计算两个元组中第k个元素的IoU分数。我们最终将所有五个元素的平均IoU得分作为两个元组的相似性得分。例如，在图3中，我们有元组p1 =(佳能，尼康，传感器，不太稳定，更糟)，g2 =(佳能，索尼，传感器，不太稳定，更糟)，元素方面的IoU分数分别为1,0,1,1,1和1。所以p1和g2的相似度是0.8。

然后定义p和q之间的分配代价:

对于真元组设置Qgold = {tupgold 1，…， tupgold K}，我们的目标是找到Qgold的一个排列π φ，使π φ (Qgold)在预测阶段(第3.3.1节)是与模型预测的元组最相似的序列。这本质上是一个赋值(又名二进制匹配)问题。

形式上，为了找到基真元组Qgold的最优阶，我们搜索一个使总分配代价最小的排列π;

K是Qgold中元组的个数。Π(K)是Qgold中K个元组的排列空间。

我的理解，模型预训练时已经具备了充分的通用领域知识。关闭梯度更新，相当于冻结模型参数，这时先让模型生成一些五元组试试看。

然后利用匈牙利算法，去改变真实标签的元组排列，让重排后的真实标签的元组列表，与冻结模型的预测结果，取得最高的IoU相似度匹配，这时认为真实标签是最优的。

匈牙利算法可以理解为，3位男士，3位女士，寻找他们之间以某种度量最优的一对一搭配。

π * (Qpred)是式(5)中元组的预测序列。这种寻找最优分配的过程可以用匈牙利算法(Kuhn, 1955)有效地解决。Cmatch(π∗，π})是排列π∗与排列π}之间的总成对匹配代价。分配成本可以定义如下

π * (Qpred)是式(5)中元组的预测序列。这种寻找最优分配的过程可以用匈牙利算法(Kuhn, 1955)有效地解决。Cmatch(π∗，π})是排列π∗与排列π}之间的总成对匹配代价。分配成本可以定义为:

where $s = \min(|Q_{pred}|, |Q_{gold}|)$ is the minimum number of tuples between

在分配黄金元组的新阶数后，我们将标签元组的新顺序作为模型的训练目标，并重新打开梯度反向传播重新开始训练。

4 实验

4.1 数据集

我们在Liu et al .(2021)发布的三个COQE数据集上进行实验:Camera-COQE、CarCOQE和Ele-COQE:

camera - coqe包含相机领域的英文产品评论。本数据集基于Kessler和Kuhn(2014)，完成了比较意见(co)和比较偏好(cp)的注释。
Car-COQE包含汽车领域的中文产品评论。数据集以Car数据集为基础，补充了比较意见和比较偏好。
Ele-COQE同样来源于COAE2012/2013中的电子产品评论数据集(Tan et al, 2013)，该数据集包含电子产品的中文比较产品评论。

三个数据集的统计结果如表1所示。每个数据集都包含非比较句和比较句。#Comparative表示比较级句的个数，#Non-Comparative表示非比较级句的个数。multicomparison是包含多个比较的比较句的个数。

	Car-COQE	Ele-COQE	Camera-COQE
#Subject
#Object
#Aspect
#Opinion
#Preference
#Comparative
#Non-Comparative
#Multi-Comparative
#Comparisons Per Sent

4.2 Experimental Setup

我们采用T5作为骨干模型。我们对英语数据集使用T5，对中文数据集使用多语言T5 (mT5) (Xue et al, 2021)。

我们没有选择中文T5模型，因为Car-COQE和Ele-COQE中有多个非中文字符(即产品名称和版本)。我们使用Huggingface1库提供的t5-base和mt5-base进行实验。对于T5和mT5，我们分别将批大小设置为24和10。两个模型的学习率都设为3e-4。我们训练T5 60轮次，mt5 30轮次。

4.3 Evaluation Metrics

根据Liu et al(2021)的设置，对于比较句子识别(CSI)任务，我们报告了准确性度量。对于COQE任务，我们考虑三种匹配策略:精确匹配、比例匹配和二进制匹配。这三个指标在模型预测的元组上不同程度地度量F1分数。

对于三种评价指标，我们分别定义#correcte,#correctp,#correctb 如下

其中gk是黄金比较五元组的第k个元素，pk是预测比较五元组的第k个元素。Len(·)表示比较元素的长度

#correcte：表示预测结果中与真实结果完全相同的元素数量。如果预测结果和真实结果之间存在差异（即某些元素在真实结果中存在，但在预测结果中不存在，或者存在但位置不同），则计数为0。
#correctp：表示预测结果中与真实结果完全匹配的元素所占的比例。如果预测结果和真实结果之间存在差异，则计算差异的元素数量占真实结果元素数量的比例。
#correctb：表示预测结果中与真实结果完全匹配的元素所占的比例，但仅在真实结果和预测结果都不为空时计算。如果真实结果或预测结果为空，则计数为0。

这些指标可用于评估模型的性能，通常用于文本生成，图像识别，语音识别等领域。

4.5 主要结果

在表2中，我们报告了所有五种方法在CSI和COQE的两个任务上的性能。

三个数据集:Camera-COQE、Car-COQE和Ele-COQE。对于CSI，我们报告精确度度量。

所有的指标都是在精确匹配的情况下。

实验结果表明，在CSI任务和COQE任务上，UniCOQE模型在三种数据集上都取得了最好的性能。这两种基于crf的方法通常在这两个任务上的性能都是最低的。MultiStageLSTM实现了相对更好的性能。

在CSI任务上，Multi-StageBERT已经在三个数据集上取得了相当满意的准确率:93.04、97.39和98.31。然而，值得注意的是，我们的UniCOQE模型仍然比Multi-StageBERT高出2.17%、0.89%和0.10%。

在COQE任务中，使用UniCOQE模型在Camera-COQE、Car-COQE和EleCOQE数据集上分别实现了18.59%、6.80%和4.73%的改进。值得注意的是，我们的UniCOQE模型相对于其他模型的优势在英文数据集上比在中文数据集上更为明显。一种可能的解释是，mT5是T5的多语言版本，涉及多种语言的预训练，并且具有更广泛的词汇表，这将削弱模型在单语言数据集上的性能。

4.6 集合匹配策略的影响

在表3中，我们展示了集合匹配策略对生成模型的影响。实验结果表明，与Vallina生成模型相比，集合匹配策略提高了模型在CameraCOQE、Car-COQE和Ele-COQE数据集上的性能。结果表明，集合匹配策略确实找到了更好的元组顺序，有助于模型更好地学习数据分布。

4.7 多元组场景结果

为了衡量模型在多数据上的有效性，我们只使用测试集中的多元数据进行评估。我们在表4中演示了多个场景的结果。实验结果表明，集合匹配策略显著提高了模型在多元数据下的性能。以精确匹配度量为例，对比Valiina生成

范例中，与Camera-COQE、Car-COQE和Ele-COQE相比，UniCOQE分别获得了3.87、1.74和1.70%的改进。

4.8多元组的交换UniCOQE在训练过程中，多元组的交换次数如图4所示。

在前十个时代，元组交换的数量不断增加。在第11个历元前后，所有三个数据集都达到峰值，并且数量趋于稳定。Camera和Car上的元组交换数量都稳定在140左右。相比之下，电子数据集稳定在60左右，因为电子领域的多元数据较少。

在图5中，我们展示了双匹配策略对T5训练过程的影响。以example1为例，我们可以观察到，在模型训练的一开始(epoch 1)，如果我们遵循默认的“黄金”序列顺序，计算得到的交叉熵损失为1.453。

然而，如果我们根据我们的集合匹配策略分配一个新的元组顺序，新的损失将变成0.598。随着训练时间的增加，这种现象更加明显。如例2所示，在epoch 15，默认元组顺序的损失为2.244，而新分配的顺序的损失要小得多:0.032。

在本文中，我们研究了比较意见五元抽取的任务。为了克服以往管道模型的误差传播问题，提出了一种基于生成范式的管道抽取模型。我们进一步引入了一种基于匈牙利算法的集合匹配策略，以减轻生成模型在训练过程中的顺序偏差。实验结果表明，我们的模型明显优于SOTA模型，并通过深入的实验验证了集合匹配策略的有效性。

我们总结了我们工作的局限性如下:•我们只验证了在COQE任务上生成模型的集合匹配策略的有效性。

•我们观察到COQE数据集的规模相当小，导致了模型的过拟合问题。

在未来，我们将从以下几个方面进行进一步的研究:•探索集匹配策略在多个研究方向上的进一步应用，如信息提取、情感分析等。

•利用无监督数据更好地帮助模型挖掘比较意见信息。

•设计数据增强方法，缓解数据稀疏性问题。

我们在(Liu et al .， 2021)之前建立的三个数据集上进行实验，即CameraCOQE、Car-COQE和Ele-COQE。这些数据集不包括个人信息或包含任何可能伤害个人或社区的令人反感的内容。值得注意的是，某些产品评论可能包含匿名客户给出的产品之间的主观比较，这并不一定反映本研究的偏好。

本文得到中国自然科学基金项目(No. 62076133、62006117、72001102)和江苏省青年自然科学基金项目(No. 62006117)的支持。

(BK20200463);BK20200018)。

大语言模型应用指南：ReAct 框架 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：ReAct框架关键词：大语言模型,ReAct框架,自然语言处理(NLP),模型融合,多模态学习,深度学习,深度学习框架1.背景介绍1.1问题由来近年来，深度学习技术在自然语言处理(NLP)领域取得了显著进展。尤其是大语言模型(LargeLanguageModels,LLMs)，如BERT、GPT系列等，通过在大规模无标签数据上进行预训练，获得了强大的语言理解和生成能力。然而，预
大语言模型原理基础与前沿基于语言反馈进行微调 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿基于语言反馈进行微调作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进展。大语言模型（LargeLanguageModels，LLMs）如GPT-3、BERT等在各项NLP任务上取得了令人瞩目的成绩。然而，如何进一步提高大语言模型的理
四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调技术时，我们进入了一个令人兴奋的领域。这些大型预训练模型，如GPT-3、BERT和T5，拥有卓越的自然语言处理能力，但要使它们在特定任务上表现出色，就需要进行微调，以使其适应特定的数据和任务需求。在这篇文章中，我们将深入探讨四种不同的人工智能大语言模型微调技术：SFT监督微调、LoRA微调方法、P-tuningv2微调方法和Freeze监督微调方法。第一部分：SFT监
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
RNN案例人名分类器（完整步骤） AI扶我青云志 rnn 人工智能深度学习 nlp lstm gru
今天给大家分享一个NLP（自然语言处理）中的一个小案例，本案例讲解了RNN、LSTM、GRU模型是如何使用并进行预测的，一、案例架构人名分类器的实现可分为以下五个步骤:第一步:导入必备的工具包第二步:对data文件中的数据进行处理，满足训练要求第三步:构建RNN模型(包括传统RNN,LSTM以及GRU)第四步:构建训练函数并进行训练五步第:构建评估函数并进行预测二、实现步骤1.导包#导入torch
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
AI原生应用必知：5大高效多轮对话框架对比 AI原生应用开发 AI-native easyui 前端 ai
AI原生应用必知：5大高效多轮对话框架对比关键词：AI原生应用、多轮对话、对话框架、自然语言处理、上下文管理、意图识别、对话状态跟踪摘要：本文深入探讨了构建AI原生应用时必备的5大多轮对话框架，包括Rasa、Dialogflow、MicrosoftBotFramework、AmazonLex和IBMWatsonAssistant。通过对比分析它们的架构设计、核心功能和应用场景，帮助开发者选择最适合
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
Nystromformer：一种基于 Nyström 方法的自注意力近似算法 AI专题精讲 Paper阅读人工智能自然语言处理 AI
1.摘要Transformer已经成为广泛自然语言处理任务中的强大工具。推动Transformer展现出卓越性能的一个关键组件是self-attention机制，它对每个token编码了其他token的影响或依赖关系。虽然self-attention机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用——这是当前社区积极研究的一个主题。为了解决这一限制，我们提出了Nystr
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
供应链风险管理：AI如何预测供应链风险 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,时间序列分析,风险评估1.背景介绍在当今全球化经济体系中，供应链风险已成为企业面临的重大挑战。供应链的复杂性和不可预测性使得企业更容易受到各种风险的影响，例如自然灾害、政治动荡、经济波动、疫情爆发等。这些风险可能导致供应中断、成本增加、交付延迟，甚至损害企业声誉。传统供应链风险管理方法主要依赖于经验和专家判断，缺乏数据驱动和预测能力。随着
使用Python爬虫与自然语言处理技术抓取并分析网页内容 Python爬虫项目 python 爬虫自然语言处理 javascript 数据分析人工智能
1.引言在如今数据驱动的时代，网页爬虫（WebScraping）和自然语言处理（NLP）已成为处理大量网页数据的重要工具。利用Python爬虫抓取网页内容，结合NLP技术进行文本分析和信息抽取，能够从大量网页中提取有价值的信息。无论是新闻文章的情感分析、社交媒体的舆情分析，还是电商网站的商品评论挖掘，这些技术都发挥着至关重要的作用。本文将介绍如何利用Python爬虫与自然语言处理技术抓取并分析网页
GPT在AI原生应用领域的无限潜力
GPT在AI原生应用领域的无限潜力关键词：GPT、AI原生应用、自然语言处理、无限潜力、应用场景摘要：本文深入探讨了GPT在AI原生应用领域所展现出的无限潜力。首先介绍了相关背景知识，包括GPT的基本概念和AI原生应用的定义。接着详细解释了GPT的核心概念，以及它与AI原生应用的紧密联系。通过数学模型和公式对GPT的工作原理进行了阐述，并给出了实际的代码案例。还探讨了GPT在多个实际应用场景中的表
深度学习前置知识全面解析：从机器学习到深度学习的进阶之路
一、引言：人工智能时代的核心技术在当今这个数据爆炸的时代，人工智能(AI)已经成为推动社会进步的核心技术之一。作为AI领域最重要的分支，深度学习(DeepLearning)在计算机视觉、自然语言处理、语音识别等领域取得了突破性进展，彻底改变了我们与机器交互的方式。本教案将从机器学习的基础知识出发，系统性地介绍深度学习的核心概念、数学基础、网络架构和训练方法，为读者构建完整的知识体系框架。无论你是刚
AI 加持下的智能家居行业：变革、挑战与机遇低代码老李人工智能智能家居
在当今科技迅猛发展的浪潮中，人工智能（AI）已深深融入智能家居领域，成为推动其蓬勃发展的关键力量，为人们的生活带来了诸多便利和创新体验，同时也面临着一系列亟待解决的问题。一、AI驱动的智能家居功能升级（1）智能语音交互与控制智能语音助手作为智能家居的核心交互方式，借助自然语言处理（NLP）技术，让用户仅通过简单的语音指令，就能轻松操控家中各类智能设备，如精准控制灯光的开关与亮度调节、窗帘的开合、电
视觉表征和多模态融合一只齐刘海的猫语言模型
视觉表征和多模态融合是当前人工智能领域的研究热点，特别是在计算机视觉和自然语言处理的交叉领域。视觉表征是指将图像或视频信息转化为模型可以处理的向量形式，而多模态融合则是将不同类型的数据（如视觉、文本、音频等）进行整合，以实现更全面、准确的信息理解和处理。视觉表征(VisualRepresentation)目的：将图像或视频数据转化为深度学习模型可以理解的特征向量。方法：卷积神经网络(CNN)：传
NLTK库全解析：用Python打开自然语言处理的第一把钥匙
引言你是否好奇过，手机里的智能助手是如何“听懂”你说的话？电商平台的差评分析又是怎样精准提取“物流慢”“质量差”这些关键词？这些看似神奇的自然语言处理（NLP）功能，背后都藏着一个“入门神器”——NLTK（NaturalLanguageToolkit）。作为Python生态中最经典的NLP库，NLTK就像一本“NLP百科全书”，从最基础的文本拆分到复杂的语义理解，它用简单的代码接口，带我们推开自然
VLA模型
一介绍在机器人领域，视觉-语言-动作(VLA)模型的发展经历了显著的演变，这得益于计算机视觉和自然语言处理领域的进步。VLA模型代表了一类旨在处理多模态输入的模型，整合了来自视觉、语言和动作的信息。这些模型对于实现具身智能至关重要，使机器人能够理解物理世界并与之互动。以下是VLA模型发展的时间线：早期阶段：计算机视觉和自然语言处理的集成大约在2015年开始，随着视觉问答(VQA)系统的出现。这些系
循环神经网络（RNN）：序列数据处理的强大工具 LNL13 rnn 人工智能深度学习
在人工智能和机器学习的广阔领域中，处理和理解序列数据一直是一个重要且具有挑战性的任务。循环神经网络（RecurrentNeuralNetwork，RNN）作为一类专门设计用于处理序列数据的神经网络，在诸多领域展现出了强大的能力。从自然语言处理中的文本生成、机器翻译，到时间序列分析中的股票价格预测、天气预测等，RNN都发挥着关键作用。本文将深入探讨RNN的工作原理、架构特点、训练方法、常见类型以及其
大语言模型应用指南：Gemini简介 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍自然语言处理（NLP）一直是人工智能领域的热门话题之一。在NLP中，语言模型是一个重要的概念，它可以用来预测下一个单词或字符的概率。近年来，随着深度学习技术的发展，大型语言模型的研究和应用也越来越受到关注。其中，Gemini是一种新型的大型语言模型，它在多项任务上取得了优异的表现。本文将介绍Gemini的核心概念、算法原理、数学模型和公式、项目实践、实际应用场景、工具和资源推荐、未来发
深入了解Transformer模型及其优缺点
目录前言1Transformer结构特点1.1注意力机制（Self-Attention）1.2编码器-解码器架构1.3位置编码和基于注意力的损失函数2Transformer模型优缺点分析2.1Transformer模型的优点2.2Transformer模型的缺点3应用领域结语前言在当今人工智能领域，自然语言处理的关键问题之一是解决文本理解和生成中的挑战。传统的循环神经网络虽然在处理序列数据方面取得
Anconda环境下Vscode安装Python Java后时代程序员 python 学习面试
最后Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习Python门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的Pytho
蒙特卡罗方法与深度学习的关系 AGI大模型与大数据研究院 AI大模型应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
蒙特卡罗方法与深度学习的关系作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来蒙特卡罗方法和深度学习都是近年来在计算科学和人工智能领域取得重大突破的技术。蒙特卡罗方法是一种基于随机抽样的数值计算方法，广泛应用于物理、工程、金融等领域。深度学习则是一种基于人工神经网络的学习方法，在图像识别、语音识别、自然语言处理等领域取得了显
新华妙笔：AI智能写作助手，让高效写作触手可及东风西巷 AI写作 android 软件需求智能手机
在当今快节奏的时代，无论是职场人士、学生还是创作者，都面临着大量的写作任务。从工作总结、调研报告到公文写作、商业文案，高效且高质量的写作能力成为了提升个人竞争力的关键。然而，写作不仅需要丰富的知识储备和扎实的文字功底，还需要大量的时间和精力去打磨。为了帮助用户更高效地完成写作任务，新华妙笔APP应运而生。它是一款功能强大的AI智能写作助手，依托自然语言处理（NLP）和大数据分析技术，能够快速生成各
【大模型面试】大模型Prompt Engineer面试题及参考答案大模型知识 prompt 人工智能开发语言 python chatgpt 深度学习大模型
一、基础概念类1.什么是大模型？大模型通常指具有庞大参数规模的机器学习模型，尤其是在自然语言处理（NLP）和计算机视觉等领域。这些模型能够学习到大量数据中的复杂模式和特征，具备强大的泛化能力，可在多种任务上表现出色，如GPT系列、BERT等。2.大模型与传统机器学习模型的区别是什么？传统机器学习模型参数规模相对较小，往往针对特定任务进行设计和训练，需要较多人工特征工程。而大模型参数数量庞大，通过在
！LangChain链的并行执行与异步处理深度解析(32) Android 小码蜂测试专栏 langchain
LangChain链的并行执行与异步处理深度解析一、LangChain链的基础概念与执行逻辑1.1LangChain链的定义与作用LangChain链（Chain）是LangChain框架的核心组件之一，它通过将多个组件（如提示模板、大语言模型、输出解析器等）串联起来，形成一个完整的处理流程，以实现特定的自然语言处理任务。例如，在问答系统中，链可以先使用提示模板构建问题，然后调用大语言模型生成回答
AI产品经理技术篇：AI领域常用术语解析让我看看好学吗人工智能产品经理机器学习深度学习学习
作为AI产品经理，深入理解人工智能领域的核心术语是高效沟通、需求定义和产品落地的关键。无论是与算法工程师协作优化模型，还是向业务方解释技术方案，准确掌握专业术语能显著提升决策效率，避免因概念混淆导致的开发偏差。本文系统梳理了模型与算法、NLP（自然语言处理）、CV（计算机视觉）、数据处理、核心评估指标等领域的核心术语，帮助产品经理快速构建AI技术认知框架。目录1.基础概念2.模型与算法3.自然语言
AI大模型的2种模型能力Function call 和ReAct DeepSeek-大模型系统教程人工智能 react.js 前端 git ai 语言模型
近年来，随着AI大模型的快速发展，如何让这些模型更好地与现实世界交互成为了一个重要课题。FunctionCall和ReAct作为两种重要的模型能力，为大模型提供了更强大的工具调用和任务执行能力。我们将深入探讨这两种能力的背景、原理、应用场景以及它们之间的对比。帮助你深入了解他们的价值。01背景介绍AI大模型（如GPT-4、PaLM等）在自然语言处理、文本生成等任务中表现出色，但它们的能力往往局限于
大模型算法工程师面试宝典：精选面试题及参考答案全解析，助你备战AI算法工程师岗位！大模型入门学习人工智能产品经理大数据机器学习程序员大模型大模型学习
大模型应该算是目前当之无愧的最有影响力的AI技术。它正在革新各个行业，包括自然语言处理、机器翻译、内容创作和客户服务等，正成为未来商业环境的重要组成部分。截至目前大模型已超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关面试也是越来越卷。我今天给大家分享一篇大模型的面试题总结，内容较长，喜欢记得收藏、关注、点赞。ii.为什么会出现LLMs复读机问题？出现LLMs复读机问题可能
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。