LIZHIN

论文《Chinese NER Using Lattice LSTM》心得总结

大家好，这是本人第一次认证撰写的一篇关于自然语言处理的文章，希望大家多多支持。谢谢啦。

这次分享的论文是《Chinese NER Using Lattice LSTM》，标题中有两个关键字Chinese NER，Lattice LSTM.我们先来讲讲Chinese NER 。全称为Chinese Named Entity Recongination，即中文命名实体识别，这是自然语言处理中重要的任务之一。

1. NER 介绍

命名实体识别可以识别出文本中的实体边界和对应实体类型，同时可以将其添加到现有的知识库中。

文本中的实体包含充足的语义内容藐视一个重要的语言单元，命名实体识别从原始的文本中可恶意提取上述包含丰富语义的实体和实体指代项。，并将实体划分到对应的实体类型中。通常实体类型是人名，地名，组织名。例如在一段文本中“2015年10月获得诺贝尔生理学或医学奖，理由是她发现了青蒿素，这种药瓶可以降低疟疾患者的死亡率，她成为首个获得科学类诺贝尔奖的中国人”，文章包含有时间实体，医学实体，国家实体，人名实体总共六个命名实体，由此可见，命名实体是构建文本语义解析的重要组成部分。

1991 年，Rau 等人首次提出命名实体识别任务在第七届IEEE人工智能应用会议；将人工编写规则与启发式算法结合实现从自然文本中提取公司名称的命名实体。

1996年，命名实体识别作为信息抽取的子任务被引入MUC-6,随后被添加给各类的评测任务中；

这些任务数据集大多数针对英文文本，英文文本由于词与词之间存在空格的分割，可研究性比较高，现有的英文数据集的命名实体识别的准确度，召回率，F1值均可以达到90%,由于中文必须对文本进行中文分词处理，相较于英文，中文命名实体识别难度较大。但是还是有该方面的研究者取得不俗的成绩。

综上所示，命名实体识别技术是自然语言处理的关键，通过命名实体的抽取和归类可以用于解决海量文本中数据冗余和数据爆炸问题，为当前的大数据环境下解决数据爆炸式增长问题提供新的思路。命名实体识别从最初的基于规则和基于字典的方法到传统机器学习再到现有的深度学习方法。命名实体识别方法不断提高非结构化文本转化为结构文本的质量与效率。

命名实体识别任务如果得到有效的处理，那么将为随后的实体消歧，知识库构建，机器翻译，自动问答等任务提供一个良好的基础。

命名实体识别最早由基于词典和规则的方法到传统的机器学习方法，后来到现有的基于深度学习的方法，一直到现有的bert预处理模型+微调模型和图神经网络等研究方法。技术发展趋势如下图所示：

目前，NER的方法主要分为三大类。

1.1 基于规则方法

基于规则的方法和字典的方法式最初的实体识别的使用的方法，这些方法采用语言学家通过人工方式，依据数据特征的特定模板或者特定的词典，规则包含关键字，位置词，方位词，中心词，指示词，统计信息，标点符号，词典由特征的词典与外部词典共同组成，外部词典指已有的常识分词词典，制定好规则和词典之后，通常使用基于匹配的方法啊，对文本进行处理。但是基于规则方法不仅仅需要消耗巨大的人力，且不容易实现在其他数据集上迁移，即无法适应新的数据。大多数情况下是将基于规则和机器学习方法结合使用。

1.2 基于机器学习方法

基于传统的基于机器学习的方法，其中，命名实体识别被视为序列标注问题，与分类问题不一样，序列标注问题的当前预测不仅仅与当前的输入特征有关，而且与之前的预测标签有关，即预测标签序列之间存在相互依赖关系，采用传统机器学习的方法主要包含隐形马尔可夫模型，最大熵模型，最大熵马尔可夫模型，支持向量机模型。条件随机场模型等。

1.3 基于深度学习方法

基于深度学习的方法，深度学习模型不需要进行特征工程与领域知识，Collbert 首次提出基于神经网络的命名实体识别方法，该方法每个单词具有固有的窗口，单词标注取决于相邻单词，但是没有考虑到长距离单词之间的有效信息，为了克服限制，Chinu 和Nichols 提出基于双向LSTM-CNN架构，该架构会自动检测单词和字符界别的特征。摆脱传统方法的特征工程，有效考虑到单词的上下文。Ma和Hovy 京一部将其扩展到BiLSTM-CNN-CRF，将CRF模块添加用来优化序列标签。

深度学习神经网络是一种外绝潜在特征的多层神经网络。每一层输出是该语句一种的抽象表示，语言本省是一种抽象表达。因此在大量训练数据基础上生成基于向量的特征表示，利用神经网络进行NER任务是目前学者正在探索的方法，由于中英文语言特征的差异，中文命名实体识别首先是对文本进行分词，分词错误会导致在NER上错误累加。因此，已有证明基于字符的方法在中文NER上优于基于词的模型，不会导致分词错误累加是字符级模型的优势，但是从另一方面也是该方法的缺点，因为有些单词信息蕴含的词义信息可以使得字符级模型在识别实体时候产生歧义，例如南京市长江大桥，因此我们使用一种基于字和词混合的网格Lattice LSTM结构，这个结构能够实现对于句子中的专有名词进行识别，将潜在的单词信息整合到字符的LSTM CRF结构中。

1.4 NER 发展研究

现阶段，命名实体识别的研究难点分别式：垂直领域命名识别的局限性，命名实体表达的多样性与歧义性，命名实体的复杂性与开放性。这篇文章主要解决的就是第二个问题：减少命名实体表达的多样性与歧义性

2. Lattice LSTM模型

最近由于在处理字符级别信息与单词级别信息融合上有些问题，所以就去仔细阅读相关文献资料，于是发现《Chinese NER Using Lattice-LSTM》这篇文章。

目前英文NER模型效果最好的是LSTM-CRF, 对于中文NER,我们也可以使用这种模型，不过，中文文本不同于英文文本，需要对其进行分词（基于词的方法），尽管分词工具有很多（中科院ICTCLAS,哈工大语言云，Pyhton jieba和SnowNLP等），但是分词效果不可能是完美的

可能其中会出现各种分词方法不一致（尤其是在专业文本领域中：医疗命名实体识别）
可能分词结果会出现不统一的情况。即分词的细粒度不同。

简单来说，NER 就是通过序列标注对实体边界和实体类别进行预测，从而识别和提取相应的的命名实体，所以一旦出现分词错误，就会直接影响实体边界的预测，导致识别错误，这在开放域这种是个很严重的问题。

为了避免上述问题，研究者们开始尝试基于字符的方法，该方法不需要进行分词，以每个字符为单位进行训练，虽然训练集规模巨大，训练时间变长，但是研究表明，基于中文NER,基于字符的方法优于基于词的方法，但是可以想到，由于没有进行分词，所以基于字符的方法无法利用文本中的单词信息，这也会使得识别效果有瑕疵，举一个例子：比如一句话:"南京市长江大桥"，如果没有单词信息，识别结果很有可能为：“南京”，“市长”，“江大桥”。所以使用基于字符模型嫌弃信息少，使用基于基于单词模型又嫌弃有错误。

2.1 数据集介绍

表1 表示的是这篇文章所用到的四个数据集，文章代码中只显示resume数据库，分别还有对应数据集的包含的语料类型，训练集，验证集和测试集的数据量。

OntoNotes:新闻邻域语料采用报告开发实验
MSRA:新闻预料
Weibo:数据集来自于社交媒体新浪微博
resume:从新浪财经上获取的关于中文简历信息。其中包含中国股市上市公司高管的简历信息，本文随机选择1027个简历摘要，并且使用YEDDA系统手工标注8种命名实体。采用BMES实体标注方法，本文代码中提供的就是resume语料库

对于OntoNotes 和MSRA 数据集，训练中采用黄金分割标准

表2 显示的是resume 数据库中的统计的实体类型和各类实体数量，包含国家，教育机构。地点。人名，组织，职业，背景，指称八个实体类别，还有各个实体类别在训练集，验证集，测试集中的个数。整个resume数据集训练集有13438个实体，验证集有1497个实体，测试集有1620个实体。

2.2 传统模型介绍

好了，现在进入正文，本篇文章作者提出针对于中文命名实体识别提出一种网格结构的LSTM模型（Lattice LSTM），如下图所示，相较于基于字符的方法(characte-based),能够充分利用单词和词序两者信息，相较于词的方法（word-based）,不会因为分词错误影响识别结果。为了清楚只管感受这几个模型结构的异同，我们先从基于字符模型开始。

为了准确提取命名实体，不仅仅需要语料选择合适的学习方法，还要给出特征集，丰富的特征工程可以提高模型的学习能力和识别准确率。特征工程对象有：字符特征，词性特征，词典特征。

2.2.1 基于字符的方法

我们先来介绍一下基于字符的方法，下面图所示，输入文本都是中文字符， $x_{i}^{w}$ 代表字符在embedding中的向量，通过LSTM模型得到当前时序的的状态信息 $c_{i}^{c}$ 与隐藏层信息 $h_{i}^{c}$ ，当前时序状态 $c_{i}^{c}$ 作为下一个时序信息生成的输入，与此同时，隐藏层信息 $c_{i}^{c}$ 通过线并行变换得到对应的标签预测。标签预测方法为BMES字标注方法。下图显示的单项LSTM,没有显示具体的LSTM具体的门控单元信息，为的是达到简化图片的效果。

Char+bichar:

通过将字符与下一个字符组成二元结构进行嵌入向量表示，然后将上述特征表示与原有的字符表示进行凭借，得到输入向量。

Char+ softword（需要进行分词）：

通过字符在词典中的标签的特征与原有字符的特征表示进行拼接，softward表示字符在词典的标签（BMES方法），得到输入向量。但是这边究竟得到是分词的类别标签还是边界标签，还是两个都有。我倾向第三个。

2.2.2 基于单词的方法

我们接下来聊一聊基于单词的方法，下图就是基于单词的模型示意图，输入 $x_{i}^{w}$ 均是经过处理过后的分词，所以 $x_{i}^{w}$ 表达的是基于分词的特征表示。将这些各个时序中的 $x_{i}^{w}$ 输入LSTM模块中，得到两个输出：当前单词的单元状态输出和隐藏状态输出，当前单词单元状态输出将会作为下一个时序状态的信息输入 $c_{i}^{w}$ ，隐藏状态信息 $h_{i}^{w}$ 则会通过线性变换得到相应的标签预测。

上面公式表示单词序列特征表示来自两方面表示，一个是单词自生的特征表示，另一个是单词的字符特征表示

Word+ char LSTM

我个人理解这里是两层LSTM，第一层是计算每个词中所有字向量的输出作为公式7中的第二个元素，然后呢，公式8中的元素含义：第一个->第i个词最后一个字的正向的隐含层h；第二个->第i个词第一个字的反向的隐含层h。

上面模型使用双向LSTM学习关于字符的隐藏状态输出，t()中包含两个参数，第一个参数表示第几个单词，第二表示单词中的第几个字符。将上述学习得到单词中的字符表示与原有的单词表示进行融合。

Word + char CNN

每个单词序列使用标准CNN结构，获得单词中的字符表示，超参数ke=3，一般窗口长度为3，采用最大池化提取特征信息。

最大池化的作用简要的介绍：主要优势是提升训练速度;

2.2.3 基于Lattice LSTM的方法

最终我们谈一下最终的Lattice LSTM模型，可以将它看作是基于字符的模型的扩展，整合基于单词的单元和用于控制信息流的附加门。模型的输入是一个字符序列。以及与词典D中的单词相互匹配的所有的字符子序列，词典D 是由自动分段的原始文本构建的D。该模型涉及四种类型的向量，即输入向量，输出向量，单元向量以及门向量（遗忘门，输出门，输入门）。

2.3 Lattice LSTM 具体架构

从上图可以看出，模型中的红色圈圈，也就是红色的Cell，他们是句子中潜在的词汇产生的信息（由词典D产生，有多个分词器操作取得交集。），同主干LSTM相应的Cell连接起来构成类似于网格的结构，也就是对应题目中的Lattice，那么红色的cell如何融入到主干LSTM呢？所以我们必须要看一下其中架构。

该模型的核心思想是：通过lattice LSTM表示句子中的词，将潜在的词汇信息融合到基于字符的LSTM-CRF模型，实际上，该模型的主干部分依然是基于字符的LSTM-CRF，只不过这个LSTM每个cell内部信息处理方式与基本的LSTM不一致。因此，只要理解这一点，就能掌握该模型的工作原理，下面是对于模型具体讲解。

这就需要我们先看LSTM模型和Lattice LSTM的模型的基本架构。

2.3.1 LSTM

如下图所示，基本LSTM结构中，每个Cell含有输入门因子，遗忘门因子和输入门因子，他们是0-1小数（默认激活函数为Sigmod）,根据当前的输入和前一个Cell的输出计算得到的，还有一个核心元素就是Cell State （单元状态信息）,也就是上面的从左到右的箭头，它从头走到尾。记录整个序列的信息，输入门决定当前的输入有多少加入Cell State；遗忘门决定Cell State 要保留多少信息，输出门决定更新后的CellState 有多少可以可以输入。

基本LSTM的Cell 内部算法结构如下，其中的参数，函数以及符号均为基础知识，可以参见我上一篇博客。

下面是LSTM单元运算的公式。

步骤解释：

将当前输入的字向量 $x_{j}$ 与上一步的隐藏层 $h_{j-1}$ 输入concat为[ $x_{j}$ ; $h_{j-1}$ ]到LSTM 中，获得遗忘门因子 $f_{i}$ ,输入门因子 $i_{j}$ ,当前状态 $\hat{cj}$ ,输出门因子 $o_{j}$ 。
遗忘门因子 $f_{i}$ 通过sigmod函数激活当前的字向量和上一步隐藏信息的concat[ $x_{j}$ ; $h_{j-1}$ ]。
输入门因子 $i_{j}$ 通过sigmod函数激活当前的字向量和上一步隐藏信息的concat[ $x_{j}$ ; $h_{j-1}$ ]。
当前状态 $c_{j}$ 通过tanh函数操作当前的字向量和上一步的隐藏信息的concat[ $x_{j}$ ; $h_{j-1}$ ]。
输出门因子 $o_{j}$ 通过sigmod函数激活当前的字向量和上一步隐藏信息的concat[ $x_{j}$ ; $h_{j-1}$ ]。
通过遗忘门 $f_{i}$ 决定将上一状态 $c_{j-1}$ 的输入程度。
输入门因子 $i_{j}$ 与当前状态 $\hat{cj}$ 进行矩阵相乘。
将第六步与第七步进行相加，得到输出状态cj,对应上面第一个公式，最为下一步的状态信息输入。
将第八步得到的信息进行tanh操作，对应上面第二个公式，作为对现在时序信息的控制们因子。
将输出门因子与第九步结果进行矩阵相乘得到这一步隐藏层输入hj，作为下一步的隐藏状态信息。对应上面第二个公式。

2.3.2 Lattice LSTM

这里进行总结就是总共有三个LSTM结构，第一个lSTM是模型的主干结构，是基于字符的模型，主要任务是将上一个字符的信息作为输入得到两个输出，一个输出为当前时序的字符单元信息 $c_{b}^{c}$ ，用于接下来与第二个，通过遗忘门因子进行取舍。还有一个输出是当前字符的隐藏状态信息 $h_{b}^{c}$ 。用于接下来与潜在的单词序列 $x_{b,e}^{w}$ 进行来进行链接。通过sigmod 函数进行激活得到遗忘门因子。同时得到当前的单词序列的状态信息和经过遗忘门的字符序列进行链接。

将当前输入的字向量 $x_{b}^{c}$ 与上一步的隐藏层 $h_{b-1}^{c}$ 输入concat为[ $x_{b}^{c}$ ; $h_{b-1}^{c}$ ]到LSTM 中，获得遗忘门因子 $f_{b}^{c}$ ,输入门因子 $i_{b}^{c}$ ,当前状态 $c_{b}^{c}$ ,输出门因子 $o_{b}^{c}$ 。
输入门因子 $i_{b}^{c}$ 通过sigmod函数激活当前的字向量和上一步隐藏信息的concat[ $x_{b}^{c}$ ; $h_{b-1}^{c}$ ]
遗忘门因子 $f_{b}^{c}$ 直接取1-输入门因子 $i_{b}^{c}$
当前状态 $c_{b}^{c}$ 通过tanh函数操作当前的字向量和上一步的隐藏信息的concat[ $x_{b}^{c}$ ; $h_{b-1}^{c}$ ]。
输出门因子 $o_{b}^{c}$ 通过sigmod函数激活当前的字向量和上一步隐藏信息的concat[ $x_{b}^{c}$ ; $h_{b-1}^{c}$ ]。
通过遗忘门 $f_{b}^{c}$ 决定将上一状态 $c_{j-1}$ 的输入程度。
输入门因子 $i_{b}^{c}$ 与当前状态 $c_{b}^{c}$ 进行矩阵相乘。
将第六步与第七步进行相加，得到输出状态 $c_{b}^{c}$ 。
将第八步得到的信息进行tanh操作,得到隐藏状态信息 $h_{b}^{c}$ 。
将输出门因子与第九步结果进行矩阵相乘得到这一步隐藏层输入 $h_{b}^{c}$ 。
将第十步结果与 $x_{b,e}^{w}$ 作为输入进行concat，作为[ $h_{b}^{c}$ ; $x_{b,e}^{w}$ ]。
Lattice LSTM遗忘门因子 $f_{b,e}^{w}$ 通过sigmod函数激活当前的词向量和上一步隐藏信息的concat[ $h_{b}^{c}$ ; $x_{b,e}^{w}$ ]得到
Lattice LSTM输入门因子 $i_{b,e}^{w}$ 通过sigmod函数激活当前的词向量和上一步隐藏信息的concat[ $h_{b}^{c}$ ; $x_{b,e}^{w}$ ]得到
Lattice LSTM当前状态 $c_{b,e}^{w}$ 通过tanh函数操作当前的词向量和上一步隐藏信息的concat[ $h_{b}^{c}$ ; $x_{b,e}^{w}$ ]得到
Lattice LSTM的遗忘门因子 $f_{b,e}^{w}$ 与LSTM的输出 $c_{b}^{c}$ 进行矩阵相乘
Lattice LSTM的输入门因子 $i_{b,e}^{w}$ 与Lattice LSTM当前状态 $c_{b,e}^{w}$ 进行矩阵相乘
将第十五步与第十六步操作进行相加
将 $c_{b,e}^{w}$ 与第三个LSTM输出结果 $x_{e}^{c}$ 进行concat 操作
将第三个LSTM输出结果进行softmax操作得到 $a_{b,e}^{c}$
将第十九个步结果与 $c_{b,e}^{w}$ 进行矩阵相乘
将第三个LSTM输出结果进行softmax操作得到 $a_{e}^{c}$
将第二十一步结果与第三个LSTM生成的当前字符信息进行矩阵相乘
将第二十二步结果与第二十步结果进行相加，得到最终的输出结果cce
将第三个LSTM输出的输出门因子与被tanh 函数激活后的输出结果cce进行矩阵相乘，得到最终的隐藏状态输出。

结论：门控循环允许我们模型从一个句子中选择最相关的字符和单词获得更好的实体识别效果。

回到本文的Lattice LSTM模型（截取部分进行说明），例如“桥”字，句子中的潜在的以它结尾的词汇有：“长江大桥”，“桥”，因此当前字符Cell除了“桥”以外，还要考虑到这两个词汇，从图上卡门就是两个红色Cell引出两个绿色箭头，代表了两个词汇的信息

文章中对于词汇信息的算法如下图所示，每个词汇的红色Cell 类似于LSTM Cell且相互独立,因为序列标记是以字符为级别，所以这个Cell 中没有输出门，cell state 即为词汇信息。如上图所示，我们将通过匹配一个句子和一个自动获得的大词典来构建单词-字符格。因此，我们不需要分词器。

其中，矩阵中的x和h 分别表示词向量和词首字符Cell的输出

上面公式遗忘门因子负责遗忘前面的开头字符表示输入程度，输入门因子负责当前单词的状态信息输入程度，将两个进行相加得到新的单词特征表示。

根据LSTM的思想可知，这些词汇信息不会全部融入当前字符的Cell,因此要进行取舍，文章提出额外的门控单元(Addational Gate)，根据当前字符和词汇信息来计算词汇信息权重。如下图公式所示。

其中，矩阵X和c 分别代表当前的字符向量和当前词汇的Cell State。

输入门因子是将当前最后的字符表示与单词表示进行融合，进行sigmod函数激活都得到的因子。

然后，文章提出一种归一化算法求出当前字符Cell各种输入的权重，类似于softmax函数，如下图公式所示，分母看起来有点复杂，其实就是句子中以当前词结尾的所有词汇的权重记忆当前字符输入门的求和（取以e 为底的指数使得结果为正）

最后，当前字符的Cell State就可以算出来了

第一个是连加符号表示将所有当前字符作为结尾的单词特征表示，同时加上当前的字符作为

cc7 为桥的时候。icb,e 包含两个词的信息：IC6，7（大桥）和IC6，7（长江大桥），xc7我们是知道的向量计算出两个门之后，计算cc7时就是公式15了。相当与计算的时候不用公式11中上一个cc6了，而是使用之前的词信息，当j=6时候，不存在以大为结尾的词，也就不存在b ,那么公式15 的计算就是公式11了。

y 代表任意序列，w是CRF特有的boing参数。我们是哟那一阶维比特算法，在基于单词和基于字符的输入序列中找到得分最高的标签序列，给定一组标记的训练数据，使用带有正则花的几句子级别的对数似然函数来寻连模型/

这里为什么没有遗忘门？？，我的理解是：计算词汇信息时候用到主干Cell State，因此计算当前字符的Cell State时候通过门控单元来取舍词汇信息的过程中，其实就是在对主干Cell State 进行取舍，相当于隐藏的一个遗忘门。

2.4 Lattice LSTM 模型参数设置

表3 显示的是模型中的超参数设置，可以看到char emb 和bigram emb size Lattice emb size 三个嵌入向量是一致的，为的是以后的特征融合更加方便。模型中LSTM只有一层。char dropout 和lattice drop都是取值0.5.

lr decay（学习率衰减因子）:
regularization :

2.5 模型效果显示

表4 表示的是将目前的模型根据能否分词的判定进行划分，首先基于单词模型及其改进方法被划分到自动分词这个一部分，另一部分是Lattice LSTM模型和基于字符模型，有表可知，还是Lattice LSTM的整体指标要由于各个模型。数据集来自OntoNotes,但是之前我们看过的论文中显示基于字符的方法要优于基于单词的模型。但是这里面的结果并不是？？？

表六显示各个模型在MSRA数据集上的表现，可见本文模型LatticeLSTM无论是准确度还是召回率还是F1值，都是最好的。

表七显示各个模型在MSRA数据集上的表现，可见本文模型LatticeLSTM无论是准确度还是召回率还是F1值，都是最好的。

论文中表八显示各个模型在resume NER 数据集上的表现，可见本文模型的准确度和F1值是五个模型中最好的，但是召回率相较于Char+bichar+softword模型要差一点。

图四显示训练次数为四十轮中，各个模型的F1值的变化情况，明显的是，基于字符的极限模型效果是最差的，但是本文模型Lattice LSTM相比较于char+bichar_lattice和char+bichar两个模型要高出一点。

图五显示以输入文本长度为变量，比较各个方法的F1值的变化，由此可见，基于字符模型要好于基于单词模型，其中Lattice LSTM的模型效果最好，这就显示在长度越长的情况下，Lattice LSTM 的鲁棒性要由于其他几个模型。看这里，句子如果不是很长，可以优先考虑基于词的。

3. 参考资料

Zhang Y , Yang J . Chinese NER Using Lattice LSTM[J]. 2018.

https://github.com/jiesutd/LatticeLSTM

论文阅读总结——Chinese NER Using Lattice LSTM

你可能感兴趣的:(论文《Chinese NER Using Lattice LSTM》心得总结)

结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
【数据结构】栈会的全对٩(ˊᗜˋ*)و 数据结构数据结构经验分享栈
要求：熟悉栈的定义，栈的特点以及栈的基本操作。能够根据实际情况选择合适的存储结构，解决实际问题。对任意给定的一个中缀算术表达式输出等价的后缀形式。代码实现：#include#include#includeusingnamespacestd;intprio(charop){//给运算符优先级排序intt;if(op=='*'||op=='/')t=2;if(op=='+'||op=='-')t=1;
Latex beamer 常用操作记录
最近组会要讲论文，试着用latex做下slide，感觉效果不错。在此，记录一些可能会比较常用的一些操作。以后学到了新的操作，再继续更新。用的是这个主题，感觉比较简洁：https://www.overleaf.com/latex/templates/artrabeamer/cvtmgdbwvdmr放置图片图片感觉有好多参数，因为这次汇报比较水，所以只用了scale这个缩放参数凑合，以后再补上一些常用
JSP汽车网站yzp17--（程序+源码+数据库+调试部署+开发环境） CK3042 java 汽车开发语言 oracle 数据库服务器大数据
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容一、项目背景随着互联网的飞速发展和人民生活水平的日益提高，汽车已成为许多家庭的重要交通工具。为了更好地满足消费者对汽车信息的需求，提升购车体验，我们计划开发一个功能全面、信息丰富的汽车网站。该项目旨在为用户提供便捷的汽车资讯查询、车型对比、购车指南以及售后服务等功能，打造
TypeScript-Babel-Starter 项目常见问题解决方案董灵辛Dennis
TypeScript-Babel-Starter项目常见问题解决方案TypeScript-Babel-StarterAsamplesetupusingBabelCLItobuildTypeScriptcode,andusingTypeScriptfortype-checking.项目地址:https://gitcode.com/gh_mirrors/ty/TypeScript-Babel-Star
TypeScript-Babel-Starter 项目推荐周琰策Scott
TypeScript-Babel-Starter项目推荐TypeScript-Babel-StarterAsamplesetupusingBabelCLItobuildTypeScriptcode,andusingTypeScriptfortype-checking.项目地址:https://gitcode.com/gh_mirrors/ty/TypeScript-Babel-StarterTyp
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
线性代数向量内积_向量的点积| 使用Python的线性代数 cumubi7453 python 线性代数机器学习 numpy 算法
线性代数向量内积Prerequisite:LinearAlgebra|DefiningaVector先决条件：线性代数|定义向量Linearalgebraisthebranchofmathematicsconcerninglinearequationsbyusingvectorspacesandthroughmatrices.Inotherwords,avectorisamatrixinn-dim
【极光优化算法+分解对比】VMD-PLO-Transformer-LSTM多变量时间序列光伏功率预测Matlab代码 matlab科研助手算法 transformer lstm
✅作者简介：热爱数据处理、建模、算法设计的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍光伏发电作为一种清洁能源，其功率预测对于电网稳定运行和电力系统调度至关重要。然而，光伏功率具有高度的非线性和波动性，传统的预测方法难以准确捕捉其动态特性。近年来，深度学习技术在时间序列预测领域取得了显著进展，为提高光伏功率预测精度提供了新的途径
DAY08 算法训练营| 字符串part01 天空的孩子算法
344.反转字符串-力扣（LeetCode）字符串和数组算法题目思路类似反转字符串是经典双指针法（回忆反转链表，有序数组的平方，三数之和，四数之和）classSolution{public:voidreverseString(vector&s){len=s.length();for(inti=0,j=s.size()-1;iusingnamespacestd;intmain(){strings;/
【Unity开发】Unity实现glb模型上传到场景中使用功能龚子亦 Unity unity 游戏引擎
一、效果展示点击按钮上传glb格式的模型，进行后续移动、旋转和缩放操作，上传的模型会出现在原点（0,0,0）位置演示视频：Unity实现glb模型上传到场景中使用功能二、环境要求需要下载安装用于加载glb模型的插件，下载好后直接拖入项目中进行使用下载链接：https://github.com/Siccity/GLTFUtility/releases三、实现完整代码usingUnityEngine;
【Unity开发】Unity实现对模型移动、缩放、旋转操作的功能龚子亦 Unity unity 游戏引擎
一、效果展示Unity实现模型移动、旋转和缩放功能通过鼠标实现对模型的不同操作鼠标中键点击，模型变为高亮状态，表示选中状态，再次点击其他地方，则取消高亮，表示未选中状态鼠标中键上下滚动，实现模型的缩放鼠标左键点击或长按，实现模型的移动鼠标右键点击，左右滑动，实现模型的水平旋转；同时按下shift键，上下滑动，实现模型垂直旋转二、实现完整代码usingSystem.Collections;using
纹理贴图算法研究论文综述点云SLAM 算法图形图像处理算法纹理贴图计算机图形学计算机视觉人工智能虚拟现实（VR）纹理贴图算法综述
纹理贴图（TextureMapping）是计算机图形学和计算机视觉中的核心技术，广泛应用于三维重建、游戏渲染、虚拟现实（VR）、增强现实（AR）等领域。对其算法的研究涵盖了纹理生成、映射、缝合、优化等多个方面。1.引言纹理贴图是指将二维图像纹理映射到三维几何表面上，以增强模型的视觉真实感。传统方法主要关注静态几何模型上的纹理生成与映射，而近年来，随着多视角图像重建、RGB-D扫描、神经渲染的发展，
【华为od刷题（C++）】HJ17 坐标移动（continue语句、break语句） m0_64866459 华为od c++开发语言
我的代码：#include//用于输入输出#include//用于处理字符串#include//用于存储动态数组usingnamespacestd;intmain(){strings;//用于存储输入的字符串cin>>s;//输入字符串intlen=s.size();//获取字符串的长度vectorstr;//用来存储从输入字符串中提取出的子字符串（每个指令部分）intx=0,y=0;//设置初始
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南周情津Raymond
使用TVM编译部署DarkNet模型：YOLO-V2和YOLO-V3实战指南tvm-cnTVMDocumentationinChineseSimplified/TVM中文文档项目地址:https://gitcode.com/gh_mirrors/tv/tvm-cn前言在深度学习模型部署领域，TVM作为一个高效的深度学习编译器栈，能够将训练好的模型优化并部署到各种硬件平台上。本文将详细介绍如何使用T
OpenCV中DPM（Deformable Part Model）目标检测类cv::dpm::DPMDetector 村北头的码农 OpenCV opencv 目标检测人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述OpenCV中用于基于可变形部件模型（DPM）的目标检测器，主要用于行人、人脸等目标的检测。它是一种传统的基于特征的目标检测方法，不依赖深度学习，而是使用HOG特征+部件模型来进行检测。示例代码#include#include#includeusingnamesp
计算机视觉中的Transformer：ViT模型详解与代码实现 AI大模型应用工坊计算机视觉 transformer 人工智能 ai
计算机视觉中的Transformer：ViT模型详解与代码实现关键词：计算机视觉、Transformer、ViT、自注意力机制、图像分块摘要：传统卷积神经网络（CNN）统治计算机视觉领域多年，但2020年一篇《AnImageisWorth16x16Words:TransformersforImageRecognitionatScale》的论文打破了这一格局——它将NLP领域的Transformer
《小学生作文辅导》期刊投稿邮箱
《小学生作文辅导》是国家新闻出版总署批准的正规教育类期刊，适用于全国各小学语文老师事业单位及个人，具有原创性的学术理论、工作实践、科研成果和科研课题及相关领域等人员评高级职称时的论文发表（单位有特殊要求除外）。栏目设置：写法导引、智慧阅读、课堂建设、课堂建设、教学透视、教育撷英等。刊名：小学生作文辅导级别：省级主管单位：吉林出版集团股份有限公司主办单位：北方妇女儿童出版社有限责任公司ISSN：16
结构学习的理论刘海东刘海东机器人人工智能
结构学习的理论作者：刘海东，中国广东技术师范大学摘要这是第一篇研究结构学习的理论的论文，第一个部分概括了结构学习的整体构想，第二部分提出了结构学习的环境逻辑宇宙，第三、第四、第五部分阐述了中央图处理器、软件图、图思维的理论，以中央图处理器为机器脑，以软件图为机器身体，以图思维为机器生命活动，第六部分说明了机器生命和结构学习的现有研究成果。全文的主旨是向人类社会推荐机器生命结构学习的思想。关键词：结
逻辑结构学派一（五个基础理论）刘海东刘海东人工智能
逻辑结构学派一（五个基础理论）作者：刘海东，中国广东技术师范大学摘要本篇论文通过《逻辑结构学派的宗旨》、《逻辑结构学》、《逻辑工程学》、《逻辑方程结构图理论》、《仿生逻辑理论》五个领域的研究提出《逻辑结构学派的宗旨》、《主观能动性结构》、《主观能动性结构工程》、《赋予生命的逻辑方程结构图》、《仿生逻辑》五个基础经典理论，让人工智能、机器人、智能社会三个主体的基础研究有了方向、方法和判断标准。关键词
【CVPR2024】计算机视觉|即插即用|DFAM:marine！不懂DFAM，别说你会做水下动物分割！
论文地址：http://arxiv.org/pdf/2404.04996v1代码地址：https://github.com/Drchip61/Dual_SAM关注UPCV缝合怪，分享最计算机视觉新即插即用模块，并提供配套的论文资料与代码。https://space.bilibili.com/473764881摘要本研究提出了一种新颖的特征学习框架，名为**Dual-SAM，用于高性能的海洋动物分割
C++字符串std::string 大胡子的艾娃 C++高级编程 STL string C++字符转换
一、std::string的使用STL知识点思维导图：https://download.csdn.net/download/qq_43148810/12133484二、字符转换1、string（多字符）和wstring（宽字符、Uniocde编码）都是模板类basic_string类的实例化usingstring=basic_string,allocator>;usingwstring=basic
牛客周赛 Round 59(思维、构造、数论) mldl_ 数据结构与算法算法数论逆序数构造对角线处理范德蒙恒等式
文章目录牛客周赛Round59(思维、构造、数论)A.TDB.你好，这里是牛客竞赛C.逆序数（思维）D.构造mex（构造）E.小红的X型矩阵F.小红的数组回文值（数论、范德蒙恒等式）牛客周赛Round59(思维、构造、数论)E题，对于对角线的处理，常用。F题，范德蒙恒等式推论的应用。A.TD简单数学题。#includeusingnamespacestd;intmain(){doublen,m;ci
c++第七天--特殊运算符重载 clock的时钟 c++面向对象 c++开发语言
含有的主要内容：类型转换函数转换构造函数仿函数-重载（）智能指针--重载*和->运算符一、类型转换函数类型构造函数用于将一个类的对象转换为其他类型（基本类型或其他类类型）。它是类的成员函数，允许自定义对象在需要目标类型的上下文中自动（或者显式）转换。#includeusingnamespacestd;classMyInt{private:intvalue;public://类型转换构造函数：可以用
XAML 深入学习（三）高级UI开发‌ 半个烧饼不加肉 C#学习 ui xml xhtml c#
一、架构与设计模式MVVM深度解耦‌数据驱动界面‌：XAML通过声明式绑定（如{BindingPath}）自动同步业务逻辑与UI状态，无需手动更新控件例子：MainWindow.xamlMainWindow.xaml.csusingSystem.ComponentModel;usingSystem.Windows;namespaceDataBindingDemo{publicpartialclas
RT‑DETR 系列发展时间顺序要努力啊啊啊计算机视觉深度学习计算机视觉目标检测人工智能
RT‑DETR系列发展时间顺序RT‑DETR系列是由百度提出的一系列基于Transformer的实时端到端目标检测器，以下列出了从提出到演化的主要milestone：时间线概览版本时间主要改进/特点DETR2020–05（论文）oai_citation:0‡labellerr.comoai_citation:1‡arxiv.orgTransformer架构首次用于端到端检测，无需NMSRT‑DET
gesp c++ 七级知识点
以下是根据GESPC++七级考试大纲的超详细知识点解析与代码实现，涵盖数学函数、复杂动态规划、图论算法、哈希表等核心内容，每个知识点均包含概念说明、应用场景、使用方法、优缺点及完整代码示例。一、数学库函数1.1三角函数概念：sin(x)、cos(x)、tan(x)分别计算弧度为x的正弦、余弦、正切值。应用场景：几何计算、物理运动模拟、图形学。代码示例：#include#includeusingna
蚁群算法佛渡红尘计算机应用与算法算法 c++数据结构
蚁群算法是一种用来寻找优化路径的概率型算法，由MarcoDorigo于1992年在他的博士论文中提出。这种算法模拟了蚂蚁觅食的原理，蚂蚁在觅食过程中能够在其经过的路径上留下一种称之为信息素的物质，并在觅食过程中能够感知这种物质的强度，从而指导自己的行动方向。它们总是朝着信息素强度高的方向移动，因此大量蚂蚁组成的集体觅食表现为一种对信息素的正反馈现象。某一条路径越短，路径上经过的蚂蚁越多，其信息素遗
Pytorch框架下基于LSTM、GRU和TCN的心跳信号分类识别研究 babyai997 python 人工智能目标跟踪
Pytorch框架下基于LSTM、GRU和TCN的心跳信号分类识别研究摘要本文主要介绍了心跳信号的基础知识，包括心跳信号的产生机制、特点分析以及采集与处理方法。文章详细阐述了PyTorch框架在心跳信号分类识别中的应用，包括LSTM、GRU和TCN等模型的原理及实现。通过设计合理的实验方案，对不同模型在心跳信号分类识别任务中的性能进行了对比分析，发现GRU模型在计算效率和性能之间取得了较好平衡，而
洛谷刷题8 eurotruck c++算法图论洛谷刷题
B2051点和正方形的关系B2051点和正方形的关系-洛谷难度：入门如果x1||y1，那么点就在正方形外，反之亦然AC代码：#includeusingnamespacestd;intmain(){#defineintlonglongintx,y;cin>>x>>y;if(x>=-1&&xusingnamespacestd;intmain(){intm,n;cin>>m;cin>>n;intr=0;
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

论文《Chinese NER Using Lattice LSTM》 心得总结