zenRRan

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）...

点击上方，选择星标或置顶，每天给你送干货！

阅读大概需要24分钟

跟随小博主，每天进步一丢丢

作者: 龚俊民(昵称: 除夕)

学校: 新南威尔士大学

方向: 自然语言处理和可解释学习

知乎: https://www.zhihu.com/people/gong-jun-min-74

亚里士多德在《形而上学》中认为，对于存在，最重要的问题，就是给世间万物的存在基于语言来分层和分类。从神说要有光起，到基友给你取了个外号叫狗蛋。你会发现，创造与命名，在历史中往往等同。名字是自我概念的一部分。它是搭建视、听、味、嗅、触，五感与想象的桥梁。而花名更是凸显了自我的核心部分，是人们看待事物的侧面。比如奶茶妹妹（章泽天），哥哥（张国荣），教主（黄晓明），范爷（范冰冰），贾老板（贾斯汀·汀布莱克），寡姐（斯嘉丽·约翰逊），拔叔（麦德斯·米科尔森），小李子（莱昂纳多·迪卡普里奥），周董（周杰伦），罗胖（罗振宇），雷布斯（雷军），大表姐（詹妮弗劳伦斯）等等。这一期，我们来爆肝

Introduction

文本数据结构化是 NLP 最有价值的任务。一个句子中，命名实体更受到人们的关注。中文分词任务关注句子中的词汇之间的边界，词性标注关注这些被分出边界的词在词法上的类型。而命名实体识别关注的是命名实体的边界。它的粒度通常比中文分词要粗——是多个单词构成的复合词或短语，比如《那些年，我们一起追过的女孩》，《我们仍未知道那天所看见的花的名字》。它的类别通常比词性标注更具混淆性——是基于自然语言体系构建的抽象世界中，某个领域下的概念归属，比如人名，地名，组织机构名、股票、影视，书籍，游戏，艺术、医学术语等等。这些依托人类想象力构筑的事物，会随着时间的向前而不断变迁。它是信息抽取任务的焦点，在实际生产中需求很迫切，但做起来又很难。

难点一：命名『命名实体』

NER 之所以难做，第一点是因为我们对命名实体定义上的模糊。我们要如何命名命名实体呢？Hanlp 作者何晗在《自然语言处理入门》一书中总结了命名实体的以下三个共性：

1. 数量无穷。比如宇宙中恒星名称、生物界中的蛋白质名称，即便是人名，也是会随着新生儿的命名不断出现新的组合。人们接触到的命名实体是一个开放的集合。有一些是已经存在，但我们的观测的视野有限，所以还未知晓，直到它在某个突如其来的一天成为了热点。还有一些则是还未存在，但任何人都有可能在某个时刻创造出它们。
2. 构词灵活。比如中国工商银行，既可以称为工商银行，也可以简称为工行。一些机构名甚至存在嵌套现象，比如“联合国销毁伊拉克大规模杀伤性武器特别委员会”内部就嵌套了地名和另一个机构名。
3. 类别模糊。一些命名实体之间的区别比较模糊，比如地名和机构名。有一些地名本身也是机构，比如“国家博物馆”，从地址角度来看属于地名，但从博物馆工作人员来看则是一个机构。

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第1张图片

当我们人都需要费力地去分辨、定义实体时，会带来两个问题。一是工业界对NER 标注数据紧缺。因为数据标注就很困难，需要专家好好定义标准规范。而这个标准是基于人类共有知识的。它还不是一成不变的，你标注完了就能一劳永逸。而是隔几个月热点实体词就要大换一次血。过去标注好了一些实体，因为未来人们谈论它的语境都变了，可能不再适用。二是超越人类专家水平的 NER 系统难以实现。当前的 SOTA 模型大都是建立在有监督模型的基础之上。通常我们会把它看作是一个序列标注问题，可以用 HMM 和 CRF 等机器学习算法，或用 BiLSTM / CNN / BERT + CRF 的深度学习范式来学习解码。这些机器学习算法在封闭式的数据集可以表现得很好，但依然满足不了工业界开放式的业务场景需求。

难点二：实体的无穷

实体命名识别要面对的是排列组合可能无穷的词表。模型对 OOV 的泛化能力远低于我们的预期，所以通常做法是以统计为主，规则词典为辅。Hanlp 作者在书中对适合用规则词典来识别的实体分成了两类：

对于结构性较强的命名实体，比如网址、E-mail、ISBN、商品编号，电话，网址，日期，淘宝或拼多多口令等，都可以用正则表达式来处理。这部分我们会在预处理中，先用规则匹配，而未匹配部分交给统计模型处理。比如数词，标点，字母，数字，量词等混合在一起。对于类如「三六零」这样的中文，我们可以把大写中文汉字不放入核心词典中，这样就可以将其作为未知字符用正则进行匹配。虽然我们需要耗费大量人力去设计规则。但好处是，比起训练玄学的机器学习模型，这里努力性价比更高，都能带来直接有效的回报。
对于较短的命名实体，如人名，完全可以用分词方法去确定边界，用词性标注去确定类别。这样就无需再专门准备命名实体模块及语料库，只需要用分词语料库就可以做到。比如音译人名，我们会先用事先构建好的一个带词性的词典，对句子粗略地分词。再对分词后的句子从左往右扫描遇到人名词典中的词语则合并。这个词典被储存在一个 DoubleArrayTrie 中用作高效匹配。词典中的单字要谨慎选择，因为音译人名常用字通常也是汉语常用字。这套逻辑虽然难以识别未知的人名片段，但可以召回极长的音译人名。

基于词典和规则的方法只在部分类型的实体识别上有用，要获得更好的泛化能力，我们也可以用「张华平」和「刘群」等教授在提出的「角色标注框架」去结合模型和规则预测人名。它的思路是，我们先为构成命名实体的短语打好标签，若标签的序列满足某种模式则识别为某种类别的实体。它是一种层叠的隐马尔可负模型 HMM。第一层是以标签为状态，去发射观测到的构成实体的字词短语，发射的概率和标签与标签之间的转移存在的依赖关系由 HMM 建模。第二层则以实体类型作为状态，去发射观测到的标签。实体内的标签到标签之间的转移存在依赖关系。举个书中的人名识别的例子：

标签 | 意义 | 例子
B | 姓氏 | 「罗」志祥
C | 双名首字 | 罗「志」祥
D | 双名末字 | 罗志「祥」
E | 单名 | 时（chi）「翔」
F | 前缀 | 「老」王
G | 后缀 | 罗「胖」
K | 人名上文 | 「又看到」卢宇正在吃饭
L | 人名下文 | 又看到卢宇正「在吃饭」
M | 两个人名之间的成分 | 张飞「和」关羽
等等...

首先我们会把语料中的数据标注成如上的标签，再用词典去记录每个标签可能发射的词短语，以及频次。接着，我们根据语料数据去计算每个标签到其它标签的转移概率，即标签 x 到标签 y 的转移次数除以标签 x 到所有标签的转移次数和。这样我们就获得了模型的参数。模型可以是 HMM 或 CRF。它们可以学到很多种规律，比如，标签姓氏 B 后面接双名、单名或后缀标签的概率远远大于接其它的标签概率。再比如，有双名首字 C 就一定有双名末字 D。又比如，姓氏 B 后面接单名 E 的概率会容易和后面接后缀 G 的概率混淆。通过收集大型的人名库，可以构建出更完善的依赖。

深度学习模型的输入数据要考虑词的粒度问题。即便我们是在一段中文的序列中，也可能掺杂着类如 DOTA2 和 CSOL 这样的英文单词。英文单词与中文的词有显著的不同。由单个字母组成的英文单词显然并没有中文单字那样丰富的语义。所以在英文中很少用 char 作模型的输入。即便是细粒度，也是用类似于前缀后缀这种比字母粗一个粒度，比单词细一个粒度的sub char 语素来作为深度学习模型的输入。在工程上，我们需要注意归一化和分字的问题。

>>> sentence = "褚泽宇是马尼拉特锦赛中的DoTa2选手"
>>> ' '.join(sentence).split() # 未归一化以单字输入
['褚', '泽', '宇', '是', '马', '尼', '拉', '特', '锦', '赛', '中', '的', 'D', 'o', 'T', 'a', '2', '选', '手']
>>> import re
>>> def is_chinese(char):
...     return '\u4e00' <= char <= '\u9fff'
...
>>> def segment(sentence):
...     i = 0
...     tokens = []
...     while i < len(sentence):
...         tok = sentence[i]
...         if is_chinese(tok):
...             tokens.append(tok)
...             i += 1
...         else:
...             i += 1
...             while i < len(sentence) and not is_chinese(sentence[i]):
...                 tok += sentence[i]
...                 i += 1
...
...             tokens.append(tok)
...     return tokens
>>> segment(sentence.lower()) # 归一化后，中文以单字，英文以单词输入
['褚', '泽', '宇', '是', '马', '尼', '拉', '特', '锦', '赛', '中', '的', 'dota2', '选', '手']

若单独分 char，连续的单词会被分成一个个的字母，这会对模型识别标注带来一定困难。所以我们可以把序列中的连续字母会先通过预处理给过滤掉。比如「data2」会先用正则获得，然后通过词典匹配到它的类别后，在把原序列的英文单词替换。再用替换过的序列输入给模型。注意，'<游戏>'是单独的一个 token，会在 word embedding 的词表中额外添加。

['褚', '泽', '宇', '是', '马', '尼', '拉', '特', '锦', '赛', '中', '的', '<游戏>', '选', '手']

类似的，如果文本序列中有可以用规则确定处理的，我们也会做替换。

['有', '事', '可', '以', '打', '我', '电', '话', ':', '1', '2', '3', '4', '5', '6', '7', '9', '0', '9']
['有', '事', '可', '以', '打', '我', '电', '话', ':', '<电话号码>']

关于规则和词典，这个 Repro 提供了比较充足的语料和规则资源:

https://github.com/fighting41love/funNLP/tree/master/data

难点三：歧义的消解

传统的词典规则方法可以很容易召回文本序列中在词表匹配到的词，但它的局限在无法解决歧义问题。一种典型的歧义是多种可能划分问题。比如下面这个例子

输入序列：又看到卢宇正在吃饭
可以分为：又 / 看到 / 卢宇 / 正在 / 吃饭
也能分为：又 / 看到 / 卢宇正 / 在 / 吃饭

通常我们会用二元语法最短路径分词的方法去判断哪种分法路径最短。具体做法是记录所有二元字转移的概率，把文本序列构建成一个词图，然后用最短路径算法找出代价最小的路径。虽然这个例子它能够通过，但这个方案无法考虑复杂的语境。拿我们人的常识来说，识别的人名实体应该为「卢宇正」，体现在「又」这个字。「又」和「正在」是有一点点冲突的。前者是描述再次看到的状态，而后者体现是当下时刻的进行时。所以第二种分法更符合常识。我们再来看另一个例子：

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第2张图片

a) 马云指着天发誓说，我不喜欢钱。b) 远方有一朵马云仿佛奔腾在宽阔的江面上。并不是所有的马云都是马云。

字典匹配会把字典中的词都召回，所以会出现把第二个句子判断成人名的错误。而深度学习模型考虑了上下文语境。人可以“指着”，所以第一句是人名。云才是“一朵”，所以不是人名。当然之前说的基于角色标注的层叠隐马尔科夫模型也可以做到。但复杂一点的语境，深度学习模型能做得更好。在类如搜索推荐的下游任务中我们还需要对实体的指代做进一步的细分。这部分是实体链接任务，日后可以再展开。

难点四：边界的界定

虽然深度学习对歧义的消解有显著优势，但它通常会遇到的问题是对新词的边界把握模糊。而词典中包含了大量词的边界信息。因此如何把词典信息融入到深度学习模型中是近几年研究的主流。一种直观的方法是先执行分词，再对分词序列标注。但这种分割后再做 NER 的流程会遇到误差传播的问题。名词是分割中 OOV 的重要来源，并且分割错误的实体边界会导致 NER 错误。这个问题在开放领域可能会很严重，因为跨领域分词仍然是一个未解决的难题。简单说就是，分词分不好，NER 也难做。而分词确实经常分不好。

这里介绍三种把词表信息融入模型的方法，往后图神经网络 GNN 中加入词表信息的方法会在图神经网络 GNN 系列中另出一期。

Chinese NER Using Lattice LSTM
CNN-Based Chinese NER with Lexicon Rethinking
Simplify the Usage of Lexicon in Chinese NER

论文1：Chinese NER Using Lattice LSTM

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第3张图片

模型的输入有很多种，按字分输入字嵌入，按词分输入词嵌入。灵活一点，可以集二者之长，把前后两个字的 bigram 嵌入，或者是分词后的词嵌入，与字嵌入拼接起来。也可以用 CNN 或 LSTM 这些模型来聚合字嵌入。比如你好这个词，可以这么表示。we 为词嵌入，ce 为字嵌入。

你好
we(你好) we(你好)
ce(你) ce(好)

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第4张图片

Lattice LSTM 主干部分用的依然是 LSTM，不同在它每个 Cell 处理信息的方式。中间红色的 Cell 储存的是句子中潜在词汇的信息。在 LSTM 中，输入门决定当前输入有多少加入 Cell，遗忘门决定 Cell 要保留多少信息；输出门决定更新后的 Cell 有多少可以输出。"桥"字以它为结尾的词有 "长江大桥"，"大桥"，"桥"。当前字符上的 Cell 除了 "桥" 以外，还需要考虑这些词的信息。图中两个绿色箭头便是这两个词的信息。其中红色的 Cell 互相独立，且没有输出门。原论文引入了一个额外门控来学得当前字符 Cell 和当前词汇 Cell 中的信息。该信息通过对当前字符 Cell 各种输入的归一化权重，加权求和获得。这类似于 Attention 机制自动给词赋予权重。

论文2：CNN-Based Chinese NER with Lexicon Rethinking

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第5张图片

Lattice 成功在两个点，一是为每个字符保存所有可能匹配的单词，自动选择与 NER 任务匹配的词来避免错误传播；二是引入训练好的词嵌入来提升性能。Lattice 缺陷也有两点：一是它的计算效率低下。句子的输入形式从一个链式序列转换为一个图，增大了句子建模的计算成本，还不支持并行化。二是存在字在词表中冲突问题。"长" 可能属于市长一词，也可能属于"长隆"一词，而对"长"所属的词判断不同，会导致字符"长"的预测标签不同。

为此论文提出一种有 Rethinking 机制的 CNN (LR-CNN)，它从两个方面来解决以上问题。

用 CNN 对句子与词表中存在的词处理
用 Rethinking 机制解决词表冲突问题。

我们如何把词表信息加入到 CNN 中？输入的句子是一串字嵌入 {c1, c2, ..., cn}，我们找出词表中，所有能在句子中找到的词。

l 表示词的字符长度，m表示在句子字符的下标。比如 = 马桶， =马桶里。

输入序列会被一个窗口为 2 的 CNN 编码 Bigram 特征，层层叠加起来就可以得到 l-gram 的特征。每个字都会对应一个在词表中的集合，而层层叠加起来的CNN也可以为每个字编码出一个l-gram的特征嵌入。为了能让词表特征更高效地融入，论文用了一个可并行计算的 Vector-based Attention，计算方式如下。

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第6张图片

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第7张图片

CNN 的分层会让底层的字信息无法影响到高层的词。比如"广州市"和"长隆"中，"市长"一词会误导模型对字符"市"产生错误预测。因此需要高层特征"广州市"来减少"市长"一词在输出特征中的权重。论文在每一层 CNN 上添加了一个 feedback layer 来调整词表的权值，计算方式如下：

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第8张图片

实验结果与 Lattice-LSTM 对比，LR-CNN 在定长句子下都取得了优于 Lattice-LSTM 的效果。但 LR-CNN 会更有处理短句的优势。随着句子长度增加，Lattice-LSTM 会因为要储存的词汇信息过多速度明显变慢，而 LR-CNN 的速度降幅较为稳定。在消融实验中发现，词表信息和Rethinking机制都能显著提升模型表现。即便没有词表信息，Rethinking机制也能提升模型表现。

论文3：Simplify the Usage of Lexicon in Chinese NER

论文提出了一种更简单的对输入进行编码的方式来实现把词表信息融入模型。首先，我们定义四个集合。

B(c)：所有以字符 c 为起始的词集合
M(c)：所有以字符 c 为中间字的词集合
E(c)：以字符 c 为结束字的词集合
S(c)：字符 c 单独组成一个词的集合

考虑这样一个句子

s = {c1, · · · , c5}

其中与词表匹配的字集合有：

{c1, c2}, {c1, c2, c3}, {c2, c3, c4}, and {c2, c3, c4, c5}

对于 c2 这个字有

B(c2) = {{c2, c3, c4}, {c2, c3, c4, c5}}
M(c2) = {{c1, c2, c3}}
E(c2) = {{c1, c2}}
S(c2) = {NONE}

论文的想法是，把每个字符的四个词集压缩成一个固定维向量。为了尽可能多地保留信息，选择将四个单词集的表示连接成一个整体，并添加到字符表示中。具体的说，我们会做如下计算来构造融合后的嵌入。对每个单词的权重进行平滑处理，以增加非频繁单词的权重。其中 z(w) 为单词的频数。

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第9张图片

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第10张图片

在计算效率上，明显好过其它方法：

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第11张图片

在MSRA，Weibo，和Resume 数据集的表现上，也是 SOTA。

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第12张图片

难点五：标注数据缺失

监督学习固然好，但业务标注数据缺乏情况下，难展现其优势。于是一切又回到了起点。业界常用的做法是用预训练语言模型在业务数据上预训练，再结合少量的人工标注去做微调。在部分类别的实体上效果表现很好，但其他一些实体上却没有改善词典和用人工规则带来的提升那么显著。就简单的名人识别，模型能容易地识别出人名，但进一步明星，歌星和历史人物上细粒度上的区分，就需要词典来做。这是因为细粒度的标注数据有限。

为解决标注数据不足问题，业界紧需好的半监督或无监督算法。通常做法有几个思路。

找相似领域的有标记数据做领域迁移。
用远程监督的思路，用领域词典生成标记数据

对于第一种思路，我们可以分别对词的边界和词的类别做领域迁移。对于词的类别，比如我们想标注娱乐明星，体育明星和企业名人的数据，可以先用模型识别出人名，再把获得的人名去进一步区分它所归属的领域，可以大大减小标注工作量。对于词的边界，比如武器、战斗机型号。Hanlp 的做法是先用词法分析器对序列做词性标注，再把其中的某几个词合并成目标词。

米格/nr
-/w
17/m
PF/nx

可以变成

[米格/nr -/w 17/m PF/nx]

对于第二种远程监督的思路，我们主要讲一下 AutoNER。

论文：Learning Named Entity Tagger using Domain-Specific Dictionary

我们如何用领域词表来生成标注数据呢？一种方法是直接的词典匹配来标注数据。但这会遇到两个问题：

词典无法覆盖所有实体，匹配会有误召回，存在噪音
无法解决相同实体对应多个类别的情况，还有未知类型的情况

为此，论文提出了一种 Tie or Break 的标注方案，来让噪音尽可能地少。

若当前词与上一个词在同一个实体内 Tie (O)
若其中一个词属于一个未知类型的实体短语，则该词的前后都是 Unknown (U)
其它情况都默认 Break (I)
某个实体类型未知 None (N)

假如我们词典中只有 "银行" 这个词，而要识别的机构实体是 "浙商银行"。如果我们用 IOBES 的方案去做远程监督，效果如下：

输入文本：浙商银行企业信贷部
真实标签：B-ORG I-ORG I-ORG I-ORG I-ORG I-ORG I-ORG I-ORG E-ORG
远程监督：O O B-ORG E-ORG O O O O O

这会出现一个问题，即"银行"的边界真实标签会与远程监督得到的标签不一致。这里的银行的两个 "I"，一个标注成了 "B"，一个标注成了 "E"。

输入文本：浙商银行企业信贷部
真实标签：I O O O O O O O O
远程监督：I I I O I I I I I

在以上例子中，Tie or Break 模式能保证 Tie 所在的位置一定是正确的，即在领域核心词典中“银行”的"行"字，一定是和前面的"银"字是合起来的。而剩下未知的 Break，模型会自动学到是否要 Tie。对于 Unknown 的词，它不会作为监督信息计算损失更新模型的权重。模型只会从正确标签中确定的信息计算损失，来从领域词典中学到必要的标注规则。再把这些规则泛化到周边未知边界和类别的词。

在 AutoNER 中，实体边界的远程监督信息和实体类别的远程监督信息是分开来计算的。这是为了能充分利用非领域词典——高质量短语词表中的词的边界信息。

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第13张图片

在原论文中，ceramic unibody 是在领域词典中，只有一个类别的词。所以它们组成的实体的类别是可以 100% 确定的。可是实际中领域词典往往不会很全，提供的监督信息是有限的。

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第14张图片

像 8GB RAM 是一个在高质量短语词表中的短语。我们虽然不知道它的类别，但它可以给我们提供词的边界信息。它们边界的标签被标记为 Unknow，且不参与 span prediction 的损失计算。这样做的好处是，它排除了许多要预测边界的字。若没有高质量短语词表，这些字都会被默认为Break，带来边界信息上的噪音，拿来给模型做监督会让表现下降。基于领域词典的远程监督标注能保证非 Unknow 标签的正确，模型能够根据这些正确标签学到泛化的知识，迁移预测这些 Unknow 标签是 Tie 还是 Break。

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第15张图片

模型使用的是一个用 Highway network 优化的 BiLSTM 来做 span prediction。Highway network 的优势是能够让 BiLSTM 训练起来更容易。其讲解可以参照以下博客。

https://zhuanlan.zhihu.com/p/38130339

span model 会把序列标注好它的实体边界，下游的 type model 就可以利用它来预测划定好边界实体的类别。它会对所有的字，包括 None 类型的标注字都预测类别。对于可能有多种类别的实体。type model 会对每一个可能的类型都计算交叉熵训练。预测时，会从这些候选类型中选出概率最高的。

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）..._第16张图片

总结：这些笔记是近日工作上的汇总，把做 NER 的传统方法和机器学习方法都概括地过了一遍。重点在如何把词典信息融入模型和如何用领域词典去做远程监督上面。自然语言处理在工程上的实践要远大于理论。下一期会详解图神经网络在 NER 上的做法。

Reference:

何晗. 2019.《自然语言处理入门》. 中国工信出版社
Yue Zhang and Jie Yang. 2018. Chinese ner using lattice lstm. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (ACL), 1554-1564.
Tao Gui, Ruotian Ma, Qi Zhang, Lujun Zhao, Yu-Gang Jiang, and Xuanjing Huang. Cnn-based chinese ner with lexicon rethinking.
Minlong Peng, Ruotian Ma, Qi Zhang, Xuanjing Huang. Simplify the Usage of Lexicon in Chinese NER.
Jingbo Shang, Liyuan Liu, Xiaotao Gu, Xiang Ren, Teng Ren, Jiawei Han. Learning Named Entity Tagger using Domain-Specific Dictionary.

交流学习，进群备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

广告商、博主勿入！

你可能感兴趣的:(命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名（一）...)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s

命名实体识别 NER 论文综述：那些年，我们一起追过的却仍未知道的花名 （一）...