听YJ讲故事

中从底向上匹配_词典信息在中文命名实体识别中的应用

命名实体识别(NER)可以被当作序列标注问题来解决，其中实体边界和类别标签被联合预测。不同于英文命名实体识别，中文没有明显的单词边界，字符序列下不同分词会有不同含义，导致命名实体识别任务更加困难。一种直观的方法是先分词再进行词级别的序列标注，但这种方法会带来分词的错误传递问题。另一种是直接基于字符级的序列标注，但这种方法忽略了词级别的信息。第三种折衷的方法是基于字符级别进行序列标注，把词信息融合到字符序列中。这种方法包括数据融合（例如分词和NER进行多任务学习）、结构融合（通过修改模型结构直接将词典融入到训练过程）。本文主要介绍第二种。涉及到的文章如下。ACL2020似乎也接收了几篇，后期会更新加上。

论文列表

Chinese NER Using Lattice LSTM[PDF] [code] [code(支持多batch)]
An Encoding Strategy Based Word-Character LSTM for Chinese NER[pdf] [code]
A Neural Multi-digraph Model for Chinese NER with Gazetteers[pdf] [code]
CNN-Based Chinese NER with Lexicon Rethinking[pdf][code]
Leverage Lexical Knowledge for Chinese Named Entity Recognition via Collaborative Graph Network[pdf] [code]
A Lexicon-Based Graph Neural Network for Chinese NER[pdf] [code]
Porous Lattice-based Transformer Encoder for Chinese NER[pdf]

开启神秘之旅：）

首先，Paper1,2,3,4前辈们已经做过细致的介绍，所以介绍的比较简单，接下来是愉快的链接时间

>> Chinese NER Using Lattice LSTM（Lattice-LSTM/ACL2018）

模型结构融合词典信息做序列标注的开山之作，致敬杨老师和张老师！

模型精髓体现在这里：

第j个字的细胞状态由门控单元控制的两部分组成：

以这个字为结尾的词的细胞状态
RNN计算时第j个字的细胞状态

具体讲解移步这篇知乎和这篇知乎

>> An Encoding Strategy Based Word-Character LSTM for Chinese NER（WC-LSTM/NAACL2019）

这篇文章也是用RNN系列为主模型，但不同于Lattice-LSTM, 在RNN进行编码时只进行字符序列的编码，第j个字符的输入为第j个字符的向量表示和以这个字符为结尾的词的向量表示的拼接，以此为输入进行正常的RNN编码操作。

由于以第j个字为结尾的词的数量不固定，文中提出四种策略得到以第j个字为结尾的词的表示，分别是最长路径，最短路径，均值，自注意力编码四种策略。

具体讲解移步这篇知乎和这篇知乎

>> A Neural Multi-digraph Model for Chinese NER with Gazetteers（Multi-digraph/ACL2019）

本文利用一个多维图来融合词信息，它将Lattice-LSTM中的链式结构转为图式。图中节点为字符和词，建图后采用GRU方式进行更新。需要注意的是，这篇文章的词汇信息使用的是带标签的gazetteer词表，其余文章的外部词表无标签。

具体讲解移步这篇知乎和这篇知乎

>> CNN-Based Chinese NER with Lexicon Rethinking（LR-CNN/IJCAI2019）

这篇文章以CNN为模型的主要框架，通过CNN中对N-gram的卷积操作来得到句子中的潜在词语信息。由于自底向上的卷积在低层时无法获取高层语义信息，会导致lexicon的歧义问题，因此采用Rethinking机制，将高层信息重新输入底层，让模型“重新思考”。

具体讲解请移步这篇博客和这篇博客

接下来进行Paper5，6，7的细致介绍

>> Leverage Lexical Knowledge for Chinese Named Entity Recognition via Collaborative Graph Network（Lexicon-CGN/EMNLP2019）

Motivation

Lattice LSTM存在三个缺点：

在Lattice LSTM中，第j个字只能获取以它为结尾的词的信息和它之前的时刻状态的词的信息，但无法获取"Inside"词的信息。举例说明：“北京机场”对于“机”的预测起着决定性作用，可以将“机”预测为“B-LOC”，但在Lattice LSTM中，“机”只接受以它为结尾的词的信息和之前时刻的状态信息，且为单向RNN，不能反向建模，因此“北京机场”的信息在建模时无法传递给“机”
距离最近的上下文对当前token的预测至关重要。例如“希尔顿离开机场”，对于“希尔顿”来说，它的上下文“离开”可以帮助把“希尔顿”预测成"PER"，而不是"LOC"。但在Lattice LSTM中，“离开”这个词的表示融合了它之前的所有时刻的状态信息，包括字和词，这些信息会对“离开”本身的含义造成干扰。
第三个问题就是老生常谈的速度问题。（不过现在出现了Lattice LSTM for NER的多batch版本，速度有一些提升，当然由于LSTM本身的速度问题即使多batch也比不过这篇文章的速度）

Model

针对上述问题，本文提出一种字符级的协作图神经网络。包括编码层，构图层，融合层，解码层。为了获取多角度全方位的词语信息，作者在构图层提出三种构图方式，在融合层将三种构图得到的向量表示进行融合。

编码层

字符表示--->双向LSTM编码

词表示----->Lookup Table

构图层

图中的节点为字和词，针对边的连接提出三种构图方式，相邻矩阵中连接边为1，不连通为0

//Containing graph (C-graph)

字与字之间无连边，词与它包含的字之间有连边

//Transition graph (T-graph)

相邻字符相连，词与它前后的字符相连

//Lattice graph (L-graph)

相邻字符相连，词与它开始结束的字符相连

最后，针对三种图，使用Graph Attention Network(GAN)来进行编码。最终每个图的输出为

其中

为第k个图的GAN表示，因为是基于字符级的序列标注，所以解码时只关注字符，因此从矩阵中取出前n行作为最终的图编码层的输出。

融合层

其中

是编码层的字符表示

解码层

CRF解码

Result

最终实验结果会在最后统一分析，这里说一下作者的消融实验

其中

分别表示C-graph, T-graph, L-graph。"w/o C"表示去掉C-graph编码。

>> A Lexicon-Based Graph Neural Network for Chinese NER（LGN/EMNLP2019）

Motivation

RNN结构按照严格的sequential结构进行编码，但语言的底层并不是严格按照sequential序列来理解的。例如“印度河流经印度”，“流”属于“河流”，“流经”， Lattice-LSTM在进行编码时，“流”只能接收“河流”所包含的语义信息，因而造成歧义。（和上一篇论文所提到的第一个缺点类似）

Model

本文提出lexicon-based graph neural network (LGN)来进行图节点分类，从而实现序列标注。通过图中各个节点的相连结构来实现局部语义信息的融合，增加一个全局节点实现全局信息融合。图中节点通过递归融合其传入节点和全局节点实现节点信息更新。

编码层

字符表示------->双向LSTM编码

词表示--------->Lookup Table

全局节点表示-->整句话中，字符和词的平均值

构图

图中节点是所有的字符，边是隐含的词，将其头尾字符相连。例如图中

分别表示"武"，"汉"，边

将这两个节点相连，表示"武汉"。至于为什么这样其实很好理解，这个模型基于字符级进行序列标注，因此最终解码层的输入只有字符节点的表示，因此用字符表示节点，单词表示边用于区分。在下面的具体计算中可以看到其实没有严格的点与边的区分，这里可以直接理解成字与词的区分。

词表中每个匹配到的词的头尾字符节点相连
存在一个全局节点"Global Node"，图中的每个节点每条边都与全局节点相连。
加一个转置图。将图中的有向边的方向反转，类似于双向LSTM中的反向LSTM，最后每个节点的表示是正向图和转置图中节点表示的向量拼接。

局部聚合

使用Multi-Head Attention作为聚合函数

节点：对于当前节点，其流入边和前继节点包含了潜在的单词边界信息，因此当前节点与它的邻接节点和邻接边做聚合。

边：对于边来说，这边条所cover住的字能够表示这条边上单词的拼写信息，因此当前边与这条边所cover的节点进行聚合

其中

全局聚合

其中，

为Global Node聚合前的向量表示，初始化为所有字符节点和词边的均值。聚合时，全局节点与字符节点做聚合操作得到

，与词边做聚合得到

,拼接得到当前时刻的全局节点向量表示。

递归更新

//节点更新

与循环神经网络异曲同工，从上往下依次是输入，注意力，更新门，输入门，忘记门。其中

表示bigram的局部信息，

表示全局信息

//边更新

//全局节点更新

边更新和全局节点更新是相似的操作，输入有些许差别，具体可参考论文，这里不贴公式了。

解码

CRF进行解码

Result

最终实验结果会在最后同一分析，这里放消融实验的实验结果

>> Porous Lattice-based Transformer Encoder for Chinese NER（PLTE/Arxiv）

写在前面：我觉得这篇论文和前两篇基于图结构的论文在公式表示上有异曲同工之妙，都是用self-attention来表示字词间的关系(当然你也可以说现在万物皆可self-attention)，也都需要GRU来维持输入的序列信息，尤其A Lexicon-Based Graph Neural Network for Chinese NER最后的递归操作与本文解码时使用的Bi-GRU有着相似的出发点，且都考虑到了全局和局部信息，使用了全局节点来建模全局信息的流通。

Motivation

在Lattice LSTM中，第j个字只能获取以它为结尾的词的信息和它之前的时刻状态的词的信息，但无法获取"Inside"词的信息。与前面所提到的缺点类似
依然是速度问题。
受到2019ACL的Lattice-based Transformer for [NMT] [Speech Translation][Speech Translation] 的启发，使用lattice-based transformer encoder来解决lattice-lstm中存在的问题。
直接将lattice-based transformer用在序列标注上效果并不好。一是star-transformer中提到的全连接自注意力机制对于小数据集并不友好；二是Modeling Localness for Self-Attention Networks 等一系列文章提到的自注意力机制应该更关注局部信息。对于NER来说，邱老师的TENER也提到过局部信息的重要性。因此作者提出了一种多孔机制，对于"相邻节点"（文中对相邻进行了定义，这里的节点指所有的字词token）信息直接计算自注意力，对于"非相邻节点"信息通过一个全局节点实现信息流通，这样所有节点直接最多两步可达。
这篇文章最后还做了在BERT上的实验，验证基于self-attention的模型会比lattice-lstm和LR-CNN更适合于更新BERT编码。

Model

输入层

字向量和词向量：lookup table

位置编码：字的位置是在字符序列中的位置，词的位置是这个词的开始字符的字符位置。例如"南京市长江大桥"中"南"的位置为0，"南京"的位置也为0

基于lattice-transformer的多孔编码层

//Lattice Aware自注意力机制（LASA）

首先是自注意力机制的计算。在输入层中，位置编码不能完全表示词在句子中的相对位置。例如"南京"和"南京市"的位置都是0，但"南京"对于"市"来说是他前面的词，"南京市"对于"市"来说是包含关系，因此本文在图1列出了几种相对位置的关系定义，在图2给出了具体的例子：

图1

图2

这里有七种关系，还有一种是全局节点与所有节点的连接定义为

,共8种关系。针对这8种关系给一个关系编码矩阵R，R为3维矩阵，

表示第i个token和第j个token之间的关系向量。最终的自注意力机制计算公式如下：

公式中，针对K和V给了两个关系矩阵

进行区别。"einsum"是爱因斯坦求和约定，其实只是制定了一种三维矩阵与二维矩阵相乘方式，在pytorch和tensorflow中都有现成的包可以调用。

//多孔多头编码层（PMHA）

Motivation中我们提到，为了更加关注局部信息，本文提出了多孔机制，对于相邻节点直接计算自注意力，对于不相邻节点通过全局节点两步到达。这里，文章对于相邻的定义是图1中的前6种关系

，不相邻关系为

,即两个token的间隔大于1。多头注意力计算如下：

从第二行公式可以看出，当前token

与

进行自注意力机制的计算，其中

是当前token的相邻token与全局节点s的拼接。在具体代码实现时，这一步通过attention种的mask矩阵实现。

解码层

解码的时候，因为是基于字符序列的序列标注模型，所以将词mask掉。最后的解码层使用Bi-GRU+CRF。至于为什么要加GRU层，笔者认为，单纯的几层多头注意力机制并不能很好的捕捉序列信息，而作为用CRF解码的序列标准模型来说，序列信息是至关重要的，因此在之前加了一层GRU。其实在前面两篇图神经网络的论文中，他们的字符表示都是通过GRU得到的，尤其是A Lexicon-Based Graph Neural Network for Chinese NER最后还加了递归更新操作，加强序列信息的建模。

BERT_based

这篇论文还加了BERT作为编码层的实验。在这个实验设置中，字向量由BERT得到，词向量由lookup table获得。最终的解码层和BERT-Tagger保持一致，使用softmax解码。

Result

同样的，放消融实验结果

我终于。。。总结完了，最后是开心的对比结果时间，我把所有模型的结果放在了一个表格中，还有最终的速度对比。

碎碎念一下实验过程，我跑了[1]lattice-LSTM, [4]LR-CNN, [7]PLTE,总的来说，用Glove为编码层做实验的时候，超参多，效果不稳定，比较难复现，收敛需要的迭代轮数也比较多（几十轮），尤其对于Weibo这种小数据集效果尤其的不稳定。但在BERT实验的时候，效果容易复现，迭代只需要5-10轮，最终的效果也高。由于Glove时需要使用CRF做解码层，并且有LSTM的存在，最终的测试速度与BERT为编码层的速度不相上下，所以强烈建议大家使用BERT做编码层来用这几个模型。

在实验结果中，[7]PLTE这篇论文自己做了[1]lattice-LSTM, [4]LR-CNN, [7]PLTE这三种模型在BERT上的实验，效果是PLTE最好，至于为什么在Glove的时候PLTE和LR-CNN差不多但在BERT时效果更好，作者认为PLTE使用的多头自注意力机制为模型主干，更容易和BERT结合，同时模型结构比LR-CNN更简单。BERT模型参数量大，NER数据集规模较小，所以更容易在简单的模型PLTE上取得更好的效果，对于大数据集这种差距还有待验证。

实验结果

速度对比

最后要致敬苏劲松老师提出的Lattice-LSTM模型给大家提供了无穷的后续：）））

结束啦！第一次写知乎~请大家批评指正：）））

C++中map和set的详解程序员Hagei c++算法开发语言
C++中map和set的介绍与使用在C++编程中，map和set是标准模板库（STL）中两种非常重要的关联容器。它们基于平衡二叉搜索树（通常是红黑树）的数据结构来实现，提供了高效的数据存储和检索功能。本文将详细介绍map和set的特点、用法以及一些常见的操作示例。一、map的介绍与使用1.map的基本概念map是一个键值对容器，其中每个键都是唯一的，且按照升序排序。map的内部结构是红黑树，这使得
负载均衡策略之轮询策略 Time-Traveler Python 算法与数据结构
本文转自:https://mozillazg.com/2019/02/load-balancing-strategy-algorithm-weighted-round-robin.html#hidround-robin,尊重原创前言:本文简单介绍一下轮询(RoundRobin)这个负载均衡策略。轮询选择(RoundRobin):轮询选择指的是从已有的后端节点列表中按顺序依次选择一个节点出来提供服务
堆数据结构：从基础原理到高效算法实现的技术探讨 Everyrt 课程设计
摘要堆作为一种特殊的树形数据结构，在多种算法场景中发挥着核心作用。本文深入剖析堆的基础原理，详细阐述堆的构建、插入、删除等操作的实现细节，并探讨其在优先队列、堆排序等高效算法中的应用，助力读者全面掌握堆数据结构及其应用技术。一、引言堆数据结构以其独特的特性，能够高效地获取集合中的最大（或最小）元素。无论是操作系统中的进程调度，还是搜索算法中的最优解筛选，堆都扮演着不可或缺的角色。理解堆的原理与实现
CST Microwave Studio助力射频电路多物理场耦合分析 FindEveryone 课程设计
摘要本文重点阐述CSTMicrowaveStudio在射频电路多物理场耦合分析中的关键作用。通过解析射频电路中涉及的电磁场、热场、机械场等多物理场耦合现象，详细介绍如何运用CSTMicrowaveStudio构建多物理场联合模型，进行全面的仿真分析。结合具体案例，深入探讨多物理场耦合对射频电路性能的影响，并依据仿真结果提出有效的优化策略，为提升射频电路在复杂工作环境下的可靠性和稳定性提供理论依据与
4（四） Jmeter自动化报表html生成夜晚打字声工具 jmeter 自动化运维
从JMeter3.0开始已支持自动生成动态报告，我们可以更容易根据生成的报告来完成我们的性能测试报告。如何生成html测试报告如果未生成结果文件（.jtl）,可运行如下命令生成报告:jmeter-n-ttest.jmx-lresult.jtl-e-o/tmp/ResultReport参数:-n：以非GUI形式运行Jmeter-t：source.jmx脚本路径-l：运行结果保存路径（.jtl）,此文
HBase的架构介绍，安装及简单操作 pk_xz123456 大数据 hbase 架构数据库
一、HBase安装1.环境准备Java环境：确保系统中已经安装了Java8或更高版本。可以通过在命令行中输入java-version来检查Java版本。Hadoop环境：HBase依赖于Hadoop，需要先安装并配置好Hadoop集群。确保Hadoop的相关服务（如HDFS、YARN等）已经正常启动。2.下载HBase从HBase官方网站（https://hbase.apache.org/）下载适
linux渲染农场大连教程,Deadline 渲染农场搭建记录温柔彭于晏 linux渲染农场大连教程
渲染农场的工作模式：多台机器组建集群进行渲染，比如：集群中有2台渲染机器A和B，服务器会同时分配给A和B任务，A渲染第一帧,B渲染第二帧，当A完成那么服务器会继续分配第三帧，同样B服务器完成以后服务器分配第四帧，以此类推。渲染农场分服务端和节点，服务器端也可以加入集群中当做节点，当然节点也可以提交渲染任务建议：服务器端单独安装，主要插件及自定义修改内容可单独存放，当多节点接入或大批量渲染任务上传时
P2P下载器项目我的sun&shine 项目
1.项目介绍该项目完成一个在局域网中进行附近文件共享下载功能的工具；能够进行搜索匹配局域网中运行工具的主机；获取到局域网在线主机列表；能够获取指定主机所共享的文件信息列表（指定的共享目录下的文件信息）；能够对指定主机上的指定文件进行多进程分块下载来提高传输效率。2.项目使用的技术Socket套接字编程（了解最基本线程池版本任务处理的tcp服务端程序）HTTP协议格式（了解最基本的http服务器中数
CAD二次开发之图纸特性字段AcDbDatabaseSummaryInfo 我的sun&shine CAD二次开发开发语言 c++
一、CAD接口类AcDbDatabaseSummaryInfo接口函数acdbGetSummaryInfo(pDb,pSum);addCustomSummaryInfo(key,value);acdbPutSummaryInfo(pSum);二、使用方法1.实现功能：在一张图纸中定义好字段，插入到另外一张图中，对应的字段会更新值。原图纸需要将对应位置写入字段的表达式例如%%%%%%%%新图纸在创建
算法设计与分析4（变治法） songx_99 算法设计与分析算法
变治法将问题转化为一个或数个有一定关联当形式上不同的更加简单或更加好解决的子问题。变治法的应用：预排序思想用预排序可以简化许多问题，如检查元素唯一性，检查出现次数最多的元素等堆算法堆的定义首先它是一个完全二叉树，完全二叉树表明树的每一层都是满的，只有最后一层最右边的元素有可能缺位。且父结点的值大于它的两个子节点，则称是一个大根堆，若值小于两个子节点，称小根堆堆化有向下调整，向上调整两种，大致思路相
理解 Node.js 中的 process`对象与常用操作 red润前端 node.js 前端 javascript
理解Node.js中的process对象与常用操作在Node.js中，process是一个全局对象，提供了与当前Node.js进程相关的信息和操作。无论是获取进程信息、处理信号、访问环境变量，还是控制进程行为，process都是不可或缺的工具。看到process不犯怵了1.获取进程信息process提供了许多属性和方法来获取当前进程的信息。process.pid：获取当前进程的PID（进程ID）。
npm详解：掌握 Node.js 包管理的艺术 Lv_Jin_Gang npm
在现代软件开发领域，包管理和依赖处理是任何项目不可或缺的一部分。对于基于Node.js的应用程序而言，NPM（NodePackageManager）不仅是安装和管理第三方库的标准工具，也是发布、共享和重用代码片段的核心平台。本文将深入探讨NPM的各个方面，从基础概念到高级用法，旨在为你提供一个全面而深入的理解。一、NPM简介与安装1.1NPM的诞生与重要性NPM伴随着Node.js的诞生而出现，它
SNMP协议以及JAVA实战代码展示 potato_h java
SNMP协议以及代码实现主要是为了实现：Java通过SNMP协议和交换机进行交互JAVA开发SNMP明细第一步：（1）首先安装SNMP服务。（控制面板→添加与删除工具→添加与删除组件→管理和监视工具→详细信息→选择“简单网络管理协议”→确定）。（2）启动snmp服务。（3）下载snmp4j.jar（4）新建项目，加如snmp4j.jar，编写代码编写的代码中需要的内容：（1）枚举网元类型（目前只有
JavaScript基础-DOM事件流難釋懷 javascript 开发语言
在Web开发过程中，理解和掌握DOM事件流是实现高效交互的关键。DOM事件流描述了当一个事件发生时，它在文档树中的传播路径。了解事件流的概念有助于我们更精确地控制事件处理逻辑，避免不必要的行为，并提升用户体验。本文将深入探讨DOM事件流的基本概念，包括事件捕获、目标阶段和事件冒泡，并通过示例展示如何应用这些知识。一、什么是DOM事件流？DOM事件流是指事件在整个页面结构中传播的过程。根据W3C标准
springboot 事务详解 hanjq_code #springboot spring boot java spring
事务的传播机制事务的传播行为是指，如果在开始当前事务之前，一个事务上下文已经存在，此时有若干选项可以指定一个事务性方法的执行行为。在TransactionDefinition定义中包括下面几种传播行为常量TransactionDefinition.propagation_required：如果当前存在事务，则加入该事务；如果当前没有事务，则创建一个新的事务。这是默认值。TransactionDef
AI学习资料|3月最新版可下载 2501_91122183 人工智能学习
AI学习资料：https://pan.quark.cn/s/d7452a3222d8都说AI是2025年新的风口，都想成为站在风口上的猪，可如何学习AI却成了拦住大多数人的第一道门槛。其实，学习AI很简单，你缺的只是一个信息差！这段时间，清华北大出品AI教学资料，火遍全网，从基础知识到实操应用，各种应用场景和进阶玩法讲解。即便是零基础新人也能轻松上手，从入门到精通。资料我已经帮大家整理好了，放在最
简单理解机器学习中top_k、top_p、temperature三个参数的作用无级程序员机器学习人工智能
在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
Spring Boot 事务详解 Dong雨 spring boot 后端 java
SpringBoot事务详解引言在现代应用程序中，事务管理是确保数据一致性和完整性的重要机制。SpringBoot提供了强大的事务管理功能，使得开发者可以轻松地定义和管理事务。本文将详细介绍SpringBoot中的事务管理，包括事务传播行为、事务属性以及声明式和编程式事务管理。声明式事务管理声明式事务管理是通过注解的方式来管理事务，最常用的注解是@Transactional。这种方式简单直观，适合
STM32八股【1】-----启动流程和startup文件理解 Invinciblenuonuo stm32 arm
启动流程知识点MCU上电复位。MSP从向量表第0个地址读取一个32位（2字节）的值并保存，该值为栈顶地址。PC计数器从第1个地址读取一个两字节的值并保存，该值为程序入口，一般是Reset_Handler。想了解FLASH地址映射可以看STM32八股【4】-----AHB地址映射__VectorsDCD__initial_sp;TopofStackDCDReset_Handler;ResetHand
Python中Pyttsx3库实现文本转化成语音MP3格式文件定星照空 python
Pyttsx3库介绍pyttsx3库是一个功能强大且使用方便的Python本地文本转语音库。它不仅能在离线下将文本转换为语音MP3格式文件，也能在Windows、MacOS和Linux等多个操作系统上实现语音播报。同时，还可以调整语音播报的语速、音量和音色。安装与基本使用安装：cmd命令行中执行pipinstallpyttsx3。基本使用示例：importpyttsx3#初始化语音引擎engine
查询数据库中第n行数据 weixin_44231698
一般情况下分页的时候是需要的关键字。Oracle中则是rownum，MSSQL中是top关键字，MySQL中是limit关键字。查第n条数据，如：（1）select*from(SELECTROWNUMrn,A.*FROMTABLEA)bwhereb.rn=n;(2)selecttop1*fromTABLEAwhereidnotin(selecttopn-1idfromTABLEA);(3)用mys
leetcode29. 两数相除-medium 智趣代码实验室 Leetcode leetcode c++
1题目：两数相除官方标定难度：中给你两个整数，被除数dividend和除数divisor。将两数相除，要求不使用乘法、除法和取余运算。整数除法应该向零截断，也就是截去（truncate）其小数部分。例如，8.345将被截断为8，-2.7335将被截断至-2。返回被除数dividend除以除数divisor得到的商。注意：假设我们的环境只能存储32位有符号整数，其数值范围是[−231,231−1]。
使用PyTorch搭建Transformer神经网络:入门篇 DASA13 pytorch transformer 神经网络
1.简介Transformer是一种强大的神经网络架构,在自然语言处理等多个领域取得了巨大成功。本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。然后,安装PyTorch和其他必要的库:pipinstalltorchnumpymatplotlib3.P
openai-agents 中custom example agent ZHOU_CAMP oi_agents 人工智能
代码pipshowopenai-agentsName:openai-agentsVersion:0.0.4Summary:OpenAIAgentsSDKHome-page:https://github.com/openai/openai-agents-pythonAuthor:Author-email:OpenAILicense-Expression:MITLocation:d:\soft\ana
STM32八股【3】------RAM和片上FLASH Invinciblenuonuo stm32 嵌入式硬件单片机
1、RAM和FLASH构成1.RAM┌──────────────────────────┐│栈区(Stack)│←从RAM顶端向下扩展（存储局部变量、函数调用信息）│--------------------------││堆区(Heap)│←从.bss段底部向上扩展（动态分配的内存，如malloc）│--------------------------││.bss未初始化数据区│←未初始化的全局
3.20 补题（二分模板，反向搜索） ZZZS0516 深度优先算法图论 c++
目录D-填涂颜色（搜索）题目描述思路分析代码实现F-跳石头（二分模板）题目描述思路分析代码实现D-填涂颜色（搜索）链接：P1162填涂颜色-洛谷题目描述由数字000组成的方阵中，有一任意形状的由数字111构成的闭合圈。现要求把闭合圈内的所有空间都填写成222。例如：6×66\times66×6的方阵（n=6n=6n=6），涂色前和涂色后的方阵如下：如果从某个000出发，只向上下左右444个方向移动
深度剖析哈希表数据结构：原理、冲突解决与优化策略麻辣酸甜笔记
摘要哈希表作为一种高效的数据结构，在计算机科学领域广泛应用。本文深入探讨哈希表的工作原理，详细分析常见的冲突解决方法，如开放地址法、链地址法等，并进一步研究哈希表在不同场景下的优化策略，旨在帮助读者全面理解哈希表数据结构及其应用。一、引言在计算机程序中，快速查找和插入数据是常见需求。哈希表以其平均时间复杂度为O(1)的高效查找和插入特性，成为解决这类问题的有力工具。从数据库索引到编程语言的集合类实
Ubuntu使用Docker部署Nginx并结合内网穿透实现公网远程访问鸭鸭渗透 eureka 云原生
目录1.安装Docker2.使用Docker拉取Nginx镜像3.创建并启动Nginx容器4.本地连接测试5.公网远程访问本地Nginx5.1内网穿透工具安装5.2创建远程连接公网地址5.3使用固定公网地址远程访问在开发人员的工作中，公网远程访问内网是其必备的技术需求之一。对于运维人员和开发者来说，能够通过公网远程访问内部的服务和应用，能够极大地提升工作效率和便利性。本文将介绍如何利用Ubuntu
Python编程：为什么使用同步原语林十一npc Python语言 python 开发语言
Python编程：为什么使用同步原语1.同步原语同步原语：计算机科学中用于实现进程或线程之间同步的机制。目的：提供一种方法来控制多个进程或线程的执行顺序，确保他们以一致的方式访问共享资源在多线程/多进程编程中，多个执行单元可能同时访问共享资源，导致竞态条件。同步原语通过协调执行顺序，确保数据一致性和操作原子性2.Python核心同步原语同步原语作用适用场景模块Lock（互斥锁）确保同一时间只有一个
kafka生产消息失败 ...has passed since batch creation plus linger time Lichenpar #记录BUG解决 kafka 网络安全 java
背景：公司要使用华为云的kafka服务，我负责进行技术预研，后期要封装kafka组件。从华为云下载了demo，完全按照开发者文档来进行配置文件配置，但是会报以下错误。org.apache.kafka.common.errors.TimeoutException:Expiring10record(s)fortopic-0:30015mshaspassedsincebatchcreationplusl
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

中从底向上匹配_词典信息在中文命名实体识别中的应用

论文列表

你可能感兴趣的:(中从底向上匹配)