CoreJT

序列标注 | (3) NER入门+BiLSTM-CRF模型原理+Pytorch代码详解(资料汇总)

原文地址

最近在系统地接触学习NER（命名实体识别/实体抽取），但是发现这方面的小帖子还比较零散。所以我把学习的记录放出来给大家作参考，其中汇聚了很多其他博主的知识，在本文中也放出了他们的原链。希望能够以这篇文章为载体，帮助其他跟我一样的学习者梳理、串起NER的各个小知识点，最后上手NER的主流模型（Bilstm+CRF）。

全文结构

一、NER资料

二、主流模型Bilstm-CRF实现详解（Pytorch篇）

三、实现代码的拓展（在第二点的基础上进行拓展）

一、NER资料

参考：NLP之CRF应用篇(序列标注任务) 包括：CRF++的详细解析、Bi-LSTM+CRF中CRF层的详细解析、Bi-LSTM后加CRF的原因、Bert+Bi-LSTM+CRF、CRF和Bi-LSTM+CRF优化目标的区别

CRF++完成的是学习和解码的过程：训练即为学习的过程，预测即为解码的过程。

参考： BiLSTM+CRF中CRF详解（这份资料对后面代码的理解是有帮助的）

序列标注问题就是对序列中每个元素打标签（基于标签集合进行多分类，这里的元素单位是字，上一篇博客是词，本质原理是一样的，具体描述稍有区别）。

参考： BiLSTM-CRF中CRF层解析-2

在上一篇的参考中提到，会在每一句话的开始加上“START”，在句尾加上“END”，这点我们可能会有疑惑。

这篇参考给予了解答：

这是为了使转移得分矩阵的鲁棒性更好，才额外加两个标签：START和END，START表示一句话的开始，注意这不是指该句话的第一个单词，START后才是第一个单词，同样的，END代表着这句话的结束。

下表就是一个转移得分矩阵的示例，该示例包含了START和END标签。

每一个格里的值表示的意思是：这个格的行值转成列值的概率大小。打个比方：上图中红框（B-Person，I-person）的值为0.9，表示的意思就是B-person转移至I-person的概率为0.9（上一个元素（字或词）标注为B-Person，下一个元素标注为I-Person的概率），这是合乎BIO标注的规定的（B是实体的开始，I是实体的内部或结束，O非实体）。类推一下，蓝框的意思代表的就是B-Organization转移至I-Organization的概率为0.8。

参考： BiLSTM-CRF中CRF层解析-3 (看完前面的参考来看这份，简直不要太良心了，易懂很多）

但是前面很多概念有提到，就不赘述了，只是加深一下印象，顺带推一下这个博主对CRF的一系列解析。

其中 $P_{i,y_i}$ 为第 i 个位置(序列中第i个元素（字或词）) softmax 输出为(标签) $y_i$ 的概率， $A_{y_i,y_{i+1}}$ 为从 (前一个元素标签) $y_i$ 到（当前元素标签） $y_{i+1}$ 的转移概率，当tag（B-person,B-location…）个数为n(标签集的大小)的时候，转移概率矩阵为（n+2）*（n+2)，因为额外增加了一个开始位置（开始标签START）和结束位置（结束标签END）。这个得分函数S就很好地弥补了传统BiLSTM的不足，因为我们当一个预测序列得分很高时，并不是各个位置都是softmax输出最大概率值对应的label，还要考虑前面转移概率相加最大，即还要符合输出规则（B后面不能再跟B，开头不能是I等约束），比如假设BiLSTM输出的最有可能序列为BBIBIOOO，那么因为我们的转移概率矩阵中B->B的概率很小甚至为负，那么根据s得分，这种序列不会得到最高的分数，即就不是我们想要的序列。（相比于只使用BiLSTM可以去掉一些无效的预测序列，添加一些约束）。

整个过程中需要训练的参数为：

BiLSTM中的参数
转移概率/得分矩阵A

BiLSTM+CRF的预测：

参考： BiLSTM+CRF的一些理解

model中由于CRF中有转移特征，即它会考虑输出label之间的顺序性（依赖或关联性），所以考虑用CRF去做BiLSTM的输出层。（只用BiLSTM的话，输出label之间是独立的）。

二、NER主流模型——BiLSTM-CRF代码详解部分（pytorch篇）

参考1: ADVANCED: MAKING DYNAMIC DECISIONS AND THE BI-LSTM CRF (PyTorch关于BILSTM+CRF的tutorial)

从参考1中找到 pytorch 关于 Bilstm-CRF 模型的tutorial，然后运行它，我这里讲一下几个主体部分的作用:

def argmax(vec):
    # return the argmax as a python int
    _, idx = torch.max(vec, 1) #idx 最大值所在的索引
    return idx.item()


def prepare_sequence(seq, to_ix): #把序列中的元素（字或词）转换为索引
    idxs = [to_ix[w] for w in seq]
    return torch.tensor(idxs, dtype=torch.long) #list转换为tensor


# Compute log sum exp in a numerically stable way for the forward algorithm
def log_sum_exp(vec):  #找到一维tensor最大值 计算全体与该值的离差平方和后 再计算log
    max_score = vec[0, argmax(vec)]
    max_score_broadcast = max_score.view(1, -1).expand(1, vec.size()[1])
    return max_score + \
        torch.log(torch.sum(torch.exp(vec - max_score_broadcast))) #再求exp之前 减去最大值，做一个平移 使最大值为0，防止指数爆炸，计算溢出

训练数据集的格式：list内为tuple(一个tuple表示一条数据)，然后分字/词以及bio（序列中每个字/词对应的标签，B实体开始，I实体中间或结束部分，O非实体）字段。

将输入句子中的字/词转换为对应的索引，把标签转换为对应的索引（上图中只定义了一种实体类型）。

建立BiLSTM_CRF model，及优化器

这是一个toy例子，很简单。

训练300epoch，画红框的是核心。将text字段（输入序列/句子）及bio label（序列中每个字/词对应的标签序列）转换为映射的数字索引，输入模型即可训练。

现在的很多NLP的网红模型，无非是将文字到数字索引的映射建立的更合理。是可拓展的。

另外，这里的模型训练使用的损失函数是： model.neg_log_likelihood() 。这是代码中建立好的 BiLSTM_CRF 类的一部分，弄明白需继续看 model（参考：pytorch版的bilstm+crf实现sequence label，有模型注解）

torch.nn.Parameter()：首先可以把这个函数理解为类型转换函数，将一个不可训练的类型Tensor转换成可以训练的类型parameter并将这个parameter绑定到这个module里面（net.parameter()中就有这个绑定的parameter，所以在参数优化的时候可以进行优化的），所以经过类型转换这个self.v变成了模型的一部分，成为了模型中根据训练可以改动的参数了。使用这个函数的目的也是想让某些变量在学习的过程中不断的修改其值以达到最优化。（参考）【一句话解释：就是（转换为模型的参数）希望它能够梯度下降（计算提督），更新优化】

（建立转移矩阵A，并加了两个我们不会变动的约束条件：1是我们不会从其他tag转向start。2是不会从stop开始转向其他。所以这些位置设为-1e4）

注意：转移矩阵是随机初始化的，而且声明为模型参数，放入了网络中，是会随训练更新的）（如果转移矩阵A的概念不懂可以理解了转移矩阵再回来看）

lstm层：经过了embedding，lstm，linear层, 输出为发射矩阵——emission matrix（seq_len*len(labels)）（该例中batch_size=1）

forward_score应该是所有路径的总得分减去真实标签对应路径的得分即为损失。

计算所有可能路径的总得分。

参考2: pytorch实现BiLSTM+CRF用于NER(命名实体识别)（提到了viterbi编码，很有启发！记录如下）【统筹CRF算法code，以及forward_score - gold_score 作为loss的根本原因】

CRF是判别模型，判别公式如下 y 是标记序列，x 是单词序列，即已知单词序列，求最有可能的标记序列:

Score(x, y) 即单词序列 x 产生标记序列 y 的得分，得分越高，说明其产生的概率越大。

在pytorch的tutorial中，其用于实体识别定义的 Score(x,y) 包含两个特征函数，一个是转移特征函数，一个是状态特征函数.

代码中用到了前向算法和维特比算法（viterbi）

log_sum_exp函数就是计算:

，**前向算法（_forward_alg）**需要用到这个函数

前向算法，求出α（alpha），即Z(x)，也就是(所有可能标注路径的得分和):

，如果不懂可以看一下李航的书关于CRF的前向算法.

但是不同于李航书的是,代码中α都取了对数，一个是为了运算方便，一个为了后面的最大似然估计。

这个代码里面没有进行优化，作者也指出来了，**其实对feats的迭代完全没有必要用两次循环，其实用矩阵相乘就够了，**作者是为了方便我们理解，所以细化了步骤。

维特比算法（viterbi）中规中矩，可以参考李航书上条件随机场的预测算法

neg_log_likelihood函数的作用（计算损失）：

我们知道forward_score是log Z(x)，即（所有可能标注路径的得分和）：

gold_score是(真实标注路径的得分):

我们的目标是极大化:

两边取对数即:

所以我们需要极大化 gold_score - forward_score，也就是极小化 forward_score - gold_score。

这就是为什么 forward_score - gold_score 可以作为loss的根本原因。

参考3: BiLSTM-CRF for Sequence Labeling

这篇跟参考2讲的是一个意思。得分score表示为:

也很清晰地提到了CRF的作用以及score中P和A矩阵分别代表的含义：P为Bi-LSTM的输出矩阵(seq_len*len(labels))；A为tag之间的转移矩阵(len(labels)*len(labels)). len(labels)=tag size.

在许多参考文章中都有提到score的成分包含了两部分，一个是Bilstm的输出结果，另一个就是CRF的转移矩阵，而转移矩阵的作用就是去给标注结果一些约束。例如标注B的后面不能接B这种约束。这种约束是根据转移矩阵A提供的。而转移矩阵A是随机初始化，然后根据你提供的训练集，训练学习、梯度下降得到的。根据画红线的去看上方score的定义，就明白定义了每一种标注情况为一条路径，使用score去计算该路径的得分的意思了。再啰嗦一下： $A_{y_i,y_{i+1}}$ 是表达这个tag $y_i$ （标注 $y_i$ ）转移至下一个tag $y_{i+1}$ （标注 $y_{i+1}$ ）的分数（概率）。而 $P_{i,y_i}$ 就是Bilstm的输出矩阵，可以看到每个字/词对应到不同tag（标注）的分数。【不懂也没关系，有很多文章都提到了。反复看就会有感觉了】

CRF的概率函数表示为

S(X,y)的计算很简单，而
)
（下面记作logsumexp）的计算稍微复杂一些，因为需要计算每一条可能路径的分数。这里用一种简便的方法，对于到词的路径，可以先把到词的logsumexp计算出来，因为：

因此先计算每一步的路径分数和直接计算全局分数相同，但这样可以大大减少计算的时间。

参考4: BiLSTM-CRF中CRF层解析-4 （用程序的思想去理解怎么计算所有路径的得分和，巨良心）

这篇文章提到了动态规划的编程思想，虽然跟pytorch的tutorial有些许偏差。但已经很到位了。卡在**_foward_alg函数**的同学多看几遍这篇文章，先理解一下动态规划的思路吧。会有帮助的。

参考5: BiLSTM-CRF中CRF层解析-5

上一篇在讲loss的一部分：所有路径的得分和。现在讲怎么去解码预测。大概的思路就是根据最高的得分去反哺这条路径，使用较多的就是Viterbi解码了。这篇文章就很详细很详细地提到了怎么去解码这个路径，具体就直接进到博主的解析上看吧！（我的序列标注系列博客的第二篇也完整转载了该系列博客）

参考6: pytorch lstm crf 代码理解（走心的解读，统筹代码块的作用，其心得部分十分到位）

这里就罗列一下作者的心得体会：

反向传播不需要一定使用forward()，而且不需要定义loss=nn.MSError()等，直接score1 - score2 （neg_log_likelihood函数），就可以反向传播了。
使用self.transitions = nn.Parameter(torch.randn(self.tagset_size, self.tagset_size)) 将想要更新的矩阵，放入到module的参数中，然后两个矩阵无论怎么操作，只要满足 y = f(x, w)，就能够反向传播
从代码看出每个循环里只是取了转移矩阵A的一行，或者就是一个值，进行操作，转移矩阵就能够更新。至于为什么能够更新，作者也不知道，这涉及到pytorch的机制。
发射矩阵（emit score）是 BiLSTM算出来的。转移矩阵是单独定义的，要学习的（模型参数）。初始矩阵是 [-1000,-1000,-1000,0,-1000]，固定的。因为当加了开始符号后，第一个位置是开始符号的概率是100%。
显式的加入了start标记，隐式的使用了end标记（总是最后多一步转移到end）的分数

参考7: Pytorch高级实战教程：基于BiLSTM-CRF实现命名实体识别和中文分词

对这份pytorch NER tutorial，只需要将中文分词的数据集预处理成作者提到的格式，即可很快的迁移这个代码到中文分词中。但这种方式并不适合处理很多的数据（数据格式迁移问题），但是对于 demo 来说非常友好，把英文改成中文，标签改成分词问题中的 “BEMS” （B是词开头，E词结束，M词中间部分，S单字词，输入序列以字为单位）就可以跑起来了。

参考资料：

pytorch中bilstm-crf部分code解析（也很良心了，作者画了草图帮助理解）
pytorch版的bilstm-crf实现sequence label （比较粗的注解）

三、模型代码扩展部分（pytorch部分）

前面我们介绍了很久pytorch实现NER任务的主流model——Bilstm+CRF，为了便于新手入门，所以还是稍微简陋了一些。刚好看到有份资源是移植这个tutorial去实践的，还是很有必要学习的

资料： ChineseNER （中文NER、有tf和torch版，市面上Bilstm+CRF的torch code基本都是出自官方tutorial）（py2.7）

因为是py2的代码，所以是需要改成py3的。

**训练代码：**train_py3.py

但这个“Bosondata.pkl”(预处理完的数据文件)是需要我们先到路径“ChineseNER\data\boson”下运行"data_util.py"才生成的。

当然，原代码也是存在python版本的问题（原代码是py2的）例如：
报错：AttributeError: ‘str’ object has no attribute ‘decode’
解决方法：把 .decode("*") 那部分删除即可

溯源: https://www.cnblogs.com/xiaodai0/p/10564471.html

报错：ImportError: No module named ‘compiler.ast’
解决方法：重新写一个函数来替代 from compiler.ast import flatten 的flatten函数

import collections
def flatten(x):
    result = []
    for el in x:
        if isinstance(x, collections.Iterable) and not isinstance(el, str):
            result.extend(flatten(el))
        else:
            result.append(el)
    return result

溯源: https://blog.csdn.net/w5688414/article/details/78489277

当成功运行"data_util.py"生成“Bosondata.pkl”后，把"train_py3.py"里面第38行的"word2id"修改为"id2word"（应该是作者打错了），然后在代码路径下创造文件夹“model”(用于存储模型文件)，就可以开始训练了。

最后附上修改后的github源码：https://github.com/Hyfred/Pytroch_NER_tutorial

509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
2024春节微信红包封面序列号大全一览帮忙赚赏金
2024微信红包封面序列号哪里领取红包封面领取微信搜索公众号：【艺间封面】千万红包封面等你领取2024微信红包封面免费序列号如何设置微信红包封面？1.打开微信，点击好友选择红包。2.单击红包封面。3.单击“添加红包封面”。4.输入接收序列号。来一波免费的微信红包封面序列号微信红包封面序列号红包封面领取微信搜索公众号：艺间封面千万红包封面等你领取微信红包封面序列号kGnkrbw5a7N微信红包封面序
每日OJ_牛客_马戏团（模拟最长上升子序列） GR鲸鱼 c++算法开发语言牛客数据结构
目录牛客_马戏团（模拟最长上升子序列）解析代码牛客_马戏团（模拟最长上升子序列）马戏团__牛客网搜狐员工小王最近利用假期在外地旅游，在某个小镇碰到一个马戏团表演，精彩的表演结束后发现团长正和大伙在帐篷前激烈讨论，小王打听了下了解到，马戏团正打算出一个新节目“最高罗汉塔”，即马戏团员叠罗汉表演。考虑到安全因素，要求叠罗汉过程中，站在某个人肩上的人应该既比自己矮又比自己瘦，或相等。团长想要本次节目中的
2024微信红包封面怎么领取免费的？（红包封面序列号获取方法）帮忙赚赏金
2024微信红包封面怎么领取免费的？（红包封面序列号获取方法）在中国，微信几乎成为了人们生活中不可或缺的一部分，而微信红包更是成为了人们表达祝福和送礼的一种形式。微信红包不仅方便快捷，还能够增添节日气氛和人与人之间的情感交流。然而，有时候我们想要定制一个特殊的微信红包封面，以更好地展现自己的个性和情感，但又担心定制费用过高。那么，如何才能免费获取2024微信红包封面的序列号呢？下面将为您详细介绍一
Python 推导式(Comprehensions) 戒灵
1,列表推导式num=[1,2,-5,10,-7,5,7,-1]filtered_and_squared=[x**2forxinnumifx>0]print(filtered_and_squared)迭代器(iterator)遍历输入序列num的每个成员x断言式判断每个成员是否大于零如果成员大于零，则被交给输出表达式，平方之后成为输出列表的成员。列表推导式被封装在一个列表中，所以很明显它能够立即生
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
Codeforces Round 972 (Div. 2) A-C 题解 AKDreamer_HeXY Codeforces 比赛题解 c++算法动态规划数据结构贪心算法
本来以为B2难度会1900什么的，结果感觉1200还没有，先做的B1，后悔了QwQ关于我现场没切出C这件事……现场排名：A.SimplePalindrome题意构造一个长度为nnn的字符串，只包含aeiou五种字母，需要使得构造出来的字符串所包含的回文子序列数量最小思路当n≤5n\le5n≤5时，只要555个字母不重复出现都是最优情况当n>5n>5n>5时，可以证明：把相同字母放在一起是最优情况：
算法刷题：300. 最长递增子序列、674. 最长连续递增序列、718. 最长重复子数组、1143. 最长公共子序列哆来咪咪咪算法
300.最长递增子序列1.dp定义：dp[i]表示i之前包括i的以nums[i]结尾的最长递增子序列的长度2.递推公式：if(nums[i]>nums[j])dp[i]=max(dp[i],dp[j]+1);注意这里不是要dp[i]与dp[j]+1进行比较，而是我们要取dp[j]+1的最大值。3.初始化：每一个i，对应的dp[i]（即最长递增子序列）起始大小至少都是1.classSolution{
python中的迭代器有什么用 hakesashou python基础知识 python 开发语言
什么是Python迭代器？迭代器（Iterator）：迭代器可以看作是一个特殊的对象，每次调用该对象时会返回自身的下一个元素，从实现上来看，一个迭代器对象必须是定义了__iter__()方法和next()方法的对象。1、Python的Iterator对象表示的是一个数据流，可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，所以Iterator的计算是惰性的，只有在需要返回下一个数
如何区分Python中数据类型可变还是不可变秸秆混凝烧结工程师
关键字改变元素值，内存地址发生改变，被称为数据内型不可变如string，元组，存储数据类型单一，不能同时存在两个数据类型，新增元素后，表容量，元素个数，元素存储区ID改变，典型的内置元素一体存储法；改变元素值，但是内存地址不改变就是可变数据内型，如list，存储元素可以不同，删除，新增，插入，表序列不改变，扩展表容量时，对象地址ID不变，属于顺序表的，分离式存储结构，外置元素法，python中不可
Cut, Paste and Learn方法解读 wangxinwei2000 深度学习人工智能
Abstract问题背景：标注数据的缺乏：在实例检测任务中，部署物体检测模型的一个主要障碍是缺乏大量标注数据。例如，在一个特定的厨房环境中找到包含实例的大型标注数据集是不太可能的。每当面对新的环境和新的物体实例时，都需要进行昂贵的数据收集和标注工作。研究贡献：解决方法：本文提出了一种简单的方法，可以以最小的努力生成大量标注的实例数据集。关键洞察：研究者的关键洞察是，仅仅确保“局部真实感”（patc
matlab游标标注移动,matlab实现图形窗口的数据游标莫白想 matlab游标标注移动
DatacursorsforfigurewindowSeveralrelatedfunctions:CreateCursorsetsupaverticalcursoronallaxesinafigure.Thecursorscanbemovedaroundusingthemouse.MultiplecursorsaresupportedineachfigureGetCursorLocationre
Spring @Async 深度解读：默认线程池执行器的配置与优化小码快撩 spring java 前端
在Spring中，@Async注解用于异步执行方法。默认情况下，@Async注解的任务是由一个线程池执行的。然而，这个默认的线程池是如何初始化的呢？本文将深入探讨这一过程，帮助你理解Spring异步任务背后的线程池执行器的初始化原理。1.@Async的基本使用首先，让我们快速回顾一下@Async的基本用法。@Async通常用于标注在需要异步执行的方法上，比如：@Servicepublicclass
【Java】面试题31：栈的压入，弹出序列小小核桃剑指offer java版
~~题目：~~输入两个整数序列，第一个序列表示栈的压入顺序，请判断第二个序列是否为该栈的弹出顺序。假设压入栈的所有数字均不相等。例如，序列{1，2，3，4，5}是某栈的压栈序列，序列{4，5，3，2，1}是该压栈序列对应的一个弹出序列，但{4，3，5，1，2}就不可能是该栈序列的弹出序列。思路：首先借助一个辅助栈，把输入的第一个序列中的数字依次压入该辅助栈，并按照第二个序列的顺序依次从该栈中弹出数
SQLite的入门级项目学习记录（二）深蓝海拓 SQLite学习笔记 sqlite 学习数据库
再补充一些基础知识：并行操作的问题1、可以多游标同时运行SQLite，对于同一个连接sqlite3.connect(db_file)，可以同时创建多个游标，每个游标都是独立的，可以执行各自的SQL命令序列。importsqlite3#创建数据库连接conn=sqlite3.connect('example.db')#创建第一个游标cursor1=conn.cursor()cursor1.execu
Pyorch中 nn.Conv1d 与 nn.Linear 的区别迪三 #NN_Layer 神经网络
即一维卷积层和全联接层的区别nn.Conv1d和nn.Linear都是PyTorch中的层，它们用于不同的目的，主要区别在于它们处理输入数据的方式和执行的操作类型。nn.Conv1d通过应用滑动过滤器来捕捉序列数据中的局部模式，适用于处理具有时间或序列结构的数据。nn.Linear通过将每个输入与每个输出相连接，捕捉全局关系，适用于将输入数据作为整体处理的任务。1.维度与输入nn.Conv1d（一
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
Apache HBase基础（基本概述，物理架构，逻辑架构，数据管理，架构特点，HBase Shell） May--J--Oldhu HBase HBase shell hbase物理架构 hbase逻辑架构 hbase
NoSQL综述及ApacheHBase基础一.HBase1.HBase概述2.HBase发展历史3.HBase应用场景3.1增量数据-时间序列数据3.2信息交换-消息传递3.3内容服务-Web后端应用程序3.4HBase应用场景示例4.ApacheHBase生态圈5.HBase物理架构5.1HMaster5.2RegionServer5.3Region和Table6.HBase逻辑架构-Row7.
数据分析-24-时间序列预测之基于keras的VMD-LSTM和VMD-CNN-LSTM预测风速皮皮冰燃数据分析数据分析
文章目录1普通的LSTM模型1.1数据重采样1.2数据标准化1.3切分窗口1.4划分数据集1.5建立模型1.6预测效果2VMD-LSTM模型2.1VMD分解时间序列2.2对每一个IMF建立LSTM模型2.2.1IMF1—LSTM2.2.2IMF2-LSTM2.2.3统一代码2.3评估效果3CNN-LSTM模型3.1数据预处理3.2建立模型3.3效果预测4VMD-CNN-LSTM模型4.1VMD分解
车载以太网之SOME/IP IT_码农车载以太网车载以太网 SOME/IP
整体介绍SOME/IP(全称为：Scalableservice-OrientedMiddlewarEoverIP)，是运行在车载以太网协议栈基础之上的中间件，或者也可以称为应用层软件。发展历程AUTOSAR4.0-完成宝马SOME/IP消息的初步集成；AUTOSAR4.1-支持SOME/IP-SD及其发布/订阅功能；AUTOSAR4.2-添加transformer用于序列化以及其他相关优化；AUT
微信红包封面序列号兑换码大全免费2024最新龍年全网优惠分享
每当月初的时候，我们都期待着的就是那一句话：“老板发红包了！”纷纷掏出手机，急切地等待着微信红包的到来。红包弹出的那一瞬间，我们的心情也跟着变得愉悦起来。这看似微不足道的小红包，却蕴含着我们对生活的期盼和希望。它不仅仅是简单的财富分享，更是一种情感的表达。微.信搜索:「封面院」关注公众号可领取红包封面序列号。最新微信红包封面序列号：先到先得，抢完为止：1、pdiqgLsY1lR2、vC8tY0VR
html添加文字标注傲世阿龍 HTML
添加文字标注有情芍药含春泪，无力蔷薇卧晓枝。作者秦观效果：
1.6编程基础之一维数组伶俐角少儿编程 C++入门篇算法 c++数据结构
文章目录01:与指定数字相同的数的个数02:陶陶摘苹果03:计算书费04:数组逆序重放05:年龄与疾病06:校门外的树07:有趣的跳跃08:石头剪刀布09:向量点积计算10:大整数加法11:大整数减法12:计算2的N次方13:大整数的因子14:求10000以内n的阶乘15:阶乘和01:与指定数字相同的数的个数总时间限制:1000ms内存限制:65536kB描述输出一个整数序列中与指定数字相同的数的
动态生成的html元素绑定click事件 .NET跨平台 Jquery及其组件 html jquery
第一篇博客，开启技术博客的生涯，欢迎大家批评指教（坚信妹子也可以做好程序猿）今天想说帮公司做项目的时候遇到的一个小问题，动态添加html元素以后再去事件监听出问题。在实际开发中会遇到要给动态生成的html元素绑定触发事件的情况。就是上面的一张表格要动态实现添加行，然后序列号还要随着增加，当删除的时候序列号依旧是按顺序排列。刚开始使用jQuery的on方法来解决，但是发现一个问题会出现事件绑定很多次
史上最全的maven的pom.xml文件详解 Meta999 Maven
注：详解文件中，用红色进行标注的是平常项目中常用的配置节点。要详细学习！转载的，太经典了、、、、欢迎收藏xxxxxxxxxxxx4.0.0xxxxxxjar1.0-SNAPSHOTxxx-mavenhttp://maven.apache.orgAmavenprojecttostudymaven.jirahttp://jira.baidu.com/[email protected]
‌seq_len 不等于 hidden_size 难道不会报错吗，他们是一会事情吗 zhangfeng1133 python 人工智能开发语言 pytorch
seq_len与hidden_size在RNN中代表不同概念，不等不会报错‌。‌seq_len‌：序列长度，表示在处理数据时，每个批次（batch）中序列的长度。RNN网络会按照seq_len指定的长度进行循环计算‌1。‌hidden_size‌：隐藏层中隐藏神经元的个数，也是输出向量的长度。它决定了RNN网络中隐藏层的状态向量的维度‌12。在RNN的训练过程中，seq_len和hidden_si
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep

序列标注 | (3) NER入门+BiLSTM-CRF模型原理+Pytorch代码详解(资料汇总)

全文结构

一、NER资料

二、NER主流模型——BiLSTM-CRF代码详解部分（pytorch篇）

三、模型代码扩展部分（pytorch部分）

你可能感兴趣的:(序列标注)