SunnyGJing

命名实体识别（NER）综述

文章目录

1. NER介绍
- 1.1 理论
- 1.2 常见命名实体
- 1.3 标注方案
- 1.4 数据集
- 1.5 评测指标
2. NER方法
- 2.1 方法概览与选择
- 2.2 深度学习模型
- - 2.2.1 字词双粒度embedding + bi-LSTM + CRF + 后处理规则
  - 2.2.2 BERT + CRF + 后处理规则
  - 2.2.3 Lattice LSTM
  - 2.2.4 FLAT
3.NER优化/拓展
- 3.1 模型加速与优化
- - 3.1.1 加速包cudnn-LSTM
  - 3.1.2 优化CRF路径选择
- 3.2 数据增强方法
- - 3.2.1 规则模板 + 领域实体词典

1. NER介绍

1.1 理论

命名实体识别（NER）是自然语言处理领域的核心技术之一，它的目标是从一段非结构化文本中识别出属于特定类别的命名实体，进而支持下游任务。例如，为了接入地图搜索服务API，查询POI信息，我们从“我要去北京市北三环西路”中，识别出市辖区类“北京市”和道路类“北三环西路”这两个实体，并作为参数值传入搜索服务API（这一步骤被称为填槽），搜索完成后可获取对应的查询结果。

1.2 常见命名实体

在公开NER语料中，命名实体类别以“时间TIME、地名LOC、人名PER、机构ORG”最为常见。

不同领域的语料可能包含不同类型的命名实体。在语料构建阶段，命名实体的设计应该结合考虑语料的来源和应用场景。例如智能导航领域，可包含如下命名实体：

表1 智能导航领域命名实体

命名实体	命名实体含义
ROAD	道路
HOTEL	酒店
DISTRICT	行政区/市辖区
ADDRESS	POI地址
PARK	公园
RESTAURANT	饭店
POI_ GENERIC	POI
CHARGING	充电桩/充电站
POI_TYPE	POI类别

1.3 标注方案

传统的NER解决方法是序列标注，也就是为文本序列中的每个字标注其所属的命名实体类别。由于一个命名实体通常由多个字组合而成，例如”北京市”组成一个DISTRICT实体；并且存在两个同类别命名实体连续出现的情况，例如“北京市海淀区”是两个DISTRICT实体，所以在实际应用时，通常采用特殊字母来帮助人们判断命名实体的开始与结束。在不同的标注方案下，特殊字母的含义不同，如下：

BIO标注方案

B 表示Begin，命名实体的第一个字
I 表示 Inside，命名实体中除了第一个字以外的其他字
O 表示 Outside，不属于命名实体

由此，语料就可以确定了，如下示例：
```
我	O
要	O
去	O
北	B-DISTRICT
京	I-DISTRICT
市	I-DISTRICT
北	B-ROAD
三	I-ROAD
环	I-ROAD
西	I-ROAD
路	I-ROAD

北	B-DISTRICT
京	I-DISTRICT
市	I-DISTRICT
海	B-DISTRICT
淀	I-DISTRICT
区	I-DISTRICT
```
BIOES标注方案

B 表示Begin，命名实体的第一个字
I 表示Inside，命名实体中除了第一个字和最后一个字以外的其他字
O 表示Outside，不属于命名实体
E 表示End，命名实体的最后一个字
S 表示Single，仅由一个字组成的命名实体

由此，语料就可以确定了，如下示例：
```
我	O
要	O
去	O
北	B-DISTRICT
京	I-DISTRICT
市	E-DISTRICT
北	B-ROAD
三	I-ROAD
环	I-ROAD
西	I-ROAD
路	E-ROAD

北	B-DISTRICT
京	I-DISTRICT
市	E-DISTRICT
海	B-DISTRICT
淀	I-DISTRICT
区	E-DISTRICT
```

1.4 数据集

本文整理了中文NER语料，以备下次接触NER任务时快速开始研究和实战，也希望能够帮助各位读者朋友减少语料准备的时间投入。

领域	语料	样本个数	实体类别示例	语料简介	数据地址
通用	MSRA	46k	PER, ORG, LOC	MSRA微软亚洲研究院开源命名实体识别数据	数据下载
通用	Ontonotes	15k		由英语、汉语和阿拉伯语组成，涵盖新闻、电话对话、网络日志、usenet新闻组、广播、脱口秀	数据下载
新闻	人民日报NER	23k	PER, ORG, LOC	1998年人民日报的实体标注语料	数据下载
	玻森Boson NER	2k	company_name, product_name	由玻森中文语义开放平台提供	数据下载
微博	weibo	1890	PER.NAM, LOC.NAM	包含2013 年11 月至2014 年12月期间从微博中采样的1,890 条博文	数据下载
简历	resume	4k	TITLE, NAME, CONT	随Lattice LSTM论文一同发布，从新浪财经爬取，收录了中国股市上市公司高管的简历	数据下载
新闻	CLUENER 2020	10k	organization, name, position	中文细粒度命名实体识别数据集，在清华大学开源的文本分类数据集THUCTC基础上，选出部分数据进行细粒度命名实体标注，原数据来源于Sina News RSS.	数据下载
电子病历	CCKS2017-Task2	800	身体部位；疼痛	由清华大学知识工程实验室，微软亚洲研究院，北京极目云健康科技有限公司提供，数据来源于其云医院平台的真实电子病历数据	详细介绍数据下载
音乐	CCKS2018-Task2	15k	song；artist	主要来自人机对话系统中音乐领域以及非音乐领域的真实用户utterance请求记录	数据下载
口语理解	NLPCC-Task4	20k	music.play, navigation.start_navigation, phone_call.make_a_phone_call	采集自一个商用的任务型对话系统的线上数据，实体所属领域包括音乐、导航、电话	数据下载

1.5 评测指标

通常，正确的命名实体识别结果，既要确保实体边界正确，也要确保实体类型正确。实体边界和分词类似，找到实体的开始和结束，如果把实体“中关村SOHO”识别为“中关村”和“SOHO”两个实体，就发生了边界错误。而实体类型是分类结果，是命名实体所属的类别，例如“中关村SOHO”的正确实体类型是POI_GENERIC。

命名实体识别任务的常用评测指标是准确率P、召回率R、F1分值。具体计算又分为micro和macro，前者是直接计算所有样本的评测指标，更常用；后者是分别计算每个类别所属样本的评测指标，再求平均值，使得样本数较少的类别的正确与否变得“重要”起来，因此更适用于类别不均衡的数据集（不均衡的命名实体识别语料很常见）。

以下以Presion的计算公式，举例说明micro和macro的不同之处：
$_{micro}P = \frac{\text{正确数量}}{\text{样本总数}}$ $_{macro}P = \frac{\frac{实体类别1正确数量}{实体类别1样本总数} + \frac{实体类别2正确数量}{实体类别2样本总数} + ... + \frac{实体类别N正确数量}{实体类别N样本总数}}{实体类别个数N}$

2. NER方法

2.1 方法概览与选择

经过上文的理解和分析，我们知道命名实体识别是从文本序列中找出属于预定义类别的一串或多串文字。简而言之，先找出命名实体的边界，再判断命名实体的类别。从两个角度来粗略地思考解决方法，一种方法是判断每个字与字之间的间隙是不是分割点，以及分割点前/后属于哪个命名实体类别，也就是分类；另一种方法是使用特殊标记界定每个字是不是实体部分，以及属于哪个命名实体类别，也就是序列标注。

2.2 深度学习模型

2.2.1 字词双粒度embedding + bi-LSTM + CRF + 后处理规则

英文NER普遍以word为输入单元和序列标注单元。不同的是，由于中文分词不一定准确，甚至Word2Vec等词嵌入表示存在OOV问题，导致基于char（字）比基于word的模型效果更好，所以中文NER普遍以char为输入单元和序列标注单元。

字词双粒度embedding是在char的基础上，融合了词边界信息。字词双粒度embedding融合做NER的方法有许多，此处介绍一个我在实践中使用过的方法“char + softword”（16年Peng等人论文）：首先获取字级char embedding，设向量维度为100，再拼接当前字的seg embedding，设向量维度为20，得到新的字级char embedding，作为模型输入，向量维度为120。其中，seg embedding取决于jieba分词后当前字在其所属词中的位置，分为4种，分别是Begin、Inside、End、Single，也就是BIES。例如，“到北京大学”由“到”和“北京大学”两个词组成，这五个字的seg embedding依次对应Single、Begin、Inside、Inside、End的向量表示。

说起NER标配，我们首先想到的是bi-LSTM + CRF组合。bi-LSTM用于捕获全局序列特征，CRF 用于模拟相邻标签之间的依赖关系。在送入CRF层之前，bi-LSTM的输出应首先经过全连接层转换为logits，logits分数表示字/词属于特定标签的发射分数(emission score)。在CRF层中，训练相邻字符的标签转移矩阵，通过结合发射分数和转移矩阵，为每一种可能的标签序列分配一个得分，并使用维特比算法解码得分最高的标签序列。以“北京市”为例，不带CRF的模型可能会输出“I-DISTRICT B-DISTRICT I-DISTRICT”，而带有CRF的模型由于学习了标签与标签的状态转移概率，减少了输出这样的错误答案的情况。

然而，再优秀的模型，难免有“人工智障”的时刻，不过没关系，后处理规则可以帮它纠正错误。还是以“北京市”为例，模型输出“I-DISTRICT B-DISTRICT I-DISTRICT”，显然是错误的，使用后处理规则句首标注为 I 时，将其修改为 B，此时如果句子第二个字标注为 B，将其修改为 I，最终模型输出“B-DISTRICT I-DISTRICT I-DISTRICT”。在对模型的准确性要求较高时，比如公司要上线一个模型，面对模型的各式各样的错误输出，人工分析badcase并总结后处理规则是必要的。

2.2.2 BERT + CRF + 后处理规则

BERT的面世对各大NLP任务产生了深远的影响，小到NLPer的个人练习，大到企业应用，都迅速换上BERT，为原有模型升级。我第一次使用BERT，就是用它来做NER。写到这里，还记得当年我“它竟然认识xxx这个地方诶”的惊叹，为它的模型容量和推理能力折服。

引入BERT后，由于BERT+bi-LSTM+CRF推理慢的问题，应该优化bi-LSTM，下文会提到，或者把bi-LSTM模型部分去掉。

2.2.3 Lattice LSTM

前文提到，中文分词难免有误影响模型的效果，因此普遍采用基于char的NER模型。但是基于char的NER也并不完美，没能充分利用词信息。为了解决这个问题，ACL 2018论文《Chinese NER Using Lattice LSTM》提出采用char+领域词典的格子模型，避免了中文分词错误（重点），又合理利用了词边界信息。

让我们带着两个问题来学习Lattice模型。第一个问题是“怎么避免分词错误”，第二个问题是“怎么利用Lattice格子融合char和词边界信息”。

问题一：怎么避免分词错误？

这篇论文在一个大型的自动分割的语料Giga-Word上，预训练了一个word2vec词嵌入词典D，包含704.4k个词。在做NER时，首先进行句子和大型词典D的匹配，所有匹配得来的词都是词典中现有的边界准确的词，从而避免了分词错误。例如，句子“北京市”和词典D匹配后，得到两个词典词“北京”和“北京市”。（作者也提到存在匹配得来的词与原句语境无关的情况，这些噪声对NER的影响将在后续研究中讨论，不在这篇论文的研究范围内。）

问题二：怎么利用Lattice格子融合char和词边界信息？

我们先来看上图，这是Lattice LSTM结构图，底部蓝色框内的字和词典词组成了LSTM的输入。图中h表示字的LSTM output，c表示字的LSTM cell。图中cell之间黑色的箭头表示基于字的循环信息流，cell之间绿色的箭头表示基于词的循环信息流。为了更加直观一些，我们擦除掉词典词的信息，如下图，剩余部分就是常见的基于字的LSTM结构。

这篇论文提出的基于Lattice的字-词典词融合，就是在字级cell中累加以该字结尾的词级cell信息流，如下图以“桥”为例，则需把“长江大桥”和“大桥”两个词的cell信息流，累加到"桥"这个字的cell信息流中。

到此，就完整地介绍了Lattice LSTM结构。

接下来，我们看看Lattice LSTM具体是如何实现呢？

第一步，计算字级cell信息流，和常规的LSTM计算公式相同，计算公式如下，其中上标c表示char。

第二步，计算词级cell信息流，计算公式如下，其中上标w表示word。词级cell和字级cell的计算区别在于，公式中绿色框出的部分，字级cell的输入是前一个字的隐层输出h_j-1，而词级cell的输入是当前词的第一个字的隐层输出h_b，其中下标b表示begin；另一个区别是，词级cell只需计算input gate和forget gate这两个LSTM gate，无需计算output gate，因为不对词进行序列标注，没有输出。

第三步，在每个字级cell中累加以该字结尾的词级cell信息流，计算公式如下，其中a是归一化后的加权系数。

第四步，利用融合了词信息的字cell信息流c_j，计算基于字的LSTM输出，计算公式如下。这里要特别说明的是，只对字进行序列标注，不对词进行序列标注，所以也就只有基于字的LSTM输出。

2.2.4 FLAT

ACL 2020论文《FLAT: Chinese NER Using Flat-Lattice Transformer》将本文前一节介绍的Lattice引入到Transformer中。这样做的好处很多，比如解决了Lattice LSTM无法并行的问题，以及使得字和词典词信息的融合更加灵活。

总结来讲，这篇论文主要做了两个工作：

第一个工作是把Lattice铺平(flat)作为Transformer的输入，引入head和tail编码，从而替代Lattice的层级结构。Lattice LSTM和FLAT的对比图更加直观一些，如下图，与Lattice LSTM不同的是，在FLAT的输入中，字和词典词并列作为Transformer的输入，第一行橙色数字表示当前字/词的head位置编码，第二行橙色数字表示当前字/词的tail位置编码，这使得可以从FLAT中重建Lattice的层级结构，所以作者认为FLAT保留了Lattice结构。

这篇论文的第二个工作是采用了相对位置编码，计算公式如下，使得在self-Attention的向量点乘计算中最大化保留方向信息。

其中，W_r是参数，⊕表示拼接，P_d是论文《Attention is all you need》中的三角函数位置编码，计算公式如下，大家都有所了解，这里就不详细介绍了。

这里要介绍的是公式中的 d^hh、d^th、d^ht、d^tt，这是这篇论文提出的四种相对距离，用于表示两个字/词之间的关系，计算公式如下。

其中，head[i]、tail[i]就是前文介绍的在FLAT的输入中的两行橙色数字。以 d^hh 为例，表示 x_i 的第一个字与 x_j 的第一个字的距离。

3.NER优化/拓展

3.1 模型加速与优化

3.1.1 加速包cudnn-LSTM

如果采用BERT+bi-LSTM+CRF模型，可能无法满足企业的模型性能要求。关键问题在于bi-LSTM的推理耗时较高，是拖慢推理速度的主要模块。最简单的解决方法是使用cudnn-LSTM 这个Python包，它基于nvidia显卡实现了LSTM的加速优化。

3.1.2 优化CRF路径选择

说到NER模型优化，不得不提到一篇有意思的论文。

论文《Masked Conditional Random Fields for Sequence Labeling》：尽管CRF在NER任务中取得了巨大的成功，但是偶尔会生成非法的标签序列，例如在“O”标签之后包含“I-”标签的序列，这是底层 BIO 标签方案所禁止的。为了解决这个问题，现有的方法是采用人工制作的后处理规则，正如本文前一章节所提到的，重新修正非法段的标记。但这种处理是任意的，会导致性能欠佳。这篇论文提出了Masked Conditional Random Field (Masked-CRF)，这是一种易于实现的变体 CRF，它可以掩盖 CRF 训练期间的非法转换，把原来的路径搜索空间P缩减到路径搜索空间P - I，其中I是非法路径集合，以有原则的方式消除非法结果。

掩盖CRF训练期间的非法转换路径的方法如图：

上图是对CRF的转移矩阵做了一些改动，其中 a₁₃ 被掩码，在图上标注为红色，即非法路径的一部分，是由于标注为 O 的字和标注为 I 的字不可能相邻，其状态转移概率值被替换为 c，一个远小于零的数字。采用掩码的目的是惩罚非法转换，使它们在维特比解码期间永远不会被选中，并且非法路径作为一个整体在训练期间仅构成可忽略不计的概率质量。这些非法路径组成了非法转移集合 Ω。

3.2 数据增强方法

3.2.1 规则模板 + 领域实体词典

对于模型难学习的口语化样本比如“我要吃北京烤鸭”，把“要吃”用标签“[D: search]”替换，把”北京烤鸭”用标签”[D: poi_type]”替换，构建这样一个句式模板，结合标签对应领域的实体词典，生成并扩充样本。

Transformer底层原理解析及基于pytorch的代码实现 LiRuiJie 人工智能 transformer pytorch 深度学习
1.Transformer底层原理解析1.1核心架构突破Transformer是自然语言处理领域的革命性架构，其核心设计思想完全摒弃了循环结构，通过自注意力机制实现全局依赖建模。整体架构图如下：以下是其核心组件：1）自注意力机制（Self-Attention）-输入序列的每个位置都能直接关注所有位置-数学公式（缩放点积注意力）：-Q：查询矩阵（当前关注点）-K：键矩阵（被比较项）-V：值矩阵（实际
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
Pytorch模型安卓部署 python&java pytorch 人工智能 python
Pytorch是一种流行的深度学习框架，用于算法开发，而Android是一种广泛应用的操作系统，多应用于移动设备当中。目前多数的研究都是在于算法上，个人觉得把算法落地是一件很有意思的事情，因此本人准备分享一些模型落地的文章(后续可能分享微信小程序部署，PyQt部署以及exe打包，ncnn部署，tensorRT部署，MNN部署)。本篇文章主要分享Pytorch的Android端部署。看这篇文章的读者
人工智能-基础篇-5-建模方式（判别式模型和生成式模型）
机器学习包括了多种建模方式，其中判别式建模（DiscriminativeModel）和生成式建模是最常见的两种。这两种建模方式都可以通过深度学习技术来实现，并用于创建不同类型的模型。简单来说：想要创建一个模型，依赖需求需要合适的建模方式来创建这个模型。通常建模方式主要分为两大类。一类是判别式模型，针对输入数据给出特定的输出。如：判断一张图片是猫还是狗，直接学习“猫”和“狗”的特征差异（如耳朵形状、
PyTorch教程：LSTM语言模型的动态量化技术解析怀灏其Prudent
PyTorch教程：LSTM语言模型的动态量化技术解析tutorialsPyTorchtutorials.项目地址:https://gitcode.com/gh_mirrors/tuto/tutorials前言在深度学习模型部署过程中，模型大小和推理速度是两个至关重要的考量因素。PyTorch提供的动态量化技术能够在不显著影响模型准确率的前提下，有效减小模型体积并提升推理速度。本文将深入解析如何对
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
后端开发实习生简历迭代的5个版本，希望能帮你找到实习今天不coding 简历实习后端 Java 大厂暑期实习
后端开发实习生简历迭代的5个版本，希望能帮你找到实习1.0研究生开学时写的第一份简历，主要是对本科做的项目的一些总结。本科主要是以深度学习的项目为主+比赛，开发的技术学的比较少，后端的项目也没有做过。但是凭此找到了一份算法的实习。当时研一还是想走算法工程师的。后面觉得自己不适合，就放弃了。2.0经历过几个月的算法实习和论文折磨之后，决定走后端开发岗了，选择Java为主语言，在B站大学做了一个项目，
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
深度学习详解：通过案例了解机器学习基础 beist 深度学习机器学习人工智能
引言机器学习（MachineLearning，ML）和深度学习（DeepLearning，DL）是现代人工智能领域中的两个重要概念。通过让机器具备学习的能力，机器可以从数据中自动找到函数，并应用于各种任务，如语音识别、图像识别和游戏对战等。在这篇笔记中，我们将通过一个简单的案例，逐步了解机器学习的基础知识。1.1机器学习案例学习1.1.1回归问题与分类问题在机器学习中，根据所要解决的问题类型，任务
大模型量化需要重新演唱大模型量化
大模型量化是一种优化技术，旨在减少深度学习模型的内存占用和提高推理速度，同时尽量保持模型的精度。量化通过将模型中的浮点数权重和激活值转换为较低精度的表示形式来实现这一目标。以下是关于大模型量化的详细知识：目录1.量化基础1.1量化定义1.2量化优势1.3量化挑战2.量化方法2.1量化类型2.2量化粒度2.3量化算法3.量化实践3.1量化流程3.2量化工具4.量化案例4.1BERT量化4.2GPT-
大语言模型(LLM)量化基础知识(一) -派神- RAG NLP ChatGPT 语言模型人工智能自然语言处理
承接各类AI相关应用开发项目(包括但不限于大模型微调、RAG、AI智能体、NLP、机器学习算法、运筹优化算法、数据分析EDA等)!!!有意愿请私信!!!随着大型语言模型(LLM)的参数数量的增长,与其支持硬件（加速器内存）增长速度之间的差距越来越大，如下图所示：上图显示，从2017年到2022年，语言模型的大小显著增加：2017年：Transformer模型（0.05B参数）2018年：GPT（0
pytorch 要点之雅可比向量积 AI大模型教程 pytorch 人工智能 python facebook 深度学习机器学习 webpack
自动微分是PyTorch深度学习框架的核心。既然是核心，就需要敲黑板、划重点学习。同时，带来另外一个重要的数学概念：雅可比向量积。PyTorch中的自动微分与雅可比向量积自动微分（AutomaticDifferentiation，AD）是深度学习框架中的关键技术之一，它使得模型训练变得更加简单和高效。且已知：PyTorch是一个广泛使用的深度学习框架，它内置了强大的自动微分功能。在本文中，我们将深
昇腾AI生态组件全解析：与英伟达生态的深度对比
随着人工智能技术的快速发展，国产AI芯片的崛起正在改变全球计算产业的格局。华为昇腾（Ascend）系列AI处理器凭借自主创新的达芬奇架构，构建了完整的软硬件生态体系。本文将从核心组件对比、显卡性能对标两个维度，深入剖析昇腾与英伟达（NVIDIA）生态的技术差异与适用场景。一、昇腾核心组件与英伟达对标分析1.推理引擎：MindIEvsTensorRT昇腾MindIE1.0.0基于昇腾芯片的深度学习推
智能汽车图像及视频处理方案，支持视频智能包装创作能力美摄科技汽车
在这个日新月异的智能时代，每一帧画面都承载着超越想象的力量。随着自动驾驶技术的飞速发展，智能汽车不仅成为了未来出行的代名词，更是技术与艺术完美融合的典范。在这场变革的浪潮中，美摄科技以创新为翼，推出了领先的智能汽车图像及视频处理方案，为智能汽车行业带来了前所未有的视觉盛宴，重新定义了智能出行的视觉体验。一、智能重塑，视觉新境界美摄科技的智能汽车图像及视频处理方案，是基于深度学习、人工智能及大数据处
深度学习计算机视觉开源系统OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置【详细、可运行】 nomoremorphine 深度学习计算机视觉开源
OpenMMLab（mmsegmentation、mmdetection、mmpose）环境配置OpenMMLab简介优势：一、Windows/Linux下环境配置（以mmsegmentationv1.2.2（最新版）为例）0.确认安装版本信息1）确认电脑显卡版本2）确认mmcv对应版本3）确认版本1.安装CUDA和cuDNN2.创建conda环境，下载pytorch3.安装mmcv4.安装MMS
Python爬虫实战：研究TextBlob相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 html TextBlob
1.引言1.1研究背景与意义随着互联网技术的飞速发展，社交媒体已成为人们获取信息和表达观点的重要平台。每天在社交媒体上产生的海量文本数据蕴含着丰富的情感信息和社会舆情，分析这些文本情感倾向，有助于企业了解消费者对产品和服务的评价，政府部门监测社会舆论动态，研究机构探索公众对热点事件的态度。情感分析（SentimentAnalysis）作为自然语言处理的重要分支，旨在通过计算方法识别和提取文本中的主
对话云蝠智能：大模型如何让企业呼叫系统从 “成本中心” 变身 “价值枢纽”？ MARS_AI_ 人工智能自然语言处理信息与通信交互
在人工智能重塑企业服务的浪潮中，云蝠智能（南京星蝠科技有限公司旗下品牌）以深厚的技术积累和行业实践，逐步成长为国内智能外呼领域的标杆企业。其发展路径揭示了技术自主创新与场景深度结合的必然性。一、技术架构：全栈自研奠定领先基础云蝠智能的核心竞争力源于其全链路自研技术体系。该架构覆盖语音识别（ASR）、自然语言处理（NLP）、语音合成（TTS）及软交换六大层级，实现从基础设施到操作层的闭环设计。这一分
Jenkins JNLP与SSH节点连接方式对比及连接断开问题解决方案 tianyuanwo devops jenkins ssh 运维
一、JNLPvsSSH连接方式优缺点对比对比维度JNLP（JavaWebStart）SSH（SecureShell）核心原理代理节点主动连接Jenkins主节点，通过加密通道通信，支持动态资源分配。Jenkins通过SSH协议远程登录代理节点执行命令，需预先配置SSH服务。适用场景容器化环境（如Kubernetes）、需要跨平台或动态扩缩容的场景。传统物理机/虚拟机、静态节点或简单命令执行场景。安
编译OpenCV支持CUDA视频解码 AI标书 python openvc cuda nvidia docker build
如何在Ubuntu上编译OpenCV并启用CUDA视频解码支持（cudacodec）在深度学习、视频处理等高性能计算领域，OpenCV的GPU加速功能非常重要。特别是它的cudacodec模块，能直接利用NVIDIA硬件实现高效的视频解码，极大提升性能。本文将基于Ubuntu环境，详细介绍从环境准备到编译安装OpenCV，并开启cudacodec模块的全过程。完整的shell脚本以及本次编译所用到
深度学习：梯度下降法数字化与智能化人工智能深度学习深度学习梯度下降法
一、梯度的概念（1）什么是梯度梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。对于一个多元函数f(x1,x2,...,xn)，其梯度是一个由函数偏导数组成的向量，其梯度表示为：Gradient=(∂f/∂x1,∂f/∂x2,...,∂f/∂xn)其中，∂f/∂xi表示函数f对第i个自变量
C# vs Python：谁更适合初学者？用5个关键点教你掌握深度学习中的线性代数墨瑾轩一起学学C#【四】c#python 深度学习
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣嘿，小伙伴们！今天我们要一起探索如何使用C#来入门深度学习的世界，特别关注其中的线性代数部分。你可能会好奇：“为什么是C#而不是Python？”别急，我们会在接下来的内容中详细解释这个问题，并通过对比两种语言的特点，让你明白选择C#进行深度学习并不是一个坏主意
入选 ICML 2025！哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15% hyperai
在人工智能技术突飞猛进的当下，大型视觉-语言模型（LVLMs）正以惊人的速度重塑多个领域的认知边界。在自然图像与视频分析领域，这类模型依托先进的神经网络架构、海量标注数据集与强大算力支持，已能精准完成物体识别、场景解析等高阶任务。而在自然语言处理领域，LVLMs通过对TB级文本语料的学习，在机器翻译、文本摘要、情感分析等任务上达到专业级水准，其生成的学术摘要甚至能精准提炼医学文献的核心结论。然而当
合规视角下银行智能客服风险防控 AI 智能服务智能客服人工智能 AIGC 数据库 chatgpt
1.AI驱动金融变革的政策与技术背景政策导向：我国《新一代人工智能发展规划》明确提出发展智能金融，要求：构建金融大数据平台，提升多媒体数据处理能力；创新智能金融产品与服务形态；推广智能客服、监控等技术应用；建立智能风控预警体系。技术支撑：云计算、大数据技术成熟为AI发展奠定了基础。深度学习算法的突破则引爆了本轮AI浪潮，显著提升了复杂任务处理精度，进而推动了计算机视觉、机器学习、自然语言处理（NL
GRU与Transformer结合：新一代序列模型 AI大模型应用工坊 gru transformer 深度学习 ai
GRU与Transformer结合：新一代序列模型关键词：GRU、Transformer、序列模型、结合、深度学习摘要：本文深入探讨了GRU与Transformer结合所形成的新一代序列模型。先介绍了GRU和Transformer各自的核心概念及工作原理，然后阐述了二者结合的原因、方式和优势。通过代码实际案例展示了如何搭建结合的模型，还探讨了其在自然语言处理、语音识别等领域的实际应用场景。最后对未
AI人工智能领域中OpenCV的深度学习融合 AI大模型应用实战人工智能 opencv 深度学习 ai
AI人工智能领域中OpenCV的深度学习融合关键词：AI人工智能、OpenCV、深度学习融合、计算机视觉、图像识别摘要：本文深入探讨了在AI人工智能领域中OpenCV与深度学习的融合。我们将先介绍OpenCV和深度学习的基本概念，再讲解它们融合的原理和方式，通过实际代码案例展示融合的具体操作，探讨其在不同场景的应用，推荐相关工具和资源，分析未来发展趋势与挑战。希望能让大家对这一融合有全面且深入的了
《AI办公类工具PPT系列之七——智谱清言》再见孙悟空_ 【2025 AI工具合集】人工智能 iSlide AI AI智能PPT powerpoint AI PPT PPT
一.简介官网地址为chatglm.cn智谱清言（也被称为ChatGLM）是一款基于大模型技术的人工智能产品，旨在通过其强大的自然语言处理能力，为用户提供高效、智能的交互体验。该产品不仅具备广泛的应用场景，还能够在多个领域内实现深度学习和自我优化。二.功能介绍内容创作：创意写作：帮助用户进行故事、诗歌等文学作品的创作。媒体写作：辅助撰写新闻稿、社交媒体帖子等内容。写作辅助：提供写作建议、结构安排和编
【深度学习解惑】训练RNN时如何解决梯度消失或梯度爆炸？
训练RNN时如何解决梯度消失或梯度爆炸？1.引言与背景介绍循环神经网络（RNN）是处理序列数据的核心模型，但在训练过程中面临两大挑战：梯度消失（GradientVanishing）和梯度爆炸（GradientExplosion）。梯度消失导致长距离依赖难以学习（如文本中相距50个词的关联），而梯度爆炸会造成参数剧烈震荡甚至数值溢出（NaN值）。本文系统分析问题根源并提供工程级解决方案。2.原理解释
找组织——机器学习社区、团体洞察小哥伯涵机器学习人工智能
在Github上，有一些中文社区可以看一看：prompt“如果我是个AI小白，想参加到一个组织，接收最新的AI有趣源项目、一些定期的刊物等。我应该加入哪些组织？”AI社区——深度学习社区Reddit上的MachineLearningsubreddit:https://www.reddit.com/r/MachineLearning/是一个拥有超过400,000名成员的活跃社区。在这里，您可以找到有
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l