腾讯智能钛机器学习平台

【技术分享】BERT系列（二）-- BERT在序列标注上的应用

本文原作者：梁源，经授权后发布。

原文链接：https://cloud.tencent.com/developer/article/1454904

序列标注是NLP中一项重要的任务，它主要包括分词，词性标注，命名实体识别等子任务。通过对预训练后的BERT模型进行finetune，并与CRF进行结合，可以很好地解决序列标注问题。上篇文章对BERT官方源码进行了介绍，本篇文章将介绍如何通过BERT解决序列标注问题。同时本篇文章将BERT+CRF模型与其他模型进行了对比，并且对BERT在序列标注上任务上存在的问题进行了分析。

1. 序列标注简介

所谓序列标注，就是对一个一维线性输入序列，给线性序列中的每个元素打上标签集合中的某个标签。所以，其本质上是对线性序列中每个元素根据上下文进行分类的问题。中文的序列标注问题，往往可以把一个汉字看做线性序列的一个元素，而不同任务其标签集合代表的含义可能不太相同，但是相同的问题都是：如何根据汉字的上下文给汉字打上一个合适的标签。无论是分词，还是词性标注，或者是命名实体标注，道理都是相通的。在深度学习流行起来之前，常见的序列标注问题的解决方案都是借助HMM模型，最大熵模型，CRF模型。尤其是CRF，它是解决序列标注问题的主流方法。随着深度学习的发展，RNN在序列标注问题上取得了巨大的成功，Bi-LSTM+CRF模型，在该任务上表现的十分出色。但是当我们把Bi-LSTM升级为BERT，在序列标注上的准确率和训练效率上都达到了新的高度。同时发现，BERT+CRF模型可以同时解决中文分词和词性标注两个任务，下面我们就通过这两个子任务分析BERT在序列标注上的应用。

2. BERT+CRF 模型原理

BERT通过”Fill in the blank task” 以及 “Next sentence prediction” 两个任务进行预训练。在预训练模型的基础上稍加修改就可以处理多个下游任务。如下图所示，中文文本的序列标注问题，每个序列的第一个token始终是特殊分类嵌入（[CLS]），剩下的每一个token代表一个汉字。BERT的input embeddings 是token embeddings, segmentation embeddings 和position embeddings的总和。其中token embeddings是词（字）向量，segment embeddings 用来区分两种句子，只有一个句子的任务（如序列标注），可以用来区分真正的句子以及句子padding的内容，而position embedding保留了每个token的位置信息。BERT的output 是每个token的encoding vector。只需要在BERT的基础上增加一层全连接层并确定全连接层的输出维度，便可把embedding vector映射到标集合。词性标注问题的标签集合即中文中所有词性的集合。

BERT模型+FC layer（全连接层）已经可以解决序列标注问题，以词性标注为例，BERT的encoding vector通过FC layer映射到标签集合后，单个token的output vector再经过Softmax处理，每一维度的数值就表示该token的词性为某一词性的概率。基于此数据便可计算loss并训练模型。但根据Bi-LSTM+CRF 模型的启发，我们在BERT+FC layer 的基础上增加CRF layer。 CRF是一种经典的概率图模型，具体数学原理不在此处展开。要声明的是，CRF层可以加入一些约束来保证最终的预测结果是有效的。这些约束可以在训练数据时被CRF层自动学习得到。具体的约束条件我们会在后面提及。有了这些有用的约束，错误的预测序列会大大减小。

3. BERT+CRF 模型工作流程

我们以词性标注为例具体讲解工作流程。

3.1 数据集

在词性标注任务中，主要采用1998年人民日报标注预料库（PRF）。该数据集共有19438条数据，格式如下图所示：“__label__” 为分隔符，分隔符的左侧为文本信息，右侧为标注的词性信息。根据6:2:2的比例将数据集分为train, eval 以及 test dataset。

3.2 数据预处理

在英文文本中单词为最小单位，且每个单词均有一一对应的词性信息，所以无需过多的预处理。但对中文文本，BERT模型的最小输入单位为单个汉字，但是词性信息是根据词语进行标注的，为了满足BERT的要求，我们需要对数据进行预处理，将原文本拆分成一系列的汉字，并对每个汉字进行词性标注。这种分词处理有多种体系，这里使用 ”BIO“，其中 “B” 表示该汉字是词汇开始字符，同时也可以表示单字词；“I” 表示该汉字是词汇的中间字符；“O” 表示该汉字不在词汇当中。”O” 在词性标注任务当中不会出现，但是在命名实体标注中有意义。经过预处理后的数据如下图所示。此外根据BERT模型的要求，需要预先设定最大序列长度(max_seq_length)，根据此参数对序列进行padding。

3.3 模型训练

3.3.1算法参数介绍

bert_dir :预训练模型的存放路径，其中包括的重要数据有：
- vocab.txt: 提供的词表用于输入数据的token embedding 的查找。
- bert_config.json: 提供预训练模型的配置信息
- init_checkpoint: 预训练模型的checkpoint

max_seq_length: 最大序列长度，长度小于该值得序列将进行padding处理，大于该值得序列将进行截断
num_epochs: 训练的epoch数
learning_rate: 学习率

3.3.2 其他细节介绍

在进行数据分割的时候，要保证所有词性标签在训练数据(training dataset) 中均有出现，否则未出现标签同样不会出在后续的预测当中。
需要将vocab.txt中不包括，但是出现在数据集中的汉字用 [UNK] 来替换，否则在训练过程中因无法获得token embedding信息而报错。

3.4 模型预测

同模型训练一样，待预测的句子需要被拆分为一系列单字后输入到训练好的模型当中，模型的输出为每一个单字对应的预测词性。因为这种形式不方便人来查看，所以增加一个后处理的步骤，把B开头，后面跟着I的汉字拼接在一起，直到碰见下一个B标签位置，这样就等于分出了一个单词词语。整个预测流程如下图所示：

在第二章节提到过增加的CRF层可以学习到一些约束，这些约束可能有：

句子的开头应该是 ”B-“，而不是“I-”。
“B-label1 I-label2 I-label3…”，在该模式中，类别1,2,3应该是同一种实体类别。比如，“B-n I-n” 是正确的，而“B-n I-v”则是错误的，同时“I-n I-v”也是错误的。

在训练数据足够大的时候，CRF层可以更好的学习到这些约束，但是无法保证在预测时不出错，因为在模型预测的后处理环节，同样需要考虑上述约束，不符合约束的token，以“ERROR” 来代替预测结果。如下图所示：

4. 模型比较及分析

4.1 模型比较

为了展示出BERT+CRF的优势，我们将其与CRF， Bi-LSTM+CRF进行比较，模型训练均采用单块Tesla P40。获得如下结果：

我们将以上5种模型进行比较，其中embedding的意思是input token使用预训练好的word embedding。可以看出BERT+CRF模型的正确率最高，相较于BERT-LSTM+CRF主流模型，提升了51.8%，训练用时缩短了78%。当我们查看准确率曲线时不难发现，完成一个epoch后，eval数据集的准确率已经超过90%，可见BERT+CRF模型的训练效率和表现均十分出色。

4.2 优缺点分析

优点

Google官方提供了包括不同语种及不同尺寸的多个版本的预训练模型，极大的适应了下游任务，并节约了训练成本。
BERT+CRF 相较于其他模型训练速度更快，准确率更高。可以很好地胜任中文文本的序列标注任务。
模型可以同时完成多任务：从上述例子可以看出，模型在处理词性标注任务的同时，也解决了中文分词的任务，一举两得。

缺点

必须设置max_seq_length参数。对BERT来讲，我们需要预先确定max_seq_length参数，未达到此长度的数据将做padding处理，而超过此长度的数据将被截断，造成信息丢失。这一点上不及Bi-LSTM灵活。
对硬件要求高。训练模型会占用较大的显存，尤其是为了适应文本增大max_seq_length时，显存占用会进一步加大，因此可能会增加预处理工作，比如预先对训练及预测文本进行分割，从而约束最大长度。
评价指标难以计算。对于词性标注任务，目前只能计算和比较字级别（token level）的准确率。但是当根据约束条件将字合并成词后，由于存在 ”ERROR“ 标签，合成词后的序列同原始序列相比会发生错位，导致词级别（term level）的评价指标难以计算。这是中文文本词性标注的问题的通病，同样存在于其他模型上，需要进一步研究解决方法。

5. 总结

BERT是一个十分强大的NLP模型，BERT+CRF 可以高质量的完成序列标注任务。目前该模块已经成功部署到最新版本的腾讯智能钛平台上，有兴趣的同学可以在平台上搭建自己的模型进行训练和预测。我们希望听到你们宝贵的意见和建议。谢谢阅读。

系列文章传送门

腾讯智能钛机器学习平台：【技术分享】BERT系列（一）——BERT源码分析及使用方法zhuanlan.zhihu.com

更多优质技术文章请关注官方微信公众号：

长按/扫描关注我们

专业AI开发者社区，期待您的光临！

智能钛AI开发者 - 云+社区 - 腾讯云cloud.tencent.com

你可能感兴趣的:(【技术分享】BERT系列（二）-- BERT在序列标注上的应用)

COM智能指针ComPtr的介绍以及使用 △曉風殘月〆 c++COM ComPtr 智能指针
ComPtr介绍ComPtr是为COM而设计的智能指针。它支持WindowsRT,也支持传统Win32。相比ATL里的CComPtr类，它有了一些提升。ComPtr会自动维护基础接口指针的引用计数，并在参考计数为零时释放接口，从而消除内存泄漏。ComPtr包含在Windows8.xSDKandWindows10SDK，如果是Windows7系统，需要下载Windows7.1SDK下载地址https
【大模型】蓝耘智算云平台对接满血DeepSeek R1/R3 实战详解小码农叔叔 AI大模型实战与应用蓝耘智算对接DeepSeek 蓝耘智算部署DeepSeek DeepSeek部署 DeepSeek部署与使用 DeepSeek
目录一、前言二、蓝耘智算云平台介绍2.1蓝耘智算云平台介绍2.2平台特点和优势2.2.1平台特点2.2.2平台优势2.3平台应用场景2.4为什么选择蓝耘智算平台部署DeepSeek2.5满血DeepSeekR1/R3介绍三、蓝耘元生代智算云平台对接过程3.1快速入口3.2创建apikey4.3Chatbox集成与使用3.4代码集成与使用3.4.1获取api文档3.4.2python代码操作deep
基于企业架构理论的研发工艺流程银行金融科技银行信息系统架构详解工艺流程企业架构理论
银行传统的研发工艺流程通常以瀑布模型或部分敏捷开发为主，但在企业架构（EnterpriseArchitecture,EA）理论的指导下，可以升级为更加灵活、高效和业务驱动的研发流程。以下是调整后的工艺流程升级方案：1.传统研发工艺流程的问题业务与IT脱节：业务需求与IT实现之间缺乏有效的对齐机制。流程僵化：瀑布模型导致开发周期长，难以快速响应市场变化。技术债务累积：缺乏整体架构规划，导致系统复杂度
Kubernetes服务暴露的4种方法——ClusterIp、NodePort、LoadBalancer 和 Ingress 未来AI编程 k8s探险记 Rancher入门到精通 kubernetes 容器云原生
今天，我们将从我在beta早期遇到的最常见问题之一开始：如何将外部流量路由到我的Kubernetes服务中？当我们的客户开始探索Kubernetes时，这个问题出现了很多，当我试图回答它时，我意识到问题的一部分在于可能的答案的数量，以及理解它们所需的概念。与该问题相关的是一个功能请求：大多数用户想要一个负载平衡工具。由于Beta阶段是关于确认产品的稳定性和验证功能集的优先级，因此我们能够快速确认L
Python | Pytorch | Tensor知识点总结漂亮_大男孩 Python拾遗 python pytorch 深度学习人工智能
如是我闻：Tensor是我们接触Pytorch了解到的第一个概念，这里是一个关于PyTorchTensor主题的知识点总结，涵盖了Tensor的基本概念、创建方式、运算操作、梯度计算和GPU加速等内容。1.Tensor基本概念Tensor是PyTorch的核心数据结构，类似于NumPy的ndarray，但支持GPU加速和自动求导。PyTorch的Tensor具有动态计算图，可用于深度学习模型的前向
Python 使用Pygame库实现复杂井字棋游戏：增加了计分、重新开始游戏、判断平局等功能程序熊. python 经验分享娱乐游戏 pygame
介绍在本项目中，我们将使用Python编程语言和Pygame库实现一个复杂的井字棋游戏。井字棋是一种简单且经典的棋类游戏，本项目将对其进行扩展，增加了计分、重新开始游戏、判断平局等功能，使游戏更加丰富和有趣。环境设置在开始之前，确保已经安装了Python和Pygame库。可以使用以下命令安装Pygame：pipinstallpygame项目分布main.py:游戏的主程序文件，包含游戏的主逻辑和界
Python 使用Pygame库实现扩展复杂井字棋游戏：实现 AI 算法优化，包括 MiniMax 算法和 Alpha-Beta 剪枝算法、检查胜利条件、绘制界面程序熊. python 经验分享娱乐游戏 pygame
1.介绍在本项目中，我们将使用Python编程语言和Pygame库来实现一个扩展的井字棋游戏。井字棋是一款简单而经典的棋类游戏，通过在3x3的棋盘上进行落子，玩家和电脑轮流进行，先在一条直线上成功连成三个自己的棋子的玩家获胜。在这个项目中，我们将实现基本的游戏逻辑、玩家操作、界面展示以及一些扩展功能，如AI算法优化、游戏界面美化、多种游戏模式等。2.环境设置确保你的电脑上已经安装了Python和P
Linux如何通过链接下载文件我想发发发 Linux学习 linux 学习
在Linux系统中，你可以通过多种方式通过链接下载文件。这些方式包括使用命令行工具（如wget、curl、axel等）和图形界面程序（如浏览器或文件管理器）。以下是几种常用的命令行方法：1.使用wgetwget是一个非交互式的网络下载器，它支持HTTP、HTTPS和FTP协议。要使用wget下载文件，你只需在终端中输入以下命令：wget[URL]将[URL]替换为你想要下载的文件的URL。例如wg
QKV 注意力机制在Transformer架构中的作用，和卷积在卷积神经网络中的地位，有哪些相似之处？安意诚Matrix 机器学习笔记 transformer cnn 深度学习
QKV注意力机制在Transformer架构中的作用，和卷积在卷积神经网络中的地位，有哪些相似之处？QKV（Query-Key-Value）注意力机制在Transformer架构和卷积在卷积神经网络（CNN）中都起着核心作用，它们有以下一些相似之处：特征提取QKV注意力机制：在Transformer中，QKV注意力机制通过Query与Key的计算来确定对不同位置Value的关注程度，从而自适应地提
wpf datagrid滚动使用外置滚动条控件 bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)wpf
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述由于某些原因，我原本datagrid的垂直滚动条不能使用，故我希望在原本的datagrid旁边额外加上一条滚动条控件，让其绑定datagrid的滚动条，实现同步移
MATLAB中的A*算法路径规划实战指南 MCPlayer542
本文还有配套的精品资源，点击获取简介：MATLAB是进行路径规划的强大工具，尤其适用于机器人导航和自动驾驶系统。文章详细介绍了如何使用MATLAB实现A算法进行二维和三维路径规划，涵盖了算法原理、环境地图构建、启发式函数设计、以及路径搜索的步骤。文章附带MATLAB代码示例，帮助读者通过实际操作深入理解A算法在路径规划中的应用。1.MATLAB路径规划应用概述路径规划作为移动机器人、无人机和其他自
WPF高级 | WPF 3D 图形编程基础：创建立体的用户界面元素 xcLeigh WPF 从入门到精通 wpf 3d ui C#
WPF高级|WPF3D图形编程基础：创建立体的用户界面元素一、前言二、WPF3D图形编程基础概念2.13D坐标系2.2模型（Model）2.3材质（Material）2.4变换（Transform）三、创建3D场景3.1Viewport3D3.2Camera（相机）3.3Light（光源）四、创建基本的3D物体4.1创建立方体4.2创建球体五、动画与交互5.1动画5.2交互六、性能优化与注意事项6
a*算法matlab代码_Matlab航迹规划仿真——A*算法 weixin_39607798 a*算法matlab代码 a算法和a*算法的区别路径规划算法 matlab仿真
文章目录1.初始化参数2.构建地图3.A*算法搜索路径4.路径优化5.效果图6.下载链接可以在这里看画仆：A星算法详解(个人认为最详细,最通俗易懂的一个版本)zhuanlan.zhihu.com在此主要解释下代码。1.初始化参数主要参数:地图大小起始点和目标点坐标clcclearallm=30;n=30;Spoint=[33];%起始点坐标Epoint=[2922];%目标点坐标2.构建地图-in
.NET全栈开发工程师学习路径 weixin_30659829 面试设计模式数据结构与算法
PS：最近一直反复地看博客园以前发布的一条.NET全栈开发工程师的招聘启事，觉得这是我看过最有创意也最朴实的一个招聘启事，更为重要的是它更像是一个技术提纲，能够指引我们的学习和提升，现在转载过来与各位园友分享。.NET全栈开发工程师1.职位描述独立负责至少一个产品的前后端开发工作//注0：今年是博客园开发团队发展的关键一年，我们有两个重要目标——实践领域驱动设计与实现.NET应用的跨平台，我们期待
PySpark实现获取S3上Parquet文件的数据结构，并自动在Snowflake里建表和生成对应的建表和导入数据的SQL weixin_30777913 python aws sql spark
PySpark实现S3上解析存储Parquet文件的多个路径，获取其中的数据Schema，再根据这些Schema，参考以下文本，得到创建S3路径Stage的SQL语句和上传数据到Snowflake数据库的SQL语句，同样的Stage路径只需创建一个Stage对象即可，并在S3上保存为SQL，并在Snowflake里创建对应的表，并在S3上存储创建表的SQL语句。要将存储在S3上的Parquet文件
Git 2.48.1 官方安装与配置全流程指南（Windows平台） waicsdn_haha 程序员教程 git windows linux 云计算版本控制版本管理团队协作
一、软件简介Git是分布式版本控制系统的标杆工具，由LinusTorvalds开发，广泛应用于代码版本管理、团队协作开发等场景。2.48.1版本优化了文件系统监控性能，并修复了跨平台兼容性问题。二、下载准备1.官方下载地址访问Git官网安装包下载页，选择Windows平台安装包（文件名：Git-2.48.1-64-bit.zip）：2.系统要求组件最低要求推荐配置操作系统Windows7Windo
grpc-go源码剖析十五之grpc + LoadBalancer 实现负载均衡方案介绍码二哥码二哥的技术专栏 grpc golang docker kubernetes 微服务
1、整体流程介绍在介绍源码前，先把大体流程说一下，然后再详细介绍源码；也就是先整体介绍，后局部介绍；grpc客户端内部采用grpclb平衡器，采用自研的方式实现一个简单版本的负载均衡loadBalancer，架构图如下所示：环境说明：本次测试是在Mac环境下进行的测试：启动一个grpc客户端，一个自研的loadBalancer,三个grpc服务器；主要流程说明：grpc服务器端启动时后依次向loa
PyTorch 中结合迁移学习和强化学习的完整实现方案小赖同学啊人工智能 pytorch 迁移学习人工智能
结合迁移学习（TransferLearning）和强化学习（ReinforcementLearning,RL）是解决复杂任务的有效方法。迁移学习可以利用预训练模型的知识加速训练，而强化学习则通过与环境的交互优化策略。以下是如何在PyTorch中结合迁移学习和强化学习的完整实现方案。1.场景描述假设我们有一个任务：训练一个机器人手臂抓取物体。我们可以利用迁移学习从一个预训练的视觉模型（如ResNet
Spring Boot Gradle 项目中使用 @Slf4j 注解曹天骄 spring boot 后端 java
SpringBootGradle项目中，如果想使用@Slf4j注解来启用日志记录，首先需要添加Lombok和SLF4J的依赖。可以通过以下步骤来添加它们：1.添加Lombok依赖在build.gradle文件中添加以下Lombok依赖：dependencies{implementation'org.springframework.boot:spring-boot-starter-logging'/
pytorch 模型测试小赖同学啊人工智能 pytorch 人工智能 python
在使用PyTorch进行模型测试时，一般包含加载测试数据、加载训练好的模型、进行推理以及评估模型性能等步骤。以下为你详细介绍每个步骤及对应的代码示例。1.导入必要的库importtorchimporttorch.nnasnnimporttorchvisionimporttorchvision.transformsastransforms2.加载测试数据假设我们使用的是CIFAR-10数据集作为示例
格行随身WiFiVS华为随身WiFi，格行随身WiFi是如何击败华为登顶随身WiFi好评榜第一名的？ shengyicanmou 华为网络
对于随身WiFi到底哪款更好用，大家一直都争论不休。有说华为是科技公司，技术强大的；有说格行是老牌物联网公司，性价比无敌的。那么今天，我们就全方位的测评一下，看看格行随身WiFi三网切与华为天际通两款设备到底谁的综合素质更胜一筹！一、网速对比1、格行：室内：20-30Mbps、室外：30-35Mbps、最好成绩：52Mbps2、华为室内：22-28Mbps、室外：27-36Mbps、最好成绩：48
Redis 源码分析-内部数据结构 intset 笨手笨脚の #Redis redis 数据结构 set intset 并差集
Redis源码分析-内部数据结构intsetintset是用于实现集合(set)这种对外的数据结构。它包含的元素无序，且不能重复。当插入的元素都是整形，底层使用intset存储，否则使用dict。intset结构和部分函数分析结构体定义如下：//intset结构体typedefstructintset{uint32_tencoding;//数据编码，表示intset中的每个数据元素用几个字节（2、
VSCode详细安装步骤，适用于 Windows/macOS/Linux 系统独隅 Linux MacOS Windws vscode windows macos
以下是VisualStudioCode(VSCode)的详细安装步骤，适用于Windows/macOS/Linux系统：VSCode的详细安装步骤一、Windows系统安装1.下载安装包2.运行安装程序3.验证安装二、macOS系统安装1.方法一：官网下载安装包2.方法二：Homebrew安装3.验证安装三、Linux系统安装1.Debian/Ubuntu2.Fedora3.ArchLinux4.
Python快速实现经典小游戏“打砖块” 壹屋安源 python pygame 小游戏逻辑
目录1.游戏框架和初始化2.游戏常量和颜色3.字体设置4.创建游戏对象：挡板、球和砖块挡板类`Paddle`球类`Ball`砖块类`Brick`5.游戏逻辑：碰撞检测6.创建按钮和界面交互7.游戏主循环和结束逻辑8.总结这段代码是一个经典的“打砖块”游戏的实现，使用了Python的`pygame`库进行图形界面的开发。游戏的基本玩法是通过控制一个可左右移动的挡板，反弹小球打破屏幕上方的砖块，玩家需
Python 学习与开发：高效编程技巧与实用案例壹屋安源知识分享 python 学习开发语言
Python学习与开发：高效编程技巧与实用案例Python是现代编程语言中最受欢迎的一种，它以简洁、易读的语法和强大的功能广泛应用于数据分析、人工智能、Web开发等多个领域。无论你是Python新手还是有经验的开发者，掌握一些高效编程技巧和实用案例，能让你的Python开发之旅更加顺畅。1.高效的函数式编程使用列表推导式列表推导式是Python中非常常用的功能，它不仅可以让代码更加简洁，还能提高执
Pandas 高级使用技巧：高效数据处理与优化壹屋安源知识分享 pandas python 数据处理
文章目录Pandas高级使用技巧：高效数据处理与优化1.高效处理大规模数据集节省内存：指定`dtypes`2.高效的数据合并与连接使用`merge`高效合并使用`concat`拼接多个DataFrame3.提高查询和过滤效率使用`query`提高过滤性能⚡利用`loc`和`iloc`高效定位数据4.高效处理缺失值使用`fillna`填充缺失值⚖️删除含有缺失值的行5.使用多线程加速计算使用`das
此虚拟机的处理器所支持的功能不同于保存虚拟机状态的虚拟机的处理器所支持的功能 Steve lu VMware 运维不得不会的知识
目录问题描述：原因分析：解决方案：问题描述：当我想要还原一台机子的快照时，遇到了这个问题，问题是“此虚拟机的处理器所支持的功能不同于保存虚拟机状态的虚拟机的处理器所支持的功能”，可是我的虚拟机一直在本地没有移动过，应该不存在处理器变化的情况他给出了两个选择，一是取消并还原错误，可我针对这个错误根本没有头绪；二是放弃快照状态，点了之后是能开启，但是之前的快照还是不能使用原因分析：我能想到我可能的问题
arm centos7 安装mysql5.7 qq_42331499 mysql linux 数据库
ARM架构下安装MySQL-学习日记ARM64架构下安装mysql5.7.22的全过程_Mysql_脚本之家错误信息：InstallingMySQLsystemtables..../bin/mysqld:errorwhileloadingsharedlibraries:libaio.so.1:cannotopensharedobjectfile:Nosuchfileordirectory解决办法：
[自然语言处理基础]NumPy基本操作 Steve lu 自然语言处理NLP 自然语言处理 numpy python conda 人工智能机器学习深度学习
什么是NumPyNumPy是Python中科学计算的基本包。它是一个Python库，提供多维数组对象、各种派生对象（如掩码数组和矩阵）以及用于对数组进行快速操作的各种例程，包括数学、逻辑、形状操作、排序、选择、I/O、离散傅里叶变换、基本线性代数、基本统计运算、随机模拟等等。NumPy数组在创建时具有固定大小，这与Python列表（可以动态增长）不同。更改数组的大小ndarray将创建新数组并删除
什么是vlan Steve lu 计算机网络华为网络网络协议
vlan划分原理一.vlan的的概念及优势二.vlan的种类三.静态vlan的配置一.概念二.配置三.Trunk介绍与配置一.Trunk的作用二.Trunk端口与access端口的区别三.配置Trunk模式命令一.vlan的的概念及优势vlan（虚拟局域网）是一个逻辑设备上的设备和用户，这些设备和用户不受物理位置的限制，可以根据功能、部门及应用等因素将他们组织起来，相互之间的通信就好像他们在同一网
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他