用深度学习做命名实体识别(二):文本标注工具brat

本篇文章,将带你一步步的安装文本标注工具brat。

brat是一个文本标注工具,可以标注实体,事件、关系、属性等,只支持在linux下安装,其使用需要webserver,官方给出的教程使用的是Apache2。

使用示例

8a891b6467697ede57e517f5505d8a6b.png

下载brat

建议下载brat的release版本,地址:https://github.com/nlplab/brat/releases/tag/v1.3p1

安装环境

本文将在Ubuntu18.04操作系统下介绍brat的安装过程。

安装过程

首先,安装apache2,使用命令:

sudo apt-get install apache2

 

安装完成后会在 /var 目录下生成一个www/html目录,进入该目录: 

cd /var/www/html

 

将下载的brat-1.3p1.zip文件移动到该目录下,使用 如下命令解压到当前目录:

unzip brat-1.3p1.zip

 

在当前目录下使用如下命令将brat-1.3p1重命名为brat

mv brat-1.3p1 brat

 

使用 如下命令对brat目录授权:

sudo chmod 777 -R /var/www/html/brat

 

进入brat目录

cd /var/www/html/bratsudo ./install.sh

 

执行以下命令,根据提示输入用户名、密码、管理员邮箱

./install.sh

 

现在开始配置apache2.conf文件:  执行命令:

vim /etc/apache2/apache2.conf

 

在文件末尾加入如下内容,注意缩进:


  AllowOverride Options Indexes FileInfo Limit
  Require all granted
  AddType application/xhtml+xml .xhtml
  AddType font/ttf .ttf
  Options +ExecCGI
  AddHandler cgi-script .cgi

 

重新启动apache2:

sudo service apache2 restart

 

然后打开 http://xxx.xxx.xxx.xxx/brat  , xxx是你brat所在主机的ip,默认80端口。

打开网页后,会发现报错,是关于协议什么的错误,这就是坑的地方,我们还需要一个步骤,如下:

cd /etc/apache2/mods-enabled
sudo ln -s ../mods-available/cgi.load

 

只有这样才能使用cgi模块,而这步在brat的官方文档中貌似没有提及。但是在issue的#1141中提到了这点。

接下来,重新加载apache2的配置:

sudo service apache2 reload

 

此时再访问 http://xxx.xxx.xxx.xxx/brat,就能看到下面的界面了:
65dab51b6200718614f50463ea8c8bcd.png

然后,用之前输入的用户名、密码登录后,就可以使用了,使用教程可以参考官方文档:   http://brat.nlplab.org/configuration.html

最后,我们看看如何添加多个用户:
找到/var/www/html/brat/config.py 对应的行,增加:

USER_PASSWORD = {
'admn': 'admin',
'test': 'test',
# (add USERNAME:PASSWORD pairs below this line.)
}

 

重新启动apache2后,使用test就可以登录了。

 

ok,本篇就这么多内容啦~,感谢阅读O(∩_∩)O,88~

用深度学习做命名实体识别(二):文本标注工具brat_第1张图片

你可能感兴趣的:(用深度学习做命名实体识别(二):文本标注工具brat)