文本标注工具--BRAT 安装

brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息:

  1. 实体:命名实体,可用于NER;
  2. 关系:实体间关系,可用于关系抽取;
  3. 事件:实体参与的事件;
  4. 属性:事件或实体的属性,常用于知识图谱。

安装web 环境

1 安装apache

sudo apt-get upgrade
sudo apt-get update
sudo apt-get install apache2

安装完毕后,会在 /var 目录下生成一个www/html目录,下面bart的安装路径均在其中:

cd /var/www/html

2 修改apache配置文件

这里主要是修改配置文件apache2.conf中的“”这一项,在这一项内部添加brat官网的配置项内容

cd /etc/apache2/
#先备份一下吧,以免误改后恢复不到原始内容了。
sudo cp apache2.conf apache2.conf.bak
#编辑apache2.conf
sudo vi apache2.conf
## ubantu环境
#sudo vi /etc/apache2/apache2.conf
# centos环境
#sudo vi /etc/httpd/conf/httpd.conf

把配置文件apache2.conf中“”这一部分的内容改成下边的样子(注意缩进,若启动apache2服务时候报错“…the control process exited with error code…”,建议手动缩进(4下空格键))

<Directory /var/www/>
    Options Indexes FollowSymLinks
    Require all granted
    AllowOverride Options Indexes FileInfo Limit
    AddType application/xhtml+xml .xhtml
    AddType font/ttf .ttf
    # For CGI support
    AddHandler cgi-script .cgi
    # Comment out the line above and uncomment the line below for FastCGI
    #AddHandler fastcgi-script fcgi
</Directory>

备选配置(需要建立软连接):

'''

  AllowOverride Options Indexes FileInfo Limit
  Require all granted
  AddType application/xhtml+xml .xhtml
  AddType font/ttf .ttf
  Options +ExecCGI
  AddHandler cgi-script .cgi

'''
#建立Apache2和cgi模块的软链接(上面的配置需要)
#cd /etc/apache2/mods-enabled
#sudo ln -s ../mods-available/cgi.load

这里如果使用普通cgi就设置普通cgi,如果使用fastcgi就注释掉普通cgi那行,打开fastcgi那行。
在配置文件apache2.conf的结尾添加服务名

ServerName localhost

3 使能userdir

#If you are not installing into public_html in your home directory, 
#adjust the above (in particular the line ) accordingly. 
#If you installed into public_html in your home directory, 
#make sure that you have the userdir module enabled
# 官方配置目录
# 我们的是 ,所以听人劝,吃饱饭
sudo a2enmod userdir

4 如果使用普通cgi,则启用

sudo a2enmod cgi

5 如果用FASTCGI支持,则安装并使能rewrite模块

cgi和fastcgi 选择一个就行,根据前边配置文件apache2.conf中的设置

# The final FastCGI step is detailed in .htaccess in the brat installation directory, which involves uncommenting and configuring the rewrite module.
sudo apt-get install libapache2-mod-fastcgi
sudo a2enmod fastcgi
sudo a2enmod rewrite
sudo /etc/init.d/apache2 reload

6 启动apache服务

sudo service apache2 restart

如果安装成功,则可以通过http://172.16.10.77 或http://localhost访问apache默认页,如下图所示:ip地址172.16.10.77为服务器地址

安装并配置BRAT

1)下载BRAT:brak压缩包

其他下载brat的地址:release版本

2)将软件安装包复制到apache根目录,解压,修改文件名为brat

cd /var/www/html
sudo cp /media/sf_Downloads/brat-v1.3_Crunchy_Frog.tar.gz /var/www/html/
sudo tar -xvzf brat-v1.3_Crunchy_Frog.tar.gz
sudo mv brat-v1.3_Crunchy_Frog brat
#修改brat路径权限
#sudo chmod 777 -R /var/www/html/brat

3)进入brat目录,并启动安装脚本,输入用户名、密码以及邮箱地址。

cd /var/www/html/brat
sudo ./install.sh

官方安装教程

4) 查看apache组名

(步骤4、步骤5 两步应该不需要,当前版本的brat在安装完成后会自动进行这两步操作)

sudo ./apache-group.sh

5)改变data、work目录及其下所有子目录和文件的所属组为www-data,使得apache可以有权限访问和修改

sudo chmod -R g+rwx data work

查看是否生效

ls -lh | grep data
ls -lh | grep work

6.0)运行

还是在brat目录下直接运行

python standalone.py
#如果报错的话,就换成 python2 standalone.py

6.1)打开网页,测试是否安装成功

如果成功,地址栏输入http://172.16.10.77 /brat或http://localhost/brat可以看到欢迎页


7)brat默认不支持中文标注

需手动修改brat主目录**/server/src路径下的projectconfig.py**文件的第162行代码

sudo vi /var/www/html/brat/server/src/projectconfig.py

将其改为:

# n  = re.sub(r'[^a-zA-Z0-9_-]', '_', n)
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)

8)重启Apache2

# ubantu
sudo service apache2 restart
# centos
sudo systemctl restart httpd.service

访问本地brat地址,若页面正常,即安装配置无误。

你可能感兴趣的:(NLP,nlp)