doccano安装与使用(Win10)

1 安装

参考:NLP工具-免费的文本数据标注平台doccano-简介、安装、使用、踩坑记录 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/451389544

  • 打开Anaconda Prompt
  • conda create -n glenn python=3.9
  •  
    #进入虚拟环境glenn
    conda activate glenn
    pip install doccano

2 使用

参考:NLP工具-免费的文本数据标注平台doccano-简介、安装、使用、踩坑记录 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/451389544 如何使用文本标注工具——doccano? - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/371752234

 2.1 doccano的启动

  • 打开Anaconda Prompt
  • # 进入虚拟环境
    conda activate glenn
  • # 初始化,设置用户名= admin,密码=pass
    doccano init
    doccano createuser --username admin --password pass
  • 打开两个Anaconda Prompt

        一个输入

conda activate glenn
doccano webserver --port 8000

         另 一个输入

conda activate glenn
doccano task

         PS:两个界面不要关闭,继续下一步

doccano安装与使用(Win10)_第1张图片

2.2 doccano界面

2.2.1 登录 

  • 用Chrome打开
http://127.0.0.1:8000/
  • Get Started
  • 输入账号admin、密码pass

2.2.2 标注 

如何使用文本标注工具——doccano?这篇说的很清楚了。但是版本不大一样,但也可以用。

我用的序列标注,数据集导入选择Textline(用Textfile整个文件导出来只有一行),标注的时候根据标签的key键盘上相应的按键,再选中需要标注的内容即可。

导出数据集选择JSONL,不要勾选Export only approved documents。

doccano安装与使用(Win10)_第2张图片

你可能感兴趣的:(doccano,自然语言处理,经验分享)