自然语言处理N天-AllenNLP学习(配置向导)

自然语言处理N天-AllenNLP学习(How-to 01)

我又回来了,Pytorch的学习也是为了熟悉AllenNLP结构,所以,在完成基础tutorial之后又折回来继续学AllenNLP。四月份的目标是复现那篇论文中的结构并使用Finetuning完成Transformer。
今天开始AllenNLP入门的第二部分How-to。总共包括七个小节。

  • 创建自己的json配置文件
  • How to train a model with lazy data
  • How to train and use a Transformer-based ELMo
  • How to Debug Your AllenNLP Code
  • How to visualize model internals (BETA)
  • Using pre-trained ELMo representations
  • Using span representations

1. 创建自己的json配置文件

AllenNLP由类似Json的配置文件驱动。我们得到的一个常见反馈是“很难知道配置文件中需要进行哪些操作。”因此,构建一些工具(仍然有点实验性)来帮助用户了解这部分。

1.1 AllenNLP配置向导

AllenNLP通过浏览器创建了一个配置想到,可以使用这行命令调用

$ allennlp configure

在浏览器中访问http://localhost:8123就可以出现下面的界面

image.png

可以在命令行版本中看到相同的字段和注释。 (注释隐藏为工具提示,将鼠标悬停在问号按钮上以查看它们)。
必填字段的名称为黑色,而可选字段的名称为灰色。未完成的必填字段以红色叹号突出显示。
如果单击dataset_reader的“CONFIGURE”按钮,将出现一个下拉列表:

image.png

如果再次选择SquadReader,将显示数据集读取器部件的配置程序:


image.png

注意在后面的那个X按钮,作用是用来删除dataset reader配置。
当用户填写配置选项后,在页面底部有实时json配置更新。用户可以使用此向导填写整个配置,将生成的JSON复制到文件中,然后启动实验。

这个配置文件等于是傻瓜式的生成模版,可以看到要生成的json的几个主要模块,更有利于初学者了解AllenNLP。

你可能感兴趣的:(自然语言处理N天-AllenNLP学习(配置向导))