CRF++的初步使用(1)

1.前言

条件随机场(Conditional Random Field,CRF)在自然语言处理中有着十分广泛的应用,
CRF条件随机场简介
而开源的CRF++避免了我们一个一个的去造轮子。我们来看一下CRF++是如何使用的。

2.CRF++的下载

原始网址:
CRF++: Yet Another CRF toolkit
我下的win版:
CRF++0.58 windows

3.CRF++初步运行

win版下载后直接解压到文件夹(我解压到了H:/qy/Python/NLP),打开cmd,cd进入到NLP下的CRF++0.58文件夹,

doc文件夹:就是官方主页的内容。
example文件夹:有四个任务的训练数据、测试数据和模板文件。
crf_learn.exe:CRF++的训练程序。
libcrfpp.dll:训练程序和预测程序需要使用的静态链接库。
实际上,需要使用的就是crf_learn.exe,crf_test.exe和libcrfpp.dll,这三个文件。

可以先拿example中的某个例子,做一下测试。例如:example中chunking文件夹,其中原有4个文件:exec.sh;template;test.data;train.data。
template为特征模版;test.data为测试数据;train.data为训练数据。关于它们具体格式和内容,待会详细介绍。

可以选择example里的某个例子做测试,比如选chunking。
将crf_learn.exe;crf_test.exe;libcrfpp.dll三个文件复制到到,含有exec.sh;template;test.data;train.data的文件夹(chunking)里。

Perl解释器的安装
ActivePerl
SWIG
conlleval.pl

你可能感兴趣的:(条件随机场,crf)