Indri建立索引

使用indri建立index


如果你已经编译过indri的源代码,你应该可以在buildindex目录下找到IndriBuildIndex这个文件。这个文件大约17MB,就是我们用来建立索引的可执行文件。这个文件你可以把它拷到任何地方。为了方便,我把它拷到了一个新文件夹bin

首先,在建索引之前,我们要告诉程序我们要为哪些文件建立索引。对你来说,就是为了database中所有题目建立索引。所以,首先你要新建一个文件夹,文件夹中为每一个题目建立一个txt文件。

下图中,我在docs文件夹中建立了6个txt文件。每个文件中有一段话。


Indri建立索引_第1张图片
存放文件的目录
Indri建立索引_第2张图片
文件的内容

接下来,我们要写建立索引所需要的参数。

首先我们要新建一个文件,里面的内容为


200m
/mnt/i/databackup/testdocs/

/mnt/i/databackup/docs/
text


注意,因为我使用win10的bash on ubuntu,所以他的路径地址是/mnt/i/databackup/docs/。另外,注意最后有个斜杠,表示这是一个文件夹,此文件夹下的所有文件都要建立索引。

接下来我们到bin路径下(我们刚才把IndriBuidIndex拷到了此目录下)


Indri建立索引_第3张图片
我们刚才新建的bin目录

执行命令./IndriBuildIndex parameter_file.txt

Indri建立索引_第4张图片
执行命令后的输出

可以看到索引已经建好了。然后去看一下刚才我设定的index的位置

Indri建立索引_第5张图片
index已经建立

这样,index就已经建立了。

你可能感兴趣的:(Indri建立索引)