trip中tfo文件的学习

1. 每一个TRIP的数据库只有三个独立的文件,其后缀分别是.BAF .BIF .VIF

 BAF为基本文件,存放着数据库记录的原始信息;

BIF是倒排文件,存放着能对原始信息快速查找的词条;

VIFBIF文件所存词条的倒排信息,用于模糊查找。

TFORM格式是一种在原有内容上加了一些标识符和控制符的TXT文件,它可用最低级的编辑器加工而成。控制符为^ ,最常用的标识符有4个:记录标识符R,字段标识符F,段落标识符P和句子标识符S,大小写不拘,此外还有记录名标识符N,子记录标识符G

注意:标识符只有紧跟控制符^后联合使用才起作用,标识符前面可用整数以指示将内容放入第几字段或第几段落。

2.注意一点:Text类型的字段,无子字段一说!!其下分段落(paragraph)、段落只有又分句子(sentence)、句子中又分词(word);

3.建立一个txt文件,把其后缀改成tfo,其就成为一个tfo文件了。你可以通过不同的编辑器打开,进行编辑,我一般是通过notepad++(一个台湾的文本编辑器,有很用,还有插件,还可以写网页。。。。)打开进行编辑的。

4.简单的tfo文件:

 R

  ^1F123456

  ^2F南京网络科技有限公司

  ^3F北京

  ^4F国家体育管理中心

  ^5全国事业单位收费系统

  ^6FJAVA

  ^

上面是一个.tfo文件的标准格式!以R开头,以^结束。注意R前面没有^!!共有6个字段,字段前的数字表示字段号!!

5.TRIP的一个记录不仅有不限量的字段、子字段,而且一个记录中内,还允许有相互独立的子记录,每个子记录有字段、子字段。这种结构对于处理像家庭户籍处理、销售商品管理。。。是相当合适的。

 

一个含有子字段tfo文件:

R

^1F北京理工大学

^2F计算机科学与技术学院

^3F计算机应用

^4F本科

^5F^1p张三^2p李四

^6F^2006-2010

^

说明:将张三和李四分别放到第五字段的第一、第二子字段

注意:如果第五字段的类型为text,那么张三和李四分别放到第五字段的第一、第二段落!!

 

6.

 

一个含有子记录的tfo文件:

R

^1F北京理工大学

^2F计算机科学与技术学院

^3F计算机应用

^4F本科

^5F张三

^G

^F李四

^G

^F王五

^G

^F马六

^G

^F朱七

^6F2006-2010

^

相信,我不用解释,你可以看到规律了!呵呵

7.那么我们把tfo文件导入数据库中了!前面我们介绍了有两种方法。那么你怎么把你在你的机器上建立的tfo文件导入到服务器上呢?!这里需要安装一个软件---winSCP(是一个Windows环境下使用SSH的开源图形化SFTP客户端。同时支持SCP协议。它的主要功能就是在本地与远程计算机间安全的复制文件。

),可以直接拖动的。去网上搜一下怎么安装的,很简单的!然后你就可以把tfo文件复制到服务器上了!

方法A:管理→数据库→装入/倒排→装入/倒排→来到下面的页面,输入数据库名和tfo文件名,回车就行了!!→(ctrl+f)+3返回,你可以查看你刚才导入的数据内容了!!

方法B:对于命令方式:我们在linux系统下,输入下面的命令即可:

Loadix mytestp2 Y N mytestp2.tfo 

 

 

本文出自 “我的JAVA世界” 博客,谢绝转载!

你可能感兴趣的:(职场,全文检索,休闲,trip,tfo文件导入)