StanfordCoreNLP 使用笔记

1、在使用 StanfordCoreNLP (下面简称为:nlp) 的时候,如果在使用完不关闭服务的话(调用 close() 方法),那么 nlp 是不会主动关闭服务进程的

2、一个 nlp 服务进程大概占用的内存为 4g 

3、可以通过参数 memory 来指定 nlp 服务所占用的 内存,可选的值为 4g、6g、8g。值得注意的是,并不一定会占用指定的 memory 这么多内存,

而是以实际占用内存为主。例如如果指定的参数 memory 值为 4g,但实际使用的内存仅为 1g,则 nlp 服务会只占用 1g 内存,而不是 4g

4、在定义 nlp 时是不会加载资源的,而是在使用的时候才会加载资源。例如分词的时候,在定义 nlp 时不加载资源,而是在使用 word_tokenize 方法来进行分词时才加载资源。并且仅在第一次的时候加载资源,在第二次及之后的调用中是不加载资源的。

5、nlp 加载资源的时间约为 8.5 秒(在使用 word_tokenize 时是花费这么多时间,其他方法还未测试过)

6、在不包括第一次调用 word_tokenize 的情况下,分词所花费的平均时间约为 0.1 秒

7、word_tokenize 不支持自定义字典

你可能感兴趣的:(StanfordCoreNLP 使用笔记)