不规范的名称也可是一种词库资源

在对来自不同系统的数据做匹配时,不规范的实体名称是一种困扰,因为程序不能自动匹配,需要人工识别匹配,举个例子,“福建省能源集团”、“能源集团”,“福能”指的是同一家公司。
但在我们做完匹配后,这些反而可以变成了一种词库资源,让系统知道,这些名称是同义词,在用于全文模糊搜索时,可以关联到同一家公司上。

你可能感兴趣的:(不规范的名称也可是一种词库资源)