正向最大匹配分词,怎么做最快?

 用所有词生成一个字典树,匹配的过程就是查字典的过程。
假设我们有两个词”百度“,”百家姓“,那么生成的字典树就是:

百---度*
|
|-----家----姓*

其中“度”和“姓”旁边的星号表示这是一个有效词。
对于句子“百度面试题“,首先在字典中找”百“,找到了;继续向下查找”度“,又找到了;继续向下查找”面“,没有找到。那么”百度“就是我们分出来的第一个词。

你可能感兴趣的:(职场,休闲,字典树)