PHP实现Trie树(字典树)

Trie树的概念(百度的解释):字典树又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。

我的理解是用来做字符串搜索的,每个节点只包含一个字符,比如录入单词"world",则树的结构是:

PHP实现Trie树(字典树)_第1张图片

这时再录入单词"worab",则树的结构为:

PHP实现Trie树(字典树)_第2张图片

所以每个节点必须还要一个字段is_end标识是否为结束单词。比如用户输入wor,搜索所有wor开头的单词,假设现在有一个单词就是wor,从"w"开始检索,当检索到"r"的时候需要判断"r"节点的is_end为true,则把wor加入到结果列表,然后继续往下面检索。

PHP实现代码:

searchChildNode($value);
		if(empty($node)){
			// 不存在节点,添加为子节点
			$node = new Node();
			$node->value = $value;
			$this->childNode[] = $node;
		}
		$node->is_end = $is_end;
		return $node;
	}

	/* 查询子节点 */
	public function searchChildNode($value){
		foreach ($this->childNode as $k => $v) {
			if($v->value == $value){
				// 存在节点,返回该节点
				return $this->childNode[$k];
			}
		}
		return false;
	}
}



/* 添加字符串 */
function addString(&$head, $str){
	$node = null;
	for ($i=0; $i < strlen($str); $i++) {
		if($str[$i] != ' '){
			$is_end = $i != (strlen($str) - 1) ? false : true;
			if($i == 0){
				$node = $head->addChildNode($str[$i], $is_end);
			}else{
				$node = $node->addChildNode($str[$i], $is_end);
			}
		}
	}
}

/* 获取所有字符串--递归 */
function getChildString($node, $str_array = array(), $str = ''){
	if($node->is_end == true){
		$str_array[] = $str;
	}
	if(empty($node->childNode)){
		return $str_array;
	}else{
		foreach ($node->childNode as $k => $v) {
			$str_array = getChildString($v, $str_array, $str . $v->value);
		}
		return $str_array;
	}
}

/* 搜索 */
function searchString($node, $str){
	for ($i=0; $i < strlen($str); $i++) {
		if($str[$i] != ' '){
			$node = $node->searchChildNode($str[$i]);
			// print_r($node);
			if(empty($node)){
				// 不存在返回空
				return false;
			}
		}
	}
	return getChildString($node);
}


/* 调用测试开始 */
$head = new Node;   // 树的head

// 添加单词
addString($head, 'hewol');
addString($head, 'hemy');
addString($head, 'heml');
addString($head, 'you');
addString($head, 'yo');

// 获取所有单词
$str_array = getChildString($head);

// 搜索
$search_array = searchString($head, 'hem');
// 循环打印所有搜索结果
foreach ($search_array as $key => $value) {
	echo 'hem' . $value . '
'; // 输出带上搜索前缀 }


你可能感兴趣的:(算法)