数据结构——Trie树

Tire树(字典树)是用于字符串检索的一种多叉树结构,其中每一个节点包含了若干个字符,在插入或检索某一个字符串时,就沿着当前节点的指针访问下一个节点,我们先来讲一下Tire树的基础操作

 

初始化

一颗空的Tire树仅包含根节点,且该点的指针为空

 

插入

当我们要插入一个字符串a时,我们先令指针p指向根节点,然后扫描a中的每一个字符c,执行以下操作:

1.当p中的c指向一个已存在的节点q,令p = q

2.当p中的c指针为空,则新建一个节点q,使c指向q,令p = q

 

检索

当我们要检索一个字符串a在Trie树中是否存在时,我们先令指针p指向根节点,然后扫描a中的每一个字符c,执行以下操作:

1.当p中的c指向一个已存在的节点q,令p = q

2.当p中的c指针为空,则说明S不存在于Trie树中,结束检索

 

下面给出具体操作代码:

 

inline void Insert(char* a) //插入一个字符串a
{
  int len = strlen(a),p = 0;
  for(int k = 0;k < len;k ++)
  {
    int ch = a[k] - '0';
    if(!trie[p][ch]) trie[p][ch] = tot ++; //不存在元素c,新建一个节点q
    p = trie[p][ch]; //令p = q
  }
  return ;
}

inline bool Search(char* a) //对字符串a进行检索
{
  int len = strlen(a),p = 0;
  for(int k = 0;k < len;k ++)
  {
    int ch = a[k] - 'a';
    if(trie[p][ch]) p = trie[p][ch]; //存在元素c,令p = q
    else return false; //不存在元素c,结束检索
  }
  return true;
}

 

 

 

下面给出两道例题

 


T1 HDU1251

 

Problem Description

 

Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).
 
Input

 

输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

 

 
Output

 

对于每个提问,给出以该字符串为前缀的单词的数量.

 

题解

显然是一道Trie树的板子题,在插入的时候,统计每个节点被访问的次数,最后查询就行了

代码如下:

 

#include 
#include 
#include 

const int maxn = 1e6;
int trie[maxn][26];
int cnt[maxn]; 
int tot = 1;
char a[100];

inline void Insert(char* a)
{
  int len = strlen(a),p = 0;
  for(int k = 0;k < len;k ++)
  {
    int ch = a[k] - 'a';
    if(!trie[p][ch]) trie[p][ch] = tot ++;
    p = trie[p][ch];
    cnt[p] ++;
  }
}

inline int Search(char* a)
{
  int len = strlen(a),p = 0;
  for(int k = 0;k < len;k ++)
  {
      int ch = a[k] - 'a';
      if(trie[p][ch]) p = trie[p][ch];
      else return 0;
  }
  return cnt[p];
} 

int main(int argc, char const *argv[]) 
{
  while(gets(a))
  {
    if(!strlen(a)) break;
    Insert(a);
  }
  while(std::cin>>a)
  {
    printf("%d\n",Search(a));
  }
  return 0;
}

 

 


T2 洛谷P2580

 

 

题目背景

XS中学化学竞赛组教练是一个酷爱炉石的人。

他会一边搓炉石一边点名以至于有一天他连续点到了某个同学两次,然后正好被路过的校长发现了然后就是一顿欧拉欧拉欧拉(详情请见已结束比赛CON900)

题目描述

这之后校长任命你为特派探员,每天记录他的点名。校长会提供化学竞赛学生的人数和名单,而你需要告诉校长他有没有点错名。(为什么不直接不让他玩炉石。)

输入输出格式

输入格式:

第一行一个整数 n,表示班上人数。接下来 n 行,每行一个字符串表示其名字(互不相同,且只含小写字母,长度不超过 50)。第 n+2 行一个整数 m,表示教练报的名字。接下来 m 行,每行一个字符串表示教练报的名字(只含小写字母,且长度不超过 50)。

输出格式:

对于每个教练报的名字,输出一行。如果该名字正确且是第一次出现,输出“OK”,如果该名字错误,输出“WRONG”,如果该名字正确但不是第一次出现,输出“REPEAT”。(均不加引号)

题解

也是一道非常简单的Trie板子题,在检索的时候注意加一个访问标记,当检索的元素已被检索过,输出“REPEAT”

代码如下:

#include 
#include 
#include 

const int maxn = 1e6 + 5;
int n,m;
int trie[maxn][26];
int tot = 1;
int vis[maxn];
bool flag;

inline void Insert(char* a)
{
  int len = strlen(a),p = 0;
  for(int k = 0;k < len;k ++)
  {
    int ch = a[k] - 'a';
    if(!trie[p][ch]) trie[p][ch] = tot ++;
    p = trie[p][ch];  
  }
  return ;
}

inline bool Search(char* a)
{
  int len = strlen(a),p = 0;
  for(int k = 0;k < len;k ++)
  {
    if(trie[p][a[k] - 'a']) p = trie[p][a[k] - 'a'];
    else return false;
  }
  if(vis[p]) flag = true;
  vis[p] = 1;
  return true;
}

int main(int argc, char const *argv[]) 
{
  scanf("%d",&n);
  for(int i = 1;i <= n;i ++)
  {
    char a[100];
    std::cin>>a;
    Insert(a);
  }
  scanf("%d",&m);
  for(int i = 1;i <= m;i ++)
  {
    char a[100];
    flag = false;
    std::cin>>a;
    if(Search(a))
    {
      if(!flag) printf("OK\n");
      else printf("REPEAT\n");
    }
    else printf("WRONG\n");
  }
  return 0;
}

 

转载于:https://www.cnblogs.com/Ackers/p/10088138.html

你可能感兴趣的:(数据结构与算法)