编程珠玑(二)寻找一个字符串中最长重复字串

例如字符串"banana"中最长重复字串为ana,这里用到了一个很简单的数据结构字符串数组,其实为一个字符串指针数组,一个char *类型的数组,用字符地址代表每个字符,可以节省空间。算法很简单,求出每个后缀数组,然后对后缀数组进行排序,最后求出相邻的两个数组之间的最大公共字串。

#include <iostream>
using namespace std;

void common_str(char *s, char **com);
void bubble(char **a, int s, int e);
int common_len(const char *s1, const char *s2); //求s1和s2从第一个字符开始相同的字符的个数

int main()
{
        char s[] = "banana";
        char *com = NULL;
        common_str(s, &com);
        printf("common str is %s\n", com);
        return 0;
}

void common_str(char *s, char **com)
{
        int len = strlen(s);
        char **a = new char *[len];
        int i = 0;
        while(s[i])
        {
                a[i] = &s[i];
                i++;
        }
        bubble(a, 0, len-1);

        int com_len = 0;
        char *com_str = NULL;
        for(int j=0; j<=len-2; j++)
        {
                int c_len = common_len(a[j], a[j+1]);
                if(c_len > com_len)
                {
                        com_len = c_len;
                        com_str = a[j];
                }
        }
        *com = new char[com_len + 1];
        memcpy(*com, com_str, com_len);
        (*com)[len] = '\0'; //这里这句话不写也可以,因为原来数组每个元素都为NULL,但是不可写成*com[len] = '\0';[]下标的优先级高于*
}

void bubble(char **a, int s, int e)
{
        int len = e-s+1;
        for(int i = len-1; i--; i>0)
                for(int j = 0; j<=i; j++)
                        if(strcmp(a[j], a[j+1]) > 0)
                        {
                                char *temp = a[j];
                                a[j] = a[j+1];
                                a[j+1] = temp;
                        }

}

int common_len(const char *s1, const char *s2)
{
        int len = 0;
        while(*s1 == *s2 && s1!=NULL && s2!=NULL)
        {
                len++;
                s1++;
                s2++;
        }
        return len;

}


 

你可能感兴趣的:(编程珠玑(二)寻找一个字符串中最长重复字串)