给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 。
输入:haystack = "sadbutsad", needle = "sad"
输出:0
解释:"sad" 在下标 0 和 6 处匹配。
第一个匹配项的下标是 0 ,所以返回 0 。
输入:haystack = "leetcode", needle = "leeto"
输出:-1
解释:"leeto" 没有在 "leetcode" 中出现,所以返回 -1 。
1 <= haystack.length, needle.length <= 10**4
haystack 和 needle 仅由小写英文字符组成
这里可以用两种方法进行解题,一种是BF算法(Brute Force暴力搜索算法),算法时间复杂度为O(n*m),另一种是KMP算法(BF算法改进),算法时间复杂度为O(n+m)。这里我们用KMP算法进行解题,最好结合着《三、函数介绍》来看。
在进行字符串匹配之前,我们需要算出模式串的前缀表,也就是算出模式串从第一个字符到倒数第二字符的最长公共前后缀。如下图:
我们可以根据第一个A来推导AB,再来推导ABA的最长公共前后缀,推导方法为:
A只有一个,最长公共前后缀:0。
AB,新增字符B,A和B不相等,最长公共前后缀:0。
ABA,新增字符A,A和A相等,最长公共前后缀:1。
ABAB,新增字符B,B和B(上一个最长公共前后缀:1为索引位的值为B)相等,最长公共前后缀:2。
ABABC,新增字符C,C和A(上一个最长公共前后缀:2为索引位的值为A)不相等,这时需要计算前两位AB和后两位BC是否相等,不相等,最长公共前后缀:0。
ABABCA,新增字符A,A和A(上一个最长公共前后缀:0,所以直接和头部的A比较)相等,最长公共前后缀:1。
ABABCAB,新增字符B,B和B(上一个最长公共前后缀:1为索引位的值为B)相等,最长公共前后缀加一变为:2。
ABABCABA,新增字符A,A和A(上一个最长公共前后缀:2为索引位的值为A)相等,最长公共前后缀加一变为:3。
再在前缀表的前面加-1主要是为了方便计算,就到了最终版前缀表。
前缀表PrefixTable,主串索引PrimaryStrIndex,模式串索引SubStrIndex,从0开始匹配,当匹配到4号索引位时和主串字符不同,SubStrIndex由4变为PrefixTable[4]也就是2,模式串的2号索引位为A,相等和主串索引4号位A,继续匹配。
当匹配到PrimaryStrIndex=6,SubStrIndex=4时,又不想等,将SubStrIndex置为PrefixTable[4]也就是2,模式串的2号索引位为A,相等和主串索引6号位A,继续匹配,发现全部匹配上,就OK了。
给出字符串StrArray及其长度StrArrayLen,返回一个int类型的前缀表数组。
int* GetPrefixTable(char* StrArray, size_t StrArrayLen)
{
int* PrefixTable = (int*)malloc(sizeof(int) * StrArrayLen);
PrefixTable[0] = -1;
if(StrArrayLen == 1)
{
return PrefixTable;
}
PrefixTable[1] = 0;
size_t StrArrayIndex = 1;
size_t PrefixTableIndex;
size_t i = 0;
for(PrefixTableIndex = 2; PrefixTableIndex
参数名 |
描述 |
StrArray |
char*类型StrArray字符串。 |
StrArrayLen |
size_t类型的StrArray长度。 |
在主串PrimaryStr搜索第Times次出现的模式串SubStr,返回SubStr的首字符在PrimaryStr的索引位。如果匹配失败返回-1。
int KmpSearch(char* PrimaryStr, char* SubStr, int Times)
{
if(PrimaryStr == NULL || SubStr == NULL)
{
return -1;
}
if(Times < 1)
{
return -1;
}
size_t PrimaryStrLen = strlen(PrimaryStr);
size_t SubStrLen = strlen(SubStr);
if(SubStrLen > PrimaryStrLen)
{
return -1;
}
else if(SubStrLen == PrimaryStrLen)
{
if(strcmp(SubStr,PrimaryStr) == 0)
{
return 0;
}
else
{
return -1;
}
}
long long PrimaryStrIndex = 0;
long long SubStrIndex = 0;
int Cnt = 0;//匹配次数和Times对应。
int* PrefixTable = GetPrefixTable(SubStr, SubStrLen);
PrintArray(PrimaryStr, PrimaryStrLen, sizeof(char));
PrintArray(SubStr, SubStrLen, sizeof(char));
PrintArray(PrefixTable, SubStrLen, sizeof(int));
while(PrimaryStrIndex < PrimaryStrLen)
{
if(PrimaryStr[PrimaryStrIndex] == SubStr[SubStrIndex])
{
PrimaryStrIndex++;
SubStrIndex++;
if(SubStrIndex == SubStrLen)
{
Cnt++;
if(Cnt == Times)
{
return PrimaryStrIndex - SubStrIndex;
}
SubStrIndex--;
SubStrIndex = PrefixTable[SubStrIndex];
}
}
else
{
SubStrIndex = PrefixTable[SubStrIndex];
if(SubStrIndex == -1)
{
PrimaryStrIndex++;
SubStrIndex++;
}
}
}
free(PrefixTable);
return -1;
}
参数名 |
描述 |
PrimaryStr |
char*类型主串。 |
SubStr |
char*类型模式串。 |
Times |
匹配第几次 |
# include
# include
# include
int* GetPrefixTable(char* StrArray, size_t StrArrayLen);
int KmpSearch(char* PrimaryStr, char* SubStr, int Times);
void PrintArray(void* Array, size_t ArrayLen, size_t TypeFlag);
int main()
{
char* PrimaryStr = "ABABABABCABAAB";
char* SubStr = "ABABCABAA";
printf("Position : %d\n",KmpSearch(PrimaryStr, SubStr, 1));
return 0;
}
int* GetPrefixTable(char* StrArray, size_t StrArrayLen)
{
int* PrefixTable = (int*)malloc(sizeof(int) * StrArrayLen);
PrefixTable[0] = -1;
if(StrArrayLen == 1)
{
return PrefixTable;
}
PrefixTable[1] = 0;
size_t StrArrayIndex = 1;
size_t PrefixTableIndex;
size_t i = 0;
for(PrefixTableIndex = 2; PrefixTableIndex PrimaryStrLen)
{
return -1;
}
else if(SubStrLen == PrimaryStrLen)
{
if(strcmp(SubStr,PrimaryStr) == 0)
{
return 0;
}
else
{
return -1;
}
}
long long PrimaryStrIndex = 0;
long long SubStrIndex = 0;
int Cnt = 0;//匹配次数和Times对应。
int* PrefixTable = GetPrefixTable(SubStr, SubStrLen);
PrintArray(PrimaryStr, PrimaryStrLen, sizeof(char));
PrintArray(SubStr, SubStrLen, sizeof(char));
PrintArray(PrefixTable, SubStrLen, sizeof(int));
while(PrimaryStrIndex < PrimaryStrLen)
{
if(PrimaryStr[PrimaryStrIndex] == SubStr[SubStrIndex])
{
PrimaryStrIndex++;
SubStrIndex++;
if(SubStrIndex == SubStrLen)
{
Cnt++;
if(Cnt == Times)
{
return PrimaryStrIndex - SubStrIndex;
}
SubStrIndex--;
SubStrIndex = PrefixTable[SubStrIndex];
}
}
else
{
SubStrIndex = PrefixTable[SubStrIndex];
if(SubStrIndex == -1)
{
PrimaryStrIndex++;
SubStrIndex++;
}
}
}
free(PrefixTable);
return -1;
}
void PrintArray(void* Array, size_t ArrayLen, size_t TypeFlag)
{
size_t i;
printf("Array : ");
for(i = 0; i < ArrayLen; i++)
{
switch(TypeFlag)
{
case sizeof(int) : printf("%d ",((int*)Array)[i]); break;
case sizeof(char) : printf("%c ",((char*)Array)[i]); break;
default : printf("Unknow Type!!!\n" );
}
}
printf("\n==================================\n");
}
[gbase@czg2 LinearTable_String_KMP]$ make
gcc -Wall -g KmpSearch.c -o Test_KmpSearch
[gbase@czg2 LinearTable_String_KMP]$ ./Test_KmpSearch
Array : A B A B A B A B C A B A A B
==================================
Array : A B A B C A B A A
==================================
Array : -1 0 0 1 2 0 1 2 3
==================================
Position : 4
int* GetPrefixTable(char* StrArray, size_t StrArrayLen);
int KmpSearch(char* PrimaryStr, char* SubStr, int Times);
int strStr(char * haystack, char * needle){
return KmpSearch(haystack, needle, 1);
}
int* GetPrefixTable(char* StrArray, size_t StrArrayLen)
{
int* PrefixTable = (int*)malloc(sizeof(int) * StrArrayLen);
PrefixTable[0] = -1;
if(StrArrayLen == 1)
{
return PrefixTable;
}
PrefixTable[1] = 0;
size_t StrArrayIndex = 1;
size_t PrefixTableIndex;
int i = 0;
for(PrefixTableIndex = 2; PrefixTableIndex PrimaryStrLen)
{
return -1;
}
else if(SubStrLen == PrimaryStrLen)
{
if(strcmp(SubStr,PrimaryStr) == 0)
{
return 0;
}
else
{
return -1;
}
}
long long PrimaryStrIndex = 0;
long long SubStrIndex = 0;
int Cnt = 0;//匹配次数和Times对应。
int* PrefixTable = GetPrefixTable(SubStr, SubStrLen);
//PrintArray(PrimaryStr, PrimaryStrLen, sizeof(char));
//PrintArray(SubStr, SubStrLen, sizeof(char));
//PrintArray(PrefixTable, SubStrLen, sizeof(int));
while(PrimaryStrIndex < PrimaryStrLen)
{
if(PrimaryStr[PrimaryStrIndex] == SubStr[SubStrIndex])
{
PrimaryStrIndex++;
SubStrIndex++;
if(SubStrIndex == SubStrLen)
{
Cnt++;
if(Cnt == Times)
{
return PrimaryStrIndex - SubStrIndex;
}
SubStrIndex--;
SubStrIndex = PrefixTable[SubStrIndex];
}
}
else
{
SubStrIndex = PrefixTable[SubStrIndex];
if(SubStrIndex == -1)
{
PrimaryStrIndex++;
SubStrIndex++;
}
}
}
free(PrefixTable);
return -1;
}
void PrintArray(void* Array, size_t ArrayLen, size_t TypeFlag)
{
size_t i;
printf("Array : ");
for(i = 0; i < ArrayLen; i++)
{
switch(TypeFlag)
{
case sizeof(int) : printf("%d ",((int*)Array)[i]); break;
case sizeof(char) : printf("%c ",((char*)Array)[i]); break;
default : printf("Unknow Type!!!\n" );
}
}
printf("\n==================================\n");
}