第5章 串(string)
串:串(string)是由零個或多個字符組成的有限序列,又名叫字符串。
關於串的匹配,文中介紹了兩種算法:
1、樸素的模式匹配算法,時間複雜度O((n-m+1)*m)
2、KMP模式匹配算法,時間複雜度O(n+m)
其中n爲主串長度,m爲要匹配的子串長度。
樸素的模式匹配算法
模式匹配的算法Index,假設主串S和要匹配的子串T的長度存在S[0]與T[0]中,實現代碼如下:
/* 返回子串T在主串S中第pos個字符之後的位置。若不存在,則函數返回值爲0。*/
/* T非空,1<=pos<=StrLength(s)。 */
int Index ( String S, String T, int pos)
{
int i = pos;
int j = 1;
while ( i<= S[0] && j <= T[0])
{
if ( S[i] == T[j] )
{
++i;
++j;
}
else
{
i = i-j+2;
j = 1;
}
if ( j > T[0])
return i-T[0];
else
return 0;
}
}
KMP模式匹配算法
KMP算法僅當模式與主串之間存在許多“部分匹配”的情況下才體現出它的優勢,否則與樸素的模式匹配差異並不明顯,算法實現如下:
/* 通過計算返回子串T的next數組 */
void get_next(String T, int *next)
{
int i,j;
i=1;
j=0;
next[1]=0;
while (i<T[0])
{
if (j==0 || T[i]==T[j])
{
++i;
++j;
next[i] = j;
}
else
j=next[j];
}
}
/* 返回子串T在主串S中第pos個字符之後的位置。若不存在,則函數返回值爲0。*/
/* T非空,1<=pos<=StrLength(s)。 */
int Index_KMP ( String S, String T, int pos)
{
int i = pos;
int j = 1;
int next[255];
get_next(T, next);
while ( i<= S[0] && j <= T[0])
{
if ( j==0 || S[i] == T[j] )
{
++i;
++j;
}
else
{
j = next[j];
}
if ( j > T[0])
return i-T[0];
else
return 0;
}
}
KMP模式匹配算法改進,對求next函數進行了改良
/* 求模式串T的next函數修正值並存入數組nextval */
void get_nextval(String T, int *next)
{
int i,j;
i=1;
j=0;
nextval[1]=0;
while (i<T[0])
{
if (j==0 || T[i]==T[j])
{
++i;
++j;
if (T[i] != T[j])
nextval[i] = j;
else
nextval[i] = nextval[j];
}
else
j=next[j];
}
}