《大話數據結構》讀書筆記(一)

第5章 串(string)


串:串(string)是由零個或多個字符組成的有限序列,又名叫字符串。


關於串的匹配,文中介紹了兩種算法:

1、樸素的模式匹配算法,時間複雜度O((n-m+1)*m)

2、KMP模式匹配算法,時間複雜度O(n+m)

其中n爲主串長度,m爲要匹配的子串長度。


樸素的模式匹配算法

模式匹配的算法Index,假設主串S和要匹配的子串T的長度存在S[0]與T[0]中,實現代碼如下:


/* 返回子串T在主串S中第pos個字符之後的位置。若不存在,則函數返回值爲0。*/
/* T非空,1<=pos<=StrLength(s)。 */
int Index ( String S, String T, int pos)
{
	int i = pos;
	int j = 1;
	
	while ( i<= S[0] && j <= T[0])
	{
		if ( S[i] == T[j] )
		{
			++i;
			++j;
		}
		else
		{
			i = i-j+2;
			j = 1;
		}
		if ( j > T[0])
			return i-T[0];
		else
			return 0;
	}
}


KMP模式匹配算法

KMP算法僅當模式與主串之間存在許多“部分匹配”的情況下才體現出它的優勢,否則與樸素的模式匹配差異並不明顯,算法實現如下:

/* 通過計算返回子串T的next數組 */
void get_next(String T, int *next)
{
	int i,j;
	i=1;
	j=0;
	next[1]=0;
	while (i<T[0])
	{
		if (j==0 || T[i]==T[j])
		{
			++i;
			++j;
			next[i] = j;
		}
		else
			j=next[j];
	}    
}
/* 返回子串T在主串S中第pos個字符之後的位置。若不存在,則函數返回值爲0。*/
/* T非空,1<=pos<=StrLength(s)。 */
int Index_KMP ( String S, String T, int pos)
{
	int i = pos;
	int j = 1;
	
	int next[255];
	get_next(T, next);
	while ( i<= S[0] && j <= T[0])
	{
		if ( j==0 || S[i] == T[j] )
		{
			++i;
			++j;
		}
		else
		{
			j = next[j];
		}
		if ( j > T[0])
			return i-T[0];
		else
			return 0;
	}
}

KMP模式匹配算法改進,對求next函數進行了改良

/* 求模式串T的next函數修正值並存入數組nextval */
void get_nextval(String T, int *next)
{
	int i,j;
	i=1;
	j=0;
	nextval[1]=0;
	while (i<T[0])
	{
		if (j==0 || T[i]==T[j])
		{
			++i;
			++j;
			if (T[i] != T[j])
				nextval[i] = j;
			else
				nextval[i] = nextval[j];
		}
		else
			j=next[j];
	}    
}
發佈了11 篇原創文章 · 獲贊 11 · 訪問量 12萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章