最長迴文子串Manacher O(n)解法+ 區間dp O(n2)解法

題解轉自博客:www.cnblogs.com/mickole/articles/3578298.html

題目:(替代題目可去pat天梯賽練習題中尋找,當然那個題n3也能過)

長度爲N(N很大)的字符串,求這個字符串裏的最長迴文子串?(百度2014校招筆試題目)

題目指出“N很大”,就是提示我們不要想通過遍歷的方法來找到這個字符串,我想到的就一種解法,時間複雜度應該不高,但是我算不出來這個算法的複雜度是多少,首先說一下什麼是迴文字符串:迴文字符串是指從左到右和從右到左相同的字符串,比如"1221"或者“12321”都是迴文字符串.
關於這個題目的解法很多。
解法一:Manacher算法(O(n))

大家都知道,求迴文串時需要判斷其奇偶性,也就是求aba和abba的算法略有差距。然而,這個算法做了一個簡單的處理,很巧妙地把奇數長度迴文串與偶數長度迴文串統一考慮,也就是在每個相鄰的字符之間插入一個分隔符,串的首尾也要加,當然這個分隔符不能再原串中出現,一般可以用‘#’或者‘$’等字符。例如:
原串:abaab
新串:#a#b#a#a#b#
    這樣一來,原來的奇數長度迴文串還是奇數長度,偶數長度的也變成以‘#’爲中心的奇數迴文串了。
接下來就是算法的中心思想,用一個輔助數組P記錄以每個字符爲中心的最長迴文半徑,也就是P[i]記錄以S[i]字符爲中心的最長迴文串半徑。P[i]最小爲1,此時迴文串爲Str[i]本身。

爲了防止求P[i]向兩邊擴展時可能數組越界,我們需要在數組最前面和最後面加一個特殊字符,令P[0]=‘$’,最後位置默認爲‘\0’不需要特殊處理
我們可以對上述例子寫出其P數組,如下:
新串: # a # b # a # a # b #
P[]  :  1 2 1 4  1 2 5  2 1 2 1
我們可以證明P[i]-1就是以S[i]爲中心的迴文串在原串當中的長度。
證明:
1、顯然L=2*P[i]-1即爲新串中以S[i]爲中心最長迴文串長度。
2、以S[i]爲中心的迴文串一定是以#開頭和結尾的,例如“#b#b#”或“#b#a#b#”所以L減去最前或者最後的‘#’字符就是原串中長度的二倍,即原串長度爲(L-1)/2,化簡的P[i]-1。

那麼怎麼計算P[i]呢?該算法增加兩個輔助變量(其實一個就夠了,兩個更清晰)id和mx,其中id表示最大回文子串中心的位置,mx則爲id+P[id],也就是最大回文子串的邊界。依次從前往後求得P數組就可以了,這裏用到了DP(動態規劃)的思想,也就是求P[i]的時候,前面的P[]值已經得到了,我們利用迴文串的特殊性質可以進行一個大大的優化。我先把核心代碼貼上:

這個算法的關鍵點就在這裏了:

if(mx > i)

   P[i] >= MIN(P[2 * id - i], mx - i)

就是這個串卡了我非常久。實際上如果把它寫得複雜一點,理解起來會簡單很多:

//記j = 2 * id - i,也就是說 j 是 i 關於 id 的對稱點。
if (mx - i > P[j]) 
    P[i] = P[j];
else /* P[j] >= mx - i */
    P[i] = mx - i; // P[i] >= mx - i,取最小值,之後再匹配更新。

當然光看代碼還是不夠清晰,還是藉助圖來理解比較容易。
當 mx - i > P[j] 的時候,以S[j]爲中心的迴文子串包含在以S[id]爲中心的迴文子串中,由於 i 和 j 對稱,以S[i]爲中心的迴文子串必然包含在以S[id]爲中心的迴文子串中,所以必有 P[i] = P[j],見下圖。 
QQ截圖20140303202219
當 P[j] >= mx - i 的時候,以S[j]爲中心的迴文子串不一定完全包含於以S[id]爲中心的迴文子串中,但是基於對稱性可知,下圖中兩個綠框所包圍的部分是相同的,也就是說以S[i]爲中心的迴文子串,其向右至少會擴張到mx的位置,也就是說 P[i] >= mx - i。至於mx之後的部分是否對稱,就只能老老實實去匹配了。 
QQ截圖20140303202230
對於 mx <= i 的情況,無法對 P[i]做更多的假設,只能P[i] = 1,然後再去匹配了。

核心代碼:

複製代碼
void pk()
{
    int i;
    int mx = 0;
    int id;
    for(i=1; i<n; i++)
    {
        if( mx > i )
            p[i] = MIN( p[2*id-i], mx-i );        
        else
            p[i] = 1;
        for(; str[i+p[i]] == str[i-p[i]]; p[i]++)
            ;
        if( p[i] + i > mx )
        {
            mx = p[i] + i;
            id = i;
        }
    }
}
複製代碼

 

 

解法二:動態規劃(DP),區間dp

思想:DP的考慮源於暴力方法,暴力方法是尋找一個字符串的所有子串,需要O(n^2)的開銷,然後對於每一個子串需要O(n)的開銷來判斷是否是迴文,故暴力方案爲O(n^3),但是這裏有一個問題,就是在暴力的時候有重複判斷;

例如,如果子串X爲迴文,那麼sXs也是迴文;如果X不是迴文,那麼sXs也不是迴文;另外,ss也是迴文。所以這裏使用DP我們可以按照子串長度從小到大的順序來構建DP狀態數組,使用一個二維數組dp[i][j]記錄子串[i-j]是否爲迴文子串,那麼我們就有初始化和自底向上的方案了;

初始化:單字符串和相等的雙字符串爲迴文

自底向上構造:X[i]==X[j] && dp[i+1][j-1]==1 則dp[i][j] = 1

2種解法的完整代碼:

#include <iostream>
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <vector>
#include <queue>
#include <set>
#include <map>
#include <string>
#include <cmath>
#include <cstdlib>
#include <ctime>
#include <stack>
#include <sstream>
#include <string>

using namespace std;

const int maxn = 1100;


string bydp(string s){
    bool dp[maxn][maxn];
    memset(dp,0,sizeof(dp));
    int n = s.length();
    int maxlen = 1,lbegin = 0;
    ///長度爲1的單獨處理
    for(int i = 0;i<n;++i){
        dp[i][i] = 1;
    }
    ///長度爲2的單獨處理。
    for(int i = 0;i<n-1;++i){
        if(s[i]==s[i+1]){
            dp[i][i+1] = 1;
            maxlen = 2;
            lbegin = i;
        }
    }

    for(int len = 3;len <=n;++len){
        for(int i = 0;i+len-1<n;++i){
            int j = i+len-1;
            if(dp[i+1][j-1] && s[i]==s[j]){
                dp[i][j] = 1;
                maxlen = len;
                lbegin = i;
            }
        }
    }
    return s.substr(lbegin,maxlen);
}


string byManacher(string s){
    ///轉換爲新串
    int n = s.length();///原串長度
    string news;
    news+='@';news+='#';
    for(int i = 0;i<n;++i){
        news+=s[i];
        news+='#';
    }


    ///求解p
    int p[2*maxn];
    n = 2*n+2;
    memset(p,0,sizeof(p));
    int id=0,mx=0;///***id是最大回文子串中心的位置,並不是最長迴文子串中心的位置
    int maxcent = 0, maxr = 0;;
    for(int i = 1;i<n;++i){
        int j = 2*id-i;///j是i關於id的對稱點
        if(mx>i) p[i] = min(p[j],mx-i);
        else p[i] = 1;
        while(i+p[i]<n && i-p[i]>0 && news[i+p[i]] == news[i-p[i]]) p[i]++;

        if(p[i]+i>mx){///更新位置
            id = i;
            mx = p[i]+i;
        }
        if(p[i]>maxr){
            maxcent = i;
            maxr = p[i];
        }
    }
    string ans;
    int maxbegin = maxcent-maxr+1,maxend = maxcent+maxr-1;
    for(int i = maxbegin;i<=maxend;++i){
        if(news[i] != '#') ans += news[i];
    }
    return ans;
}

int main(){

    string s;
    getline(cin,s);
    s = bydp(s);
    ///s = byManacher(s);
    cout<<s.length();

    return 0;

}




發佈了229 篇原創文章 · 獲贊 252 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章