kmp

/*
kmp的next數組存的是i之前的串的前綴和後綴的最長匹配長度
*/
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
using namespace std;
int next1[10100];
int bmBc[10100],suff[10100],bmGs[10100];
string str;//模式串
string a;//主串
void makenext1()//找模式串的next數組,未優化
{
    int l=str.size();
    next1[0]=-1;
    int k=-1,j=0;
    while(j<l)
    {
        if(k==-1||str[j]==str[k])
        {
            ++j;
            ++k;
            next1[j]=k;
        }
        else
            k=next1[k];
    }
}
void getNext()//優化後的next1數組
{
    int l=str.size();
    next1[0]=-1;
    int k=-1,j=0;
    while(j<l)
    {
        if(k==-1||str[j]==str[k])
        {
            ++j;
            ++k;
            if(str[j]!=str[k])
                next1[j]=k;
            else
                next1[j]=next1[k];
        }
        else
            k=next1[k];
    }
}
int kmp()//kmp算法
{
    makenext1();
    //getNext();
    int i=0,j=0,sum=0;
    int n=a.size();
    int m=str.size();
    while(i<n)
    {
        if(j==-1||a[i]==str[j])
            i++,j++;
        else
            j=next1[j];
        if(j==m)
        {
            //return i-j;//模式串第一次在主串中出現的位置
            sum++;//模式串在主串中出現過多少次
        }
    }
    return sum;//沒出現過返回-1
}
void preBmBc()
{
    int i;
    int m=str.size();
    for(int i=0; i<256; i++)
        bmBc[i]=m;
    for(i=0; i<m-1; i++)
        bmBc[str[i]]=m-i-1;
}
void suffixes()
{
    int m=str.size(),q;
    suff[m-1]=m;
    for(int i=m-2; i>=0; i--)
    {
        q=i;
        while(q>=0&&str[q]==str[m-i-1+q])
            q--;
        suff[i]=i-q;
    }
}
void preBmGs()
{
    int i,j=0,m=str.size();
    suffixes();
    for(i=0; i<m; i++)
        bmGs[i]=m;
    for(int i=m-1; i>=0; --i)
        if(suff[i]==i+1)
            for(; j<m-1-i; ++j)
                if(bmGs[j]==m)
                    bmGs[j]=m-1-i;
    for(i=0; i<=m-2; i++)
        bmGs[m-1-suff[i]]=m-1-i;
}
int BM()//有毒慎用
{
    int i, j=0,sum=0;
    preBmGs();
    preBmBc();
    // for(int i=0;i<=20;i++)
    //printf("%d ",bmGs[i]);printf("\n");
    int n=a.size(),m=str.size();
    //for(int i=0;i<m;i++)
    //printf("%d ",bmBc[str[i]]);printf("\n");
    //j=0;
    while (j<=n-m)
    {
        i=m-1;
        while(i>=0&&str[i]==a[i+j])
            i--;
        if (i<0)//匹配成功
        {
            //OUTPUT(j);返回當前值
            sum++;
            j+=bmGs[0];
        }
        else
        {
            //printf("i=%d j=%d bm=%d\n",i,j,bmBc[a[i+j]]);
            j+=max(bmGs[i],bmBc[a[i+j]]-m+1+i);

            //printf("j=%d\n",j);
        }
    }
    return sum;//不存在返回-1
}
int main()
{
    int ncase;
    scanf("%d",&ncase);
    while(ncase--)
    {
        cin>>str>>a;
        int sum=kmp();
        printf("%d\n",sum);//主串中有多少個模式串
    }
}
發佈了110 篇原創文章 · 獲贊 18 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章