BZOJ4180：字符串計數（後綴自動機+二分答案+矩陣快速冪）

原創

KsCla

2020-06-19 11:52

題目傳送門：http://www.lydsy.com/JudgeOnline/problem.php?id=4180

題目分析：別人眼中的好題~~，然而我覺得就是把SAM強套上另一個算法的題~~。

後綴自動機的特點使其能夠很好地解決本題，因爲它能夠識別原串的所有子串。如果從Root開始匹配模式串，而走到的當前狀態並不擁有模式串下一位的轉移，那麼原串便沒有這個子串。

接下來從靜態的問題開始考慮：假設已經給定了一個模式串，如何求出題目中最少的操作次數？做法是將模式串在SAM上貪心地向後匹配，出現空轉移時返回Root的對應兒子繼續匹配，並令操作數+1。爲什麼這樣最優呢？我們將模式串用XYZW表示，其中X，XY，ZW，YZW都是原串的子串。按照貪心的策略，應該從XY，ZW處斷開，變成兩個子串。而如果從X，YZW處斷開，最後一個子串就變長了。YZW存在的轉移ZW必然存在，而ZW卻有可能繼續向後匹配而YZW不能。所以貪心正確。

然後變爲動態的問題。假設當前節點P不存在c這個轉移，爲了方便我們將P轉移到根節點的c兒子，並令這條邊的代價爲1，代表操作數+1，其餘邊代價爲0。現在問題變成了：從Root出發，走N步，求最大的代價。

然而直接解決這個問題比較困難。我們發現這個新圖中權值爲0的邊很多，所以可以把一些無用的點刪掉，合併兩條邊，最後發現有用的點只有Root的A，B，C，D四個兒子。從A到C的邊長度爲新圖中從A向下走，走到某個擁有空轉移’C’的狀態的最短步數。然後這就濃縮成了一個4個點的完全圖。現在我們要走長度之和不超過N的邊，使得經過的邊數儘可能多。直接做依舊不好搞，可以二分答案mid，看走mid步經過的最小長度是多少。這可以用類似floyd的矩陣快速冪加速判斷。由於這題的時間主要來自SAM，所以時間爲 $O (| T |)$ 。

其實如果這題字符集再大一些的話，二分+矩乘的時間複雜度就會比較高。然而如果字符集比較大的話，似乎會很難出數據。可能這就是T中只有A，B，C，D的原因吧。

我本來以爲這題能1A，結果我還是太naive了。一開始BFS的隊列沒有開|T|的兩倍，RE了一次（SAM節點數爲串長的2倍）；後來發現判斷mid的邊界沒有處理好；再後來我實在想不出有什麼問題，又檢查了一遍代碼，發現我的SAM居然建錯了？！總之4A，代碼還是寫得很快的。QAQ

CODE：

#include<iostream>
#include<string>
#include<cstring>
#include<cmath>
#include<cstdio>
#include<cstdlib>
#include<stdio.h>
#include<algorithm>
using namespace std;

const int maxn=100100;
const int maxc=4;
const long long oo=2e18;
typedef long long LL;

struct Tnode
{
    int val;
    bool vis;
    Tnode *parent,*son[maxc];
} tree[maxn<<1];
Tnode *Root,*last;
int cur=-1;

struct mat
{
    LL num[maxc][maxc];
} e;
int id;

Tnode *que[maxn<<1]; //!!!
int dep[maxn<<1]; //!!!
int tail;

char s[maxn];
int len;
LL n;

Tnode *New_node(int v)
{
    cur++;
    tree[cur].val=v;
    tree[cur].parent=NULL;
    for (int i=0; i<maxc; i++) tree[cur].son[i]=NULL;
    return tree+cur;
}

void Build()
{
    last=Root=New_node(0);
    for (int i=1; i<=len; i++)
    {
        int to=s[i-1]-'A';
        Tnode *NP=New_node(i),*P=last;
        last=NP;
        while ( P && !P->son[to] ) P->son[to]=NP,P=P->parent;
        if (!P)
        {
            NP->parent=Root;
            continue;
        }
        Tnode *Q=P->son[to];
        if (P->val+1==Q->val) NP->parent=Q;
        else
        {
            Tnode *NQ=New_node(P->val+1);
            for (int i=0; i<maxc; i++) NQ->son[i]=Q->son[i];
            NQ->parent=Q->parent;
            Q->parent=NP->parent=NQ;
            while ( P && P->son[to]==Q ) P->son[to]=NQ,P=P->parent; //!!!
        }
    }
}

void Bfs()
{
    tail=1;
    que[1]=Root->son[id];
    que[1]->vis=true;
    dep[1]=1;
    for (int i=1; i<=tail; i++)
    {
        Tnode *P=que[i];
        for (int j=0; j<maxc; j++)
            if ( P->son[j] && !P->son[j]->vis )
                P->son[j]->vis=true,que[++tail]=P->son[j],dep[tail]=dep[i]+1;
            else e.num[id][j]=min(e.num[id][j],(long long)dep[i]);
    }
}

mat Times(mat x,mat y)
{
    mat z;
    for (int i=0; i<maxc; i++)
        for (int j=0; j<maxc; j++) z.num[i][j]=oo;
    for (int i=0; i<maxc; i++)
        for (int j=0; j<maxc; j++)
            for (int k=0; k<maxc; k++)
                z.num[i][j]=min(z.num[i][j],x.num[i][k]+y.num[k][j]);
    return z;
}

mat Fast_power(LL x)
{
    if (x==1) return e;
    mat temp=Fast_power(x>>1);
    temp=Times(temp,temp);
    if (x&1) temp=Times(temp,e);
    return temp;
}

bool Judge(LL mid)
{
    //mid--;
    mat temp=Fast_power(mid);
    LL min_len=oo;
    for (int i=0; i<maxc; i++)
        for (int j=0; j<maxc; j++) min_len=min(min_len,temp.num[i][j]);
    return (min_len<n); //!!!
}

LL Binary()
{
    LL L=0,R=oo;
    while (L+1LL<R)
    {
        LL mid=(L+R)>>1;
        if ( Judge(mid) ) L=mid;
        else R=mid;
    }
    return L+1LL;
}

int main()
{
    freopen("4180.in","r",stdin);
    freopen("4180.out","w",stdout);

    scanf("%lld",&n);
    scanf("%s",s);
    len=strlen(s);

    Build();
    for (id=0; id<maxc; id++)
    {
        for (int i=0; i<=cur; i++) tree[i].vis=false;
        for (int i=0; i<maxc; i++) e.num[id][i]=oo;
        Bfs();
    }

    LL ans=Binary();
    printf("%lld\n",ans);

    return 0;
}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

BZOJ4180：字符串計數（後綴自動機+二分答案+矩陣快速冪）

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

CSP2019Day2T3 洛谷P5666：樹的重心（樹上倍增）

UOJ#86：mx的組合數（Lucas定理+原根+NTT+高精度）

多項式乘法優化學習筆記

hdu5909：Tree Cutting （FWT/點分治優化樹形DP）

BZOJ4180：字符串計數（後綴自動機+二分答案+矩陣快速冪）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

BZOJ4180：字符串計數 （後綴自動機+二分答案+矩陣快速冪）

BZOJ4180：字符串計數（後綴自動機+二分答案+矩陣快速冪）