CF1276F Asterisk Substrings【endpos後綴的本質不同串個數(dfs序並)】

在這裏插入圖片描述

題目分析:

s,s,ts,s*,*t 都很好求,問題主要在與 s ⁣ ⁣ts\!*\!t
考慮枚舉本質不同的 ss,需要藉助後綴自動機。
發現對於 endposendpos 集合相同的 ss,可選的 tt 的集合都是一樣的,即對於後綴自動機上的節點 uu,它對答案的貢獻是(len[u]len[fa[u]])(len[u]-len[fa[u]])* (pendposu s[p+2,n](\cup_{p\in endpos_u}~s[p+2,n] 這些後綴中的本質不同後綴個數))

而求多個後綴的並的不同的後綴個數,用後綴數組或後綴自動機都可以解決。
後綴數組就是將對應的後綴按照 rankrank 排序後每個後綴的長度減去相鄰兩個後綴的 LCP\texttt{LCP}
後綴自動機就是建出反串的後綴自動機,把對應的後綴在自動機上的對應節點按照 dfsdfs 序排序後每個後綴的 lenlen 減去相鄰兩個後綴的 LCA\texttt{LCA}lenlen

這兩種做法都可以在failfail樹上轉移時用 線段樹合併 或 setset 啓發式合併維護。線段樹合併需要記錄最左和最右的點。

Code(後綴自動機+線段樹合併):

#include<bits/stdc++.h>
#define maxn 200005
#define maxp maxn*17
#define LL long long
using namespace std;
const int Log = 18;
int n,dfn[maxn],tim,st[Log+1][maxn*2],lg[maxn*2];
int rt[maxn*2],lc[maxp],rc[maxp],pl[maxp],pr[maxp],tot;
LL ans,sum[maxp];
int DLCA(int x,int y){
	if(!x||!y) return 0;
	int k=lg[y-x+1];
	return min(st[k][x],st[k][y-(1<<k)+1]);
}
void upd(int i){
	sum[i]=sum[lc[i]]+sum[rc[i]]-DLCA(pr[lc[i]],pl[rc[i]]);
	pl[i]=pl[lc[i]?lc[i]:rc[i]];
	pr[i]=pr[rc[i]?rc[i]:lc[i]];
}
void ins(int &i,int l,int r,int x){
	i=++tot;
	if(l==r) return (void)(pl[i]=pr[i]=x,sum[i]=st[0][x]);
	int mid=(l+r)>>1;
	x<=mid?ins(lc[i],l,mid,x):ins(rc[i],mid+1,r,x);
	upd(i);
}
void merge(int &i,int x,int y){
	if(!x||!y) return void(i=x+y);
	if(lc[x]||rc[x]) i=x,merge(lc[i],lc[x],lc[y]),merge(rc[i],rc[x],rc[y]),upd(i);
	else assert(0);//when reach leaves. this problem no else.
}
struct SAM{
	int fa[maxn],ch[maxn][26],len[maxn],pos[maxn],last,sz;
	vector<int>G[maxn];
	SAM(){fa[0]=-1;}
	void extend(int c,int id){
		int cur=++sz,p=last,q; len[last=cur]=len[p]+1,pos[id]=cur;
		for(;~p&&!ch[p][c];p=fa[p]) ch[p][c]=cur;
		if(p==-1) fa[cur]=0;
		else if(len[q=ch[p][c]]==len[p]+1) fa[cur]=q;
		else{
			int clone=++sz; len[clone]=len[p]+1;
			memcpy(ch[clone],ch[q],sizeof ch[q]),fa[clone]=fa[q],fa[cur]=fa[q]=clone;
			for(;~p&&ch[p][c]==q;p=fa[p]) ch[p][c]=clone;
		}
	}
	void dfs1(int u){
		st[0][dfn[u]=++tim]=len[u];
		for(int v:G[u]) dfs1(v),st[0][++tim]=len[u];
	}
	void ST(){
		for(int i=1;i<=sz;i++) G[fa[i]].push_back(i);
		dfs1(0);
		for(int i=2;i<=tim;i++) lg[i]=lg[i>>1]+1;
		for(int j=1;j<=Log;j++)
			for(int i=1,l=1<<j;i+l-1<=tim;i++)
				st[j][i]=min(st[j-1][i],st[j-1][i+(l>>1)]);
	}
	void dfs2(int u){
		for(int v:G[u]) dfs2(v),merge(rt[u],rt[u],rt[v]);
		if(u) ans+=(len[u]-len[fa[u]])*sum[rt[u]];
	}
	void calc(){
		for(int i=1;i<=sz;i++) G[fa[i]].push_back(i);
		dfs2(0);
	}
}S,RS;
char s[maxn];
int main()
{
	scanf("%s",s+1),n=strlen(s+1);
	for(int i=1;i<=n;i++) S.extend(s[i]-'a',i),ans+=i-S.len[S.fa[S.last]],i==n-1&&(ans<<=1);//s and s*
	for(int i=n;i>=1;i--) RS.extend(s[i]-'a',i),i>1&&(ans+=n-i+1-RS.len[RS.fa[RS.last]]);//*t
	RS.ST();
	for(int i=1;i<=n-2;i++) ins(rt[S.pos[i]],1,tim,dfn[RS.pos[i+2]]);
	S.calc();
	printf("%lld\n",ans+2);
}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章