P4449 於神之怒加強版 題解

博客園同步

原題鏈接

簡要題意:

給定一個固定的 kkTT 組詢問求:

i=1nj=1mgcd(i,j)k\sum_{i=1}^n \sum_{j=1}^m \gcd(i,j)^k

其中 n,m,k5×106n,m,k \leq 5 \times 10^6T2×103T \leq 2 \times 10^3.

沒什麼好說的,沒有部分分。根據 莫比烏斯反演性質 開始推式子!

i=1nj=1mgcd(i,j)k\sum_{i=1}^n \sum_{j=1}^m \gcd(i,j)^k

=i=1min(n,m)dki=1ndj=1nd[gcd(i,j)==1] = \sum_{i=1}^{\min(n,m)} d^k \sum_{i=1}^{\lfloor \frac{n}{d} \rfloor} \sum_{j=1}^{\lfloor \frac{n}{d} \rfloor} [\gcd(i,j)==1]

=i=1min(n,m)dki=1ndj=1ndkgcd(i,j)μk = \sum_{i=1}^{\min(n,m)} d^k \sum_{i=1}^{\lfloor \frac{n}{d} \rfloor} \sum_{j=1}^{\lfloor \frac{n}{d} \rfloor} \sum_{k|\gcd(i,j)} \mu_k

=i=1min(n,m)dkk=1min(n,m)dnkdmkd = \sum_{i=1}^{\min(n,m)} d^k \sum_{k=1}^{\lfloor \frac{\min(n,m)}{d} \rfloor} \lfloor \frac{n}{kd} \rfloor \lfloor \frac{m}{kd} \rfloor

=i=1TnTmTdTdk×μTd = \sum_{i=1}^T \lfloor \frac{n}{T} \rfloor \lfloor \frac{m}{T} \rfloor \sum_{d|T} d^k \times \mu_{\frac{T}{d}}

顯然 O(Tn)O(T \sqrt{n}) 的時間足以通過,前面的部分整除分塊足夠。但是對於後面這一塊較難解決,則設:

gx=dxdk×μxdg_x= \sum_{d|x} d^k \times \mu_{\frac{x}{d}}

通過觀察可知這是個 積性函數。那麼顯然,對於:

x=i=1qpiaix = \prod_{i=1}^q p_i^{a_i}

存在:

gx=i=1qg(piai)g_x = \prod_{i=1}^q g(p_i^{a_i})

=i=1q(pik×(ai1)×μpi+pik×ai×μ1) = \prod_{i=1}^q (p_i^{k \times (a_i-1)} \times \mu_{p_i} + p_i^{k \times a_i} \times \mu_1)

=i=1qpik×(ai1)×(pik1) = \prod_{i=1}^q p_i^{k \times (a_i-1)} \times (p_i^k-1)

首先,上面對於 gg 的幾步需要解釋。那個關於 xx 的式子實際上是 xx 質因數分解以後的結果piprimep_i \in \text{prime}.

然後第一步是線性篩積性函數的套路。

第二步是一個變形,考慮展開 g(piai)g(p_i^{a_i}) 的過程.

第三步就是個乘法分配律,算出 μ\mu 而已。

好了,看看這個式子,每個部分都可以篩。結束。

時間複雜度:O(n+Tn+plogk)O(n + T \sqrt{n} + p \log k). pp 的值之後解釋。

實際得分:100pts100pts.

#pragma GCC optimize(2)
#include<bits/stdc++.h>
using namespace std;

typedef long long ll;
const int N=5e6+1;
const ll MOD=1e9+7;

inline int read(){char ch=getchar(); int f=1; while(ch<'0' || ch>'9') {if(ch=='-') f=-f; ch=getchar();}
	int x=0; while(ch>='0' && ch<='9') x=(x<<3)+(x<<1)+ch-'0',ch=getchar(); return x*f;}

inline void write(ll x) {
	if(x<0) {putchar('-');write(-x);return;}
	if(x<10) {putchar(char(x%10+'0'));return;}
	write(x/10);putchar(char(x%10+'0'));
}

int prime[N],mu[N];
ll g[N],f[N]; bool h[N];
int T,k,cnt=0; ll ans=0;

inline ll pw(ll x,ll y) {
	ll ans=1; while(y) {
		if(y&1) ans=ans*x%MOD;
		x=x*x%MOD; y>>=1;
	} return ans;
}

inline void Euler(int n) {
	f[1]=1; for(int i=2;i<=n;i++) {
		if(!h[i]) prime[++cnt]=i,g[cnt]=pw(i,k),f[i]=(g[cnt]-1+MOD)%MOD;
			//f 表示 分解質因數後後面的一堆東西
		for(int j=1;j<=cnt && i*prime[j]<=n;j++) {
			h[i*prime[j]]=1;
			if(i%prime[j]==0) {f[i*prime[j]]=1ll*f[i]*g[j]%MOD;break;}
			f[i*prime[j]]=1ll*f[i]*f[prime[j]]%MOD; //線性篩模板
		}
	}
	for(int i=1;i<=n;i++) f[i]=(f[i]+f[i-1])%MOD; //前綴和
}

int main() {
	T=read(); k=read(); Euler(N-1);
	while(T--) {
		int n=read(),m=read();
		ll ans=0; int r;
		for(int i=1;i<=min(n,m);i=r+1) { //整除分塊
			r=min(n/(n/i),m/(m/i));
			ans=(ans+1ll*(f[r]-f[i-1]+MOD)*(n/i)%MOD*(m/i)%MOD)%MOD;
		} write(ans); putchar('\n');
	}
	return 0;
}


顯然,你發現對於素數我們需要暴力計算 pkp^k. 那麼,首先 5×1065 \times 10^6 以內的素數有多少個呢?代碼測試:

Link 代碼

得到結果約 3.4×1053.4 \times 10^5,也即 p3.4×105p \leq 3.4 \times 10^5. 而 logk=log(5×106)\log k = \log (5 \times 10^6),大概是 2222,不會出問題,顯然 3.4×105×223.4 \times 10^5 \times 2210710^7 級的,這也是程序較慢的原因(不過不影響通過,照樣 2.55s2.55s

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章