M. Frequent Subsets Problem - 狀態壓縮-2017 ACM-ICPC 亞洲區(南寧賽區)網絡賽

The frequent subset problem is defined as follows. Suppose UUU={1, 2,…\ldots,N} is the universe, and S1S_{1}S1,S2S_{2}S2,…\ldots,SMS_{M}SM are MMM sets over UUU. Given a positive constant α\alphaα,0<α≤10<\alpha \leq 10<α1, a subset BBB (B≠0B \neq 0B0) is α-frequent if it is contained in at least αM\alpha MαM sets of S1S_{1}S1,S2S_{2}S2,…\ldots,SMS_{M}SM, i.e. ∣{i:B⊆Si}∣≥αM\left | \left \{ i:B\subseteq S_{i} \right \} \right | \geq \alpha M{i:BSi}αM. The frequent subset problem is to find all the subsets that are α-frequent. For example, letU={1,2,3,4,5}U=\{1, 2,3,4,5\}U={1,2,3,4,5},M=3M=3M=3,α=0.5\alpha =0.5α=0.5, and S1={1,5}S_{1}=\{1, 5\}S1={1,5},S2={1,2,5}S_{2}=\{1,2,5\}S2={1,2,5},S3={1,3,4}S_{3}=\{1,3,4\}S3={1,3,4}. Then there are 333 α-frequent subsets of UUU, which are {1}\{1\}{1},{5}\{5\}{5} and {1,5}\{1,5\}{1,5}.

Input Format

The first line contains two numbers NNN and α\alpha α, where NNN is a positive integers, and α\alphaα is a floating-point number between 0 and 1. Each of the subsequent lines contains a set which consists of a sequence of positive integers separated by blanks, i.e., linei+1i + 1i+1 contains SiS_{i}Si,1≤i≤M1 \le i \le M1iM . Your program should be able to handle NNN up to 202020 and MMM up to 505050.

Output Format

The number of α\alphaα-frequent subsets.

樣例輸入

15 0.4
1 8 14 4 13 2
3 7 11 6
10 8 4 2
9 3 12 7 15 2
8 3 2 4 5

樣例輸出

11



/*
題意:
給你一個n表示集合U是從1~n,一個頻率0<α<=1
M個集合,M不是給你的要自己統計,最後讓你找這樣的子集:
在M個集合中出現次數 >= M*α的

題解:
枚舉子集,看其在M個集合中出現的次數

優化:
1.如何存這個M個集合?
用二進制的思想,第幾位表示數值爲幾的數在集合中存在
例如用 0011010 表示1、3、4屬於集合Si
那麼這個數x存在就可以表示爲 1<<x
最大的數是20,也就是說最多21位,最大數值是2^21,long long輕鬆處理
於是我們得到了M個longlong型的整數,這些數在計算機中都是以01串存在的

2. 如何枚舉子集?
for(i = 1;i<=U;++i){if(i & Sj)==i,i是U的一個子集}

例如i在計算機中二進制表示爲101,Sj在計算機表示爲1101
如果i是Sj的子集那麼按位與出來的結果還是i
如果結果 != i 說明存在某些位置i是1 Sj是0 即集合i中存在該元素,集合Sj不存在


枚舉子集 也不過2^21 * 50 應該超不了一秒,不過這裏還可以做一個優化

3.我們統計所有元素出現的總次數,如果<M*α,那麼所求子集中一定不會出現這些元素。
於是我們得到了一個新集合tempans ,枚枚舉該集合的子集即可
即 for(i = 1;i<=tempans;++i){
    if(i 屬於 集合tempans && i 屬於 集合Sj && i是M*α個以上集合的子集)
    then ans++;

}

4.讀入用cin的io流處理
*/

#include <bits/stdc++.h>
#include <string>
#include <cstring>
#include <sstream>
#include <algorithm>
using namespace std;
typedef long long ll;
const int maxn=1e6+10;
long long S[55];
int cnt[30];
int main()
{
    string s;
    int n;
    double a;

    cin>>n>>a;
    getchar();
    int m = 0;
    while(getline(cin,s)){

        stringstream ss;
        ss << s; ///從s讀進ss
        int tmp;
        while(ss>>tmp){ ///從ss依次提取
           S[m] += (1 << tmp);
           cnt[tmp] ++;
        }
        m++;
    }

   int minnum;
    if(a*m - int(a*m) > 0.0000001) minnum = ceil(a*m);
        else minnum = a*m;

    long long tempans = 0;
    for(int i = 0;i<30;++i){
        if(cnt[i]>=minnum) tempans += (1<<i);
    }

    long long ans = 0;
    for(int i = 1;i<=tempans;++i){

        if((i & tempans)!=i) continue;
        long long temp = 0;
        for(int j = 0;j<m;++j){
            if((i & S[j]) == i)
                temp++;
            if(temp >= minnum) {
                ans++;break;
            }
        }
    }
    printf("%lld\n",ans);


    return 0;
}


發佈了229 篇原創文章 · 獲贊 252 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章