Trie樹計算單詞前綴的個數

時間限制:10000ms
單點時限:1000ms
內存限制:256MB

描述

小Hi和小Ho是一對好朋友,出生在信息化社會的他們對編程產生了莫大的興趣,他們約定好互相幫助,在編程的學習道路上一同前進。

這一天,他們遇到了一本詞典,於是小Hi就向小Ho提出了那個經典的問題:“小Ho,你能不能對於每一個我給出的字符串,都在這個詞典裏面找到以這個字符串開頭的所有單詞呢?

身經百戰的小Ho答道:“怎麼會不能呢!你每給我一個字符串,我就依次遍歷詞典裏的所有單詞,檢查你給我的字符串是不是這個單詞的前綴不就是了?

小Hi笑道:“你啊,還是太年輕了!~假設這本詞典裏有10萬個單詞,我詢問你一萬次,你得要算到哪年哪月去?”

小Ho低頭算了一算,看着那一堆堆的0,頓時感覺自己這輩子都要花在上面了...

小Hi看着小Ho的囧樣,也是繼續笑道:“讓我來提高一下你的知識水平吧~你知道樹這樣一種數據結構麼?”

小Ho想了想,說道:“知道~它是一種基礎的數據結構,就像這裏說的一樣!”

小Hi滿意的點了點頭,說道:“那你知道我怎麼樣用一棵樹來表示整個詞典麼?”

小Ho搖搖頭表示自己不清楚。

提示一:Trie樹的建立

“你看,我們現在得到了這樣一棵樹,那麼你看,如果我給你一個字符串ap,你要怎麼找到所有以ap開頭的單詞呢?”小Hi又開始考校小Ho。

“唔...一個個遍歷所有的單詞?”小Ho還是不忘自己最開始提出來的算法。

“笨!這棵樹難道就白構建了!”小Hi教訓完小Ho,繼續道:“看好了!”

提示二:如何使用Trie樹

提示三:在建立Trie樹時同時進行統計!

“那麼現在!趕緊去用代碼實現吧!”小Hi如是說道

輸入

輸入的第一行爲一個正整數n,表示詞典的大小,其後n行,每一行一個單詞(不保證是英文單詞,也有可能是火星文單詞哦),單詞由不超過10個的小寫英文字母組成,可能存在相同的單詞,此時應將其視作不同的單詞。接下來的一行爲一個正整數m,表示小Hi詢問的次數,其後m行,每一行一個字符串,該字符串由不超過10個的小寫英文字母組成,表示小Hi的一個詢問。

在20%的數據中n, m<=10,詞典的字母表大小<=2.

在60%的數據中n, m<=1000,詞典的字母表大小<=5.

在100%的數據中n, m<=100000,詞典的字母表大小<=26.

本題按通過的數據量排名哦~

輸出

對於小Hi的每一個詢問,輸出一個整數Ans,表示詞典中以小Hi給出的字符串爲前綴的單詞的個數。

樣例輸入
5
babaab
babbbaaaa
abba
aaaaabaa
babaababb
5
babb
baabaaa
bab
bb
bbabbaab
樣例輸出
1
0
3
0

0

這是一道hiho上的題目,主要方法是Trie樹,俗稱字典樹,是一種高效存儲海量單詞的結構,通過Trie可以很快地查詢自己想要找的單詞是否在單詞集合中,或者如本題中的含有某相同前綴的單詞個數。此處的前綴指的是單詞“abc”,那麼"a","ab","abc"都是它的前綴。

Trie樹的建立有兩種方法,一種是鏈表的形式,一種是雙數組形式,前者理解起來相對簡單,但是空間佔用較大,後者是理解起來複雜,暫時還沒有搞懂,網上都是在說有限自動機的,後面會進一步搞懂他。

Trie樹每個節點表示一個字母,且有26個子節點。原理很簡單:樹的每一層都對應字符串的一個位置。

此題一開始的思路有問題,應該集中思考問題——包含前綴的單詞個數。如果仔細想得話,會發現Trie樹在建立的時候,在所輸入的所有單詞中單詞前綴重複的部分會被遍歷很多次,所以如果用一個數據記錄遍歷的次數,就能知道結果。所以,“abc”中的c對應的遍歷次數,就是以它爲前綴的所有單詞的個數。

#include<string.h>
#include<stdio.h>



class TrieNode{
public:
	TrieNode(): flag(0){
		for(int i=0;i<26;i++){
			pArry[i]=NULL;
		}
	}

public:
	int flag;
	TrieNode *pArry[26];
};


void insert(char tar[], int len, TrieNode *root){
	for(int i=0;i<len;i++){
		TrieNode* &p=root->pArry[tar[i]-'a'];
		if(p==NULL)
			p=new TrieNode;
		root=p;
		root->flag+=1;
	}
	return ;
}

int find(char tar[], int len, TrieNode *root){
	for(int i=0;i<len;i++){
		if(root->pArry[tar[i]-'a']==NULL)
			return 0;
		root=root->pArry[tar[i]-'a'];
	}
	return root->flag;
}



int main()
{
	int N,M;
	TrieNode *root=new TrieNode;
	char input[11];

	scanf("%d",&N);
	for(int i=0;i<N;i++){
		scanf("%s",input);
		insert(input,strlen(input),root);
	}

	scanf("%d",&M);
	for(int i=0;i<M;i++){
		scanf("%s",input);
		
		printf("%d\n",find(input,strlen(input),root));
		
	}
	
	return 0;
}


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章