DNA序列(DNA Consensus String, ACM/ICPC Seoul 2006, UVa1368)

問題描述:

輸入m個長度均爲n的DNA序列,求一個DNA序列,到所有序列的總Hamming距離儘量 小。兩個等長字符串的Hamming距離等於字符不同的位置個數,例如,ACGT和GCGA的 Hamming距離爲2(左數第1, 4個字符不同)。
輸入整數m和n(4≤m≤50, 4≤n≤1000),以及m個長度爲n的DNA序列(只包含字母 A,C,G,T),輸出到m個序列的Hamming距離和最小的DNA序列和對應的距離。如有多 解,要求爲字典序最小的解。例如,對於下面5個DNA序列,最優解爲TAAGATAC。
       TATGATAC
       TAAGCTAC
       AAAGATCC
       TGAGATAC
       TAAGATGT

解決方案:

每列字母出現最多的且字典序相對較小的爲最優解該列字母

#include<stdio.h>
#include<string.h>
int main(){
	int m,n;
	char p[50][1000],b[1000];
	int na,nt,nc,ng,i,j; 
	printf("請輸入m,n:");	
	scanf("%d%d",&m,&n);            //m爲行n爲列 
	printf("輸入相應的DNA序列\n"); 
	
	for(i=0;i<m;i++)            //可以按回車依次輸入下一行DNA序列 
        scanf("%s",&p[i]); 
	printf("\n");
	
	for(i=0;i<n;i++){
		na=0,nt=0,nc=0,ng=0;
		for(j=0;j<m;j++){
			switch(p[j][i]){
				case 'A':
					na+=1;
					break;
				case 'C':
					nc+=1;
					break;
				case 'G':
					ng+=1;
					break;
				case 'T':
					nt+=1;
					break;
			}
			
		}
		if(na>=nc&&na>=nt&&na>=ng) b[i]='A';
		if(nc>=na&&nc>=nt&&nc>=ng) b[i]='C';
		if(ng>=na&&ng>=nc&&ng>=nt) b[i]='G';
		if(nt>=na&&nt>=nc&&nt>=ng) b[i]='T';
	}
	for(i=0;i<n;i++){
		printf("%c",b[i]);
	}
	return 0;
} 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章