3-7 DNA序列(DNA Consensus String, ACM/ICPC Seoul 2006, UVa1368)

输入 m 个长度均为 n DNA 序列,求一个 DNA 序列,到所有序列的总 Hamming 距离尽量
小。 两个等长字符串的
Hamming 距离等于字符不同的位置个数,例如, ACGT GCGA
Hamming 距离为 2 (左数第 1, 4 个字符不同)。
输入整数
m n 4≤ m ≤50, 4≤ n ≤1000 ),以及 m 个长度为 n DNA 序列(只包含字母
A C G T ),输出到 m 个序列的 Hamming 距离和最小的 DNA 序列和对应的距离。 如有多
解,要求为字典序最小的解。 例如,对于下面
5 DNA 序列,最优解为 TAAGATAC
TATGATAC
TAAGCTAC
AAAGATCC
TGAGATAC

TAAGATGT


将A,C,G,T看成是0,1,2,3;

定义一个数组int ans[4][50];

对于每一行的输入,1<=i<=m;

ans[字母][i]++;

这样就记录了每一列每种字母出现的总次数;

最后遍历ans的每一列 把每一列的第一个最大值所在行转换成字母

合起来就是最优解;

总行数减去字母出现最多的字母数在第一列到第n列求和就是hamming值

#include 

using namespace std;

int ans[4][1000];//放次数的数组
char DNA[50][1000];   //放输入DNA的数组
char mDNA[1000];    //放最优解得数组
int T,m,n;
map m1;
char zimu[4]={'A','C','G','T'};
int main()
{
    //freopen("input.txt","r",stdin);
        m1['A']=0;
        m1['C']=1;
        m1['G']=2;
        m1['T']=3;
    scanf("%d",&T);
    while(T>0){
        int len=0;
        scanf("%d%d",&m,&n);
        getchar();
        memset(ans,0,sizeof(ans));
        for(int i=0;imax1){
                    max1=ans[j][i];
                    pos1=j;
                }
            }
            len+=m-max1;
            mDNA[i]=zimu[pos1];
        }
        for(int i=0;i




转载于:https://www.cnblogs.com/alonglyn/p/9953966.html

你可能感兴趣的:(3-7 DNA序列(DNA Consensus String, ACM/ICPC Seoul 2006, UVa1368))