题目背景
大家都知道,基因可以看作一个碱基对序列。它包含了4种核苷酸,简记作A,C,G,T。生物学家正致力于寻找人类基因的功能,以利用于诊断疾病和发明药物。
在一个人类基因工作组的任务中,生物学家研究的是:两个基因的相似程度。因为这个研究对疾病的治疗有着非同寻常的作用。
题目描述
两个基因的相似度的计算方法如下:
对于两个已知基因,例如AGTGATG和GTTAG,将它们的碱基互相对应。当然,中间可以加入一些空碱基-,例如:
这样,两个基因之间的相似度就可以用碱基之间相似度的总和来描述,碱基之间的相似度如下表所示:
那么相似度就是:(-3)+5+5+(-2)+(-3)+5+(-3)+5=9。因为两个基因的对应方法不唯一,例如又有:
相似度为:(-3)+5+5+(-2)+5+(-1)+5=14。规定两个基因的相似度为所有对应方法中,相似度最大的那个。
输入输出格式
输入格式:
共两行。每行首先是一个整数,表示基因的长度;隔一个空格后是一个基因序列,序列中只含A,C,G,T四个字母。1<=序列的长度<=100。
输出格式:
仅一行,即输入基因的相似度。
输入输出样例
输入样例#1:
7 AGTGATG
5 GTTAG
输出样例#1:
14
状态转移方程:f[i,j]:=max(f[i-1,j]+—,f[i,j-1]+—,f[i-1,j-1]+—);
整体来看类似于最长公共子序列
program df;
var i,j,n,m,y,z,k,t:longint;
x:char;
a,b:array[0..10000] of longint;
f,g:array[0..100,0..100] of longint;
function fan(x:char):longint;
begin
if x=’A’ then exit(1)
else
if x=’C’ then exit(2)
else
if x=’G’ then exit(3)
else
if x=’T’ then exit(4);
end;
procedure init;
var i,j:longint;
begin
for i:=1 to 4 do
g[i,i]:=5;
g[2,1]:=-1; g[1,2]:=-1;
g[3,1]:=-2; g[1,3]:=-2;
g[3,2]:=-3; g[2,3]:=-3;
g[4,1]:=-1; g[1,4]:=-1;
g[4,2]:=-2; g[2,4]:=-2;
g[4,3]:=-2; g[3,4]:=-2;
g[5,1]:=-3; g[1,5]:=-3;
g[5,2]:=-4; g[2,5]:=-4;
g[5,3]:=-2; g[3,5]:=-2;
g[5,4]:=-1; g[4,5]:=-1;
end;
function max(x,y:longint):longint;
begin
if x>y then exit(x)
else exit(y);
end;
begin
init;
read(n);
read(x);
for i:=1 to n do
begin
read(x);
a[i]:=fan(x);
end;
readln;
read(m);
read(x);
for i:=1 to m do
begin
read(x);
b[i]:=fan(x);
end;
for i:=1 to n do
f[i,0]:=f[i-1,0]+g[a[i],5];
for i:=1 to m do
f[0,i]:=f[0,i-1]+g[b[i],5]; //两列中前多少个碱基联的是空键
(例如 A A A A A C)
( - - - - - C)
for i:=1 to n do
for j:=1 to m do
begin
f[i,j]:=max(f[i-1,j]+g[a[i],5],f[i,j-1]+g[b[j],5]);
f[i,j]:=max(f[i,j],f[i-1,j-1]+g[a[i],b[j]]);
end;
writeln(f[n,m]);
end.