病毒检测(BF实现)

题目:

给出几组人的DNA序列(如abcabcd),以及几组病毒的DNA序列(bca),已知其中病毒DNA都是环状的。检测该人体的DNA中是否含有病毒的DNA序列。

思路:

该问题为典型的字符串匹配问题,可以采用BF算法或者KMP算法。由于病毒DNA为环状的,所以可以设一个字符串为它的2倍长。

如病毒DAN:abc  设一个temp为:abcabc,从中依次取出长度为3的字符串:abc,bca,cab,abc 这样就相当于绕了一圈。

#include 

using namespace std;

/**字符串匹配,找出子串在主串中的位置*/
int BF(char * parent,char * child)
{
    int i = 0,j = 0;
    int index = 0;
    while(parent[i]!='\0'&&child[j] != '\0')
    {
        if(parent[i] == child[j])
        {
            i++;
            j++;
        }
        else
        {
            index++;
            i = index;
            j = 0;
        }
    }
    if(child[j] == '\0')
        return index + 1;
    else return 0;
}

int check(char * parent,char * child)
{
    int len_child = 0;
    while(child[len_child]!='\0')
        len_child++;//计算子串长度

    char  temp[len_child * 2 + 1];//由于virus的DNA是环状的 所以长度变为2倍来匹配如acb 变为acbacb

    for(int i = 0;i < len_child * 2;i++)
        temp[i] = child[i % len_child];//赋值

    temp[len_child*2] = '\0';

    for(int i = 0;i  < len_child ;i++)
    {
        char virus[len_child+1];//截取病毒长度的片段,用于匹配
        //acbacb: acb cba bac acb
        for(int j = i; j  < i+len_child;j++)//长度为len_child ,所以小于i+len_child
        {
            virus[j-i] = temp[j];//求virus[0~2]
        }
        virus[len_child] = '\0';
        if(BF(parent,virus)!=0) //与主串匹配上则可以返回不用再进行了
            return 1;
    }
    //都没有匹配上
    return 0;


}
int main()
{
    //病毒感染检测
    char * persons[] = {
    "bbaabbba","aaabbbba","efghkkl","cabbbbab","abcbacbac"
    };
    char * virus[] ={
        "acb","fghk","aba","bbba","acc"
    };

    for(int i = 0;i < 5;i++)
    {
        for(int j = 0;j < 5;j++)
        {
            if(check(persons[i],virus[j]) != 0)
               {
                   cout << "人类DNA:" << persons[i] << " 匹配上的病毒:" << virus[j]<

 

 

 

你可能感兴趣的:(数据结构,数据结构,字符串)