【华为OJ】【089-DNA序列】

【华为OJ】【算法总篇章】

【华为OJ】【089-DNA序列】

【工程下载】

题目描述

一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次
数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。

给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。

输入描述

输入一个string型基因序列,和int型子串的长度

输出描述

找出GC比例最高的字串

输入例子

AACTGTGCACGACCTGA
5

输出例子

GCACG

算法实现

import java.util.Scanner;

/** * Author: 王俊超 * Date: 2016-01-06 15:18 * All Rights Reserved !!! */
public class Main {
    public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
// Scanner scanner = new Scanner(Main.class.getClassLoader().getResourceAsStream("data.txt"));
        while (scanner.hasNext()) {
            String input = scanner.nextLine();
            int n = scanner.nextInt();
            System.out.println(maxRatio(input, n));
        }

        scanner.close();
    }

    /** * 初始化两个数组,一个序列数值数组K[N],一个序列和数组SUM[N],先遍历一边序列, * 为C或者G则K[i]为1,否则则置为0,然后计算连续M个K[I]之和存入SUM就行。 * * @param s * @param m * @return */
    private static String maxRatio(String s, int m) {
        int[] k = new int[s.length()];
        int[] sum = new int[s.length()];
        for (int i = 0; i < s.length(); i++) {
            char c = s.charAt(i);
            if (c == 'C' || c == 'G') {
                k[i]++;
            }
        }

        for (int i = 0; i < k.length - m; i++) {
            for (int j = 0; j < m; j++) {
                sum[i] += k[i + j];
            }
        }

        int max = 0;
        int idx = 0;
        for (int i = 0; i < k.length - 1; i++) {
            if (sum[i] > max) {
                max = sum[i];
                idx = i;
            }
        }

        return s.substring(idx, idx + m);
    }
}

你可能感兴趣的:(java,算法,华为)