两个字符串的最大公共子串(七)

东家蝴蝶西家飞,白骑少年今日归。 愿,所有迷茫的人,都不再迷茫的,愿,所有努力工作的人,都可以得到应有的回报,愿,所有的人,都可以找到回家的方向,愿,再无苦痛,再无离别。
上一章简单介绍了统计字符串中各个字符出现的次数(六),如果没有看过,请观看上一章

一. 最大公共子串

有两个字符串,这两个字符串可能会存在公共的部分,如字符串"abcdef" 和字符串"defg",这两个字符串之间有共同的字符串,“d”,“e”,“f”,“de”,“ef”,“def” 等。最长的公共子串就是"def"。

二.第一种思路,循环找寻

	// 如,传递的参数为 "abcdef" 和"defg"
	public static String getMaxSubString(String maxString,String minString){
		String max=null; //并不知道哪个字符串长,哪个字符串短。
		String min=null;
		//1。 先找到最大的字符串和最小的字符串。 根据长度进行比较
		max=maxString.length()>minString.length()? maxString:minString;
		min=maxString.equals(max)?minString:maxString;
		
		//2. 求出最小的那个的长度。 根据这个长度,进行相应的循环。
		int minLength=min.length();
		//3.如果整个包含的话,那个就不用循环判断了。
		if(max.contains(min)){
			return min;
		}
		//3.开始进行相关的循环操作了。
		for (int i = 0; i 

三. LCS (Longest Common Subsequence) 算法

参考教程: https://blog.csdn.net/xiehaoyun2012/article/details/12066515
算法的主要原理为:

LCS[i,j] = 0 (i<0||j<0)
LCS(i-1,j-1) (i>=0 && b>0 && (str1[i]==str2[j]))
(1) 构造一个str1.size()*str2.size()的矩阵vec
(2) 如果 str1[i] == str2[j],则vec[i][j] = vec[i-1][j-1]+1;

翻译成中文就是:

  1. 将两个字符串分别以行和列组成矩阵。
    (2) 计算每个节点行列字符是否相同,如相同则为 1。
    (3) 通过找出值为 1 的最长对角线即可得到最长公共子串。
    两个字符串的最大公共子串(七)_第1张图片

可以进一步的优化:
我们可以将字符相同节点(1)的值加上左上角(d[i-1, j-1])的值,
这样即可获得最大公用子串的长度。如此一来只需以行号和最大值为条件即可截取最大子串。
两个字符串的最大公共子串(七)_第2张图片
只需要比较 数组里面的最大值即可了。

程序代码为:

// 如,传递的参数为 "abcdef" 和"defg"
	public static String getMaxSubString(String maxString,String minString){
		//1. 必须保证 第一个字符串的长度是长的。第二个是短的。
		if(minString.length()>maxString.length()){
			// 重新调用这个方法
			return getMaxSubString2(minString, maxString);
		}
		//2. 判断一下,是否直接包含,如果是的话,就不用进行阵列转换了。
		if(maxString.contains(minString)){
			return minString;
		}
		//3. 取出长度,转换相对应的矩阵。 通常,长的为y,短的为x.
		int maxLength=maxString.length();
		int minLength=minString.length();
		// 构建二维数组
		int [][] conver=new int[minLength][maxLength];
		int maxValue=0; //最大的值。
		int maxIndex=0;//最大的索引。
		//4. 对这个矩阵进行相应的放值。
		for (int i = 0; i 

谢谢!!!

你可能感兴趣的:(Java小知识点,LCS算法,最大公共子串)