XDOJ字符串相似度(最长公共子串)

字符串相似度

类别
字符串处理

时间限制
1S

内存限制
256Kb

问题描述
最长公共子串指给定的两个字符串之间最长的相同子字符串(忽略大小写),最长公共子串长度可用来定义字符串相似度。
现给出两个字符串S1和S2,S1的长度为Len1,S2的长度为Len2,假设S1和S2的最长公共子串长度为LCS,则两个字符串的相似度定义为2LCS/(Len1+Len2)。
例如:S1=”App”,S2=”apple”,S1长度为3,S2长度为5,它们的最长公共子串为”App”,长度为3,则相似度为2
3/(3+5)=0.75。
现给出两个字符串,请计算它们的相似度结果保留3位小数。

输入说明
输入为两行,分别表示两个字符串S1和S2,每个字符串长度不超过100个字符,所有字符均为可打印字符,包括大小写字母,标点符号和空格。

输出说明
输出两个字符串的相似度,结果四舍五入保留3位小数。

输入样例
App
Apple

输出样例
0.750

思路

先说最长公共子串:(此处转载)
XDOJ字符串相似度(最长公共子串)_第1张图片
算法为:如果俩个字母不相同,则值为0
如果俩个字母相同,值为左上角数字加1

伪代码:

if word_a[i] == word_b[j]://a存一个字符串,b存另一个字符串
cell[i][j] = cell[i-1][j-1] + 1
else:
cell[i][j] = 0

然后找这个矩阵里面最大数即可

#include
#include
#include
int main()
{
	char s1[101],s2[101],t[101];
	int i,j;
	float len1,len2,max=0;
	int a[100][100]={0};
	float similar;
	gets(s1);
	gets(s2);
	len1=strlen(s1);
	len2=strlen(s2);
	
	for(i=0;i<len1;i++)
	{
		for(j=0;j<len2;j++)
		{
			if(s1[i]==s2[j]||abs(s1[i]-s2[j])==32)
			{
				if(i!=0&&j!=0)
				a[i][j]=a[i-1][j-1]+1;
				else a[i][j]=1;
			}
		}
	}
	
	for(i=0;i<len1;i++)
	{
		for(j=0;j<len2;j++)
		{
			if(a[i][j]>max) max=a[i][j];
		}
	}
	similar=2.0*max/(len1+len2);
	printf("%.3f",similar);
 } 

最长公共子序列

一个串的子串是指该串的一个连续的局部。如果不要求连续,则可称为它的子序列。
比如对串: “abcdefg” 而言,“ab”,“abd”,“bdef” 等都是它的子序列。
特别地,一个串本身,以及空串也是它的子序列。

XDOJ字符串相似度(最长公共子串)_第2张图片

算法为:

如果俩个字母不相同,就选择左方或者上方较大的填入
如果俩个字母相同,选择左上方的数字加1填入
伪代码:

if word_a[i] == word_b[j]:
cell[i][j] = cell[i-1][j-1] + 1
else:
cell[i][j] = max(cell[i-1][j], cell[i][j-1])

————————————————
原文链接

你可能感兴趣的:(XDOJ)