英文字母编码问题

【座右铭】1. 想要成为行家,就必须尝试解决大量的问题;

                    2. 解决大量问题并不代表能解决所有问题,而是表示解决下一个问题的几率变大了


1. 五笔的编码范围是a ~ y的25个字母,从1位到4位的编码,如果我们把五笔的编码按字典序排序,形成一个数组如下: a, aa, aaa, aaaa, aaab, aaac, … …, b, ba, baa, baaa, baab, baac … …, yyyw, yyyx, yyyy。其中a的Index为0,aa的Index为1,aaa的Index为2,以此类推。
1)编写一个函数,输入是任意一个编码,比如baca,输出这个编码对应的Index;
2)编写一个函数,输入是任意一个Index,比如12345,输出这个Index对应的编码

【问题来源于v_JULY_v的博客:http://blog.csdn.net/v_july_v/article/details/6855788

第一部分:思路

1)计算出相邻2个同位数编码之间的距离,保存于base[4]中:

base[4] = 1, 即aaaa与aaab之间相隔;base[3] = base[4]*25+1,即aaa与aab之间相隔;base[2] = 25*base[3] + 1,即aa与ab之间相隔;base[1] = 25*base[2]+1,即a与b之间相隔

2)编码:给定一个字符编码,从高位向低位扫描。对第i位找出相同位数的,且前面i-1位相同,且第i位是a的编码之间的距离

例如baca:

第一步:找出b的位置,即与a之间的距离d1=('b'-'a')*base[1] + 1

第二步:找出ba的位置,即与ba之间的距离d2 = ('a'-'a')*base[2] + 1

第三步:找出bac的位置,即与baa之间的距离d3 = ('c'-'a')*base[3] + 1

第四步:找出baca的位置,即与baca之间的距离d4 = ('a'-'a')*base[4] + 1

即baca的Index = d1+d2+d3+d4-1

3)解码:是编码的逆过程,给定一个索引值,依次去除base[i],得到与相同位数的,且前面i-1位相同,且第i位是a的编码之间的距离

第二部分:java代码:不考虑异常处理

1.编码

//参数说明:source给定的字符编码,len为长度
	public static int encode(char[] source, int len)
	{
		//计算base
		int[] base = new int[4];
		base[3] = 1;
		for(int i=2;i>=0;i--)
		{
			base[i] = base[i+1]*25 + 1;
		}
		//计算index
		int code = 0;
		for(int j=0;j<len;j++)
		{
			code += ((source[j]-'a')*base[j] + 1);
		}
		return code-1;
	}

2.解码

//参数说明:index为索引值
	public static char[] decode(int index)
	{
		//计算base
		int[] base = new int[4];
		base[3] = 1;
		for(int i=2;i>=0;i--)
		{
			base[i] = base[i+1]*25 + 1;
		}
		//计算字符
		char[] target = new char[4];
		int j = 0;
		while(index>=0)
		{
			target[j] = (char)('a' + index/base[j]);
			index = index%base[j] - 1;
			j++;
		}
		char[] ret = new char[j];
		for(int k=0;k<j;k++)
		{
			ret[k] = target[k];
		}
		return ret;
	}

第3部分:测试用例

编码:a --> 解码:0--> 再解码:a

编码:aab --> 解码:28 --> 再解码:aab

解码:12345 --> 编码:asya --> 再解码:12345

编码:406899 --> 解码:yyyy --> 再解码:406899

你可能感兴趣的:(java,c,测试)