问题:五笔的编码范围是a ~ y的25个字母,从1位到4位的编码,如果我们把五笔的编码按字典序排序,形成一个数组如下:
a, aa, aaa, aaaa, aaab, aaac, … …, b, ba, baa, baaa, baab, baac … …, yyyw, yyyx, yyyy
其中a的Index为0,aa的Index为1,aaa的Index为2,以此类推。
1)编写一个函数,输入是任意一个编码,比如baca,输出这个编码对应的Index;
2)编写一个函数,输入是任意一个Index,比如12345,输出这个Index对应的编码。
解答:初看一下,编码并不是按照数位大小进行,而是按照字典序进行排序。首先通过枚举一些例子找找规律。
index[a]=0,index[aa]=1,index[aaa]=2,index[aaaa]=3,前四个字符串的规律是strlen(str)-1。
我们再看已知index[a]求index[b]。a,aa,aaaa,aaab,…,ayyy。其中aa->ay(25个数),aaa->ayy(25*25个数),aaaa->ayyy(25*25*25个数),这样index[b]=index[a]+25^3+25^2+25+1
再看已知index[aa]求index[ab]。aa,aaa,aaaa,aaab,…,aayy。其中aaa->aay(25个数),aaaa->aayy(25*25个数),这样index[ab]=index[aa]+25^2+25+1
再看已知index[aaa]求index[aab]。aaa,aaaa,…,aaay。其中aaaa->aaay(25个数)。这样index[aab]=index[aaa]+25+1
再看已知index[aaaa]求index[aaab]。index[aaab]=index[aaaa]+1。
这样我们就可以将上述因子放在一个数组里。factor[]={25^3+25^2+25+1,25^2+25+1,25+1,1}
我们以bdce为例说明。
对字符串从左到右遍历,首先发现的是b,b距离a的相对index=factor[0],而index[a]=0,所以到达b是factor[0];再看第二个字符d,bd距离ba的长度为factor[1]*(b-a),而ba距离b的长度又为1;所以到达bd是1+factor[0]+factor[1]*(b-a);再看第三个字符c,bdc到bda的长度为factor[2]*(c-a),而bda距离bd的长度又为1,所以到达bdc是1+1+factor[0]+factor[1]*(b-a)+factor[2]*(c-a);最后再看e,bdce到bdca的长度为factor[3]*(e-a),而bdca距离bdc的长度又为1,所以到达dbce是1+1+1+factor[0]+factor[1]*(b-a)+factor[2]*(c-a)。所以编码就出来了。
1
2
3
4
5
6
7
8
9
10
11
|
int
factor[]={25*25*25+25*25+25+1,25*25+25+1,25+1,1};
int
encode(
char
*str)
{
int
len=
strlen
(str);
int
index=len-1;
for
(
int
i=0;i<len;++i)
{
index+=factor[i]*(str[i]-
'a'
);
}
return
index;
}
|
对于第二个问题,解码就是编码的逆过程,也是顺序求字符串的1234个字符就行。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
char
* decode(
int
index)
{
char
str[4];
int
i=0;
while
(index>=0)
{
str[i]=
'a'
+index/factor[i];
index=index%factor[i];
--index;
++i;
}
str[i]=
'\0'
;
return
str;
}
|