字典序问题

问题描述:

在数据加密和数据压缩中需要对特殊的字符串进行编码。给定的字母表由26个小写字母组成。该字母表产生的升序字符串是指字符串中字母从左到右出现的次序与字母在字母表中出现的次序相同,且每个字符最多出现1次。例如,a,b,ab,bc,xyz等都是升序字符串。
           现在对字母表中产生的所有长度不超过6的升序字符串按照字典序排列并编码如下:

对于任意长度不超过6的升序字符中,迅速计算出它在上述字典中的编码。

任务:对于给定的长度不超过6的升序字符串,编程计算它在上述字典中的编码。

解题思路:本题的关键之处在于正确理解题目描述中给出的字典序,其关键之处在于首先出现长度为1的字符串,然后是长度为2的字符串、……。而在相同长度的字符串中,按照字典序进行。

例如,对字符串cfkp这个长度为4的字符串来讲,如果能够计算出排在它前面的字符串数目,加1就得到该字符串的编码。排列在该字符串前的字符串可以如下分析:

(1)长度为1的字符串、长度为2的字符串、长度为3的字符串;

  (2)在以字母c打头的长度为4的字符串中,以cd、ce打头、长度为4的字符串同样排列在该字符串前面;而在以cf打头的长度为4的字符串中,以cfg、cfh、cfi、cfj打头的长度为4的字符串排列在该字符串前面;在以cfk打头的字符串中,以cfkl、cfkm、cfkn、cfko打头的长度为4的字符串同样在它前面。

 对第(2)种情况进行分析,可以分为如下几种情况:

以cd和ce打头、长度为4的字符串数目与以d、e打头、长度为3的字符串数目相同;

其他情况可以描述为:以g、h、i、j打头,长度为2的字符串数目;

以l、m、n、o打头、长度为1的字符串数目。 分析上述情况,对其中的规律进行总结,需要计算的字符串数目可以分为两类:

(1)长度为k的字符串数目,用g(k)表示;

(2)以字符ch打头,长度为k的字符串数目,用f(ch,i)表示。 显然,有 g(k)=sum_{ch=1}^26 f(ch,k) 同样,有如下规律可以发现: f(ch,1)=1 f(ch,k)=sum_{i=ch+1}^26 f(i,k-1) 在此基础上,可以计算出每个字符串的编码。

//字典序问题

#include

#includeint f(int ch,int len)

{
    int index=0;
    int i;
    if(len==1)
        return 1;
    for(i=ch+1;i<=27-len;i++)
        index+=f(i,len-1);
    return index;
}

int g(int len)
{
    int index=0;
    int ch;
    for(ch=0;ch<=26-len;ch++)
        index+=f(ch,len);
    return index;
}

int main()    
{
    int i,k;
    int ch;
    char *str="cfkp";
    int pos=0;
    for(i=1;i

 

你可能感兴趣的:(算法)