下标处理问题

 

下标处理问题

 

主要是针对于插入排序算法写的程序,其他情况可以借鉴这些思路。

 

数学上或者通常意义上,下标都是从1开始的,但是在多数编程语言里面数组下标都是从0开始的,这就很恼火了,简单一个下标处理起来却异常麻烦!请看

例如:

(1)典型的数组下标越界问题

假设有个数组:a[0] a[1],我们要用插入法排序,把a[1]插入到a[0]前面,插入法是这样写的

while( a[j]>temp)       // j=0; temp=a[1];

{a[j+1]=a[j--];}

a[j+1]=temp;

其原理是把比temp(即a[1])小的元素挨个往后移,腾出前面的一个位置将temp插进去,但是当j=0是,如果a[0]>a[1],那么j将减小到-1,在执行while时就会遇到a[-1]。为了解决这个问题,每次都要判断j是否越界,即写成

if( j != 0 )

       j--;

else

       break;

而且这样写还不行,越界问题解决了,逻辑问题上又有问题,所以说很蛋疼。通常为了避免下标越界的问题,某些人喜欢用a[0]做“哨兵”(即把上面的temp换成a[0]),这样就回避了越界的问题,代码简洁了许多。但是使用“哨兵”对数据结构有要求,那就是a[0]要空出来,不存数据,专门做哨兵。

(2)下标默认为1的情况

       在MATLAB中所有下标默认是自然数(1,2,3),不允许出现0,这就恼火了,因为所有的算法都是从0开始的,要是没有0会出现一些逻辑问题,所以后来我只能用“p_{k}”这种形式来表示向量的下标了,传统的数组根本用不上。

 

下标0和1矛盾的解决方案

 

刚才说了,一种方法就是每次都检测是否会越界,例如下面的直接插入排序算法:

/* ****************************************************************************

直接插入排序(无哨兵的情况)

       作者:zollty

**************************************************************************** */

#include<stdio.h>

 

void InsertSort(int *a, int r)

{     //注意传递参数的时候r为尾元素的下标,即r=n-1

       int i, j;

       int temp;

       for(i=1; i<=r; i++)

       {

              temp=a[i];

              j=i-1;

              while( a[j]>temp )

              {

                     a[j+1]=a[j];

                     if( j != 0 )//检查越界

                     {

                            j--;

                     }

                     else

                     {//理论上j--后j=-1,但是不能再执行while(a[j]>temp),所以break

                            j=-1;

                            break;

                     }

              }

              if( j != i-1 )//如果没有执行while则无需赋值。

              {

                     a[j+1]=temp;

              }

       }

}

 

//专门打印整型数组的函数,n为元素个数.

void print(int s[], int n)

{

       int i;

       for(i=0; i<n; i++)

              printf("%d ", s[i]);

       printf("\n");

}

 

int main(void)

{

       int a[6]={6,5,4,3,2,1};

       print(a,6);

       InsertSort(a, 5);

       print(a,6);

       return 0;

}

第二种方案,设置哨兵,但倘若数据是从0开始储存的就不适合,所以要用另外一个数组去拷贝原数组,新生成的数组首元素不存数据。算法如下:

/* ****************************************************************************

直接插入排序(a[0]作哨兵)

       作者:zollty

**************************************************************************** */

#include<stdio.h>

 

void InsertSort(int *a, int r)

{     //注意传递参数的时候r为尾元素的下标,即r=n-1

       int i, j;

       for(i=2; i<=r; i++)

       {

              a[0]=a[i];

              j=i-1;

              while( a[j]>a[0] )

              {

                     a[j+1]=a[j];

                     j--;

              }

              if( j != i-1 )

              {

                     a[j+1]=a[0];

              }

       }

       a[0]=0;

}

 

//专门打印整型数组的函数,n为元素个数.

void print(int s[], int n)

{

       int i;

       for(i=0; i<n; i++)

              printf("%d ", s[i]);

       printf("\n");

}

 

int main(void)

{

       int a[6]={6,5,4,1,2,3};

       int b[7], i;

       for(i=0, b[0]=0; i<6; i++)

              b[i+1]=a[i];

       print(b,7);

       InsertSort(b, 6);

       print(b,7);

       return 0;

}

也可以把拷贝数组a的操作放在插入算法内部,这样就可以直接传递一般格式的数组。

 

然而,上面这种拷贝记录,在新记录上操作的方法要拷贝数据过来,如果不拷贝回去,那么a数组就相当于报废了,倘若a数组还有其他函数调用,那么就必须拷贝回去,拷过来又拷过去,效率就稍微低了一点。

下面是我发明的头尾哨兵法,这不仅仅是一个算法,而是一种通用的思路。

/* ****************************************************************************

直接插入排序(头尾哨兵法)

       作者:zollty

 

  思路是这样的:我们先把a[0]的值保存,然后用a[0]做哨兵,最后再恢复a[0]的值并

插入到合适的位置,这就相当于我们先对a[1]到a[r]进行排序,然后再插入a[0],插入

的时候又有可能插入到最末尾的情况,这是又会造成越界,所以还必须用最末尾的元素

a[r]做哨兵,这就是为什么我取名为“头尾哨兵法”的原因。

**************************************************************************** */

#include<stdio.h>

 

void InsertSort(int *a, int r)

{     //注意传递参数的时候r为尾元素的下标,即r=n-1

       int i, j, temp;

       temp=a[0];//保存a[0]的值,避免丢失,a[0]将要做哨兵

       for(i=2; i<=r; i++)

       {

              a[0]=a[i];

              j=i-1;

              while( a[j]>a[0] )

              {

                     a[j+1]=a[j];

                     j--;

              }

              if( j != i-1 )

              {

                     a[j+1]=a[0];

              }

       }

 

       a[0]=temp;//a[0]不再是哨兵,还原a[0]的值

       temp=a[r];//保存a[r],a[r]将要做哨兵

       a[r]=a[0];

 

       j=1;

       while( a[r]>a[j] )

       {

              a[j-1]=a[j];

              j++;

       }

       if( temp>a[r] )//如果a[0]比a[r]大,则a[r]要放在次末尾的位置

       {

              a[j-1]=a[r];

              a[r]=temp;

       }

       else  //a[0]比a[r]小,直接放在a[r]的前面

       {

              a[j-1]=temp;

       }

}

 

//专门打印整型数组的函数,n为元素个数.

void print(int s[], int n)

{

       int i;

       for(i=0; i<n; i++)

              printf("%d ", s[i]);

       printf("\n");

}

 

int main(void)

{

       int a[6]={6,5,4,1,2,3};

       print(a,6);

       InsertSort(a, 5);

       print(a,6);

       return 0;

}

       最后,再来回顾一下解决下标的方法:

1. 最直接的方法就是每次检查是否越界,但是要执行多次类属于if(j!=0)的判断;

2. 代码量最简单的方法就是把a[0]当做哨兵用,排序的时候只对a[1]到a[r]排序;

3. 最高效但是思路稍微复杂一点的方法是我自创的“首尾哨兵法”,对a[1]到a[r]排序,然后插入a[0],同对a[0]到a[r]排序而言效率稍好,但最主要的是它解决了普通哨兵法要求首元素储存为哨兵的要求。

 

你可能感兴趣的:(问题)