下标处理问题

下标处理问题

主要是针对于插入排序算法写的程序,其他情况可以借鉴这些思路。

数学上或者通常意义上,下标都是从1开始的,但是在多数编程语言里面数组下标都是从0开始的,这就很恼火了,简单一个下标处理起来却异常麻烦!请看

例如:

(1)典型的数组下标越界问题

假设有个数组:a[0] a[1],我们要用插入法排序,把a[1]插入到a[0]前面,插入法是这样写的

while( a[j]>temp) // j=0; temp=a[1];

{a[j+1]=a[j--];}

a[j+1]=temp;

其原理是把比temp(即a[1])小的元素挨个往后移,腾出前面的一个位置将temp插进去,但是当j=0是,如果a[0]>a[1],那么j将减小到-1,在执行while时就会遇到a[-1]。为了解决这个问题,每次都要判断j是否越界,即写成

if( j != 0 )

j--;

else

break;

而且这样写还不行,越界问题解决了,逻辑问题上又有问题,所以说很蛋疼。通常为了避免下标越界的问题,某些人喜欢用a[0]做“哨兵”(即把上面的temp换成a[0]),这样就回避了越界的问题,代码简洁了许多。但是使用“哨兵”对数据结构有要求,那就是a[0]要空出来,不存数据,专门做哨兵。

(2)下标默认为1的情况

在MATLAB中所有下标默认是自然数(1,2,3),不允许出现0,这就恼火了,因为所有的算法都是从0开始的,要是没有0会出现一些逻辑问题,所以后来我只能用“p_{k}”这种形式来表示向量的下标了,传统的数组根本用不上。

下标0和1矛盾的解决方案

刚才说了,一种方法就是每次都检测是否会越界,例如下面的直接插入排序算法:

/* ****************************************************************************

直接插入排序(无哨兵的情况)

作者:zollty

**************************************************************************** */

#include<stdio.h>

void InsertSort(int *a, int r)

{ //注意传递参数的时候r为尾元素的下标,即r=n-1

int i, j;

int temp;

for(i=1; i<=r; i++)

{

temp=a[i];

j=i-1;

while( a[j]>temp )

{

a[j+1]=a[j];

if( j != 0 )//检查越界

{

j--;

}

else

{//理论上j--后j=-1,但是不能再执行while(a[j]>temp),所以break

j=-1;

break;

}

}

if( j != i-1 )//如果没有执行while则无需赋值。

{

a[j+1]=temp;

}

}

}

//专门打印整型数组的函数,n为元素个数.

void print(int s[], int n)

{

int i;

for(i=0; i<n; i++)

printf("%d ", s[i]);

printf("\n");

}

int main(void)

{

int a[6]={6,5,4,3,2,1};

print(a,6);

InsertSort(a, 5);

print(a,6);

return 0;

}

第二种方案,设置哨兵,但倘若数据是从0开始储存的就不适合,所以要用另外一个数组去拷贝原数组,新生成的数组首元素不存数据。算法如下:

/* ****************************************************************************

直接插入排序(a[0]作哨兵)

作者:zollty

**************************************************************************** */

#include<stdio.h>

void InsertSort(int *a, int r)

{ //注意传递参数的时候r为尾元素的下标,即r=n-1

int i, j;

for(i=2; i<=r; i++)

{

a[0]=a[i];

j=i-1;

while( a[j]>a[0] )

{

a[j+1]=a[j];

j--;

}

if( j != i-1 )

{

a[j+1]=a[0];

}

}

a[0]=0;

}

//专门打印整型数组的函数,n为元素个数.

void print(int s[], int n)

{

int i;

for(i=0; i<n; i++)

printf("%d ", s[i]);

printf("\n");

}

int main(void)

{

int a[6]={6,5,4,1,2,3};

int b[7], i;

for(i=0, b[0]=0; i<6; i++)

b[i+1]=a[i];

print(b,7);

InsertSort(b, 6);

print(b,7);

return 0;

}

也可以把拷贝数组a的操作放在插入算法内部,这样就可以直接传递一般格式的数组。

然而,上面这种拷贝记录,在新记录上操作的方法要拷贝数据过来,如果不拷贝回去,那么a数组就相当于报废了,倘若a数组还有其他函数调用,那么就必须拷贝回去,拷过来又拷过去,效率就稍微低了一点。

下面是我发明的头尾哨兵法,这不仅仅是一个算法,而是一种通用的思路。

/* ****************************************************************************

直接插入排序(头尾哨兵法)

作者:zollty

思路是这样的:我们先把a[0]的值保存,然后用a[0]做哨兵,最后再恢复a[0]的值并

插入到合适的位置,这就相当于我们先对a[1]到a[r]进行排序,然后再插入a[0],插入

的时候又有可能插入到最末尾的情况,这是又会造成越界,所以还必须用最末尾的元素

a[r]做哨兵,这就是为什么我取名为“头尾哨兵法”的原因。

**************************************************************************** */

#include<stdio.h>

void InsertSort(int *a, int r)

{ //注意传递参数的时候r为尾元素的下标,即r=n-1

int i, j, temp;

temp=a[0];//保存a[0]的值,避免丢失,a[0]将要做哨兵

for(i=2; i<=r; i++)

{

a[0]=a[i];

j=i-1;

while( a[j]>a[0] )

{

a[j+1]=a[j];

j--;

}

if( j != i-1 )

{

a[j+1]=a[0];

}

}

a[0]=temp;//a[0]不再是哨兵,还原a[0]的值

temp=a[r];//保存a[r],a[r]将要做哨兵

a[r]=a[0];

j=1;

while( a[r]>a[j] )

{

a[j-1]=a[j];

j++;

}

if( temp>a[r] )//如果a[0]比a[r]大,则a[r]要放在次末尾的位置

{

a[j-1]=a[r];

a[r]=temp;

}

else //a[0]比a[r]小,直接放在a[r]的前面

{

a[j-1]=temp;

}

}

//专门打印整型数组的函数,n为元素个数.

void print(int s[], int n)

{

int i;

for(i=0; i<n; i++)

printf("%d ", s[i]);

printf("\n");

}

int main(void)

{

int a[6]={6,5,4,1,2,3};

print(a,6);

InsertSort(a, 5);

print(a,6);

return 0;

}

最后,再来回顾一下解决下标的方法:

1. 最直接的方法就是每次检查是否越界,但是要执行多次类属于if(j!=0)的判断;

2. 代码量最简单的方法就是把a[0]当做哨兵用,排序的时候只对a[1]到a[r]排序;

3. 最高效但是思路稍微复杂一点的方法是我自创的“首尾哨兵法”,对a[1]到a[r]排序,然后插入a[0],同对a[0]到a[r]排序而言效率稍好,但最主要的是它解决了普通哨兵法要求首元素储存为哨兵的要求。

你可能感兴趣的:(问题)