C语言辨析——声明int a[3][6], a[0][9]越界吗?

本文来源:声明int a[3][6], a[0][9]越界吗?

1. 问题

看下面的程序:


#include  
int main(void) 
{
  int a[3][6];
  for(int i=0; i<3; i++) {
    for(int j=0; j<6; j++){
      a[i][j] =i * 6 + j;
    }
  }
  printf("%d\n",a[0][9]);
  return 0;
}

第10行中的数组元素a[0][9]中的下标9越界吗?

这是一个关于二维数组的问题,下面先了解一下二维数组的相关知识。

2. 二维及多维数组定义和存储方式

二维数组通常用于表示由固定多个同类型的、具有行列结构的数据所构成的复合数据。

二维数组定义的一般形式是:

类型说明符 数组名[元素长度1][元素长度2];

其中类型说明符、数组名的含义和一维数组完全相同。元素长度1表示数组第一维(高维)的长度,元素长度2 表示第二维的长度。二维数组经常用来表示行列式,因此第一维也称为行,第二维也称为列。例如:

int mat[3][4];

定义了一个三行四列的二维数组,数组名为mat,该数组共有3×4=12个int类型元素,每个元素的名称、前后顺序如图1所示。

C语言辨析——声明int a[3][6], a[0][9]越界吗?_第1张图片

图1 二维数组mat

二维数组的两个下标在横向和纵向两个方向上变化,而不像一维数组只是一个方向。但是,计算机中存储器是一维编址的,或者说存储器单元是按一维线性排列的,只有一个方向。那么如何在一维结构的存储器中存放二维数组呢,一般有两种方式存储二维数组:一种是按行优先存放,即存放完二维数组第一行之后再存放入第二行;另一种是按列优先存放,即存放完二维数组第一列之后再存放第二列。C实现都是按行优先存放。

因此图1所示二维数组mat,各元素在存储器中存放的先后次序为:

mat[0][0],mat[0][1],mat[0][2],mat[0][3],mat[1][0],mat[1][1],mat[1][2],mat[1][3],mat[2][0],mat[2][1],mat[2][2],mat[2][3]

和一维数组一样,二维数组定义后,系统会在内存中为二维数组分配一块连续区域,从内存的低地址开始依次存放二维数组的各元素数据。因此mat[3][4]定义以后,12个整型元素存放在一块连续的内存中。这一原则对任何类型的数组都成立。

3. C标准的规定

C标准规定,多维数组按行优先存放。在附录J.2 未定义行为一节中列出了下标越界,这说明,下标越界属于未定义行为。

An array subscript is out of range, even if an object is apparently accessible with the given subscript (as in the lvalue expression a[1][7] given the declaration int a[4][5]) (6.5.6).

给定声明int a[4][5],显然左值表达式a[1][7]给定的下标是可以访问的,但其数组下标越界了(6.5.6)。

4. 结论

声明int a[3][6], 则a[0][9]的下标越界。

对于数组越界来说,它属于未定义行为。任何未定义行为都是潜在的bug。但C编译器对数组越界不进行判断,对于a[0][9]仍可以正常访问,我们可以认为这是一个假越界。

对于声明int a[3][6]来说,a[i][j]等价于 *(a+(i*6+j)*sizeof(int))。

如果i*6+j<3*6,且0<=i<3, j>=6,我们定义这种情况为假越界,程序可以正常访问,这是一个假bug。

如果i*6+j>=3*6,且 i>=0, j>=0,我们定义这种情况为真越界。可以判断这是一个真的bug。

你可能感兴趣的:(c语言,开发语言)