线性关系、线性表的定义,线性表的基本操作。
线性表的顺序存储结构与链式存储结构(包括单(向)链表、循环链表和双向链表)的构造原理。
在以上两种存储结构的基础上对线性表实施的基本操作,包括顺序表的插入与删除、链表的建立、插入与删除、查找等操作对应的算法设计(含递归算法的设计)。
A = ( a 1 , a 2 , . . . , a n ) A=(a_{1},a_{2},...,a_{n}) A=(a1,a2,...,an)
数据元素之间具有逻辑关系为线性关系的数据元素合集称为线性表,n为线性表的长度,长度为0的线性表称为空表。
e.g:线性表,数组,堆栈,队列,串,文件等
线性关系:
用一组地址连续的存储单元依次存储线性表中的数据元素,数据元素之间的逻辑关系通过数据元素的存储位置直接反映。
note:所谓一个元素的地址是指该元素占用的若干连续的存储单元的第一个单元的地址。记为 L O C ( a i ) LOC(a_{i}) LOC(ai)。假设每个数据占用k个存储单元,并且已知第一个元素的存储位置 L O C ( a 1 ) LOC(a_{1}) LOC(a1),则有
L O C ( a i ) = L O C ( a 1 ) + ( i − 1 ) ∗ k LOC(a_{i}) = LOC(a_{1}) + (i-1)*k LOC(ai)=LOC(a1)+(i−1)∗k
e.g: L O C ( a 1 ) = 100 , k = 4 , LOC(a_{1})=100,k=4, LOC(a1)=100,k=4, 求 L O C ( a 5 ) LOC(a_{5}) LOC(a5)
L O C ( a 5 ) = 100 + ( 5 − 1 ) ∗ 4 = 116 LOC(a_{5})=100+(5-1)*4 = 116 LOC(a5)=100+(5−1)∗4=116
[C语言-顺序表]
#define MAXSIZE = 100
ElemType A[MAXSIZE];
int n;
1. 确定元素item在长度为n的线性表A中的位置
( a 1 , a 2 , . . . a i − 1 , a i , a i + 1 , . . . , a n ) (a_{1},a_{2},...a_{i-1},a_{i},a_{i+1},...,a_{n}) (a1,a2,...ai−1,ai,ai+1,...,an)
[确定元素位置]
int LOCATE(ElemType A[], int n, ElemType item)
{
for(int i = 0; i < n; i++)
{
if (A[i] == item)
{
return i; /*查找成功,返回表中位置*/
}
}
return -1;/*查找失败,返回信息-1*/
}
算法复杂度分析: O ( n ) O(n) O(n)
2. 在长度为n的线性表A的第i个位置上插入一个新的数据元素item
该运算是在线性表的第i-1个数据元素与第i个数据元素之间插入一个由符号item表示的数据元素,使长度为n的线性表转换为长度为n+1的线性表。
[线性表顺序存储插入新元素]
/*
n:现在线性表的长度
i:要插入线性表的位置
item:插入线性表的数据元素
*/
int INSERTLIST(ElemType A[],int &n, int i, ElemType item)
{
if(n == MAXSIZE || i<0 || i>n+1)
return -1;/*插入失败*/
for(int j=n-1;j>=i-1;j--){
A[j+1]=A[j];/*元素依次后移一个位置*/
}
A[i-1]=item;/*将item插入表的第i个位置*/
n++;/*线性表的长度+1*/
return 1;/*插入成功*/
}
算法时间复杂度分析:若设置 p i p_{i} pi为插入一个元素于线性表第i个位置的概率(概率相等),则在长度为n的线性表中插入一个元素需要移动的其他的元素的平均次数为:
T i n s e r t = ∑ i = 1 n p i ( n − i + 1 ) = ∑ i = 1 n 1 n + 1 ∗ ( n − i + 1 ) = n 2 T_{insert} = \sum_{i=1}^{n} p_{i}(n-i+1) = \sum_{i=1}^{n} \frac{1}{n+1}*(n-i+1) = \frac{n}{2} Tinsert=i=1∑npi(n−i+1)=i=1∑nn+11∗(n−i+1)=2n
从线性表中插入一个元素算法的时间复杂度是 O ( n ) O(n) O(n)
3. 删除长度为n的线性表的第i个数据元素,从线性表中去掉,使得长度为n的线性表转换成长度为n-1的线性表
正常情况下需要做的工作:
需要考虑的异常情况:
[线性表顺序存储删除元素]
/*
n:现在线性表的长度
i:要删除元素的位置
*/
int DELETELLIST(ElemType A[],int &n, int i)
{
if(i < 0 || i > n-1)
return -1;/*删除失败*/
for(int j = i; j < n; j++)
A[j-1]=A[j]/*元素依次前移一个位置*/
n--;/*线性表长度-1*/
return 1;/*删除成功*/
}
算法时间复杂度分析:若 p i p_{i} pi为删除一个元素于线性表第i个位置的概率(设概率相等),则在长度为n的线性表中删除一个元素需要移动的其他的元素的平均次数为:
T d e l e t e = ∑ i = 1 n p i ( n − i ) = ∑ i = 1 n 1 n ∗ ( n − i ) = n − 1 2 T_{delete} = \sum_{i=1}^{n} p_{i}(n-i) = \sum_{i=1}^{n} \frac{1}{n}*(n-i) = \frac{n-1}{2} Tdelete=i=1∑npi(n−i)=i=1∑nn1∗(n−i)=2n−1
从线性表中删除一个元素的算法的时间复杂度是 O ( n ) O(n) O(n)
所谓一个元素的地址是指该元素占用的若干连续的存储单元的第一个单元的地址。记为 L O C ( a i ) LOC(a_{i}) LOC(ai)。假设每个数据占用k个存储单元,并且已知第一个元素的存储位置 L O C ( a 1 ) LOC(a_{1}) LOC(a1),则有
L O C ( a i ) = L O C ( a 1 ) + ( i − 1 ) ∗ k LOC(a_{i}) = LOC(a_{1}) + (i-1)*k LOC(ai)=LOC(a1)+(i−1)∗k
(3) 由于只需存放数据元素本身的信息,而无其他空间开销,相对链式存储结构而言,存储空间相对开销较小(仅此而已)
练习
已知长度为n 的线性表A采用顺序存储结构,并且数据元素按值大小非递减排列,写一算法,在该线性表中插入一个数据元素 item,使得线性表仍然保持按值非递减排列。
思路:
void insert(ElemType A[], int &n, ElemType item)
{
int i = 0;
if(item >= A[n-1])
A[n] = item;/*插入表的末尾*/
else
{
i=0
while(item >= A[i])
i++;
for(int j=n-1;j>=i;j++)
A[j+1]=A[j];
A[i]=item;/*插入新的元素*/
}
n++;
}
构造原理:用一组地址任意的存储单元(连续或不连续的)依次存储白哦中各个数据元素,数据元素之间的逻辑关系通过指针间接反映出来。
线性表的这种存储结构又称为单链表,或者线性链表,其一般形式为:
[链结点] data-link
typedef struct node {
ElemType data;
struct node *link;
}LNode,*LinkList;
LinkList list *p;