1. 数据:数据是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被
计算机程序所处理的符号的总称。
2. 数据元素:数据元素是数据的基本单位,是数据这个集合中的个体,也称之为元素,结点,顶点记录。
(补充:一个数据元素可由若干个 数据项组成。数据项是数据的不可分割的最小单位。)
3.数据对象:数据对象是具有相同性质的数据元素的集合,是数据的一个子集。(有时候也
叫做属性。)
4. 数据结构:数据结构是相互之间存在一种或多种特定关系的数据元素的集合。
(1)数据的逻辑结构:数据的逻辑结构是指数据元素之间存在的固有逻辑关系,常称为数
据结构。
数据的逻辑结构是从数据元素之间存在的逻辑关系上描述数据与数据的存储无关,是
独立于计算机的。
依据数据元素之间的关系,可以把数据的逻辑结构分成以下几种:
6.算法与程序:
(1)算法的 5 个特性
1、 输入:有零个或多个输入
2、 输出:有一个或多个输出
3、有穷性:要求序列中的指令是有限的;每条指令的执行包含有限的工作量;整个指令序
列的执行在有限的时间内结束。(程序与算法的区别在于,程序不需要有有穷性)
4、确定性:算法中的每一个步骤都必须是确定的,而不应当含糊、模棱两可。没有歧义。
5、可行性:算法中的每一个步骤都应当能被有效的执行,并得到确定的结果。
(2).算法设计的要求:
1、正确性(达到预期效果,满足问题需求)
2、健壮性(能处理合法数据,也能对不合法的数据作出反应,不会产生不
可预期的后果)
3、可读性(要求算法易于理解,便于分析)
4、可修改可扩展性
5、高效率(较好的时空性能 )
补充内容:
1、名词解释:数据结构、二元组
数据结构就是相互之间存在一种或多种特定关系的数据元素的集合。
二元组就是一种用来表示某个数据对象以及各个元素之间关系的有限集合。
2、根据数据元素之间关系的不同,数据的逻辑结构可以分为集合、线性结构、树形结构和
图状结构四种类型。
3、常见的数据存储结构一般有两种类型,它们分别是顺序存储结构、链式存储结构
6.在一般情况下,一个算法的时间复杂度是问题规模的函数
7.常见时间复杂度有:常数阶 O(1)、线性阶 O(n)、对数阶 O(log 2 n)、平方阶 O(n^2)、
指数阶 O(2^n)。通常认为,具有常数阶量级的算法是好算法,而具有指数阶量级的算法是
差算法。
定义: 线性表是 n 个数据元素的有限序列。 一个数据元素可由若干个 数据项组成。
*
)malloc(sizeof(struct student));typedef int datatype; //结点数据类型,假设为 int
typedef struct node { //结点结构
datatype data;
struct node *next; //双向链表还应加上*previous
} Lnode, * pointer ; //结点类型,结点指针类型
typedef pointer lklist; //单链表类型,即头指针类型
//1.初始化:
lklist initlist() {
pointer head;
head=new node;//这是 C++做法
//head=( pointer)malloc(sizeof(Lnode)); 这是 C 语言做法
head->next=NULL; //循环链表则是 head->next=head;
//双向链表应加上 head->previos=NULL;
return head;
}
//2.插入:(C 语言中需要把 head 转化为全局变量才能实现此程序)
int insert(lklist head,datatype x,int i){
pointer q,s;
q=get(head,i-1); //找第 i-1 个点
if(q==NULL) //无第 i-1 点,即 i<1 或 i>n+1 时
{
cout<<”非法插入位置!\n”; //这是 C++做法,即 C 语言中的 printf(“非法插入位置!\n”);
return 0;
}
s=new node;//生成新结点 即 C 语言中的 s=( pointer)malloc(sizeof(Lnode));
s->data=x;
s->next=q->next; //新点的后继是原第 i 个点
q->next=s; //原第 i-1 个点的后继是新点
return 1; //插入成功
}
//3.删除:(C 语言中需要把 head 转化为全局变量才能实现此程序)
int delete(lklist head,int i) {
pointer p,q;
q=get(head,i-1); //找待删点的直接前趋
if(q==NULL || q->next==NULL) //即 i<1 或 i>n 时
{cout<<”非法删除位置!\n”;return 0;}
p=q->next; //保存待删点地址
q->next=p->next; //修改前趋的后继指针
delete p; //释放结点 即 C 语言中的 free(p);
return 1; //删除成功
定义:限定仅在表尾进行插入或删除操作的线性表。
结构:
typedef struct list{
int listsize; //栈的容量
struct list *head; //栈顶指针
struct list *base; //栈底指针
}
// 初始化栈
Status InitStack(SqStack *S) {
// 分配初始空间
S->base = (ElemType *) malloc(Stack_Init_Size * sizeof(ElemType));
if (!S->base) {
exit(0);
}
S->top = S->base; /// 栈顶与栈底相同
S->stack_size = Stack_Init_Size; // 栈的最大长度等于初始长度
return 1;
}
// 判断栈是否为空,只需要判断栈顶指针与栈底指针是否相同即可
Status EmptyStack(SqStack *S) {
return S->base == S->top;
}
// 获取栈的实际长度,栈顶减去栈底指针即为栈的长度
Status LengthStack(SqStack *S) {
if (S->top == S->base) {
return 0;
}
return (Status) (S->top - S->base);
}
// 获取栈顶的元素,参数e用来存放栈顶的元素
Status GetTopStack(SqStack *S, ElemType *e) {
if (S->top == S->base) {
return 0;
}
*e = *(S->top - 1);
return 1;
}
// 进栈,参数e是要进栈的元素
Status PushStack(SqStack *S, ElemType e) {
// 若栈的最大长度不会够用时,重新开辟,增大长度
if (S->top - S->base >= S->stack_size) {
S->base = (ElemType *)realloc(S->base, (S->stack_size + StackIncrement) * sizeof(ElemType));
if (!S->base) {
return 0;
}
// 栈顶指针为栈底指针加上栈之前的最大长度
S->top = S->base + S->stack_size;
// 栈当前的最大长度等于栈之前的最大长度与增加的长度之和
S->stack_size += StackIncrement;
}
*S->top++ = e; // 先赋值,后栈顶指针上移
return 1;
}
// 出栈,参数e用来存放出栈的元素
Status PopStack(SqStack *S, ElemType *e) {
if (S->base == S->top) {
return 0;
}
*e = *--S->top; // 栈顶指针先下移,后赋值
return 1;
}
// 销毁栈,释放栈空间,栈顶栈底指针置为NULL,长度置为0
Status DestroyStack(SqStack *S) {
free(S->base);
S->base = S->top = NULL;
S->stack_size = 0;
return 1;
}
// 遍历栈,依次打印每个元素
Status StackTraverse(SqStack *S) {
ElemType *p;
if (S->top == S->base) {
printf("Stack is NULL.\n");
return 0;
}
p = S->top;
// 由栈顶依次向下遍历
while (p > S->base) {
p--;
printf("%d ", *p);
}
printf("\n");
return 1;
}
(3) 链栈操作算法
结构:
typedef struct StackNode{
ElemType data;
struct StackNode *next;
}StackNode, *LinkStack;
初始化:
Status InitStack(LinkStack &S){
//构造一个空栈,栈顶指针置为空
S = NULL;
return OK;
}
入栈:
Status Push(LinkStack &S,ElemType e){
LinkStack p;//定义p
p=new StackNode;//生成新结点
p->data=e;//e赋给新结点的数据域
p->next=S; //新结点插入栈顶
S=p;//修改栈顶指针为p
return OK;
}
出栈:
Status Pop(LinkStack &S,ElemType &e){
LinkStack p;//定义p
if(S==NULL) return ERROR;//栈空
e=S->data;//将栈顶元素赋给e
p=S;//p临时保存栈顶元素以备释放
S=S->next;//修改栈顶指针
delete p;//释放空间
return OK;
}
定义:只允许在表的一端进行插入,而在另一端删除元素。
补充内容:
1、一个栈的入栈序列为“ABCDE”,则以下不可能的出栈序列是(B)
A. BCDAE B. EDACB C. BCADE D. AEDCB
2、栈的顺序表示中,用 TOP 表示栈顶元素,那么栈空的条件是(D)
A. TOPSTACKSIZE B. TOP1 C. TOP0 D. TOP-1
3、允许在一端插入,在另一端删除的线性表称为队列。插入的一端为表头,删除的一端为
表尾。
4、栈的特点是先进后出,队列的特点是先进先出。
5、对于栈和队列,无论他们采用顺序存储结构还是链式存储结构,进行插入和删除操作的
时间复杂度都是 O(1)(即与已有元素 N 无关)。
6、已知链栈 Q,编写函数判断栈空,如果栈空则进行入栈操作,否则出栈并输出。(要求判
断栈空、出栈、入栈用函数实现)(详看考点 2)
7.出队与取队头元素的区别:出队就是删除对头的数据元素,取队头元素是获取对头的数据
元素值,不需要删除。
8.链栈与顺序栈相比,比较明显的优点是:(D)
A.插入操作比较容易 B.删除操作比较容易
C.不会出现栈空的情况 D.不会出现栈满的情况
考点 1:队列的编程:
结构:
typedef struct QNode{
int date;
struct QNode *next;
}QNode,*QueuePtr;
typedef struct{
QueuePtr front;
QueuePtr rear;
}LinkQueue;
创建:
LinkQueue InitQueue(LinkQueue Q)
{
Q.front=Q.rear=(QueuePtr)malloc(sizeof(QNode));
Q.front->next=NULL;
return (Q);
}
入队:
LinkQueue EnQueue(LinkQueue Q,int e)
{
QueuePtr p;
p=(QueuePtr)malloc(sizeof(QNode));
p->date=e;
p->next=NULL;
Q.rear->next=p;
Q.rear=p;
return (Q);
}
出队:
LinkQueue DeQueue(LinkQueue Q)
{
int e;
QueuePtr p;
p=Q.front->next;
e=p->date;
Q.front=p->next;
printf("%d",e);
if(Q.rear==p)Q.rear=Q.front=NULL;
free(p);
return (Q);
}
考点 2:栈的编程:
上述已有具体实现代码
1.串是由零个或多个字符组成的有限序列
2.串的赋值:x=’abc’;或 x[ ]=’abc’;
补充内容:
三元组:
结构:
typedef struct{
int i,j; //元素行下标及列下标
int e; //元素值
}Triple;
typedef struct{
int mu,nu,tu; //矩阵的行数、列数、非零元素个数
Triple data[MAXSIZE+1]; //矩阵包含的三元组表,data[0]未用
}TSMatrix;
十字链表:
typedef struct OLNode{
int i,j; //元素行下标及列下标
int e; //元素值
struct OLNode *right,*down; //行的后继以及列的后继
} OLNode,*OLink;
typedef struct{
int mu,nu,tu; //矩阵的行数、列数、非零元素个数
OLink *rhead,*chead; //行和列的表头指针组的首地址
}CrossList;
CrossList Creat(CrossList M){
int m,n,t;
scanf(“%d%d%d”,&m,&n,&t);
M.mu=m;M.nu=n;M.tu=t;
M.rhead=( OLink *)malloc((m+1)*sizeof(OLink)); //开辟行表头指针组
M.chead=( OLink *)malloc((n+1)*sizeof(OLink)); //开辟行列头指针组
M.rhead[]=M.chead[]=NULL; //初始化
…… //接下来就是赋值和入链
}
(1) 树的概念及术语
树 :n(n≥0)个结点的有限集合。当 n=0 时,称为空树;任意一棵非空树满足以下条件:
⑴ 有且仅有一个特定的称为根的结点;
⑵ 当 n>1 时,除根结点之外的其余结点被分成 m(m>0)个互不相交的有限集合
T1,T2,… ,Tm,其中每个集合又是一棵树,并称为这个根结点的子树。
(2) 结点的度: 结点所拥有的子树的个数。
树的度:树中所有结点的度的最大值。
(3) 叶子结点: 度为 0 的结点,也称为终端结点。
分支结点:度不为 0 的结点,也称为非终端结点。
(4)孩子、双亲 :树中某结点的子树的根结点称为这个结点的孩子结点,这个结点称为它
孩子结点的双亲结点;
兄弟: 具有同一个双亲的孩子结点互称为兄弟。
(5)路径: 如果树的结点序列 n1, n2, …, nk 有如下关系:结点 ni 是 ni+1 的双亲(1<=i
(6)祖先、子孙: 在树中,如果有一条路径从结点 x 到结点 y,那么 x 就称为 y 的祖先,
而 y 称为 x 的子孙。
(7)结点所在层数: 根结点的层数为 1;对其余任何结点,若某结点在第 k 层,则其孩子
结点在第 k+1 层。
树的深度: 树中所有结点的最大层数,也称高度。
(8)层序编号: 将树中结点按照从上层到下层、同层从左到右的次序依次给他们编以从 1
开始的连续自然数。
(9)有序树、无序树: 如果一棵树中结点的各子树从左到右是有次序的,称这棵树为有序
树;反之,称为无序树。数据结构中讨论的一般都是有序树
(10) 树通常有前序(根)遍历、后序(根)遍历和层序(次)遍历三种方式(树,
不是二叉树,没中序遍历。)
(1)二叉树的定义:二叉树是 n(n≥0)个结点的有限集合,该集合或者为空集(称为空
二叉树),或者由一个根结点和两棵互不相交的、分别称为根结点的左子树和右子树的二叉
树组成。
满二叉树:在一棵二叉树中,如果所有分支结点都存在左子树和右子树,并且所有叶子都在
同一层上。
(满二叉树的特点:叶子只能出现在最下一层;只有度为 0 和度为 2 的结点。)
完全二叉树:对一棵具有 n 个结点的二叉树按层序编号,如果编号为 i(1≤i≤n)的结点与
同样深度的满二叉树中编号为 i 的结点在二叉树中的位置完全相同。
完全二叉树的特点:
1.在满二叉树中,从最后一个结点开始,连续去掉任意个结点,即是一棵完全二叉树。
2.叶子结点只能出现在最下两层,且最下层的叶子结点都集中在二叉树的左部;
3. 完全二叉树中如果有度为 1 的结点,只可能有一个,且该结点只有左孩子。
4. 深度为 k 的完全二叉树在 k-1 层上一定是满二叉树。
(2)二叉树的性质:
性质 1:二叉树的第 i 层上最多有 2i-1 个结点(i≥1)。
性质 2: 一棵深度为 k 的二叉树中,最多有 2k-1 个结点,最少有 k 个结点。深度为 k
且具有 2k-1 个结点的二叉树一定是满二叉树
性质 3:在一棵二叉树中,如果叶子结点数为 n0,度为 2 的结点数为 n2,则有: n0=n2
+1。(一个结点的度就是指它放出的射线)
性质 4:具有 n 个结点的完全二叉树的深度为 log2n +1。
性质 5: 对一棵具有 n 个结点的完全二叉树中从 1 开始按层序编号,则对于任意的序
号为 i(1≤i≤n)的结点(简称为结点 i),有:
(1)如果 i>1,则结点 i 的双亲结点的序号为 i/2;如果 i=1,则结点 i 是根结点,无双
亲结点。
(2)如果 2i≤n,则结点 i 的左孩子的序号为 2i;如果 2i>n,则结点 i 无左孩子。
(3)如果 2i+1≤n,则结点 i 的右孩子的序号为 2i+1;如果 2i+1>n,则结点 i 无右孩子。
(1) 先序遍历
void XianXu(BiTree T){
if(T){
printf("%c",T->data); //先访问
XianXu(T->lchild); //再继续遍历
XianXu(T->rchild);
}
}
(2) 中序遍历
(3) 后序遍历
(1)同级以左为亲,即左一结点的右孩子是与它同级的右一结点
(2)只认最左路线为亲子路线,即结点的左孩子是它下一级结点的最左的元素
(1)哈夫曼树的基本概念:
哈夫曼树:给定一组具有确定权值的叶子结点, 带权路径长度最小的二叉树。
(2)哈夫曼树的特点:
1、已知一棵完全二叉树有 47 个结点,则该二叉树有(C)个叶子结点。
A. 6 B. 12 C. 24 D.48
解法如下:
1+2+4+8+16=31 计算从第一层到 n-1 层的结点个数
47-31=16 计算第 n 层的叶子结点个数
16-16/2=8 计算第 n-1 层的叶子结点个数
所以,叶子结点数=16+8=24 计算第 n 层和第 n-1 层的总叶子结点数
2、已知遍历一棵二叉树的前序序列 ABCDEFG 和中序序列 CBEDAFG,那么是下面哪棵树
(C )。
C 图如下:
A
↙ ↘
B F
↙ ↘ ↘
C D G
↙
E
4、完全二叉树必须满足的条件为: :一棵具有 n 个结点的二叉树,它的结构与满二叉树的
前 n 个结点的的结构相同。
5、哈夫曼树不存在度为 1 的结点。
6、有 5 个带权结点,其权值分别为 2,5,3,7,11,根据哈夫曼算法构建该树,并计算该
树的带权路径长度。(构建哈夫曼树,很简单,从小开始,计算相加,然后把所有叶子结点
乘以等级数字然后相加。也即是:带权路径长度=叶结点的权值*路径长度)
7.试找出分别满足下列条件的所有二叉树:
⑴ 前序序列和中序序列相同:只有右子树
⑵ 中序序列和后序序列相同:只有左子树
⑶ 前序序列和后序序列相同:只有根,空二叉树
图的结点之间的关系可以是任意的,图中任意两个数据元素之间都可能相关。
设图有 n 个顶点,则:
有 1/2 n(n-1)条边的无向图称为 完全图
有 n(n-1)条弧的有向图称为 有向完全图
元素被多少条弧的箭头所指,它的 入度就为多少;反之,出度。
第一个顶点和最后一个顶点相同的路径叫做 回路或环 环
顶点不重复出现的路径叫 简单路径
若图中任意两个顶点之间存在路径(不一定是直接相连),则称作 连通图。
.
W i,j
邻接矩阵的定义: A[i][j]={
0 即 VR 中不存在
(1)深度优先遍历
步骤:1.从任意顶点开始访问。
2.访问后把该元素对应的访问标志赋值为 1 表示已访问该数据元素
3.寻找与其有关未被访问的所有邻接顶点,并从该顶点开始进行访问
4. 重复 2、3 步骤直到该连通图的所有顶点均已访问完毕
(2)广度优先遍历
步骤:1.从任意顶点开始访问。
2.访问后把该元素对应的访问标志赋值为 1 表示已访问该数据元素
3.寻找与其有关未被访问的邻接顶点,并按顺序入列直到所有邻接顶点均
已访问完毕
4.把最先入列的顶点出列,以它为顶点开始访问
5. 重复 2、3、4 步骤直到该连通图的所有顶点均已访问完毕
查找表
是由同一类型的数据元素(或记录)构成的集合
对查找表的操作有:
(1) 查询某个“特定的”数据元素是否在查找表中;
(2) 检索某个“特定的”数据元素的各种属性
(3) 在查找表中插入一个数据元素;
(4) 从查找表中删去某个特定元素
静态查找表
只进行前两种“查找”操作的查找表为静态查找表
动态查找表
若在查找过程中同时插入查找表中不存在的数据元素,或者从查找表中删除已存在的某
个数据元素,则成为动态查找表
排序
其功能是将一个数据元素(或记录)的任意序列,重新排列成一个按关键字有序的序列。