一.计算机组成与体系结构(上午场6分左右)
1.数据的表示
R-10进制转换:按权展开。
10-R进制转换:短除法。
原反补移码表示
数值表示范围
浮点数运算
2.计算机体系结构
CPU组成:运算器与控制器
3.Flynn分类:4种
4.CISC(复杂)与RISC(简单)的区分和比较
5.流水线的概念与计算:
1条指令执行时间+(指令条数-1)*流水线周期
分为理论与实践两种方式,考试时看情况选用。
吞吐率计算:
TP=指令条数/流水线执行时间
最大吞吐率:
TPmax=1/▲t(忽略流水线建立时间,即流水线形成后的吞吐率)
流水线加速比:S=不使用流水线时间/使用流水线时间
流水线效率:E=n个任务所占的时空区/k个流水段的总的时空区=T(0)/kT(k)
6.层次化存储结构:速度慢——>快:外存(U盘等)—内存—Cache—CPU(寄存器)。
Cache功能:提高CPU数据输入输出的速率,
在计算机存储系统体系中,Cache是访问速度最快的层次(按内容存取) 考试时有寄存器选寄存器
Cache提高性能的依据是 局部性原理
引入Cache后存取的平均周期t3计算:t3=h*t1+(1-h)*t2
h为对Cache的访问命中率,t1为Cache周期时间,t2为主存储器周期时间。
局部性原理:时间,空间,工作集理论。
主存:随机存取存储器(RAM),只读存储器(ROM)。
编址的相关计算。
磁盘结构与参数
存取时间=寻道时间+等待时间(平均定位时间+转动延迟)
7.总线:内部总线,系统总线,外部总线
系统总线:分为 数据总线(传输数据),地址总线(内存大小,2的多少次方),控制总线(发送相应控制信号))
8.串并联系统可靠度计算:
串联:一个失效则失效
可靠度:R=R1*R2*R3*...*Rn
失效率r=r1+r2+r3+...+rn(子系统多且失效率极低时用来估算)
并联:全部失效才失效
可靠度:R=1-(1-R1)*(1-R2)*...*(1-Rn)
失效率r=1-R
9.校验码
差错控制:检错与纠错
检错:检测e个误码,要求最小码距为e+1
纠错:纠正t个误码,最小码距2t+1
循环校验码CRC:可检错不可纠错
模2除法运算(异或)
海明校验码(难点,重点):
2^r>=n+r+1 (r是校验码个数,n是信息个数)
二.操作系统基本原理(5-7分,较重要)
1.操作系统概念
管理整个系统的软硬件资源,控制程序运行,人机接口,软硬件接口
操作系统管理职能:进程管理,存储管理,文件管理,作业管理(略),设备管理(略),微内核操作系统(附)
进程管理
三态模型:分为运行,就绪,等待三种状态
运行态:全准备好了
就绪态:只差CPU
等待态:缺CPU+某些资源
五态模型:运行,活跃就绪,活跃阻塞(对应三态模型),静止就绪,静止阻塞。
关键:挂起操作
前驱图
进程的同步与互斥
*PV操作(难,应用灵活)
临界资源(互斥方式共享的资源),临界区(代码段),信号量(特殊的变量)
死锁问题:多个进程死锁会造成系统死锁
计算多少资源不会造成死锁:k*(n-1)+1 k是进程数,n是各进程需要的资源数
死锁问题四大条件:互斥,保持和等待,不剥夺,环路等待
死锁的预防:打破四大条件
死锁的避免:有序资源分配法,银行家算法(考的多)
银行家算法:要求会用
存储管理:
分区存储组织:
分配空间:首次适应法,最佳适应法,最差适应法,循环首次适应法。
页式存储组织:(易考逻辑地址与物理地址的转换)
优点:利用率高,碎片小,分配及管理简单
缺点:增加系统开销,可能产生抖动现象
段式存储组织:
优点:多道程序共享内存,各段程序修改互不影响
缺点:内存利用率低,内存碎片浪费大
段页式存储组织:
优点:空间浪费小,存储共享容易,存储保护容易,能动态连接
缺点:复杂性和开销增加,执行速度大大下降(先查段表再差页表)
块:一块小容量的相联存储器,由高缓组成,速度快。
页面置换算法:最优算法(OPT),随机算法(RAND),先进先出算法(FIFO)(重),最近最少使用算法(LRU)(重)
FIFO:可能产生“抖动”
LRU:不会抖动
做题特殊
文件管理:
索引文件结构:通常是13个节点的结构,分为直接索引(0-9),一级间接索引(10),二级间接索引(11),三级简介索引(12)
文件和树形目录结构:
文件属性;R只读文件属性,A存档属性,S系统文件,H隐藏文件
文件名的组成:驱动器号,路径,主文件名,扩展名。
绝对路径和相对路径
设备管理:
数据传输控制方式:主要讲内存和外设的数据传输控制问题
主要有 程序控制方式,程序中断方式,DMA方式,通道,输入输出处理机。(主要讲前三种)
程序控制:外设被动
中断:较主动,比控制优
DMA(直接存取控制方式):效率高很多
虚设备与SPOOLING技术:开辟了缓冲区,解决了外设低效的问题。(打印机排队打印)
微内核操作系统:
优势:可靠性,稳定性,安全性(见拍的图)
三.数据库系统
内容:数据库模式,ER模型,关系代数与元组演算,规范化理论,并发控制,数据库完整性约束,分布式数据库,数据仓库与数据挖掘。
三级模式-两级映射:
三级模式:
内模式(和物理层次数据库直接关联,主管数据的存放),
概念模式(表级别)
外模式(视图,灵活安全)
两级映射:
外模式-概念模式映射
概念模式-内模式映射
数据库设计:
需求分析:数据流图,数据字典,需求说明书
概念结构设计:做ER模型
逻辑结构设计:ER模式转成关系模式
物理设计
E-R模型:椭圆:属性
矩形:实体
菱形:联系
集成冲突问题:属性冲突,命名冲突,结构冲突
一个实体转换成一个关系模式
要求知道把某E-R图转为到少个关系模式。
关系代数:并,交,差,笛卡尔积,投影,选择,联结
并:重复的只显示一次
交:只显示公共部分
差:前者有但后者没有的
笛卡尔积:交叉组合
投影:选列
选择:选行
联结:重复列只写一次,一般符号下有条件,没写条件的是自然连接(相同字段做等值),
规范化理论:
函数依赖:部分函数依赖,传递函数依赖
部分:主键的一个部分就能确定某个属性
传递:A确定B,B确定C,推出A确定C(条件:B不能确定A)
价值与用途:
非规范化的关系模式可能存在以下问题:数据冗余,更新异常,插入异常,删除异常。
规范化理论就是用来解决这些问题的
键:超键(附),候选键,主键,外键
超键:唯一标识元组,可能存在冗余属性
候选键:唯一标识元组,不存在冗余属性
主键:候选键种任选一个
外键:用于关联查询
求候选键:
图示法:把关系用图表示,找出入度为0的节点,遍历,如果能遍历整个图则为候选键
如果没有入度为0的,找有入有出的
范式(必考)
1FN,2FN,3FN,BCFN。从低到高逐步优化,解决插入异常,删除异常,数据冗余。
1FN:属性值都是不可分的原子值
2FN:消除非主属性对候选键的部分依赖
3FN:消除非主属性对候选键的传递依赖
BCFN:消除主属性对候选键的传递依赖
模式分解:
保持函数依赖的分解;分解后不影响原有的函数依赖
无损分解:可以还原
并发控制:
事务:把多个操作封装起来,当成整体操作
原子性(不能拆分),一致性,隔离性(内部互不影响),持续性
并发概念:提高操作效率
并发问题:丢失更新,不可重复读问题,读“脏”数据
封锁协议:
一级封锁协议:事务在修改前必须先加X锁(写锁),可防止丢失更新
二级封锁协议:一级+S锁(读锁),读完后即可释放S锁,防止丢失更新和读“脏”数据,
三级封锁:一级+S锁,事务结束才可释放。防止丢失更新,防止读“脏”数据和防止数据重复读
两断锁:可串行化,可能发生死锁
死锁问题:预防法,死锁的解除法
数据库完整性约束:目的是提高数据的可靠性
实体完整性约束:给数据表定义主键,主键不能为空,不能重复。
参照完整性约束:外键,允许为空,控制不能乱输数据
用户自定义约束:设置属性的值要求
触发器:应对复杂要求,写脚本
数据库安全:
措施:用户标识和鉴定(身份认证),存取控制(对用户授权),密码存储和传输,视图的保护(对视图授权),审计(记录操作)
数据备份(重要):
冷备份(静态备份):数据库关闭时将文件复制下来,简单。不实用
热备份(动态备份):利用备份软件,在数据库正常运行时将文件备份下来,灵活,复杂。不能出错,后果严重。
完全备份:备份所有数据
差量备份:仅备份上一次完全备份后变化的数据
增量备份:备份上一次备份之后变化的数据(速度快但恢复麻烦)
静态海量转储,静态增量转储,动态海量转储,动态增量转储。
日志:针对数据库改变所做的记录。
数据库故障与恢复:
事物本身的可预期故障:本身逻辑问题。可在程序预先设置Rollback语句
事物本身的不可预期故障:算术溢出,违反存储保护。通过日志解决
系统故障:系统停止运转。使用检查点法
介质故障 :外存被破坏。使用日志重做
数据仓库与数据挖掘:
区分数据库和数据仓库:数据仓库是特殊的数据库,数据库面向应用,数据仓库面向主题。
数据仓库的数据一般不变,用于查询,统计等。
数据仓库:面向主题,集成的,相对稳定的,反映历史变化
数据仓库的建立过程:
1.数据源:从数据源里抽取,清理,装载,刷新数据
2.数据仓库:数据集市(部门级的数据仓库),整合好数据集市形成企业级的数据仓库
3.OLAP服务器(连接分析处理服务器):做分析处理工作(主要有查询工具,报表工具,分析工具,数据挖掘工具(挖掘人发现不了的信息)等)
数据挖掘方法分类:
方法:决策树,神经网络,遗传算法,关联规则挖掘算法
分类:关联分析,序列模式分析,分类分析,聚类分析。
反规范化:
因为过度规范化会使数据表过多,影响系统系统效率。思想是 用空间换时间
技术手段:增加派生性冗余列,增加冗余列,重新组表,分割表
大数据
对海量数据进行处理,数据量大,关系复杂
4V:数据量(Volume) 速度(Velocity) 多样性(Variety) 值(Value)
大数据处理系统应有的重要特征:高度可扩展性,高性能,高度容错,支持异构环境,较短的分析延迟,易用且开放的接口,较低成本,向下兼容性。
四.计算机网络:
OSI/RM七层模型:
1-7层:
物理层:二进制传输(中继器,集线器)
数据链路层:传送以帧为单位的信息(网桥,交换机,网卡,PPP)
网络层:分组传输和路由选择(三层交换机,路由器,IP)
传输层:端到端的连接(TCP,UDP)
会话层:建立,管理和终止会话
表示层:数据的格式与表达,加密,压缩 (五六七层主要设备:POP3,FTP,HTTP,Telnet等)
应用层:实现具体的应用功能
网络技术标准与协议:
TCP/IP协议:Internet,可扩展,可靠,应用最广,牺牲速度和效率
IPX/SPX协议:NOVELL,路由,大型企业网
NETBEUI协议:IBM,非路由,快速
TCP协议:三次握手
DHCP:IP地址的动态分配
DNS协议:域名和IP地址的转换。方法:递归(间接),迭代(直接)
SNMP协议:简单网络管理
FTP与TFTP:前者可靠,后者不可靠
计算机网络分类-拓扑结构:
按分布范围分:局域网,城域网,广域网,因特网
按拓扑结构分:总线型,星型(存在单点故障的问题问题),环型
网络规划与设计:
逻辑网络设计:核心步骤:IP地址方案,安全方案
物理网络设计:
分层设计(考的多):
接入层(底层 1层):向本地网段提供用户接入
汇聚层(中间层 多层):网络访问策略控制,数据包处理,过滤,寻址。
核心层(顶层 1层):数据交换
IP地址与子网划分:
IP地址:
1.IP V4:分ABCDE五类:
A类:前8位为网络号,后24位为主机号,所以地址数量为2的24次方-2个。全0和全1去掉。
B类:前16位为网络号,后16位为主机号,所以地址数量为2的16次方-2个。全0和全1去掉。
后面依次类推。
2.因为各类类范围变化太大,不好应用,故开发了子网划分技术
3.无分类编址:172.18.129.0/24 后面的/24表示前24为网络号
子网划分:
1.子网掩码:区分哪部分是网络号,哪部分为主机号
2.将一个网络划分成多个子网(取部分主机号当网络号)
3.将多个网络合并成一个大的网络(取部分网络号当主机号)
要求会求子网掩码。
无分类编址:
特殊含义的IP地址:
127网段:回播地址
网络号全0地址:当前子网中的主机
全1地址:本地子网的广播
主机号全1地址:特定子网的广播
10.0.0.0/8:10.0.0.1至10.255.255.254
还有两个类似的,用于局域网,因为国内IP地址不足
169.254.0.0:保留地址,用于DHCP失效(Win)
0.0.0.0:保留地址,用于DHCP失效(Linux)
这两个用于搪塞,是无法上网的
HTML:web开发环境中常用的基础技术,是一种标签语言。一系列标签的使用。
无线网:优势:移动性,灵活性,成本低,容易扩充
分为 无线局域网(比如wifi),无线城域网(比如WiMax),无线广域网(比如4G),无线个人网(范围最小。比如蓝牙)
网络接入技术:
3G:WCDMA(应用最广) CDMA2000 TD-SCDMA
4G:LTE-Advanced(主要) WirelessMAN-Advanced
IPV6:替代IPV4的下一代IP协议
1.地址长度为128位,比IPV4多了96位,所以地址空间增大了2的96次方倍。可解决IP地址不够用的问题
2.灵活的IP报文头格式
3.简化报文头部格式,提高了吞吐量
4.提高安全性
5.支持更多服务类型
6.允许协议继续演变
地址分为:
单播地址:用于单个接口的标识符
任播地址:一组接口的标识符,对应IPV4的广播地址
组播地址:与IPV4的组播类似
系统安全分析与设计
信息系统安全属性:
安全性:保密性(最小授权原则),完整性(安全协议,校验码等),可用性(综合保障),不可抵赖性(数字签名)
对称加密技术:加密和解密的密钥是一样的,优点:速度快。缺陷:加密强度不高,密钥分发困难
常见的有:DES(替换加位移,56位密钥),3DES(两个56位密钥),AES,RC-5,IDEA等
非对称加密技术:加密和解密的密钥不一样(公钥,私钥),缺陷是加密速度慢,不适合加密大信息量的数据
常见有:RSA(512位或1024位),Elgamal(基础是D-H),ECC(椭圆曲线算法),背包算法,Rabin,D-H。
信息摘要:一段信息的特征值,会根据信息改变,用于验证原信息的正确性和完整性。
常见信息摘要算法有MD5,SHA等,SHA安全性高些。
摘要具有一定破坏性,不可还原为原信息。因为算法采用的是单向散列函数(单向Hash函数),固定长度的散列值。
数字签名:防抵赖
数字信封与PGP:
数字信封:将原文用对称密钥加密传输,将对称密钥用接收方公钥加密发送给对方,则只有指定的对方才能解密查看原文。
PGP:可用于电子邮件,云盘等。
承认两种证书格式:PGP证书,X。509证书
要求会设计加密系统:用到加密技术,摘要数字签名,数字信封等知识。
网络安全-各个网络层次的安全保障
物理层:隔离,屏蔽
数据链路层:链路加密,PPTP,L2TP
网络层:防火墙,IPSec
传输层:TLS,SET,SSL
应用,表示,会话层:PGP,Https,SSL
网络安全-网络威胁与攻击
详情见图片
重放攻击(ARP),拒绝服务(DOS),窃听,业务流分析,信息泄露,破坏信息的完整性,非授权访问。
假冒,旁路控制,授权侵犯,特洛伊木马,陷阱门,抵赖
网络安全-防火墙
防火墙:
网络级(较简单):
包过滤
状态检测
应用级(复杂):
双穴主机(略)
屏蔽主机(略)
屏蔽子网(主):最安全
五.数据结构与算法基础(上下午都考)
内容包括:数组与矩阵,线性表(重),广义表,树与二叉树(重),图,排序与查找(重),算法基础及常见的算法(重要)
数组:
求存储地址:一维:a[n]:a+i*len
二维:a[m][n]:按行:a+(i*n+j)*len
按列:a+(j*m+i)*len
稀疏矩阵:做题代入法快速解决
数据结构的定义:
概念:计算机存储以及组织数据的方式
数据逻辑结构:线性结构,非线性结构(树,图)
线性表:
顺序表:连续的空间,一维数组的方式存信息
链表:分为单链表,循环链表,双向链表
空间不一定连续,用指针连接。
链表基本操作:单,双链表删除结点:
单,双链表插入结点:
双的操作一般不考,原理和单的一样。都是靠修改指针。
头结点为空方便操作。
顺序存储与链式存储:
空间:存储密度:顺序存储更优。容量分配:链式更优
时间:查找运算:都为O(n/2),读运算:顺序优,插入运算和删除运算:链式更优
队列与栈(必考):
队列:先进先出
栈:先进后出
循环队列:队列的头尾相接,队空条件:head=tail 队满条件:(tail+1)%size=head
要会分析各种可能出现的出入顺序。
广义表: 如:LS=(a0,a1,(a3,a4),a5)
是n个表组成的有限序列,是线性表的推广。通常以递归的形式定义。
长度:最外层包含的元素数,深度:括号的重数.
基本运算:取表头head和取表尾tail。
表头:第一个元素 表尾:除第一个元素外所有元素。
树与二叉树:
概念:结点的度,树的度,叶子结点,分支结点,内部结点,父结点,子结点,兄弟结点,层次。
满二叉树:没有缺失的部分。
完全二叉树:按从左到右的顺序没有缺失。
二叉树的重要特性:见图。
二叉树遍历:
前序遍历:根,左子树,右子树
中序遍历:左子树,根,右子树
后序遍历:左子树,右子树,根
层次遍历:从上至下一层一层。
反向构造二叉树:告诉你遍历序列,构造二叉树。
树转二叉树:孩子结点-左子树结点。 兄弟结点-右子树结点。
查找二叉树:所有左结点小于根节点,右结点大于根节点的树叫做查找二叉树(排序二叉树)
方便查询,插入和删除比较复杂。
最优二叉树(哈夫曼树):
树的路径长度:需要几根线到达
权:数值
带权路径长度:长度*权
树的带权路径长度:所有带权路径长度相加
哈夫曼树条件:让树的带权路径长度最小。(只算叶子结点)
要求会构造。
线索二叉树:利用叶子结点上空闲的指针,使遍历方便。
也分前序中序后序。
要求会画出线索(虚线)
平衡二叉树:任意结点的左右子树深度相差不超过1。每结点的平衡度只能为-1,0,1。
图:
完全图:无向图,有向图。
邻接矩阵:i到j有邻接边则为1,无则为0
邻接表:
图的遍历:
深度优先:类似前序遍历
广度优先:
拓扑排序:一步步解除约束条件
图的最小生成树:普利姆算法(红蓝点),克鲁斯塔尔算法(最小边一个个选)
不允许形成环。
算法基础:
算法的特性:有穷性(有穷步骤),确定性(每条指令又确切含义),输入(>=0),输出(>=1),有效性(每个步骤能有效执行并得到确定的结果)。
算法的复杂度:时间复杂度,空间复杂度。
时间复杂度:0(1)<0(log2 n)<0(n)<0(nlog2 n)<0(n平方)<0(n立方)<0(2的n次方)
空间复杂度:算法运行过程中临时占用存储空间大小的度量。
查找:
顺序查找:效率较低,时间复杂度:0(n)
二分查找:不断寻找中间点。条件:查找的内容是有序排列的。
注意:1.二分时下标为小数需进行取整操作,而不是四舍五入,如:[6.5]=6
2.确定下一步范围时需舍弃上一步的中点,因为已经排除。
时间复杂度:O(log2 n)
散列表:类似按内容存储,利用散列函数存储,如果被占则依次后移,解决冲突办法:线性探测发,伪随机数法
排序(必考):
概念:稳定与不稳定排序,内排序与外排序
排序方法:插入类排序:直接插入排序,希尔排序
交换类排序:冒泡排序,快速排序
选择类排序:简单选择排序,堆排序
归并排序
基数排序
直接插入排序:原本队列已经有序,从头至尾一个个比较,速度慢
希尔排序:属于插入排序,先分组,然后组内直接插入排序。即先大概分,然后细分。
直接选择排序:选最小的与最前面没安排位置的数交换
堆排序:
堆的概念(类似完全二叉树):大顶堆(所有根结点比子结点小),小顶堆(所有根结点比子结点大)。
有序列:{k0,k1k2....ki}
大:ki<=k2i且ki<=k2i+1
小:ki>=k2i且ki>=k2i+1
堆排序的初建和重建过程
冒泡排序:相邻元素的比较和交换
快速排序:采用的是分治法,确定一个基准,把数列分为两部分,一部分比基准大,一部分比基准小,基准会在中间。再把部分继续分,依次下去即可完成排序
归并排序:将两个或两个以上的有序子表合并成一个新的有序表。
基数排序:借助多关键字排序思想,如排数把个位十位百位分批排。
排序算法的时间和空间复杂度及稳定性(几乎必考):见图
六.程序设计语言与语言处理程序基础:
内容:编译与解释,文法,正规式,有限自动机,表达式,传值与传址,多种程序语言特点。
正规式,表达式,传值与传址考的概率高。
编译过程:编译型,解释型。
编译型:源程序-词法分析-语法分析-语义分析-中间代码生成-中间代码优化-目标代码生成-目标程序。
文法:有0,1,2,3四种类型:0型:短语文法 1型:上下文有关文法 2型:上下文无关文法 3型:正规文法
有限自动机:M={S,∑, ,S0,Z}
∑是一个有穷字母表,它的每一个元素称为一个输入符号;
S是一个有限状态集,它的每一个元素称为一个状态;
是转换函数,是一个单值对照
S0,属于S,是一个唯一的初始状态;
是一个终止状态集。
题:给一个图和条件,找一条路从起点到终点。
正规式:有限自动机的另一种表达形式。
表达式:前缀后缀中缀表达式。
函数调用的传值与传址:
传值调用:形参取的是实参的值,形参的改变不会导致调用点所传的实参的值发生改变
传址(引用)调用:形参取的是实参的地址,即相当于实参存储单元的地址引用因此其值的改变同时就改变了实参的值。
各种程序语言的特点:见图
法律法规:
从试题考点分布角度可分为:保护期限,知识产权人确定,侵权判断
知识产权:著作权及邻接权,专利权,工业品外观设计权,商标权,地理标志权,集成电路布图设计权
保护期限:见图
知识产权人确定:见图
侵权判断(重):
中国公民,法人或者其他组织的作品,不论是否发表,都享有著作权
开发软件所用的思想,处理过程,操作方法或者数学概念不受保护。
见图。
标准化基础知识:
标准分类:国际标准,国家标准,区域标准,行业标准,地方标准,企业标准,项目规范
国家标准:GB-中国,ANSI-美国,BS-英国,JIS-日本
行业标准:GJB-中国军用标准
七.多媒体基础:多媒体技术基本概念,多媒体相关计算问题,常见多媒体标准,数据压缩技术
音频相关概念:声音的带宽(赫兹),人耳:20Hz-2000KHz
采样:采样频率,采样精度,频率应为声音最高频率2倍多一点点。
图像相关概念:亮度(越亮越白),色调(红绿,冷暖),饱和度(是否鲜艳)
彩色空间:RGB(主要),YUV(电视),CMY(印刷),HSV,光的三原色(红绿蓝)
媒体种类:
感觉媒体:视听触等等
表示媒体:文字图片动画音频等
显示媒体(表现媒体):表现和获取信息的物理设备(输入输出设备)
存储媒体:磁盘,光盘等
传输媒体:电缆,光缆等
多媒体的计算问题:
图像容量计算:像素*字节
像素:水平*垂直,如640*480
知道位数:则字节为位数/8
知道色数:2的k次方=色数 k为位数,然后求出字节。
音频容量计算:采样频率(Hz)*量化/采样位数*声道数/8
视频容量计算:每帧图像容量*每秒帧数*时间+音频容量*时间
常见多媒体标准:JPEG(最常见图片文件标准,有损,高压缩比),JPEG-2000(可无损)
MPEG-1(MP3),2(DVD),4(交互),7,21
数据压缩基础:
有冗余才有压缩
冗余:空间冗余(几何冗余),时间冗余,视觉冗余,信息熵冗余,结构冗余,知识冗余
有损压缩与无损压缩:
有损(熵编码法):无法还原为原来的样貌 如:图片JPG格式 常见:变换编码,预测编码
无损(冗余压缩法或熵编码法):可以还原 如:压缩包 常见:哈夫曼编码,行程编码,算术编码
八.软件工程:
软件开发模型:瀑布,演化,增量,螺旋,快速原型,喷泉,V
瀑布:结构化方法中的模型,适用于需求明确的项目。
原型:与瀑布互补,一般用于开发需求阶段。强调构造一个简易的系统,用于需求不明确的项目
演化模型:由原型演化而来成为最终产品
增量模型:原型思想+瀑布思想
螺旋模型:由多个模型组合
V模型:与瀑布相像,不过强调测试,边开发边测试。
喷泉模型:特点:面向对象。迭代,无间隙。
构建组装模型:提高了软件开发的复用性。提高可靠性
敏捷开发方法:短平快的会议,小型版本发布,较少的文档等等 适合做小型项目
信息系统开发方法:结构化法(用户至上,自顶向下,逐步分解,不灵活),原型法(需求不明确),面向对象方法(复用性),面向服务方法
需求分类与需求获取:
分类:业务需求,用户需求,系统需求。
结构化设计:自顶向下逐步求精,信息隐蔽,模块独立(高内聚,低耦合,复杂度)
内聚,耦合的程度排序要记。
软件测试:
动态测试:黑盒白盒灰盒测试
静态测试(人工检查):桌前检查,代码走审,代码审查
测试用例设计:
黑盒:等价类划分,边界值分析,错误推测,因果图
白盒:基本路径测试,循环覆盖测试,逻辑覆盖测试
逻辑覆盖测试:语句,判定,条件,路径覆盖
测试阶段:单元测试,集成测试,确认测试,系统测试
McCabe复杂度:
计算有向图G的环路复杂度公式:V(G)=m-n+2
V(G)是有向图G中的环路个数,m是G中的有向弧数,n是G中的节点数。
系统运行与维护:
可维护性:易分析性,易改变性,稳定性,易测试性
维护类型:改正性维护,适应性维护,完善性维护,预防性维护。
软件过程改进-CMMI:
阶段式:成熟度,等级:已管理级,已定义级,定量管理级,优化级。
连续式:软件过程能力。过程管理,项目管理,工程,支持。
项目管理:
时间管理:Gantt图和PERT图。甘特图不能很好的表示任务之间的依赖关系,
风险管理:风险曝光度计算
面向对象
面向对象基本概念:对象,类,抽象,封装,继承与泛化,多态,接口,消息,组件,模式和复用
面向对象设计:
设计原则:单一职责原则,开放-封闭原则,李氏替换原则,依赖倒置原则,接口隔离原则,组合重用原则,迪米特原则。
UML(重):构造块,规则(略),公共机制(略)
构造块:事物,关系,图
关系:依赖,关联,泛化,实现
图:
结构图(静):类图,对象图,包图,组合结构图,构件图,部署图,制品图
行为图(动):用例图,顺序图,通信图,定时图,状态图,活动图,交互概览图
设计模式概念:
架构模式:反映了基本设计决策,如C/S架构
设计模式:主要关注软件系统的设计
惯用法:最低层的模式,关注软件系统的设计与实现
设计模式分类:创建型模式,结构型模式,行为型模式。
创建型模式:抽象工厂模式,构建器模式,工厂方法模式,原型模式,单例模式
结构型模式:适配器模式(转换接口),桥接模式(继承树拆分),组合模式(树形目录结构),装饰模式(附加职责),外观模式(对外统一接口)
行为型模式:职责链模式(传递职责),命令模式(日志记录,可撤销),中介者模式(不直接引用),状态模式(状态变成类),策略模式(多方案切换)
数据流图(DFD)(重)
数据流图基本概念,数据字典,数据平衡原则
一定要多做练习
数据流图基本概念:
元素:数据流(箭头),加工(圆形或圆角矩形),数据存储(两横线或缺一边的矩形),外部实体(矩形)。
数据流图的分层:顶层,*层,底层,自顶向下逐层分解。
数据字典:具体见图。
数据平衡原则:
父图子图平衡:找有没有缺失数据流
子图内平衡:只输入不输出称为 黑洞,只输出无输入称为 奇迹。
答题技巧:详细分析试题说明,利用数据平衡原则
九.数据库设计(必考):数据库设计过程,ER模型,答题技巧
数据库设计过程:需求分析:数据流图,数据字典,需求说明书
概念结构设计:ER模型
逻辑结构设计:关系模型
物理设计
ER模型:
对应关系有:1-1 1-n m-n
E-R图转成关系模型:实体和联系分别转换成关系,属性则转换成相应关系的属性。
1-1的:联系可以合并到任意一方
1-n的:联系只能合并到多的那一边
m-n的:联系必须单独成为一个关系模式
UML建模:
用例图,类图与对象图,顺序图,活动图,状态图,通信图,构件图。
用例图:
人形:参与者,圆圈:用例
关系:包含关系,扩展关系,泛化关系
类图与对象图:
填类名方法名属性名,填多重度,填关系
多重度:1,0...*,*,1..*
关系:依赖,范化,关联,聚合,组合,实现 (根据图标识别)
顺序图:特点:表现出处理事务时的时间顺序。
考消息和对象名。
活动图: 特点:表现整个处理流程的情况和状态
状态图:特点:状态的变迁
考:填缺失的状态和条件。
通信图:功能类似顺序图,结构不同,不太强调时间。
填缺失的对象和消息。
数据结构及算法应用
分治法,回溯法,贪心法,动态规划法。
分治法: