单选题2-6分。已阅第2小时和教程。
1. 操作系统(Operating System,OS)是计算机系统中的核心系统软件,负责管理和控制计算机系统中的软、硬件资源,合理地组织计算机工作流程和有效地利用资源,在计算机和用户之间起接口作用。
2. 操作系统的特征:并发性(concurrency)、共享性(sharing)、虚拟性(virtual)、不确定性(non-determinacy)。【并共虚不】
3. 操作系统的功能:进程管理、文件管理、存储管理、设备管理、作业管理。【五大管理:进文存设业】
4. 典型的操作系统:批处理操作系统、分时操作系统、实时操作系统、网络操作系统和分布式操作系统。
批处理操作系统
原理:把用户提交的作业分类、将一批中的作业编成一个作业执行序列。【用户作业分类,一批变一个】
分类:联机批处理和脱机批处理。
主要特征:用户脱机使用计算机、成批处理、多道程序运行。
分时操作系统
原理:采用分时技术,使多个用户同时以会话方式控制自己程序的运行,每个用户都感到似乎各各自有一台独立的、支持自己请求服务的系统。分时技术把处理机的运行时间分成很短的时间片,按时间片轮流把处理机分配给各联机作业使用。若某个作业在分配给它的时间片内不能完成其计算,则该作业暂时中断,把处理机让给另一个作业使用,等待下一轮时再继续运行。【处理机分片,时间片流转】
主要特征:交互性、多用户同时性、独立性。
实时操作系统
原理:实时操作系统往往是专用的,系统与应用很难分离,紧密结合在一起。实时操作系统不强调资源利用率,而更关心及时性(时间紧迫性)、可靠性和完整性。【专用、实时】
分类:实时过程控制和实时信息处理。
主要特征:提供即时响应、高可靠性。
网络操作系统
原理:按照网络架构的各个协议标准进行开发,包括网络管理、通信、资源共享、系统安全和多种网络应用服务等。在网络系统中,各计算机的操作可以互不相同,它需要有一个支持异种计算机系统之间进程通信的网络环境,以实现协同工作和应用集成。
主要特性:互操作性、协作处理。
分布式操作系统
分布式操作系统要求有一个统一的操作系统,实现系统操作的统一性,负责全系统的资源分配和调度,为用户提供统一的界面。它是一个逻辑上紧密耦合的系统。【和分布式应用是一个道理】
5. 进程概述
进程和程序的比较
进程是程序的一次执行,是一个动态的概念;而程序是静态的概念,是指令的集合,具有动态性和并发性。
程序是进程运行所对应的运行代码,一个进程对应于一个程序,一个程序可以同时对应多个进程。
进程的组成
在操作系统中,进程是进行系统资源分配、调度和管理的最小单位。
从静态的观点看,进程由程序、数据和进程控制块(Process Control Block,PCB)组成;从动态的观点看,进程是计算机状态的一个有序集合。
进程控制块(PCB)
PCB是进程存在的唯一标识,PCB描述了进程的基本情况。其内容可分为:
PCB随着进程的建立而产生,随着进程的完成而撤销。
6. 进程状态的划分
一个进程从创建而产生至撤销而消亡的整个生命周期,可以用一组状态加以刻画,为了便于管理进程,把进程划分为几种状态,分别有三态模型和五态模型。【三态模型与五态模型的区别在五态模型区分了在内存中还是在二级缓存中】
三态模型
三种状态:假设所有进程都在内存中,则可分为三种状态。
状态之间的转换:一个进程在创建后将处于就绪态。每个进程在执行过程中,任意时刻当且仅当处于上述三种状态之一。同时,在一个进程执行过程中,它的状态将会发生变化。如下图所示。运行状态的进程因出现等待事件而进入阻塞状态,当等待事件发生后,等待状态的进程就会进入就绪状态,根据处理器的调度策略使得进程在就绪状态与运行状态之间进行切换。
状态转换的原因:
五态模型
进程挂起的目的:实际使用中,进程不能总是全部都在内存中,有时需要将某些进程挂起,对换到磁盘镜像区中,使之暂时不参与进程调度,起到平滑系统操作负荷的目的。
五种状态:下图中给出了具有挂起进程功能的系统中的进程状态。静止就绪态表明进程具备运行条件但目前在二级存储器中(外存储器、外村、辅存)中,只有当它被对换到内存才能被调度执行。静止阻塞态则表明进程正在登台某一个事件且在二级存储其中。
状态转换的原因
7. 信号量与PV操作的概述
在操作系统中,进程之间经常会存在互斥(都需要共享独占性资源)和同步(完成异步的两个进程的协作)两种关系。为了有效地处理这两种情况,W.Dijkstra在1965年提出信号量和PV操作。
8. PV操作的理解
9. 利用PV操作实现进程的互斥控制
互斥控制是为了保护共享资源,不让多个进程同时访问这个共享资源,换句话说,就是阻止多个进程同时进入访问这些资源的代码段,这个代码段称之为临界区,在这种一次值允许一个进程访问的资源称为临界资源。
为了实现进程互斥地进入自己的临界区,代码可以写为:
P(信号量)
临界区
V(信号量)
由于只允许一个进程进入,信号量S的初始值应为1。S的值表示可以允许进入的进程数,当S<0时,其绝对值是等待使用临界资源的进程数,也就是等待队列中的进程数。而当一个进程从临界区出来后,会执行V操作(信号量S=S+1),如果等待队列中还有进程(S<=0),则调入一个新的进程进入(唤醒)。
10. 利用PV操作实现进程的同步控制
最简单的同步形式是进程A在另一个进程B到达L2以前,不应前进到超过点L1,这样就可以使用如下的程序:
进程A 进程B
... ...
L1:P(信号量) L2:V(信号量)
... ...
要确保进程B执行V操作之前,不让进程A的运行超过L1,就要设置信号量S的初值为0。这样,如果进程A先执行到L1,那么执行P操作后(S=S-1)后,S<0,则停止运行。直到进程B执行到L2时,执行V操作(S=S+1),唤醒A以继续执行。
11. 生产者-消费者问题
生产者-消费者是一个经典的问题,它不仅要解决生产者进程与消费者进程的同步关系,还要处理缓冲区的互斥关系,因此通常需要3个信号量来实现:
信号量 | 功能类型 | 功能说明 |
empty | 同步 | 说明空闲的缓冲区数量,因为程序开始时,缓冲区全部为空。所以,其初始值应为缓冲区的总个数 |
full | 同步 | 说明已经填充的缓冲区数量,因为冲虚开始,所有缓冲区都为空(未填充),所以,其初始值应为0 |
mutex | 互斥 | 保证同时只有一个进程在写缓冲区,因此,其初始值为1 |
12. 管程和线程
管程的组成部分:由管程名、局部子管程的变量说明、使用共享资源并在数据集上进程操作的若干过程,以及对变量赋初值的语句4个基本部分组成。
管程的执行过程:每一个管程管理一个临界资源。当有几个进程调用某管程时,仅允许一个进程进入管程,其它调用者必须等待。方法是通过调用特定的管程入口进入管程,然后通过管程中的一个过程使用临界资源。当某进程通过调用请求访问某临界资源而未能满足时,管程调用相应同步原语使该进程等待,并将它排在等待队列上。当使用临界资源的进程访问完该临界资源并释放之后,管程又调用相应的同步原语唤醒等待队列中的队首进程,为了表示不同的等待原因,设置条件变量,条件变量不能取任何值,只是一个队列栈。
线程是进程的活动成分,是处理器分配资源的最小单位,它可以共享进程的资源与地址空间,通过线程的活动,进程可以提供多种服务(对服务器进程而言)或实行子任务并行(对用户进程而言)。采用线程机制的最大优点是节省开销,创建时间短。
多线程系统:在多线程系统中,一个进程可以由一个或者多个线程构成,每个线程可以独立运行,一个进程的线程共享这个进程的地址空间。核心级线程和用户级线程以及二者的组合方式都可以实现多线程系统。多线程实现的并行避免了进程间并行的缺点:创建线程的开销要比创建进程的开销小,同一进程的线程共享进程的地址空间,所以线程切换(处理器调度)比进程切换快。
13. 死锁问题
定义:死锁是指多个进程之间相互等待对方的资源,而在得到对方资源之前又不释放自己的资源,造成循环等待的一种现象。如果一个进程在等待一个不可能发生的事件,则进程就死锁了。如果一个或多个进行产生死锁,就会造成系统死锁。
发生的必要条件:产生死锁的根本原因在于系统提供的资源个数少于并发进程所要求的资源数量。产生死锁有4个必要条件:
银行家算法:是指在分配资源之前先看清楚资源分配后是否会导致死锁。如果会死锁,就不分配;否则就分配。按照银行家算法的思想,当进程请求资源时,系统将按如下原则分配资源:
14. 存储管理
存储管理的主要任务:提高主存的利用率、扩充主存以及对主存信息实现有效保护。
存储管理的对象:主存储器(简称主存)。
逻辑地址和物理地址:用户编程所用到的地址称为逻辑地址(虚地址),而实际的内存地址则称为物理地址(实地址)。每次访问内存时都要进行逻辑地址到物理地址的转换,这种转换是由硬件完成的,而内存和外存间的信息动态调度是硬件和操作系统二者配合完成的。
地址重定位:程序的逻辑地址被转换成物理地址的过程。地址重定位有两种是:静态重定位和动态重定位。
常见的虚拟存储组织技术:分段技术、分页技术和段页式技术。
1. 基本概念
数据库(DataBase,DB):是指长期存储在计算机内的、有组织的、可共享的数据集合。
数据库系统(DataBase System,DBS):由数据库、硬件、软件和人员组成,管理的对象是数据。
数据库管理系统(DataBase Management System,DBMS):是一种操纵和管理数据库的大型软件,用于建立、使用和维护数据库。DBMS通常分成三类:关系数据库系统(RDBMS)、面向对象的数据库系统(OODBS)、对象关系数据库系统(ORDBS)。
数据库技术采用分级的方法,将数据库的结构划分为多个层次。最著名的是美国ANSI/SPARC数据库系统研究组与1975年提出的三级划分法。如下图所示,把数据库系统分为内模式、概念模式和外模式三个层次。其中,概念模式是数据库的中心和关键;内模式依赖于概念模式,独立于外模式和村塾设备;外模式面向具体的应用,独立于内模式和存储设备;应用程序依赖于外模式,独立于概念模式和内模式。
2. 数据库的结构
3. 常用的数据模型
概念数据模型:又称实体联系模型,它按照用户的观点来对数据和信息建模,主要用于数据库设计。概念模型主要用实体-联系方法(Entity-Relationship Approach)表示,简称E-R方法。
E-R模型简称E-R图,是描述概念世界、建立概念模型的实用工具。
E-R图的三个要素有:
基本数据模型:又称结构数据模型,是按照计算机系统的观点来对数据和信息建模,主要用于DBMS的实现。基本数据模型是数据库系统的核心和基础,通常由数据结构、数据操作和完整性约束三部分组成,其中数据结构是对系统静态特性的描述;数据操作是对系统动态特性的描述;完整性约束是一组完整性规则的集合。
面向对象模型:用面向对象观点来描述现实世界实体的逻辑组织、对象间键值、联系等的模型。一个面向对象数据库系统是一个持久的、可共享的对象库的存储和管理者,而一个对象库是由一个面向对象模型所定义的对象的集合体。面向对象数据库模式是类的集合,提供了一种类层次结构。在面向对象数据库模式中,一组类可以形成一个类层次,一个面向对象数据库可能有多个类层次。在一个类层次中,一个类继承其所有超类的全部属性、方法和消息。面向对象的数据库系统在逻辑上和物理上从面向记录上升为面向对象、面向可具有复杂结构的一个逻辑整体。允许用自然的方法,并结合数据抽象机制在结构和行为上对复杂对象建立模型,从而大幅度提高管理效率,降低用户使用复杂度。
4. 数据的规范化
函数依赖:设R(U)是属性U上的一个关系模式,X和Y是U的子集,r是R的一关系,如果对于r中的任意两个元素u和v,只要有u[X]=v[X],就有u[Y]=v[Y],则称X函数决定Y,或称Y函数依赖于X,记为X->Y。函数依赖是一种最重要、最基本的数据依赖,而关系数据库设计理论的核心就是数据间的函数依赖。
范式:
5. 事务管理
DBMS运行的基本工作单位是事务,事务是用户定义的一个数据库操作序列,这些操作序列要么全做,要么全不做,是一个不可分割的工作单位。
事务的4个特性(ACID):
事务的相关SQL:
6. 并发控制
并发控制:在多用户共享系统中,许多事务可能同时对同一数据进行操作,称为并发操作。此时数据库管理系统的并发控制子系统协调并发事务的执行,保证数据库的完整性不受破坏,同时避免用户得到不正确的数据。
封锁:并发控制的主要技术是封锁。封锁分为两类,分别是X封锁和S封锁。
X封锁,是排他型封锁,如果事务T对数据A(可以是数据项、记录、数据集以至整个数据库)实现了X封锁,那么只允许事务T读取和修改数据A,其它事务需要等事务T解除X封锁后,才能对数据A实现任何类型的封锁。
S封锁,是共享型锁,如果事务T对数据A实现了S封锁,那么允许事务T读取数据A,但不能修改数据A,在所有S封锁解除之前绝不允许任何事务对数据A实现X封锁。[其它事务呢?]
7. 数据库备份与恢复
数据库备份是指通过数据转储和监理日志文件的方法冗余数据,DBA定期地将整个数据库复制到磁盘上保存起来的过程。备份后的数据文本称为后备副本。
数据库恢复是指数据库从错误状态恢复到某一个已知的正确状态的功能。当数据库遭到破坏后,就可以利用后备副本把数据库恢复,这时数据库只能恢复到备份时的状态,从那以后的所有更新事务必须重新运行才能恢复到故障时的状态。
备份的分类:
数据库有4类故障:事务故障、系统故障、介质故障、计算机病毒。事务故障的恢复有两个操作:撤销事务(undo)和重做事务(redo)。介质故障的恢复由数据库管理员装入数据库的备份和日志文件副本,再由系统执行撤销和重做操作。
8. 数据库设计
数据库设计:对一个给定的应用环境,构造最优的数据库,建立数据库及其应用系统,使之能有效地存储数据,满足用户的各种需求。
数据库设计的特点:从数据结构(即数据模型)开始,并以之为核心开展;静态结构设计与动态行为设计分离;试探性;反复性和多步性。
数据库设计方法:直观设计法、规范设计法、计算机辅助设计法、自动化设计法。
数据库设计步骤:需求分析、概念结构设计、逻辑结构设计、物理结构设计、应用程序设计、运行维护。
9. 分布式数据库系统
分布式数据库系统(DDBS):针对地理上分散、而管理上又需要不同程度集中管理的需求,而提出的一种数据管理信息系统。
分布式数据库系统的特点:数据的集中控制性、数据独立性、数据冗余可控性、场地自治性、存取有效性。
分布式数据库的体系结构:全局外层、全局概念层、局部概念层、局部内层。
10. 商业智能
商业智能(BI):是企业对商业数据的搜集、管理和分析的系统过程,目的是使企业的各级决策者获得知识或洞察力,帮助他们作出对企业更有利的决策。一般认为数据仓库、联机分析处理(OLAP)和数据挖掘是商业智能的三大组成部分。
数据仓库(Data Warehouse):是一个面向主题的、集成的、相对稳定且随时间变化的数据集合,用于支持管理决策。数据仓库的关键特征是:面向主题、集成的、非易失的、时变的。
传统数据库与数据仓库的比较:
比较项 | 传统数据库 | 数据仓库 |
数据内容 | 当前值 | 历史的、归档的、归纳的、计算的数据(处理过的) |
数据目标 | 面向业务操作程序、重复操作 | 面向主体域,分析应用 |
数据特性 | 动态变化、更新 | 静态、不能直接更新,只能定时添加、更新 |
数据结构 | 高度结构化、复杂,适合操作计算 | 简单、适合分析 |
使用频率 | 高 | 低 |
数据访问量 | 每个事务一般只访问少量的记录 | 每个事务一般访问大量记录 |
对相应时间的要求 | 计时单位小,如秒 | 计时单位相对较大,除了秒,还有分钟、小时 |
OLTP:即联机事务处理,是关系数据库的基础。
OLAP:即联机分析处理,是数据仓库的核心部分。
OLTP和OLAP的区别:
项目 | OLTP | OLAP |
用户 | 操作人员、底层管理人员 | 决策人员(高级管理人员) |
功能 | 日常操作处理 | 分析决策 |
DB设计 | 面向应用 | 面向主题 |
数据 | 当前的、最新的、细节的、二维的分立的 | 历史的、聚集的、多维的、集成的、统一的 |
存取 | 读/写数十条即可 | 读上万条记录 |
工作单位 | 简单的事务 | 复杂的查询 |
用户数 | 上千个 | 上百个 |
DB大小 | 百兆至GB级 | 百GB至TB级 |
数据挖掘与传统数据分析的区别:数据挖掘是在没有明确假设条件的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先知、有效和可实用三个特性。先前为知的信息是指该信息是预先未曾预料到的,即数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。
1. OSI七层协议
下面是OSI/ISO和TCP/IP协议:
OSI7层模型的主要功能及详细说明:
层 | 主要功能 | 详细说明 |
物理层 | 二进制位传输 | 通过一系列协议定义了通信设备的机械、电气、功能及规程特征 |
数据链路层 | 按帧为单位传输 | 建立、维持和释放网络实体之间的数据链路,把流量控制和差错控制合并在一起。包含MAC和LLC两个子层。服务访问点为物理地址 |
网络层 | 分组传输和路由选择 | 通过网络连接交换传输层实体发出的数据,解决路由选择、网络拥塞、异构网络互连的问题。服务访问点是逻辑地址(网络地址) |
传输层 | 端到端连接 | 实现发送端和接收端的端到端的数据分组传输,负责保证实现数据包无差错、按顺序、无丢失和无冗余的传输。服务访问点为端口 |
会话层 | 互联主机通信 | 负责管理远程用户或进程间的通信,通常包括通信控制、检查点设置、重建中断的传输链路、名字查找及安全验证服务 |
表示层 | 数据表示 | 使应用层可以根据其服务解释数据的含义。通常包括数据编码的约定、本地句法的转换 |
应用层 | 处理网络应用 | 直接为终端用户服务,提供各类应用过程的接口和用户接口 |
Internet协议的主要协议及其层次关系(可以和上面的图合并):
2. 网络分类、组网和接入技术
根据计算机网络覆盖的地理范围分类:局域网、城域网、广域网。
根据链路传输控制技术分类:以太网、令牌网、FDDI网、ATM网、帧中继网和ISDN网。其中,总线争用技术是以太网的标识,ATM称为异步传输模式,ISDN是综合业务数据网。
根据网络拓扑结构分类:总线型、星型、树型、环型、网状。
网络中的数据交换可以分为:电路交换、分组交换、ATM交换、全光交换和标记交换。
网络接入技术分为:光纤接入、同轴电缆接入、铜线接入、无线接入。
无线网络是指以无线电波作为信息的传输媒介,根据应用领域可分为:无线个域网、无线局域网、无线城域网、蜂窝移动通信网。
3. 网络服务器和网络存储技术
网络服务器与个人计算机的最大差异就是在多用户多任务环境下的可靠性上。
网络存储技术包括三种:DAS、NAS、SAN。
4. 网络规划、设计与实施
如今局域网技术主要是交换以太网技术。
选择拓扑结构时,应该考虑的主要因素有地理环境、传输介质、传输距离、可靠性。
汇聚层的存在与否,取决于网络规模的大小。
网络通信设备选型包括:核心交换机选型、汇聚层/接入层交换机选型、远程接入与访问设备选型。
5. 网络安全及其防范技术
信息安全的基本要素有机密性、完整性、可用性、可控性、可审查性。为了达成上述目的,需要做的工作有制定安全策略、用户验证、加密、访问控制、审计和管理。
典型的网络攻击步骤为:信息收集、试探寻找突破口、实施攻击、消除记录、保留访问权限。
信息安全的五个等级:用户自主保护级、系统审计保护级、安全标记保护级、结构化保护级、访问验证保护级。
防火墙无法阻止和检测基于数据内容的黑客攻击和病毒入侵,同时也无法控制内部网络之间的违规行为。扫描器无法发现正在进行的入侵行为,而且它有可能成为攻击者的工具。防毒软件对基于网络的攻击行为(如发描、针对漏洞的攻击)无能为力。
6. 网络管理
网络管理包括对硬件、软件和人力的使用、综合与协调,以便对网络资源进行监视、测试、配置、分配、评价和控制,这样就能以合理的价格满足网络的一些需求,如实行运行性能、服务质量等。当网络出现故障时也能及时报告和处理,同时网络管理中的一个重要工作是备份。
7. 综合布线系统包括六个子系统
TODO 解释
1. 概念
媒体:承载信息的载体。
多媒体:数字、文字、声音、图形、图像和动画等各种媒体的有机组合,并与先进的计算机、通信和广播电视技术相结合,形成一个可组织、存储、操纵和控制多媒体信息的集成环境和交互系统。
多媒体技术:以数字化为基础,能够对多种媒体信息进行采集、编码、存储、传输、处理和表现,综合处理多种媒体信息并使之建立起有机的逻辑联系,集成为一个系统并能具有良好交互性的技术。多媒体技术的特征有多样性、集成性、交互性、实时性。
多媒体计算机MPC = PC + CD-ROM + 声卡 + 显卡 + 多媒体操作系统。
2. 多媒体数据压缩编码技术
静止图像压缩标准(JPEG):是网络上使用最为广泛的图像格式。这是一种有多种压缩程度的有损压缩算法, 其文件扩展名包括.jpg、.jpeg等。
运动图像压缩标准(MPEG):视频图像压缩的一个重要标准,兼顾了JPEG标准和CCITT专家组的H.261标准。其中MPEG-1标准是针对传输速率为1Mbit/s到1.5Mbit/s的普通电视质量的视频信号的压缩;MPEG-2标准的目标则是对每秒30帧的720x572分辨率的视频信号进行压缩;在扩展模式下,MPEG-2可以对分辨率打1440x1152高清晰度电视(HDTV)的信号进行压缩。
视频通信编码标准(H.261):是1990年ITU-T制定的一个视频编码标准,属于视频编码解码器。其设计目的是能够在宽度为64kb/s的倍数的综合业务数字网上传输质量可接受的视频信息。
1. 系统性能包括:性能指标、性能计算、性能设计、性能评估。
2. 性能指标是软、硬件的性能指标的集成。
评价计算机的性能指标:时钟频率(主频)、运算速度、运算精度、内存的存储容量、存储器的存取周期、数据处理速率、吞吐率、响应时间、利用率、RASIS特性(可靠性、可用性、可维护性、完整性、安全性)、平均故障响应时间、兼容性、可扩充性、性价比。
评价网络的性能指标分类:
操作系统的性能指标:系统的可靠性、吞吐量、响应时间、系统资源利用率、可移植性。
数据库管理系统的性能指标:数据库描述功能、数据库管理功能、数据库查询和操纵功能、数据库维护功能。
3. 性能指标计算方法
定义法、方式法、程序检测法、仪器检测法。
4. 性能设计
阿姆达尔定律主要用于系统性能改进的计算。其是指计算机系统中对某一部件采用某种更快的执行方式所获得的系统性能改变程度,取决于这种方式被使用的频率或所占总执行时间的比例。
5. 性能评估
是对一个系统进行各项检测,并形成一份直观的文档,因此性能评估是通过各项测试来完成的。