(注:将从第一节课和大体宏观概念上对于计算机进行总结,因通知时间过晚,难以查阅足够多的资料,希望谅解)
1) 信息的定义:
i、信息是认知主体对物质运动的本质特征、运动方式、运动状态以及运动的有序性的反映和揭示,是事物之间相互联系、相互作用的状态的描述。通俗地讲,信息泛指包含于消息、情报、指令、数据、图像、信号等形式之中的新的知识和内容。
ii、特征:普遍性、动态性、依附性、相对性、可传递性、共享性、可加工性。
iii、分类:1.按信息发生领域划分:物理信息、生物信息、社会信息
2.人们对信息有无加工划分:原始信息、派生信息
3.按信息的表现形式划分:消息、资料、知识
2) 信息熵的计算:
i、信息熵计算公式:
性别(x) 考试成绩(y)
男 优
女 优
男 差
女 优
男 优
X的信息熵计算为:
p(男) = 3/5 = 0.6
p(女) = 2/5 = 0.4
根据上面的计算公式可得:
列X的信息熵 为: H(x)= - ( 0.6 * log2(0.6) + 0.4 * log2(0.4)) = 0.97.......
Y的信息熵计算为:
p(优) = 4/5 = 0.8
p(差) = 1/5 = 0.2
列X的信息熵 为: H(x)= - ( 0.8 * log2(0.8) + 0.2 * log2(0.2)) = 0.72.......
由信息熵引出的条件熵:
条件熵的概念类似于条件概率,就是再给定X的情况的条件下,y的信息熵。
给定性别为男,成绩为优的条件熵:
H(y | x = 男)= 3/5 * -(2/3 * log2(2/3) + 1/3 * log2(1/3)) = 0.55…
H(y | x = 女)= 2/5 * -( 1 * log2(1) + 1 * log2(1)) = 0.0…
H(y | x)= H(y | x = 男)+ H(y | x = 女) = 0.55… + 0.0… = 0.55
3) 信息处理:
i.如何表示文字:文字编码
常见的编码字集:
ASCI***斜体样式***I / EBCDIC
Unicode / GB18030-2000, GB18030-2005
ii.如何输入文字:
输入法,即将键盘的按键组合映射为文字的编码。
iii、如何表示声音:
声卡:
录音:麦克风配合声卡完成声音的数字化(采样)
放音:数字化的声音还原成模拟信号输出
iv、如何表示图像:
两种方法:
位图图像:用像素表示的图像(所需存储量更大,图像容易失真)
矢量图像:用矢量表示的图像(图片不易失真,但难以表现色彩层次丰富的逼真效果图像。)
4) 计算机科学的定义:研究计算机及其周围各种现象和规律的科学,亦即研究计算机系统结构、程序系统(即软件)、人工智能以及计算本身的性质和问题的学科。计算机科学是一门包含各种各样与计算和信息处理相关主题的系统学科,从抽象的算法分析、形式化语法等等,到更具体的主题如编程语言、程序设计、软件和硬件等。计算机科学分为理论计算机科学和实验计算机科学两个部分。后者常称为“计算机科学”而不冠以“实验”二字。前者有其他名称,如计算理论、计算机理论、计算机科学基础、计算机科学数学基础等。
5) 图灵机
i.不是真实的机器,是一种理论模型。可以视为现代数学计算机的数学模型。
ii.图灵机有一个可以向左右两端无限伸展的纸带。有一个能在纸带上左右移动的读写头HEAD。还有一个控制器,存有控制规则和一个状态寄存器。
6) 种 属差:所谓的“属”与“种”“种差”是指如果一个概念B的外延集合是另一个概念A的外延集合的真子集,我们称作概念A是概念B的属概念,概念B是概念A的种属性,具有这种关系的概念之间称作具有属种关系的概念。在同一属概念里,种概念A具有而其他种概念不具有的本质属性的差别,称作种概念A的种差。(具体见B8)
7) 位存储:在计算机中,由于只有逻辑0和逻辑1的存在,因此很多东西、动作、数字都要表示为一串二进制的字码例如: 1001 0000 1101等等。其中每一个逻辑0或者1便是一个位。例如这个例子里的1000 1110共有八个位,它的英文名字叫(bit),是计算机中最基本的单位。
拓展:所谓的字节 Byte,是由八个位组成的一个单元,也就是8个bit组成1个Byte。字节有什么用呢? 在计算机科学中,用于表示ASCII字符,便是运用字节来记录表示字母和一些符号~例如字符A便用 “0100 0001”来表示。
而字节以上,便是字:16个位为一个字,它代表计算机处理指令或数据的二进制数位数,是计算机进行数据存储和数据处理的运算的单位。通常称16位是一个字,而32位呢,则是一个双字,64位是两个双字。
第1题. 对于符号“alibaba”,下列描述错误的为( )。参考答案:D
A. 字符 a 出现的概率为 3/7
B. 字符 l 出现的概率 = 字符 i 出现的概率
C. 所给定的符号长度为 7
D. 字符 b 出现的概率 = 字符 i 出现的概率
解析:显然出现的概率不一样
第2题. 关于计算机科学,错误的是( )。参考答案:A
A. 计算机科学是信息处理的学科
B. 计算机科学包括信息的处理、管理和改善
C. 计算机科学是对描述和变换信息的算法过程的系统研究
D. 计算机科学不等于程序设计
解析:A见计算机科学的定义
第3题. 下面描述错误的是( )。参考答案:B
A. 信息熵越大,不确定性越大
B. 计算机可以采用余码表示数值
C. 计算机的反码中存在 +0 和 -0
D. 计算机采用位置计数法
解析:计算机采用补码
第4题. 关于图灵机的控制器,下列说法错误的是( )。参考答案:D
A. 只有 1 个控制器
B. 控制规则的集合是有限集合
C. 所描述的状态是有限的
D. 控制规则执行后,处理符号记录在有限的带子上
解析:显然错误
第5题. 信息处理就是对信息进行( )的过程。参考答案:B
A. 信息感知、信息缓冲、信息分类、屏幕显示
B. 信息接收、信息传输、信息存储、信息转换、信息发布
C. 信息输入、信息备份、信息转换、信息传递、信息发布
D. 信息获取、信息传输、信息保存、信息检索、信息显示
解析:接受 传输 存储 转换 发布 是一个信息进行的正常的循环
第6题. 不属于认识论层次的信息为( )。参考答案:A
A. 语句信息
B. 语义信息
C. 语用信息
D. 语法信息
解析:显然错误
第7题. 利用属+种差定义学生甲的错误方式是( )。参考答案:D
A. 学生甲是中国人,具有自己的中国身份证号
B. 学生甲是whut学生,具有自己的学号
C. 学生甲是中国人,具有自己的中国护照号
D. 学生甲是选择CS导论课程的学生,选课系统中具有学生甲的编号
解析:d选项二者不存在从属关系,显然错误,定义见上。
第8题. 关于位bit,错误的说法是( )。参考答案:C
A. 香农用数学公式定义了 bit
B. 每一个bit,因为计数制不同,表示数值范围不同
C. 每一个bit表示的状态不同
D. 二进制中每一个bit只能 0 或 1
解析:bit是最基本的单位,不会有不同的状态
:
第9题. 关于图灵机不正确的为( )。参考答案:D
A. 只有一个开始状态
B. 只有一个终止状态
C. 读写头可以左右动,或不动
D. 存在无限多的状态
解析:见上定义
第10题. 信息存储不包括( )。参考答案:D
A. 对接收的信息或处理的中间信息的临时存储
B. 对接收的信息或处理的中间信息的永久存储
C. 对接收的信息或处理的中间信息的备份
D. 对接收的信息或处理的中间信息的传输
解析:传输显然与存储无关