信息的表示和处理
通过使用标准的字符码能够对文档中的字母和符号进行编码。
三种重要的数字表现形式:
1、 无符号数:编码基于传统的二进制表示法表示大于或等于零的数字。
2、 补码:编码是表示有符号整数的最常见方法,可以是正或者是负的数字。
3、 浮点数:编码是表示实数的科学计数法的以二位基数的版本
溢出:计算机的表示法是用有限数量的位来为一个数字编码,因此当结果太大就会导致某些运算溢出。
整数和浮点数会有不同的数学属性是因为:处理数字表示有限性的方法不同:
整数:编码相对较小的数值范围,但精确度高
浮点数:编码较大范围的数,但这种表示是近似的
2.1信息存储
编写机器级程序的常见任务就是在位模式的十进制、二进制、十六进制之间人工的进行进制转换。
1. 十六进制表示法:我会。
2. 字: 字长:指明整数和指针数据的标称大小。字长决定最重要的系统参数就是虚拟地址空间的最大大小。
3. 数据大小:计算器和编译器支持不同方式编码的数字格式,也具有处理单个字节的指令或2字节,4字节,8字节整数的指令。
4. 寻址和字节顺序:最高有效位前八位和最低有效位后八位。是网络编程基础
小端法:某些机器选择在存储器中按最低有效字节到最高有效字节
大端法:某些机器选择在存储器中按最高有效字节到最低有效字节
小端法“高对高,低对低”大端与之相反。
5. 表示字符串:文本数据比二进制数据具有更强的独立性
6. 布尔代数:二进制是计算机编码存储和操作信息的核心。数电里学过布尔运算。我会。
7. C语言中的位级运算:C语言支持按位的布尔运算。与或非,异或同或
常见用法就是实现掩码运算。
8. C语言中的逻辑运算:&&与。||或。!非。
9. C语言中的移位运算:x<<k:左移k位。X>>k:右移
2.2整数表示
1.整型数据类型:根据字节分配,不同的大小所能表示的值的范围不同。C
C 和C++默认支持有符号数和无符号数,Java只支持有符号数。
2.无符号数的编码:B2U4([0001])=0*2^3+0*2^2+0*2^1+1*2^0=1
3.补码编码:B2T4([1011])=-1*2^3+0*2^2+1*2^1+1*2^0=-5
最高位有效位也称符号位,权重为-2^w-1。符号位为1是负为0是正。
补码的范围不对称,是因为:一半的数的整数一半是负数,而0是非负数。最大的无符号数值刚好比补码的最大值的两倍大一点。
4.有符号数和无符号数之间的转换:
5.C语言中的有符号数和无符号数:默认有符号,若想创建无符号常量必须加后缀U/u。
C语言转换的原则是底层的位保持不变。无到有:U2TW。有到无:T2UW
6.扩展一个数字的位表示:在不同字长的整数之间转换又保持数值不变。
0扩展:简单的在表示的开头加0。
符号扩展:将补码数字转换成更大类型的数据。规则在表中添加最高有效位的值的副本。
7.截断数字:减少表示一个数字的位数。
2.3整数运算
1.无符号加法:可以被视为模运算形式,等价于计算和模2^w。在我的理解看来应该就是跟溢出差不多的性质。运算的溢出是指完整的整数结果不能存放到数据类型的字长限制中。
2.补码加法:负溢出得到的结果比整数和大16,正溢出得到的结果比整数小16.
3.补码的非&4.无符号乘法计算公式看书。
5.补码乘法:给定长度的两个为位向量,无符号乘积的位级与补码乘积的位级表示是相同的,表明及其可以用一种乘法指令来进行有符号数和无符号数的乘法。无符号和补码乘积的低位是相同的
6.乘以常数:为了缩短计算时间,试着用移位和加法运算的组合来代替乘以常数的乘法。推理过程看书。
7除以2的幂:除法比乘法的计算时间更长。除以2 的幂用右移而不是左移。同样推理过程仔细阅读书上的内容。
8.关于整数运算:整数运算实际是一种模运算。表示数字的有限字长限制了可能的取值范围,结果可能溢出。补码提供了技能表示正数也能表示负数的灵活方法,同时使用了与执行无符号算数相同的位级实现。
2.4浮点数
1.二进制小数:
与十进制小数类似,会转换就行。二进制小数点向左移动一位相当于这个小数被2除,向右移动一位相当于该数乘以2。
2.IEEE浮点表示:标准 V=(-1)^s*M*2^E
其中:
符号:s 决定这个数是正数还是负数。
尾数:M 二进制小数。
阶码:E 对浮点数加权,权重是2 的E次幂。
将浮点数的位划分成三段分别进行编码:
一个单独的符号位直接编码符号。
K位的阶码字段exp=ek-1……e1e0编码阶段
N位小数字段
情况1:规格化的值。当exp的为模不全为1或0。阶码字段被解释为以偏置形式表示有符号整数。
情况2:非规格化的值:阶码域全为0。用途:提供了一种表示数值0的方法。表示非常接近于0.0的数。
情况3:特殊值:阶码域全为1。小数域全为0,得到的值表示无穷。在表示未初始化的数据时也很有用。
3.数字示例:k位阶码和n位小数的浮点表示的一般属性:
值+0.0总有一个全为0的位表示。
最小的正非规格化值的位表示,是由最低位为1而其他位为0构成的
最大的非规格化值的位表示,是由全为0的阶段字码和全为1的小数字段组成
最小的正规格化值的位表示,是由最低位为1而其他位为0构成的。
值1.0的位表示的阶码字段除了最高有效位等于0以外其他位为1.
最大的规格化值的位表示,符号位为0阶码的最低有效位为0,其他位为1.
4.舍入:浮点运算只能近似的表示示数运算想要找到最接近x的值就是舍入,问题的关键在于在两个可能的值中间确定舍入方向。
a.向偶数舍入:也叫向最接近的值舍入。是默认方法。将数字向上或向下舍入使的结果的最低有效数字是偶数。其他三种方式产生实际值的确界。
5.浮点运算:IEEE的优势可以独立于任何具体的硬件或软件实现。
浮点加法不具有结合性但满足了单调性属性。
小结
计算机将信息按位编码,通常组织成字节序列。用不同的编码方式表示整数、实数和字符串。不同的计算机模型在编码数字和多字节数据中的字节排序时使用不同的约定。
C语言的设计可以包容多种不同字长和数字编码的实现。虽然高端机器逐渐开始使用64位字长,但是目前大多数机器仍使用32位字长。大多数机器对整数使用补码编码,而对浮点数使用IEEE浮点编码。在位级上理解这些编码,并且理解算术运算的数学特性,对于想使编写的程序能在全部数值范围上正确运算的程序员来说,是很重要的。
在相同长度的无符号和有符号整数之间进行强制类型转换时,大多数C语言实现遵循的原则是底层的位模式不变。在补码机器上,对于一个w位的值,这种行为是由函数T2Uw和U2Tw来描述的。C语言隐式的强制类型转换会出现许多程序员无法预计的结果,常常导致程序错误。
由于编码的长度有限,与传统整数和实数运算相比,计算机运算具有完全不同的属性。当超出表示范围时,有限长度能够引起数值溢出。当浮点数非常接近于0.0,从而转换成零时,也会下溢。
和大多数其他程序语言一样,C语言实现的有限整数运算和真实的整数运算相比,有一些特殊的属性。例如,由于溢出,表达式x*x能够得出负数。但是,无符号数和补码的运算都满足整数运算的许多其他属性,包括结合律、交换律和分配律。这就允许编译器做很多的优化。例如,用(x<<3)-x取代表达式7*x时,我们就利用了结合律、交换律和分配律的属性,还利用了移位和乘以2的幂之间的关系。
我们已经看到了几种使用位级运算和算术运算组合的聪明方法。例如,使用补码运算,~x+1等价于 -x 。另外一个例子,假设我们想要一个形如[0,…,0,1,…,1]的位模式,由w - k个0后面紧跟着k个1组成。这些位模式有助于掩码运算。这种模式能够通过C表达式(1<<k)-1生成,利用的是这样一个属性,即我们想要的位模式的数值为2k-1。例如,表达式(1<<8)-1将产生位模式0xFF。
浮点表示通过将数字编码为x×2y的形式来近似地表示实数。最常见的浮点表示方式是由IEEE标准754定义的。它提供了几种不同的精度,最常见的是单精度(32位)和双精度(64位)。IEEE浮点也能够表示特殊值+∞、-∞和NaN。
必须非常小心地使用浮点运算,因为浮点运算只有有限的范围和精度,而且不遵守普遍的算术属性,比如结合性。
这一章主要是一些关于计算机底层最基本的数值运算,在以前学习过的基础上又新加了一些更专业更学术的方法,所以学好这一章就要多练多做题,大部分知识和方法以前有接触过所以学起来不是特别困难,但是因为十一要出去玩导致时间有点紧有些问题不能深入的思考研究,有些问题只能等十一回来再继续学习。
看了一下午的书,正在努力搞懂书上的题目。发现对离开书本根本写不出什么代码,本来想试着完成一个课后作业纠结了好久最终还是无奈的放弃了,先把课后的重点练习题好好看一遍再说吧。