第二章 信息的表示和处理
计算机存储和处理信息以二值信号表示。
三种重要的数字表现形式:
1、 无符号数:编码基于传统的二进制表示法表示大于或等于零的数字。
2、 补码:编码是表示有符号整数的最常见方法,可以是正或者是负的数字。
3、 浮点数:编码是表示实数的科学计数法的以二位基数的版本
溢出:计算机的表示法是用有限数量的位来为一个数字编码,因此当结果太大就会导致某些运算溢出。
整数和浮点数会有不同的数学属性是因为:处理数字表示有限性的方法不同:
整数:编码相对较小的数值范围,但精确度高 浮点数:编码较大范围的数,但这种表示是近似的
2.1信息存储
机器级程序将存储器视为一个非常大的字节数组, 称为虚拟存储器。存储器的每个字节都由一个唯一的数字来标识,称为它的地址,所有可能地址的集合称为虚拟地址空间。
1.十六进制表示法
2.字
每台计算机都有一个字长,指明整数和指针数据的标称大小。因为虚拟地址是以这样的一个字来编码的,所以字长决定的最重要的系统参数就是虚拟地址空间的最大大小。对于一个字长为w位的机器而言,虚拟地址的范围为0~2w-1,程序最多访问2w个字节,计算机多为32和64位。
3.字节顺序
小端法——在存储器中按照从最低有效字节到最高有效字节的顺序存储对象。
大端法——从最高有效字节到最低有效字节的顺序存储。
小端法:高对高,低对低。
大端法:高对低,低对高。
4.布尔代数
与或非,取反运算。
用0、1表示真假,以研究逻辑推理的基本原则。
5.C语言中的运算
位级:将十六进制的参数扩展成二进制表示并执行二进制运算,然后再转换回十六进制。
逻辑:逻辑运算符 “||、&&、!”分别对应于命题逻辑中的OR、AND、NOT运算。
移位:对于无符号数据,右移必须是逻辑的。而对于有符号数据,算术的或者逻辑的右移都可以。
2.2整数表示和运算
1.整型数据类型:根据字节分配,不同的大小所能表示的值的范围不同。 C 和C++默认支持有符号数和无符号数,Java只支持有符号数。
2.无符号数的编码:B2U4([0001])=0x2^3+0x2^2+0x2^1+1x2^0=1
3.补码编码:B2T4([1011])=-1x2^3+0x2^2+1x2^1+1x2^0=-5
最高位有效位也称符号位,权重为-2^w-1。符号位为1是负为0是正。 补码的范围不对称,是因为:一半的数的整数一半是负数,而0是非负数。最大的无符号数值刚好比补码的最大值的两倍大一点。
4.有符号数和无符号数之间的转换
5.C语言中的有符号数和无符号数:默认有符号,若想创建无符号常量必须加后缀U/u。
C语言转换的原则是底层的位保持不变。无到有:U2TW。有到无:T2UW
6.扩展一个数字的位表示:在不同字长的整数之间转换又保持数值不变。
0扩展:简单的在表示的开头加0。 符号扩展:将补码数字转换成更大类型的数据。规则在表中添加最高有效位的值的副本。
7.截断数字:减少表示一个数字的位数。
2.3浮点数
浮点表示对形如V = x×2y的有理数进行编码。它对执行涉及非常大的数字(|V |>
0)、非常接近于0(|V |<<1)的数字,以及更普遍地作为实数运算的近似值的计算,是很有用的。
IEEE浮点表示
IEEE浮点标准用V = (-1)^s × M × 2^E的形式来表示一个数:
- 符号:s决定这个数是负数(s=1)还是正数(s=0),而对于数值0的符号位解释作为特殊情况处理。
- 尾数:M是一个二进制小数,它的范围是1~2-ε,或者是0~1-ε。
- 阶码:E的作用是对浮点数加权,这个权重是2的E次幂(可能是负数)。
将浮点数的位表示划分为三个字段,分别对这些值进行编码:
- 一个单独的符号位s直接编码符号s。
- k位的阶码字段exp = ek-1…e1e0编码阶码E。
- n位小数字段frac = fn-1…f1 f0编码尾数M,但是编码出来的值也依赖于阶码字段的值是否等于0。
给定了位表示,根据exp的值,被编码的值可以分为以下三种情况:
情况1:规格化的值。当exp的为模不全为1或0。阶码字段被解释为以偏置形式表示有符号整数。
情况2:非规格化的值:阶码域全为0。用途:提供了一种表示数值0的方法。表示非常接近于0.0的数。
情况3:特殊值:阶码域全为1。小数域全为0,得到的值表示无穷。在表示未初始化的数据时也很有用。
舍入:浮点运算只能近似的表示示数运算想要找到最接近x的值就是舍入,问题的关键在于在两个可能的值中间确定舍入方向。
向偶数舍入:也叫向最接近的值舍入。是默认方法。将数字向上或向下舍入使的结果的最低有效数字是偶数。其他三种方式产生实际值的确界。
浮点运算
IEEE标准指定了一个简单的规则,用来确定诸如加法和乘法这样的算术运算的结果。把浮点值x和y看成实数,而某个运算⊙定义在实数上,计算将产生Round (x ⊙ y),这是对实际运算的精确结果进行舍入后的结果。当参数中有一个是特殊值(如-0、-∞或NaN)时,IEEE标准定义了一些使之更合理的规则。例如,定义1/-0将产生-∞,而定义1/+0会产生+∞。
- 浮点加法不具有结合性,这是缺少的最重要的群属性。
- 浮点加法满足了单调性属性:如果a≥b,那么对于任何a、b以及x的值,除了NaN,都有x + a ≥ x + b。无符号或补码加法不具有这个实数(和整数)加法的属性。