【javascript】js中0.1+0.2为什么不等于0.3IEEE754浮点数二进制表示

【javascript】js中0.1+0.2为什么不等于0.3IEEE754浮点数二进制表示
IEEE754浮点数二进制表示

上图是IEEE对浮点数表示的说明，这里分单精度与双精度之分，如下图：

对于单精度浮点数，采用32位存储，最高的1位是符号位s，接着的8位是指数E，剩下的23位为有效数字M。
对于双精度浮点数，采用64位存储，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。
在单精度浮点格式中，s、exp和frac字段分别为 1 位、k = 8 位和 n = 23 位，得到一个 32 位的表示。在双精度浮点格式(C 语言中的 double)中，s、exp 和 frac 字段分别为 1 位、k = 11 位和 n = 52 位，得到一个 64 位的表示。

根据 exp 的值，被编码的值可以分成三种不同的情况(最后一种情况有两个变种)。下图说明了对单精度格式的情况。

情况1:格式化的值

情况2:非格式化的值

情况3:特殊值

好了，下面我们重点关注一下情况1，并举例来看，不然实在头大啊。以单精度举例。

浮点数转换为二进制

浮点数转换成二进制，我们要将整数部分和小数部分分开，整数部分采用除2取余，小数部分采用乘2取整。
例如，13.125 转换为二进制：
1.整数部分

逆序将余数拼上得到13的二进制：1101

2.小数部分
得到小数部分的二进制：0.001

两部分相加，得到13.125的二进制：1101.001

好了，到现在，我们知道了如何将浮点数转换为二进制表示，也知道了IEEE中浮点数的存储方式，那么，我们接下来用13.125这个例子来看看计算机中具体是如何表示的呢。

二进制 1101.001可以写成 1.101001 * 2^3，即这里 M 为 1.101001,E为3,s为0。
单精度下，符号位s即为0,阶码字段exp的值e=E+127，即e=3+127=130，130的二进制表示为10000010
小数字段，frac为尾数M的二进制，即1.101001
那么，在单精度下，计算机中的表示为：
0 10000010 101001 00000000000000000 ------------------------------------- s exp frac
0.1+0.2

好了，关于浮点数转换二进制，以及浮点数的表示我们都知道了，那么，现在我们来看看，为什么 0.1+0.2!=0.3的吧。首先，我们还是先看看js里到底输出多少吧：
> 0.1+0.2 0.30000000000000004
0.1的二进制
0.1 x 2 ------- 0.2 0 x 2 ------- 0.4 0 x 2 ------- 0.8 0 x 2 ------- 0.6 1 x 2 ------- 0.2 1 ------- 又从0.2开始循环了
于是，我们得到了0.1的二进制表示，即为0.0001100110011(0011循环)，即1.100110011(0011)*2^-4
即，M 1.100110011(0011),E -4,
那么，s=0,e=-4+1023=1019,
那么，js中由于是双精度的，那么0.1的表示为：

0 01111111011 1001100110011001100110011001100110011001100110011001 -------------------------------------------------------------------- s exp(11位) frac(52位)

0.2的二进制

0.2 x 2 ------- 0.4 0 x 2 ------- 0.8 0 x 2 ------- 0.6 1 x 2 ------- 0.2 1 ------- 又从0.2开始循环了

0.2的二进制表示：0.001100110011(0011循环)，即1.100110011(0011)*2^-3
那么，js双精度0.2的表示：

0 01111111100 1001100110011001100110011001100110011001100110011001

浮点数运算

浮点数的加减运算一般由以下五个步骤完成：

对阶

尾数运算

结果规格化

舍入处理

溢出判断

1.对阶

将两个进行运算的浮点数的阶码对齐的操作。对阶的目的是为使两个浮点数的尾数能够进行加减运算。因为，当进行Mx·2Ex与My·2Ey加减运算时，只有使两浮点数的指数值部分相同，才能将相同的指数值作为公因数提出来，然后进行尾数的加减运算。
对阶的具体方法是：首先求出两浮点数阶码的差，即⊿E＝Ex-Ey，将小阶码加上⊿E，使之与大阶码相等，同时将小阶码对应的浮点数的尾数右移相应位数，以保证该浮点数的值不变。几点注意：

（1）对阶的原则是小阶对大阶，之所以这样做是因为若大阶对小阶，则尾数的数值部分的高位需移出，而小阶对大阶移出的是尾数的数值部分的低位，这样损失的精度更小。

（2）若⊿E＝0，说明两浮点数的阶码已经相同，无需再做对阶操作了。

（3）采用补码表示的尾数右移时，符号位保持不变。

（4）由于尾数右移时是将最低位移出，会损失一定的精度，为减少误差，可先保留若干移出的位，供以后舍入处理用。

2. 尾数运算

尾数运算就是进行完成对阶后的尾数相加减。这里采用的就是我们前面讲过的纯小数的定点数加减运算。

3. 结果规格化

在机器中，为保证浮点数表示的唯一性，浮点数在机器中都是以规格化形式存储的。对于IEEE754标准的浮点数来说，就是尾数必须是1.M的形式。由于在进行上述两个定点小数的尾数相加减运算后，尾数有可能是非规格化形式，为此必须进行规格化操作。规格化操作包括左规和右规两种情况。左规操作：将尾数左移，同时阶码减值，直至尾数成为1.M的形式。例如，浮点数0.0011·25是非规格化的形式，需进行左规操作，将其尾数左移3位，同时阶码减3，就变成1.1100·22规格化形式了。右规操作：将尾数右移1位，同时阶码增1，便成为规格化的形式了。要注意的是，右规操作只需将尾数右移一位即可，这种情况出现在尾数的最高位（小数点前一位）运算时出现了进位，使尾数成为10.xxxx或11.xxxx的形式。例如，10.0011·25右规一位后便成为
1.00011·26的规格化形式了。

4. 舍入处理

浮点运算在对阶或右规时，尾数需要右移，被右移出去的位会被丢掉，从而造成运算结果精度的损失。为了减少这种精度损失，可以将一定位数的移出位先保留起来，称为保护位，在规格化后用于舍入处理。 IEEE754标准列出了四种可选的舍入处理方法：

（1）就近舍入（round to nearest）这是标准列出的默认舍入方式，其含义相当于我们日常所说的“四舍五入”。例如，对于32位单精度浮点数来说，若超出可保存的23位的多余位大于等于100…01，则多余位的值超过了最低可表示位值的一半，这种情况下，舍入的方法是在尾数的最低有效位上加1；若多余位小于等于011…11，则直接舍去；若多余位为100…00，此时再判断尾数的最低有效位的值，若为0则直接舍去，若为1则再加1。

（2）朝+∞舍入（round toward +∞）对正数来说，只要多余位不为全0，则向尾数最低有效位进1；对负数来说，则是简单地舍去。

（3）朝-∞舍入（round toward -∞）与朝+∞舍入方法正好相反，对正数来说，只是简单地舍去；对负数来说，只要多余位不为全0，则向尾数最低有效位进1。

（4）朝0舍入（round toward 0）即简单地截断舍去，而不管多余位是什么值。这种方法实现简单，但容易形成累积误差，且舍入处理后的值总是向下偏差。

5. 溢出判断

与定点数运算不同的是，浮点数的溢出是以其运算结果的阶码的值是否产生溢出来判断的。若阶码的值超过了阶码所能表示的最大正数，则为上溢，进一步，若此时浮点数为正数，则为正上溢，记为+∞，若浮点数为负数，则为负上溢，记为-∞；若阶码的值超过了阶码所能表示的最小负数，则为下溢，进一步，若此时浮点数为正数，则为正下溢，若浮点数为负数，则为负下溢。正下溢和负下溢都作为0处理。

计算0.1+0.2

0.1的阶码-4,0.2的阶码-3,对阶阶段，将0.1的阶码变为-3，然后0.1的尾数部分：

1100110011001100110011001100110011001100110011001100

可能会有人问，这里最高位怎么是1，移位后不应该是0么，别忘了，尾数部分我们隐含了一个最高位是1的条件，因此，移位后，会将该位一并移过来。
将其与0.2的尾数部分进行相加：

1100110011001100110011001100110011001100110011001100 + 1001100110011001100110011001100110011001100110011001 ---------------------------------------------------- 100110011001100110011001100110011001100110011001100111

注意，这里计算时，进位2位，去除原来最高位默认的1，相当于阶码部分加1，即由原来的-3变为-2，那么，阶码部分的表示：

1111111101

而尾数部分，去除最高位1，最后一位1，进行舍入，得到52位新的二进制表示：

0011001100110011001100110011001100110011001100110100

即，最后计算的结果如下：

0 01111111101 0011001100110011001100110011001100110011001100110100

该数表示的即0.1+0.2的结果 2^-2 * 1.0011001100110011001100110011001100110011001100110100，即为：0.010011001100110011001100110011001100110011001100110100

转换为十进制：0*2⁰+0*2^-1+1*2^-2+0*2^-3+0*2^-4+1*2^-5+1*2^-6+...，结果为：0.3000000000000000444089209850062616169452667236328125

计算方式参照：https://jingyan.baidu.com/article/597a0643614568312b5243c0.html

由于精度问题，只取到0.30000000000000004
转自：https://www.jianshu.com/p/404e2958c281
相关阅读:
【中文分词】条件随机场CRF
【中文分词】最大熵马尔可夫模型MEMM
【中文分词】二阶隐马尔可夫模型2-HMM
【中文分词】隐马尔可夫模型HMM
Elasticsearch的CRUD：REST与Java API
d3的比例尺和坐标轴
 webpack DllPlugin的用法
 webpack单独启动目录方法
 d3的常用方法和数据类型
 d3中的enter，exit，update概念
原文地址：https://www.cnblogs.com/vickylinj/p/14495155.html

【javascript】js中0.1+0.2为什么不等于0.3IEEE754浮点数二进制表示

IEEE754浮点数二进制表示

情况1:格式化的值

情况2:非格式化的值

情况3:特殊值

浮点数转换为二进制

0.1+0.2

0.1的二进制

0.2的二进制

浮点数运算

1.对阶

2. 尾数运算

3. 结果规格化

4. 舍入处理

5. 溢出判断

计算0.1+0.2