转自:
【解惑】剖析float型的内存存储和精度丢失问题
1、小数的二进制表示问题
首先我们要搞清楚下面两个问题:
(1) 十进制整数如何转化为二进制数,其实就是采用的科学计数法
算法很简单。举个例子,11表示成二进制数:
11/2=5 余 1
5/2=2 余 1
2/2=1 余 0
1/2=0 余 1
0 结束
所以:11二进制表示为(从下往上):1011 = 1*(2的3次方)+0*2的2次方+1*(2的1次方)+1*(2的0次方) = 8+0+2+1 =11
这里提一点:只要遇到除以后的结果为0了就结束了,大家想一想,所有的整数除以2是不是一定能够最终得到0。换句话说,所有的整数转变为二进制数的算法会不会无限循环下去呢?绝对不会,整数永远可以用二进制精确表示 ,但小数就不一定了。
(2) 十进制小数如何转化为二进制数
算法是乘以2直到没有了小数为止。举个例子,0.9表示成二进制数
0.9*2=1.8 取整数部分 1
0.8(1.8的小数部分)*2=1.6 取整数部分 1
0.6*2=1.2 取整数部分 1
0.2*2=0.4 取整数部分 0
0.4*2=0.8 取整数部分 0
0.8*2=1.6 取整数部分 1
0.6*2=1.2 取整数部分 1
.........
所以:0.9二进制表示为(从上往下): 11100110011001100110011......
注意:上面的计算过程循环了,也就是说*2永远不可能消灭小数部分,这样算法将无限下去。很显然,小数的二进制表示有时是不可能精确的 。其实道理很简单,十进制系统中能不能准确表示出1/3呢?同样二进制系统也无法准确表示1/10。这也就解释了为什么浮点型减法出现了"减不尽"的精度丢失问题。
2、 float型在内存中的存储
IEEE754规定:
单精度浮点数字长32位,尾数长度23,指数长度8,指数偏移量127;双精度浮点数字长64位,尾数长度52,指数长度11,指数偏移量1023;
约定小数点左边隐含有一位,通常这位数是1,所以上述单精度尾数长度实际为24(默认省略小数点左边的1则为23),双精度尾数长度实际为53(默认省略小数点左边的1则问53);
众所周知、 Java 的float型在内存中占4个字节。float的32个二进制位结构如下
float内存存储结构 :
表示 | 符号位 | 指数符号位 | 指数位 | 有效数位 |
4bytes | 31 | 30 | 29-23 | 22-0 |
其中符号位1表示正,0表示负。有效位数位24位,其中一位是实数符号位。
将一个float型转化为内存存储格式的步骤为:
(1)先将这个实数的绝对值化为二进制格式,转化成***.*******
(2)将这个二进制格式实数的小数点左移或右移n位,直到小数点移动到第一个有效数字的右边。
(3)从小数点右边第一位开始数出二十三位数字放入第22到第0位。
(4)如果实数是正的,则在第31位放入“0”,否则放入“1”。
(5)如果n是左移得到的,说明指数是正的,第30位放入“1”。如果n是右移得到的或n=0,则第30位放入“0”。
(6)如果n是左移得到的,则将n减去1后化为二进制,并在左边加“0”补足七位,放入第29到第23位。如果n是右移得到的或n=0,则将n化为二进制后在左边加“0”补足七位,再各位求反,再放入第29到第23位。或者采用偏移量方法计算,127+x,左移x为正数,右移x为负数。如左移1位得128,得10000000,右移3位得124,得01111100
结果验证(浮点数转二进制)网站: http://www.binaryconvert.com/result_float.html?decimal=048046053
举例说明: 11.9的内存存储格式
(1) 将11.9化为二进制后大约是" 1011. 1110011001100110011001100..."。
(2) 将小数点左移三位到第一个有效位右侧: "1. 011 11100110011001100110 "。 保证有效位数24位,右侧多余的截取(误差在这里产生了 )。
(3) 这已经有了二十四位有效数字,将最左边一位“1”去掉,得到“ 011 11100110011001100110 ”共23bit。将它放入float存储结构的第22到第0位。
(4) 因为11.9是正数,因此在第31位实数符号位放入“0”。
(5) 由于我们把小数点左移,因此在第30位指数符号位放入“1”。
(6) 因为我们是把小数点左移3位,因此将3减去1得2,化为二进制,并补足7位得到0000010,放入第29到第23位。
最后表示11.9为: 0 1 0000010 011 11100110011001100110
再举一个例子:0.5的内存存储格式
转为二进制为 0.1000000000000000000000000000000000000...
小数点右移1位 1.00000000000000000000000000000000...
由于0.5为正数, 第31位为0
由于是右移得到的,第30位为0
右移1位,将1转为二进制 0000001 取反为1111110 此为23-29位
第22-0位 为 0000000000000000000000000
合并起来就是0 01111110 00000000 00000000 0000000
再举一个例子:3.25的内存存储格式
转为二进制为 11.01000000000000000000000000000000000000...
小数点右移1位 1.1010000000000000000000000000000000...
由于3.25为正数, 第31位为0
由于是左移得到的,第30位为1
左移1位,将1转为二进制 0000001 减1 为0000000 此为23-29位
第22-0位 为小数点后22位 1010000000000000000000000
合并起来就是0 10000000 10100000 00000000 0000000
再举一个例子:0.2356的内存存储格式
(1)将0.2356化为二进制后大约是0.00111100010100000100100000。
(2)将小数点右移三位得到1.11100010100000100100000。
(3)从小数点右边数出二十三位有效数字,即11100010100000100100000放入第22到第0位。
(4)由于0.2356是正的,所以在第31位放入“0”。
(5)由于我们把小数点右移了,所以在第30位放入“0”。
(6)因为小数点被右移了3位,所以将3化为二进制,在左边补“0”补足七位,得到0000011,各位取反,得到1111100,放入第29到第23位。
最后表示0.2356为:0 0 1111100 11100010100000100100000
将一个内存存储的float二进制格式转化为十进制的步骤:
(1)将第22位到第0位的二进制数写出来,在最左边补一位“1”,得到二十四位有效数字。将小数点点在最左边那个“1”的右边。
(2)取出第29到第23位所表示的值n。当30位是“0”时将n各位求反。当30位是“1”时将n增1。
(3)将小数点左移n位(当30位是“0”时)或右移n位(当30位是“1”时),得到一个二进制表示的实数。
(4)将这个二进制实数化为十进制,并根据第31位是“0”还是“1”加上正号或负号即可。
1 public static void main(String[] args)throws Exception { 2 /*addTest(0.1,0.0625,0.1625); 3 addTest(0.1,0.8,0.9); 4 addTest(0.125,0.25,0.375);*/ 5 6 /*showIntegerBinary();*/ 7 /*showFloatBinary(MEDIUM);*/ 8 showBase64(); 9 } 10 11 private static void addTest(double a, double b,double expect){ 12 System.out.println((a+b)==expect); 13 } 14 private static void showFloatBinary(int flag){ 15 Float[][] floats= { 16 {11.9f,-178.125f,-176.0625f},{8.135f,-0.2356f,0.2356f},{-3.0013f} 17 }; 18 19 for (int j = 0; j < floats.length; j++) { 20 String level =""; 21 if(j!=flag){ 22 continue; 23 } 24 switch(j){ 25 case 0: 26 level = "入门:"; 27 break; 28 case 1: 29 level = "一般:"; 30 break; 31 case 2: 32 level = "变态:"; 33 break; 34 } 35 36 for (int k = 0; k < floats[j].length; k++) { 37 System.out.println("#### "+floats[j][k]+" ####"); 38 39 Integer i = Float.floatToIntBits(floats[j][k]); 40 String binaryStr = intToBinary32(i,32); 41 System.out.println(level+ binaryStr); 42 System.out.println(level+binaryStr.substring(0,1)+"-"+binaryStr.substring(1,9)+"-"+binaryStr.substring(9)); 43 } 44 45 System.out.println(); 46 } 47 } 48 49 private static void showIntegerBinary(){ 50 int[] ints= {11,1001,6,-6,0,-0}; 51 for (int i = 0; i <ints.length ; i++) { 52 System.out.println("########## "+ints[i]+" ###########"); 53 System.out.println(intToBinary32(ints[i],32)); // 进制转换的正规函数 54 } 55 } 56 57 private static void showBase64() throws Exception{ 58 String[] strings = {"sky","X"}; 59 for (int i = 0; i <strings.length ; i++) { 60 System.out.println("original :"+strings[i]); 61 System.out.println("original binary: "+toBinary(strings[i])); 62 byte[] encodeBase64 = org.apache.commons.codec.binary.Base64.encodeBase64(strings[i].getBytes()); 63 String base64Encode = new String(encodeBase64, "UTF-8"); 64 65 66 System.out.println("base64 :"+ base64Encode); // 进制转换的正规函数 67 String decodeString = new String(Base64.getDecoder().decode(base64Encode),"UTF-8"); 68 System.out.println("decode :"+ decodeString); 69 } 70 } 71 72 public static String toBinary(String str){ 73 char[] strChar=str.toCharArray(); 74 String result=""; 75 for(int i=0;i<strChar.length;i++){ 76 result +=intToBinary32(strChar[i],8)+ " "; 77 } 78 return result; 79 } 80 81 private static void showEncoding(){ 82 String s = "一";//Unicode编码:4E00 83 String s1 = "a";//Unicode编码:9FA5 84 //?是汉字扩展字符,占两个字符,也就是两个char,也就是4字节,也就是32位 85 String s2 = "b";//Unicode编码:20000 86 System.out.println("测试字符s:" + s); 87 System.out.println("测试字符s2:" + s2); 88 System.out.println("测试字符s长度:" +s.length()); 89 System.out.println("测试字符s2长度:" +s2.length()); 90 //System.out.println("s转为二进制:" + Integer.toBinaryString(s.charAt(0))); 91 //System.out.println("s2转为二进制:" + Integer.toBinaryString(s2.charAt(0)) + "-" + Integer.toBinaryString(s2.charAt(1))); 92 93 } 94 95 public static String intToBinary32(int i, int bitNum){ 96 String binaryStr = Integer.toBinaryString(i); 97 while(binaryStr.length() < bitNum){ 98 binaryStr = "0"+binaryStr; 99 } 100 return binaryStr; 101 }