• 编写安全代码:小心使用浮点数


    作者:gfree.wind@gmail.com
    博客:blog.focus-linux.net   linuxfocus.blog.chinaunix.net
     
     
    本文的copyleft归gfree.wind@gmail.com所有,使用GPL发布,可以自由拷贝,转载。但转载请保持文档的完整性,注明原作者及原链接,严禁用于任何商业用途。
    ======================================================================================================
    其实浮点数使用时的注意事项,是一个老生常谈的问题,我本来不想写这个东西的。但是论坛上偶尔还是会有一些朋友问一些浮点的问题,另外前几天写得一篇博文《有趣的问题:C的表达式x==x何时为假》http://blog.chinaunix.net/space.php?uid=23629988&do=blog&id=3126229&cid=565775&comment=true
     
    在那篇文章中,通过x != x为假这一有趣的问题,引出一个特殊的浮点数值NaN。当时我还为了对比浮点与整数的转换,所以使用了memcpy来达到用0xff填充浮点数,来形成NaN。但是在评论中,发现有的朋友反而因为示例中的memcpy而没有注意到重点NaN。
     
    那么今天就重点说一下NaN,并顺带说一下浮点的其它陷阱。
     
    1. 浮点的精度限制。
    浮点数的存储格式与整数完全不同。大部分的实现采用的是IEEE 754标准,float类型,是1个sign bit,8 exponent bits,23 mantissa bits。而double类型,是1个sign bit,11 exponent bits,52 mantissa bits。至于浮点如何去表示小数,请自行搜索google。由于float使用的小数表示方法,导致浮点数值是有精度限制的。
     
    有限的精度就引发了浮点数值使用时的两个陷阱。
     
    1)交换定律不适用浮点数
    如有三个浮点数float x=1/3,y=1/6,z=1/7,而x*y/z不等于x*(y/z)
     
     
    #include <stdlib.h>
    #include <stdio.h>
    
    int main(void)
    {
    
        float x = 1/3;
        float y = 1/6;
        float z = 1/7;
        if (x*y/z != x*(y/z)) {
    
            printf("Not equal!\n");
        }
        return 0;
    
    }
    编译输出:
    [fgao@fgao-vm-fc13 test]$ gcc -g test.c
    [fgao@fgao-vm-fc13 test]$ ./a.out
    Not equal!

    而对于整数来说,如果不发生溢出的情况下,x*y/z是等于x*(y/z)。

     
    2)浮点数的比较要使用范围比较
    如:
    #include <stdlib.h>
    #include <stdio.h>
    int main(void)
    {
    
        float x = 0.123-0.11-0.013;
        if (x == 0) {
            printf("x is 0!\n");
        }
        if (-0.0000000001 < x && x < 0.0000000001) {
            printf("x is in 0 range!\n");
        }
        return 0;
    }

    编译输出:

    [fgao@fgao-vm-fc13 test]$ gcc -g test.c
    [fgao@fgao-vm-fc13 test]$ ./a.out
    x is in 0 range!

    这两个都是比较常见的浮点陷阱,下面要说明的是浮点数值的两个exception

    1)infinite无限
    2)NaN即Not a Number
    其中NaN为最为特殊的一个“浮点值”——它不是一个合法的浮点值
    在前面的文章中,我使用memcpy构造了一个非法的浮点数值,它导致了x与自身比较的失败。那么,有的朋友会说平时谁会用memcpy去填充浮点啊,那么NaN就离我很远了啊。请看下面的例子:
    #include <stdlib.h>
    
    #include <stdio.h>
    
    int main(void)
    {
    float x = 1/0.0; printf("x is %f\n", x); x = 0/0.0; printf("x is %f\n", x); return 0;
    }

    编译输出

    [fgao@fgao-vm-fc13 test]$ gcc -g test.c
    [fgao@fgao-vm-fc13 test]$ ./a.out
    x is inf
    x is -nan
    当1除以0.0时,我们得到的是infinite,而是用0除以0.0时,得到的就是NaN。这里完全是普通的除法运算,也会产生NaN的情况。
     
    那么当使用除法的时候,对除数进行检查,保证其不为0.0是否就可以避免NaN了呢?再看下面的代码:
    #include <stdlib.h>
    #include <stdio.h>
    int main(void)
    {
        float x;
        while (1) {
    
            scanf("%f", &x);
    
            printf("x is %f\n", x);
    
        }
        return 0;
    }

    编译执行

    [fgao@fgao-vm-fc13 test]$ ./a.out
    inf
    x is inf
    nan
    x is nan

    示例代码中,调用scanf来得到用户输入的浮点数。令人惊讶的是,scanf作为C库函数是接受浮点数的这两种exceptions的,用户可以直接输入无限inf和NaN。而C库中究竟有多少种输入输出函数支持这两种exception,我也不知道。那么对于UI程序来说,当遇到浮点数值的时候,我们必须要判断该浮点数是否为一个合法的浮点数,要对用户输入值进行检查,或者说对于一切不属于本模块的浮点输入值都要进行检查。——我在我同事那就遇到一个开源库返回的浮点数为NaN,才引发的前文。

     
    以上面的代码为例,应该为:
    #include <stdio.h>
    #include <stdlib.h>
    #include <math.h>
    int main()
    {
        float x;
        while (1) {
            scanf("%f", &x);
            if (isinf(x)) {
                printf("It's infinite\n");
            }
            if (isnan(x)) {
                printf("It's NaN\n");
            }
            printf("x is %f, 0x%X\n", x, *(int*)&x);
        }
       return 0;
    }

    编译运行:

    inf
    It's infinite
    x is inf, 0x7F800000
    nan
    It's NaN
    x is nan, 0x7FC00000

    其中isinf和isnan为C库提供的检测函数,分别用于检查infinite和NaN。而isnan实际上就是返回x != x,利用的就是NaN的特性,与任何数值进行相等比较都是返回false。所以当x != x时,即为NaN浮点值。

        
    作者:wanglei_wan
        
    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
  • 相关阅读:
    JavaEE编程实验 实验1 Java常用工具类编程(未完成)
    设计模式(一)Chain Of Responsibility责任链模式
    JavaSE习题 第八章 线程
    JavaSE习题 第七章 常用实用类
    JavaSE习题 第六章 字符串和正则表达式
    JavaSE 字符串和正则表达式
    HDFS的Shell操作
    HDFS概述
    Hadoop完全分布式模式
    免密登陆
  • 原文地址:https://www.cnblogs.com/because/p/2711989.html
Copyright © 2020-2023  润新知