• java中符号类型和无符号类型的问题分析


    一 参考博文

    java中无符号类型的解决方案
    原码、反码、补码知识详细讲解(此作者是我找到的讲的最细最明白的一个)
    0x80000000为什么等于-2147483648和负数如何在内存上储存

    二 java中的无符号数和有符号数

    在计算机中,可以区分正负的类型,称为有符号类型,无正负的类型,称为无符号类型。

    • 使用二进制中的最高位表示正负
      计算机中用补码表示数值;另外,用二进制的最高位表示符号,0表示正数、1表示负数。
    • 无符号和有符号数的范围的区别
      无符号数中,所有的位都用于直接表示该值的大小;有符号数中最高位用于表示正负,所以,正值时,该数的最大值就会变小:
      无符号数:1111 1111 值:255
      有符号数:0111 1111 值:127
      同样一个字节,无符号的最大值是255,有符号的最大值是127

    三 java中的基本类型

    Java的原始类型里除了char是无符号类型之外,其他都是有符号数据类型,如果需要某个宽度的无符号类型,可以用>>>进行转化,这个是java的无符号右移操作符,或者使用下一个宽度的带符号类型来模拟
    例如,需无符号的short,就用int来模拟:

        int toUnsigned(short s) { 
             return s & 0x0FFFF;
        } 
    

    java中十进制的字面常理只有一个特性,就是所有的十进制字面常量都是正数,如果想写一个负的十进制,则需要在正的十进制字面常量前面加上“-”就好了。
    但是十六进制或者八进制的字面常量就不一定是正数或者负数,如果最高位是1,那么就是负数:

            System.out.println(0x80);//128
            //0x81看作是int型,最高位(第32位)为0,所以是正数
            System.out.println(0x81);//129
            System.out.println(0x8001);//32769
            System.out.println(0x70000001);//1879048193
            //字面量0x80000001为int型,最高位(第32位)为1,所以是负数
            System.out.println(0x80000001);//-2147483647
            //字面量0x80000001L强制转为long型,最高位(第64位)为0,所以是正数
            System.out.println(0x80000001L);//2147483649
    

    四 补码与真值

    这里先看一个问题:

        @Test
        public void test01(){
            System.out.println(0x80000000); // -2147483648
        }
    

    这个结果是怎么得来的?
    要搞明白这个问题,得先明白几个概念:

    • 机器数:
      一个数在计算机中的二进制表示形式, 叫做这个数的机器数。机器数是带符号的,在计算机用一个数的最高位存放符号, 正数为0, 负数为1.
      比如,十进制中的数 3 ,计算机字长为8位,转换成二进制就是00000011。如果是 -3 ,就是 10000011 。那么,这里的 00000011 和 10000011 就是机器数
    • 真值:
      因为第一位是符号位,所以机器数的形式值就不等于真正的数值。例如上面的有符号数 10000011,其最高位1代表负,其真正数值是 -3 而不是形式值131(10000011转换成十进制等于131)。
      所以,为区别起见,将带符号位的机器数对应的真正数值称为机器数的真值(即补码表示的值)。
      例:0000 0001的真值 = +000 0001 = +1,1000 0001的真值 = –000 0001 = –1
    • 计算真值
      就拿-3来说,机器数为 10000011,那么补码是 11111101,所以真值就是补码的值:
      补码求值公式:补码的最高位有效位乘以(-1),然后按一般求二进制的方法求值
      例如:
      -3的补码 11111101 = (-1)12^7 + 12^6+.... 12^0 = -3
      3的补码 00000011 = (-1)027+........1*20= 3
    • 0x80000000问题解析
      再来看0x80000000为什么等于-2147483648,Java中用此十六进制表示int的最小值:
        /**
         * A constant holding the minimum value an {@code int} can
         * have, -2<sup>31</sup>.
         */
        @Native public static final int   MIN_VALUE = 0x80000000;
    

    此十六进制数内存中存储的的确是0x80000001的二进制码。因为使用十六进制给int赋值时,这里的十六进制是补码形式。
    也就是说,我们给变量赋的是补码,不是源码,所以会直接把0x80000001这个补码存入内存
    补码求值得: 0x80000000 = (-1)1231+.....+0*20 = -2147483648
    所以这个值是这样来的!

    五 java中的数据类型符号扩展

    先看一个jdk源码中int转为long用到的方法:

        @Test
        public void test03(){
            final long l = -5 & 0xffffffffL;
            System.out.println(l);  // 4294967291
        }
    

    如果运算一个操作数是long型,而另一个操作数是int类型。为了执行该计算,Java将int类型的数值用拓宽原生类型转换提升为long类型,然后对两个long类型数值相加。
    因为int是有符号的整数类型,所以这个转换执行的是符号扩展。
    -5 转换为long再转换为二进制,0xffffffff转换为二进制
    进行与运算:
    1111111111111111111111111111111111111111111111111111111110000101
    0000000000000000000000000000000011111111111111111111111111111111
    ---------------------------------------------------------------------- & 与运算,两个都为1才为1,否则为0
    0000000000000000000000000000000011111111111111111111111110000101= 4294967173 (十进制)
    为什么-5转long前面要补1呢,这里就需要知道符号扩展规则:
    窄的整型转换成较宽(字节数多)的整型时符号扩展规则:
    如果最初的数值类型是有符号的,那么就执行符号扩展(即如果符号位为1,则扩展为1,如果为零,则扩展为0);
    如果它是char,那么不管它将要被提升成什么类型,都执行零扩展,

    如果将一个char数值c转型为一个宽度更宽的整型,并且希望有符号扩展,那么就先将char转型为一个short,它与char上个具有同样的宽度,但是它是有符号的
    宽的整型转换成窄的整型直接截取低位的值,高位扔掉
    所以上面-5符号是1,所以进行符号扩展前面都补1,补成long(64位),再进行位运算得出结果!

    六 Java中byte转换int时与0xff进行与运算的原因

    jdk源码中byte转int用到了 & 0xff,比如String的API:

        public static char charAt(byte[] value, int index) {
            if (index < 0 || index >= value.length) {
                throw new StringIndexOutOfBoundsException(index);
            }
            return (char)(value[index] & 0xff);// 先转int,再转char
        }
    

    这里为什么要用与运算呢? 因为char是无符号类型,所以不能进行符号扩展,需要零扩展,即前面补0
    窄整型->宽整型要进行符号扩展,这里byte->cahr是窄到宽,如果不想进行符号扩展,则需要&0xff处理,先转int消除掉符号扩展,再转char即可
    (b & 0xff)的结果是32位的int类型,前24被强制置0,后8位保持不变,然后转换成char型时,直接截取后16位。这样不管b是正数还是负数,转换成char时,都相当于是在左边补上8个0,即进行零扩展而不是符号扩展
    至于为什么要进行零扩展: 因为char是无符号类型,他会把 1111 1111 当做65535而不是-1,,所以你前面补1的话数就会变很大,所以这里需要进行0扩展,于是 & 0xff这种骚操作就来了,这里确实有点绕!如果不看源码(并且要认真看啊,哈哈)一般发现不了这种问题
    再比如下面代码:

        @Test
        public void test01(){
            byte b=-1;
            System.out.println((int)b);   // -1
            System.out.println(b & 0xff); // 255
        }
    

    这里第二行255应该都好说,高位清零就是,至于直接强转为-1,那么符号扩展之后补码为11111111111111111111111111111111,求出结果原码:100000000000000000000000000001 还是-1,所以就是上面的结果,原理就是这样!
    主要就是一个符号扩展延伸出来的问题!

  • 相关阅读:
    {Python之进程} 背景知识 什么是进程 进程调度 并发与并行 同步异步阻塞非阻塞 进程的创建与结束 multiprocess模块 进程池和mutiprocess.Poll
    {Python之线程} 一 背景知识 二 线程与进程的关系 三 线程的特点 四 线程的实际应用场景 五 内存中的线程 六 用户级线程和内核级线程(了解) 七 python与线程 八 Threading模块 九 锁 十 信号量 十一 事件Event 十二 条件Condition(了解) 十三 定时器
    {03--CSS布局设置} 盒模型 二 padding bode margin 标准文档流 块级元素和行内元素 浮动 margin的用法 文本属性和字体属性 超链接导航栏 background 定位 z-index
    {前端CSS} 语法 Css的几种引入方式 css选择器 选择器的优先级 CSS属性相关 背景属性 边框 CSS盒子模型 清除浮动 overflow溢出属性  定位(position)z-index
    JavaScript 引入方式 语言规范 语言基础 数据类型 常用方法 数组 if_else 比较运算符 for while 函数 函数的全局变量和局部变量 {Javascript学习}
    JS BOM DOM对象 select联动 计时器 时间 css操作 节点(标签 ) 查找标签 {前端基础之BOM和DOM}
    Bootstrap框架 inconfont font-awesome
    MySQL 安装 用户管理 常用命令
    介绍elasticsearch的文件
    ELK之elasticsearch安装&&kibana安装
  • 原文地址:https://www.cnblogs.com/houzheng/p/12259759.html
Copyright © 2020-2023  润新知