• Java 中 equals() 和 hashcode() 方法详解


    hashCode 使用中产生的问题

    HashSet 是一个无序、不可重复的集合,代码如下:

    public class HashSetDemo {
        public static void main(String[] args) {
            Set<Student> sets = new HashSet<>();
            sets.add(new Student(1,"张三",23));
            sets.add(new Student(2,"李四",24));
            sets.add(new Student(3,"王五",22));
            sets.add(new Student(4,"赵六",27));
            sets.add(new Student(4,"赵六",27));
    
            for (Student student: sets) {
                System.out.println(student);
            }
        }
    }
    

    运行打印结果如下:

    Student{id=4, name='赵六', age=27, clazz='null', score=0.0}
    Student{id=3, name='王五', age=22, clazz='null', score=0.0}
    Student{id=4, name='赵六', age=27, clazz='null', score=0.0}
    Student{id=1, name='张三', age=23, clazz='null', score=0.0}
    Student{id=2, name='李四', age=24, clazz='null', score=0.0}
    

    是不是结果和我们想象的不一样,HashSet 集合元素不是不重复,为何这里却发生的重复现象呀?这其实是因为 equals、hashCode 使用不规范导致的。那么,equals 和 hashCode 到底有何关系呢?为何影响 HashSet 的使用?

    equals 与 Hashcode 的关系

    它们都是 Object 类中的方法,如下:

    public boolean equals(Object obj)
    public int hashCode()
    
    • equals(): 用来判断两个对象是否相同,在 Object 类中是通过判断对象间的内存地址来决定是否相同
    • hashCode(): 获取哈希码,也称为散列码,返回一个int整数。这个哈希码的作用是确定该对象在哈希表中的索引位置。

    阅读 hashCode 方法的注释如下:

    1. hashCode() 方法返回对象的哈希码,支持该方法是为哈希表提供一些优点,例如,HashMap 提供的哈希表。
    2. 同一个对象未发生改变时多次调用 hashCode() 返回值必须相同
    3. 两个对象 equals 不相等,那么两对象的 hashCode() 返回必定不同(此处可用来提高哈希表性能)
    4. 两个对象的 hashCode() 返回值相同,两对象不一定相同,还需要通过 equals() 再次判断
    5. 当 equals 方法被重写时,通常有必要重写 hashCode 方法

    通过第 1 点其实可以看出,hashCode() 在散列表中才有用,在其它情况下没用。在散列表中 hashCode() 的作用是获取对象的散列码,进而确定该对象在散列表中的位置,当对象不会用来创建像 hashMap、hashSet 等散列表时,hashCode() 实际上用不上。

    产生问题的原因

    分析原因前需要了解哈希表的底层实现,hashCode 在哈希表中充当的作用:

    • 假设内存中有0 1 2 3 4 5 6 7 8这8个位置,如果我有个字段叫做 ID,那么我要把这个字段存放在以上8个位置之一,如果不用HashCode而任意存放,那么当查找时就需要到8个位置中去挨个查找
    • 使用 HashCode 则效率会快很多,把ID的 HashCode%8,然后把 ID 存放在取得余数的那个位置,然后每次查找该类的时候都可以通过ID的 HashCode%8 求余数直接找到存放的位置了
    • 如果 ID 的HashCode%8 算出来的位置上本身已经有数据了怎么办?这就取决于算法的实现了,比如 ThreadLocal 中的做法就是从算出来的位置向后查找第一个为空的位置,放置数据;HashMap 的做法就是通过链式结构连起来。反正,只要保证放的时候和取的时候的算法一致就行了。
    • 如果ID的 HashCode%8 相等怎么办(这种对应的是第三点说的链式结构的场景)?这时候就需要定义 equals 了。先通过HashCode%8 来判断类在哪一个位置,再通过 equals 来在这个位置上寻找需要的类。对比两个类的时候也差不多,先通过HashCode 比较,假如 HashCode 相等再判断 equals。如果两个类的 HashCode 都不相同,那么这两个类必定是不同的。

    其实在 HashSet 就是采用的这种存储和获取方式,通过 HashCode 和 equals 组合的方式来保证集合无重复。也说明了 HashCode() 在散列表中是发挥作用的

    hashCode 的正确使用

    从 JDK 源码的注释中可以看出,hashCode() 在散列表中才会发挥作用,当对象无需创建像 HashMap、HashSet 等集合时,可以不用重写 hashCode() 方法,但是如果有使用到对象的哈希集合等操作时,必须重写 hashCode() 和 equals()。

    作者:Binge
    本文版权归作者和博客园共有,转载必须给出原文链接,并保留此段声明,否则保留追究法律责任的权利。
  • 相关阅读:
    函数
    循环练习
    循环结构
    分支结构
    C语言关键字
    进制编码
    MAC/Xcode简单操作命令
    Hibernate
    Hibernate
    Hibernate
  • 原文地址:https://www.cnblogs.com/binbingg/p/14450595.html
Copyright © 2020-2023  润新知