HashMap集合:
1 HashMap集合底层是哈希表/散列表的数据结构。
2 哈希表是一个怎样的数据结构呢?
哈希表是一个数组和单向链表的结合体。
数组:在查询方面效率很高,随机增删方面效率较低。
单向链表:在随机增删方面效率较高,在查询方面效率较低。
哈希表将以上的两种数据结构融合在一起,充分发挥他们各自的优点。
3 HashMap底层的源代码:
public class HashMap{
// HashMap底层实际上就是一个数组。(一维数组)
transient Node<K,V>[] table;
// 静态的内部类HashMap.Node
static class Node<K,V> implements Map.Entry<K,V> {
final int hash; // 哈希值(哈希值是key的hashCode()方法的执行结果。hash值通过哈希函数/算法,可以转换存储为数组的下标。)
final K key; // 存到Map集合中的那个key
V value; // 存储到Map集合中的那个value
Node<K,V> next; // 下一个节点的内存地址
}
哈希表/散列表:一维数组,这个数组中每一个元素是一个单向链表。(数组和链表的结合体)
4 最主要掌握的是:
map.put(k,v)
v = map.get(k)
以上这两个方法的实现原理,是必须掌握的。
5 HashMap集合的key部分特点:
无序,不可重复。
为什么无序?因为不一定挂到哪个单向链表上。
不可重复是怎么保证的?equals方法来保证HashMap集合的key不可重复。
如果key重复了,value会覆盖。
放在HashMap集合key部分的元素其实就是放到了HashSet集合中了。
所以HashMap集合中的元素也需要同时重写hashCode()+equals()方法。
6 哈希表HashMap使用不当时无法发挥性能!
假设将所有的hashCode()方法返回值固定为某个值,那么会导致底层哈希表变成了纯单向链表。
这种情况我们称为:散列分布不均匀
什么是散列分布均匀?
假设有100个元素,10个单向链表,那么每个单向链表上有10个节点,这是最好的。是散列分布均匀的。
假设将所有的hashCode()方法返回值都设定为不一样的值,可以吗?有什么问题?
不行,因为这样的话导致底层哈希表就成为了一维数组了,没有链表的概念了。
也是散列分布不均匀。
散列分布均匀需要你重写hashCode()方法时有一定的技巧。
7 重点:放在HashMap集合key部分的元素,以及放在HashSet集合中的元素,需要同时重写hashCode和equals方法。
8 HashMap集合的默认初始化容量是16,默认加载因子是0.75
这个默认加载因子是当HashMap底层数组的容量达到75%的时候,数组开始扩容。
重点,记住:HashMap集合初始化容量必须是2的倍数,这也是官方推荐的,这是因为达到单列分布均匀,为了提高HashMap集合的存取效率,所必需的。
9 HashMap在初始化的过程中
1 向Map集合中存,以及从Map集合中取,都是先调用key的hashCode方法,然后在调用equals方法。
equals方法有可能调用,也有可能不调用。
拿put(k,v)方法举例,什么时候equals不会调用?
k.hashCode()方法返回哈希值,
哈希值经过哈希算法转成数组下标,
数组下标位置上如果是null,equals不需要执行。
拿get(k),什么时候equals不会调用?
k.hashCode()方法返回哈希值,
哈希值经过哈希算法转成数组下标,
数组下标位置上如果是null,equals不需要执行。
2 注意:如果一个类的equals方法重写了,那么hashCode()方法必须重写。
并且equals方法返回的如果是true,hashCode()方法返回的值必须一样的。
equals方法返回true表示两个对象相同,在同一个单向链表上比较。
那么对于同一个单向链表上的节点来说,他们的哈希值都是相同的。
所以hashCode()方法的返回值也应该相同。
3 hashCode()方法和equals()方法不用研究了,直接使用IDEA工具生成,但是这两个方法需要同时生成。
4 终极结论:
放在HashMap集合key部分的,以及放在HashSet集合中的元素,需要同时重写hashCode方法和equals方法。
HashMap内存图:
案例:
package com.javaSe.Map; import java.util.HashMap; import java.util.Map; import java.util.Set; /* HashMap集合: 1 HashMap集合底层是哈希表/散列表的数据结构。 2 哈希表是一个怎样的数据结构呢? 哈希表是一个数组和单向链表的结合体。 数组:在查询方面效率很高,随机增删方面效率较低。 单向链表:在随机增删方面效率较高,在查询方面效率较低。 哈希表将以上的两种数据结构融合在一起,充分发挥他们各自的优点。 3 HashMap底层的源代码: public class HashMap{ // HashMap底层实际上就是一个数组。(一维数组) transient Node<K,V>[] table; // 静态的内部类HashMap.Node static class Node<K,V> implements Map.Entry<K,V> { final int hash; // 哈希值(哈希值是key的hashCode()方法的执行结果。hash值通过哈希函数/算法,可以转换存储为数组的下标。) final K key; // 存到Map集合中的那个key V value; // 存储到Map集合中的那个value Node<K,V> next; // 下一个节点的内存地址 } 哈希表/散列表:一维数组,这个数组中每一个元素是一个单向链表。(数组和链表的结合体) 4 最主要掌握的是: map.put(k,v) v = map.get(k) 以上这两个方法的实现原理,是必须掌握的。 5 HashMap集合的key部分特点: 无序,不可重复。 为什么无序?因为不一定挂到哪个单向链表上。 不可重复是怎么保证的?equals方法来保证HashMap集合的key不可重复。 如果key重复了,value会覆盖。 放在HashMap集合key部分的元素其实就是放到了HashSet集合中了。 所以HashMap集合中的元素也需要同时重写hashCode()+equals()方法。 6 哈希表HashMap使用不当时无法发挥性能! 假设将所有的hashCode()方法返回值固定为某个值,那么会导致底层哈希表变成了纯单向链表。 这种情况我们称为:散列分布不均匀 什么是散列分布均匀? 假设有100个元素,10个单向链表,那么每个单向链表上有10个节点,这是最好的。是散列分布均匀的。 假设将所有的hashCode()方法返回值都设定为不一样的值,可以吗?有什么问题? 不行,因为这样的话导致底层哈希表就成为了一维数组了,没有链表的概念了。 也是散列分布不均匀。 散列分布均匀需要你重写hashCode()方法时有一定的技巧。 7 重点:放在HashMap集合key部分的元素,以及放在HashSet集合中的元素,需要同时重写hashCode和equals方法。 8 HashMap集合的默认初始化容量是16,默认加载因子是0.75 这个默认加载因子是当HashMap底层数组的容量达到75%的时候,数组开始扩容。 重点,记住:HashMap集合初始化容量必须是2的倍数,这也是官方推荐的,这是因为达到单列分布均匀,为了提高HashMap集合的存取效率,所必需的。 9 HashMap在初始化的过程中 */ public class HashMapTest01 { public static void main(String[] args) { // 测试HashMap集合key部分的元素特点 // Integer是key,他的hashCode和equals都重写了。 // String的hashCode和equals也都重写了。 Map<Integer,String> map = new HashMap<>(); map.put(1111,"zhangsan"); map.put(2222,"lisi"); map.put(3333,"wangwu"); map.put(4444,"liuliu"); map.put(4444,"king");// key重复的时候value会自动覆盖。 System.out.println(map.size()); //4 Set<Map.Entry<Integer,String>> set = map.entrySet(); for(Map.Entry<Integer,String> entry :set){ // 验证结果:HashMap集合key部分元素:无序不可重复。 System.out.println(entry.getKey() + "=" + entry.getValue()); } } }
案例2:
package com.javaSe.Map; import com.javaSe.Map.bean.Student; import java.util.HashSet; import java.util.Set; /* 1 向Map集合中存,以及从Map集合中取,都是先调用key的hashCode方法,然后在调用equals方法。 equals方法有可能调用,也有可能不调用。 拿put(k,v)方法举例,什么时候equals不会调用? k.hashCode()方法返回哈希值, 哈希值经过哈希算法转成数组下标, 数组下标位置上如果是null,equals不需要执行。 拿get(k),什么时候equals不会调用? k.hashCode()方法返回哈希值, 哈希值经过哈希算法转成数组下标, 数组下标位置上如果是null,equals不需要执行。 2 注意:如果一个类的equals方法重写了,那么hashCode()方法必须重写。 并且equals方法返回的如果是true,hashCode()方法返回的值必须一样的。 equals方法返回true表示两个对象相同,在同一个单向链表上比较。 那么对于同一个单向链表上的节点来说,他们的哈希值都是相同的。 所以hashCode()方法的返回值也应该相同。 3 hashCode()方法和equals()方法不用研究了,直接使用IDEA工具生成,但是这两个方法需要同时生成。 4 终极结论: 放在HashMap集合key部分的,以及放在HashSet集合中的元素,需要同时重写hashCode方法和equals方法。 */ public class HashMapTest02 { public static void main(String[] args) { Student s1 = new Student("zhangsan"); Student s2 = new Student("zhangsan"); // 重写equals方法之前是false // System.out.println(s1.equals(s2)); // 重写equals方法之后是true System.out.println(s1.equals(s2)); // true (s1 和 s2 表示相等) System.out.println("s1的hashCode = " + s1.hashCode()); //284720968 重写hashCode之后 值变成了-1432604525 System.out.println("s2的hashCode = " + s2.hashCode()); //122883338 重写hashCode之后 值变成了-1432604525 // s1.equals(s2)结果已经是true了,表示s1和s2是一样的,相同的,那么往HashSet集合中放的话,按说只能放进去1个。(HashSet集合特点:无序不可能重复。) Set<Student> studentSet = new HashSet<>(); studentSet.add(s1); studentSet.add(s2); System.out.println(studentSet.size()); // 这个结果按说应该是1,但是结果是2,显然不符合HashSet存储特点。怎么办? } }
Product对象:
package com.javaSe.Map.bean; import java.util.Objects; public class Product { private int no; private String name; public Product() { } public Product(int no, String name) { this.no = no; this.name = name; } public int getNo() { return no; } public void setNo(int no) { this.no = no; } public String getName() { return name; } public void setName(String name) { this.name = name; } // 重写hashCode + equals // 假设业务要求:商品编号和商品名字都相同时,表示同一件商品。 @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Product product = (Product) o; return no == product.no && Objects.equals(name, product.name); } @Override public int hashCode() { return Objects.hash(no, name); } }
Student对象:
package com.javaSe.Map.bean; import java.util.Objects; public class Student { private String name; public Student() { } public Student(String name) { this.name = name; } public String getName() { return name; } public void setName(String name) { this.name = name; } // hashCode // equals(如果名字一样,表示是同一个学生。) /*public boolean equals(Object o) { if(null == o && !(o instanceof Student)) return false; if(o == this) return true; Student s = (Student)o; return this.name.equals(s.name); }*/ public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Student student = (Student) o; return name.equals(student.name); } public int hashCode() { return Objects.hash(name); } }
案例:
package com.javaSe.Map; import com.javaSe.Map.bean.Student; import java.util.HashSet; import java.util.Set; /* 1 向Map集合中存,以及从Map集合中取,都是先调用key的hashCode方法,然后在调用equals方法。 equals方法有可能调用,也有可能不调用。 拿put(k,v)方法举例,什么时候equals不会调用? k.hashCode()方法返回哈希值, 哈希值经过哈希算法转成数组下标, 数组下标位置上如果是null,equals不需要执行。 拿get(k),什么时候equals不会调用? k.hashCode()方法返回哈希值, 哈希值经过哈希算法转成数组下标, 数组下标位置上如果是null,equals不需要执行。 2 注意:如果一个类的equals方法重写了,那么hashCode()方法必须重写。 并且equals方法返回的如果是true,hashCode()方法返回的值必须一样的。 equals方法返回true表示两个对象相同,在同一个单向链表上比较。 那么对于同一个单向链表上的节点来说,他们的哈希值都是相同的。 所以hashCode()方法的返回值也应该相同。 3 hashCode()方法和equals()方法不用研究了,直接使用IDEA工具生成,但是这两个方法需要同时生成。 4 终极结论: 放在HashMap集合key部分的,以及放在HashSet集合中的元素,需要同时重写hashCode方法和equals方法。 5 对于哈希表数据结构来说: 如果o1和o2的hash值相同,一定是放到同一个单向链表上。 当然如果o1和o2的hash值不同,但由于哈希算法执行结束之后转换的数组下标可能相同,此时会发生“哈希碰撞”。 */ public class HashMapTest02 { public static void main(String[] args) { Student s1 = new Student("zhangsan"); Student s2 = new Student("zhangsan"); // 重写equals方法之前是false // System.out.println(s1.equals(s2)); // 重写equals方法之后是true System.out.println(s1.equals(s2)); // true (s1 和 s2 表示相等) System.out.println("s1的hashCode = " + s1.hashCode()); //284720968 重写hashCode之后 值变成了-1432604525 System.out.println("s2的hashCode = " + s2.hashCode()); //122883338 重写hashCode之后 值变成了-1432604525 // s1.equals(s2)结果已经是true了,表示s1和s2是一样的,相同的,那么往HashSet集合中放的话,按说只能放进去1个。(HashSet集合特点:无序不可能重复。) Set<Student> studentSet = new HashSet<>(); studentSet.add(s1); studentSet.add(s2); System.out.println(studentSet.size()); // 这个结果按说应该是1,但是结果是2,显然不符合HashSet存储特点。怎么办? } }
案例:
package com.javaSe.Map; import java.util.HashMap; import java.util.Map; /* HashMap集合key部分允许为null吗? 允许 但是要注意:HashMap集合的key null值只能有一个。 有可能面试的时候会遇到这个问题。 */ public class HashMapTest03 { public static void main(String[] args) { Map<Integer,String> map = new HashMap<>(); // HashMap集合允许key为null map.put(null,null); System.out.println(map.size()); // 1 // key重复的话value是覆盖! map.put(null,"100"); System.out.println(map.size()); // 1 // 通过key获取value吗? System.out.println(map.get(null)); // 100 } }