• [Java复习] 集合框架 Collection


    Q1 Collection

    java的集合以及集合之间的继承关系?

    数组和链表的区别?

    固定长度,连续内存,不能扩展,随机访问快,插入删除慢。链表相反

    List, Set, Map的区别?

    List,Set继承Collection接口

    List可以放重复数据,Set不能,Map是k-v对

    List和Map的实现方式以及存储方式?

    ArrayList: 底层动态数组。随机访问快,增删慢,线程不安全。

    扩容导致数组复制,批量删除会导致找两个集合交集,效率低。

    LinkedList: 底层链表(双向列表)。增删快,查找慢,线程不安全。

    遍历: 1.普通for循环,元素越多后面越慢 2.迭代器:每次访问,用游标记录当前位置

    根据下标获取node,会根据index处于前半段还是后半段进行折半,提升效率。

    HashMap: 散列表, 数组+链表+红黑树(JDK1.8) 默认16, 扩容2的幂

    Q2 List

    ArrayList实现原理?

    动态数组,默认10,扩容grow(minCapacity),增加到1.5倍

    ArrayList和LinkedList的区别,以及应用场景?

    1.动态数组和双向队列链表。

    2.ArrayList(实现了RandomAccess接口)用for循环遍历优于迭代器,LinkedList则相反。

    3.ArrayList在数组任意位置插入,或导致该位置后面元素重新排列,效率相对低。

    LinkedList增删只需移动指针,时间效率高。不需扩容,空间效率也高。但随机访问元素时间效率低。

    链表翻转? 手写链表逆序代码?

    方法1:递归: 从最后一个Node开始,在弹栈的过程中将指针顺序置换。

     1 public class Node {
     2 
     3     private String data;
     4 
     5     private Node next;
     6 
     7               // Getter() & Setter()
     8 
     9 }
    10 
    11     public Node reverse(Node head) {
    12 
    13         if (head == null || head.getNext() == null) {
    14 
    15             return head;
    16 
    17         }
    18 
    19         Node temp = head.getNext();
    20 
    21         Node newHead = reverse(head.getNext());
    22 
    23         temp.setNext(head);
    24 
    25         head.setNext(null);
    26 
    27         return newHead;
    28 
    29 }
    View Code

    解析:递归本质是系统压栈,压栈时保留现场。

    例子:A->B->C->D

    程序先压栈,到达倒数第2个节点时(C),C的next为D, reverse(D)返回D。

    接着就是弹栈过程,执行temp.setNext(head); 此时temp是D, head是C,temp的next设置为C, 就是D->C, 不过head是C,还有next是D,这句会形成环(D->C->D)。需要下一句head.setNext(null);把C的next指针断开,形成D->C(C.next->null)的反转最后2个节点。返回新链表的头结点newHead,也就是D。后面进行相同操作,最终完成整个链表的反转。

    方法2:遍历: 在链表遍历的过程中将指针顺序置换。

     1 public Node traverseReverse(Node head) {
     2 
     3               Node pre = null;
     4 
     5               Node next;
     6 
     7               while(head != null) {
     8 
     9                              next = head.getNext();
    10 
    11                              head.setNext(pre);
    12 
    13                              pre = head;
    14 
    15                              head = next;
    16 
    17               }
    18 
    19               return pre;
    20 
    21 }
    View Code

    解析:在head点遍历, 第一次时为A节点,next为B节点,head(A)节点的next设置为前一个节点pre(当前为null),把head节点赋给pre,pre为A节点,再把next节点(B)赋给head。

    进行下一次循环,head为B节点,pre为A节点,head(B)节点的next设置为前一个节点pre(A),形成B->A,再复制给pre。Head移动到下一个节点。依次继续循环。。。

    判断一个单链表是否有环?如果有环找出环的起点,以及环的长度?

    方法一,穷举遍历。用新节点ID和此节点之前所有节点ID依次比较,如发现存在相同ID,则有环。时间复杂度O(N*N), 没有额外空间,空间复杂度O(1)

    方法二,哈希表HashSet缓存。如发现存在相同节点,则说明有环。时间复杂度O(N),空间复杂度O(N)。

    方法三,快慢指针。快指针移动2个节点,慢指针移动1个节点。然后比较2个指针节点是否相同。相同有环。

    Q3 Map

    HashMap数据结构,实现原理?put, get, resize等工作原理?

    HashMap存储key-value键值对。Key和value都允许为null。Key重复会被覆盖,value可以重复。无序。非线程安全。

    JDK1.7 数组+链表,JDK1.8 数组+链表+红黑树。

    默认集合容量16,默认填充因子0.75,数组长度为2的幂次方,链表长度>8,集合容量>64,链表转红黑树,当红黑树节点个数小于6,又会转化为链表。新增红黑树作为底层数据结构,在数据量较大且哈希碰撞较多时,提高索引效率。

    HashMap实现原理:

    底层table,是一个Node<K,V>的数组,当添加一个元素时,先计算key的hash值,以此确定插入table的位置。如果同一个hash的元素已经放入在table的同一位置,则添加到该元素的后面,形成链表。当链表过长时,转化为红黑树,提高查询效率。

    计算数组table索引的方法:(算hash是1,2步,第3步算table索引)

    1. 取 hashCode 值: h = key.hashCode()

    2. 高位参与运算:h ^ (h>>>16)

         好处:右位移16位,正好是32bit的一半,高半区和低半区做异或,就是为了混合原始哈希码的高位和低位,以此来加大低位的随机性。

    3. 取模运算:(table.length - 1) & hash

        为什么用&,不用%? 因为lenth = 2n 时,X % length = X & (length - 1), & 的效率比 % 高很多。

    Put()方法工作原理:

    ① 判断键值对数组 table 是否为空或为null,否则执行resize()进行扩容;

    ② 根据键值key计算hash值得到插入的数组索引i,如果table[i]==null,直接新建节点添加,转向⑥,如果table[i]不为空,转向③;

    ③ 判断table[i]的首个元素是否和key一样,如果相同直接覆盖value,否则转向④,这里的相同指的是hashCode以及equals;

    ④ 判断table[i] 是否为treeNode,即table[i] 是否是红黑树,如果是红黑树,则直接在树中插入键值对,否则转向⑤;

    ⑤ 遍历table[i],判断链表长度是否大于8,大于8的话把链表转换为红黑树(treeifyBin),在红黑树中执行插入操作,否则进行链表的插入操作;遍历过程中若发现key已经存在直接覆盖value即可;

    ⑥ 插入成功后,判断实际存在的键值对数量size是否超过了最大容量threshold,如果超过,进行扩容resize()。

    ⑦ 如果新插入的key不存在,则返回null,如果新插入的key存在,则返回原key对应的value值(注意新插入的value会覆盖原value值)

     

    Resize扩容的工作原理:

    1.计算新桶数组的容量 newCap

    2.新阀值 newThr

    3. 将原集合的元素重新映射到新集合中

    3.1 既不是链表又不是红黑树,直接插入

    3.2 红黑树,调用split方法重新分配

    3.3.链表,不用像JDK1.7重新计算hash,只看原hash值新增的bit是1还是0,是0则索引不变,是1则索引变为”原索引+oldCap”

    Get工作原理:

    1. 通过key的hash计算table索引位置:hash & (length - 1)。

    2. 检查数组该位置节点是否刚好是要找的元素,如果是则返回,如果不是则第3步。

    3. 判断该元素时否TreeNode, 如果是则用红黑树TreeNode的方法find查找元素。如果不是则第4步。

    4.遍历链表,找到相等(==或equals)的key。

    HashMap线程不安全实际会如何体现?

    1. 多线程同时Put元素,假设key发生碰撞(hash相同),这个两个key会添加到数组同一个位置,其中一个线程的数据被覆盖。

    2. 多线程同时检查到需要扩容,都在重新计算元素位置及复制数据,最终只有一个线程扩容后的数组会赋值给table,其他线程会丢失。

    HashMap如何变成线程安全?

    1. Collections.synchronizeMap();

    2. ConcurrentHashMap(java.util.concurrent). JDK1.5+

    为什么String, Integer这样的wrapper类适合作为键?

    String是不可变的,所以他创建的时候hashcode就被缓存了,不需要重新计算。还有字符串的处理速度要快过其他的键对象。

    Integer的hashcode返回本身的值,也是不变的。

    重新调整HashMap的大小存在什么问题?

    JDK1.7多线程会产生竞争条件(race condition)。

    两个线程同时尝试调整大小。调整过程,存储链表中元素次序会反过来,放在头部不是尾部,是为了避免尾部遍历(tail traversing)。如果竞争条件发生,就产生死循环。

    HashMap中如何解决碰撞问题?如何减少碰撞?

    在调用Put和get方法时,首先通过key的hashcode方法计算哈希桶的位置在存储对象。当获取对象时,通过键对象的equals()方法找到正确的键值对。

    HashMap使用链表来解决碰撞问题,当碰撞发生了,对象将会存储在链表的下一个节点。

    减少碰撞:1. 使用不可变,声明为final的对象,比如String 作为Key。

    2.采用合适的equals()和hashCode()方法,将会减少碰撞发生,提高效率。String已经重写了equals和hashcode方法,很适合作为HashMap的Key。

    LinkedHashMap和TreeMap是如何保证它的顺序的?

    LinkedHashMap继承HashMap.Node的属性,额外增加了before, after用于指向前一个Entry和后一个Entry,在哈希表继承上构成双向链表。可以按照插入的顺序排序的Map。

    TreeMap是按照Key的自然顺序或者Comparator的顺序进行排序。

    LinkedHashMap是双向链表,TreeMap是红黑树。

    它们两个哪个的有序实现比较好?

    如果要按自然顺序或自定义顺序遍历键,那么TreeMap实现更好。如果需要输出的顺序和输入的相同,那么用LinkedHashMap实现更好。

    Collection思维导图Github地址:

    https://github.com/channingy/JavaSummary/

    参考资料:

    https://www.cnblogs.com/ysocean/p/8657850.html

    https://www.cnblogs.com/ysocean/p/8711071.html

    https://www.cnblogs.com/litexy/p/9744241.html

  • 相关阅读:
    Spring @Async开启异步任务
    Spring中@Async用法总结
    分布式任务调度平台XXL-JOB
    异常的概念和Java异常体系结构
    Java中主线程如何捕获子线程抛出的异常
    java主线程捕获子线程中的异常
    springboot线程池@Async的使用和扩展
    全面理解Java内存模型(JMM)及volatile关键字
    C++异常处理入门
    VC6下深入理解new[]和delete[](在多线程下new和delete的时候,必须选择上多线程库,不然可能造成进程崩溃)
  • 原文地址:https://www.cnblogs.com/fyql/p/11027148.html
Copyright © 2020-2023  润新知