• Java8集合框架——基础知识点汇总


    前言

      Java的集合框架比较基础,像 List、Map、Set 中大概10来个比较常见的集合类,建议多看几遍源码(这里主要是基于 Java 8),然后回过头再来看看各路博客总结的这些知识点,会有一种豁然开朗的感觉。本文的目录结构如下:

    一、Java的基础集合分类和继承结构

      Java的集合主要有 Set、List、Queue、Map 等。其中,Set、List、Queue 继承于 Collection,而 Map 的实现用于保存具有映射关系的数据(key-value),和 Collection 有一定的差别,它是另一个上层接口。

    Collection 的继承结构:

    Map 的继承结构:

    二、基本特征:

      List 、 Set 、 Map 这几类基础集合的基本特征如下:

    集合类型

    基本特征

    List

    1、有序集合(读取数据和存放数据的顺序一致)

    2、元素可以重复,访问元素可以根据元素的索引来访问。

    Set

    1、无序集合(读取数据和存放数据的顺序不一致)

    2、根据元素本身来访问元素和进行重复性判断,因此元素不可以重复,类似于数学上的集合概念

    Map

    保存 Key-value 对形式的元素,访问时只能根据每项元素的 key 来访问其 value。

    1、Set 和 Map 容器都有基于哈希存储(HashSet/HashMap)和排序树(红黑树)(TreeSet/TreeMap)的两种实现版本

    2、基于哈希存储的版本理论存取时间复杂度为 O(1)(没有哈希冲突),

    3、基于排序树版本的实现在插入或删除元素时会按照元素或元素的键(key)构成排序树从而达到排序和去重的效果,各类操作的时间复杂度为 O(logN)。

    三、集合的几种实现:

      集合的几种实现方式如下:

    实现方式

    说明

    举例

    数组

    1、数组占用连续内存空间,根据索引查找(即读取)或修改指定索引的元素,速度较快;

    2、指定索引处的增删元素较慢,因为需要移动指定索引处后面的元素。

     
    列表

    一般通过数组实现,但可以自动扩展,通过将旧元素复制到新的内存空间上进行扩容。

    ArrayList

    链表

    1、充分利用了内存,存储空间是不连续的,内部存储上/下一个节点的信息

    2、读慢改快:因存储空间不连续,所以寻址麻烦,顺序遍历,查找速度慢,但是找到元素后增删快,

    只需要修改节点链接信息,无需挪动其他的元素。

    LinkedList

    哈希表 链表哈希表综合了前两者的优点,一个哈希表,一般内部由数组和链表(或者红黑树)组成 HashMap

    四、集合常见的实现类和源码浅析:

      常见的集合实现类和相关的源码实现浅析:

    集合类型 常见的实现类 说明 源码实现浅析参考
    List ArrayList

    1、内部是数组实现,查询快(通过数组索引),指定索引处增删慢(需要移动后续的元素);

    2、对插入的元素不进行判断,元素可为空,还可以重复;

    3、元素读取和存放同序,即按照存放的顺序进行读取;

    4、轻量级,相关操作都没有进行同步或者加锁,因此线程不安全,

         可以用 Collections 配合 ArrayList 实现线程同步。

    Java8集合框架——ArrayList源码分析
    LinkedList 链表实现,增删快(前提是要找到指定的结点),查询慢(需要顺序遍历)。 Java8集合框架——LinkedList源码分析
    Vector

    1、其实现和 ArrayList 类似

    2、区别在于:方法中使用了 synchronized 进行同步,重量级操作,但是线程安全

     
    Map HashMap

    1、键值对,key 不能重复(相同的 key,其旧的 value 会被覆盖),但是 value 可以重复;

    2、整体实现是数组+链表(or 红黑树);

    3、允许 null 的键或值;

    4、轻量级,相关操作都没有进行同步或者加锁,因此线程不安全;

    5、可配合 Collections 工具类使用实现线程安全,或者建议直接使用 ConcurrentHashMap。

    Hashtable

    (弃用)

    线程安全的,其线程安全是通过 Sychronize 实现,而且不允许 null 的键或值  
    Properties key 和 value 都是 String 类型,用来读配置文件  
    TreeMap

    1、对 key 排好序的 Map;

    2、key 要实现 Comparable 接口或 TreeMap 的构造器中传入 Comparator,用于比较排序;

    3、内部以 red-black(红-黑)树数据结构实现,插入,删除和查找的时间复杂度都是 O(log n);

    4、实现了SortedMap接口

     
    LinkedHashMap

    1、HashMap 的子类,对 HashMap 进行了扩展,维护着一个运行于所有元素的双向链表。

    2、存储的数据是有序的,保存了记录(或访问)的插入顺序(双向链表的记录)。

    Java8集合框架——LinkedHashMap源码分析
    Set HashSet

    1、存放重复的元素时,只会保留一个。

    2、一般需要重写 hashCode() 方法,采用恰当的方式分配散列码。

    3、内部实现是使用 HashMap,元素为 key,value 都是同个 Object 对象。

    而value是同一个 Object,即 private static final Object PRESENT = new Object(); 。

    Java8集合框架——HashSet源码分析
    TreeSet

    1、SortedSet 的实现类,实现排序,因此添加到 TreeSet 的元素必须是可排序的(元素自身可排序

    或者提供Comparator 进行排序),它总是平衡的,保证了插入、删除、查询的性能为 log(n)。

    2、内部实现是 TreeMap

     
    LinkedHashSet

    1、与 HashSet 的不同之外在于,维护着一个运行于所有元素的双向链接。

    2、存储的数据是有序的(通过双向链表维持有序性)

    3、扩展自 HashSet,但是其底层使用 LinkedHashMap,元素为 key,而value是同一个 Object,

    即 private static final Object PRESENT = new Object(); 原理和 LinkedHashMap 类似。

     Java8集合框架——LinkedHashSet源码分析
    Queue

    PriorityQueue

    1、一个基于优先级堆的无界队列,它的元素是按照自然顺序(natural order)排序的。

    2、在创建的时候,可以提供一个负责给元素排序的比较器。

    3、PriorityQueue不允许null值,因为他们没有自然顺序,或者说他们没有任何的相关联的比较器。

    4、PriorityQueue不是线程安全的,入队和出队的时间复杂度是O(log(n))。

     

    关于 Collection 的几点简单/补充说明: 

    1. Collection 是最基本的集合接口。所有实现 Collection 接口的类都需要提供两个标准的构造函数
      • 无参数的构造函数:用于创建一个空的 Collection
      • 有一个 Collection 参数的构造函数:用于创建一个新的 Collection,这个新的 Collection 与传入的 Collection 有相同的元素,即允许用户复制一个 Collection。
    2. 可以使用 iterator() 或者 foreach 循环对 Collection 的元素进行遍历
    3. Collection 接口派生的两个接口是 List 和 Set
      • Set 接口
        • Set 表示数学意义上的集合,不予许有重复的元素,即不会存在元素 e1 和 e2,使得 e1.equals(e2)。常见操作是对象的添加、删除,但不支持随机访问。
      • List 接口
        • 允许有重复项,且元素有顺序(索引),可以根据索引对元素进行访问。
        • List 接口提供了4种对列表元素进行定位(索引)访问方法:索引、迭代器 Iterator、特殊迭代器 ListIterator、foreach、for 循环。
        • List 接口提供了特殊的迭代器,称为 ListIterator,除了允许 Iterator 接口提供的正常操作外,该迭代器还允许元素插入和替换,以及双向访问。还提供了一个方法来获取从列表中指定位置开始的列表迭代器。

    Collections.synchronizedCollection(Collection<T> c) 方法去处理原本非同步的类,在不丢失性能的前提下,实现同步。Java1.5提供了 ConcurrentHashMap,适用于高并发的线程安全实现。

    注:ConcurrentHashMap:线程安全,是通过 Lock 的方式实现的,并且锁分离。ConcurrentHashMap 内部使用段(Segment)来表示这些不同的部分,每个段其实就是一个小的 HasMap,它们有自己的锁,只要多个修改操作发生在不同的段上,它们就可以并发进行。大体可以看出这也是 ConcurrentHashMap 名称的由来。

    五、Collection、Collections、Arrays的区别

      Collection 、 Collections 、 Arrays 三者的区别和相关说明如下:

    Collection 集合类的上级接口,继承于他的接口主要有 Set、List。Set 里的元素是不能重复的,equals() 方法来区分重复与否。  
    Collections 针对集合类的一个工具类,提供一系列静态方法实现对各种集合的搜索、排序、线程安全化等操作。 Java8集合框架——集合工具类Collections内部方法浅析
    Arrays 包含用来操作数组(比如排序和搜索)的各种方法 Java8集合框架——集合工具类Arrays内部方法浅析

    六、其他待补充

    以下这几点的内容待研究和补充。。。。

    1、集合迭代 Iterator

    2、Iterator 的 fail-fast 和 fail-safe

    1. 每次我们尝试获取下一个元素的时候,Iteratorfail-fast 属性检查当前集合结构里的任何改动(使用内部属性 modCount,修改计数器)。如果发现任何改动,它抛出 ConcurrentModificationExceptionCollection 中所有 Iterator 的实现都是按fail-fast 来设计的(ConcurrentHashMapCopyOnWriteArrayList 这类并发集合类除外)。
    2. Iteratorfail-fast 属性与当前的集合共同起作用,因此它不会受到集合中任何改动的影响。java.util 包中的所有集合类都被设计为 fail-fast 的,而 java.util.concurrent 中的集合类都为 fail-safe 的。fail-fast 迭代器抛出 ConcurrentModificationException,而 fail-safe 迭代器从不抛出 ConcurrentModificationException
    3. 在 Java fail fast 迭代器中,迭代 objects 集合有时会出现并发修改异常,出现这种情况有2个原因:①如果一个线程正在迭代一个集合,而另一个线程同时试图修改这个集合;②遍历过程中,试图去修改集合。注:在遍历过程中调用 remove() 方法不会引起 ConcurrentModificationException
    4. fail-fast(快速失败):快速失败机制在遍历一个集合时,如果集合内容被修改,会抛出 ConcurrentModificationException 异常。
    5. fail-safe(安全失败):安全失败机制对集合的任何修改都会在一个复制的集合上进行,因此不会抛出异常。
  • 相关阅读:
    Python画图代码
    关于meshgrid和numpy.c_以及numpy.r_
    Reshape以及向量机分类学习和等高线绘制代码
    Python中的数组和list
    关于透视图和等高线
    Iris花逻辑回归与实现
    Crowd安装和破解
    Confluence搭建
    基于搜狗微信搜索获取公众号文章的阅读量及点赞量
    PHP中使用cURL实现Get和Post请求的方法
  • 原文地址:https://www.cnblogs.com/wpbxin/p/9033468.html
Copyright © 2020-2023  润新知