• 疯狂Java讲义-Java集合


    Java集合

    本章思维导图

    Java集合

    Java集合概述

    为了保存数量不确定的数据,以及保存具有映射关系的数据(也被称为关联数组),Java提供了集合类。集合类主要负责保存、盛装其他数据,因此集合类也被称为容器类

    集合和数组不一样,数组元素既可以是基本类型的值,也可以是对象(实际上保存的是对象的引用变量);而集合里只能保存对象(实际上只是保存对象的引用变量)。

    Java的集合类主要由两个接口派生而出:CollectionMap,Collection和Map是Java集合框架的根接口,这两个接口又包含了一些子接口或实现类。

    SetList接口是Collection接口派生出的两个子接口,它们分别代表了无序集合有序集合Queue是java提供的队列实现,类似于List。

    Map实现类用于保存具有映射关系的数据(关联数组);Map保存的每项数据都是key-value对;Map里的key是不可重复的,key用于标识集合里的每项数据。

    可以把Java所有集合分成三大类

    • Set:把一个对象添加到Set集合时,Set集合无法记住添加这个元素的顺序,所以Set里的元素不能重复
    • List:非常像一个数组,它可以记住每次添加元素的顺序、且List的长度可变。
    • Map:也像一个罐子,只是它里面的每项数据都由两个值组成。

    Collection和Iterator接口

    Collection体系图

    Collection

    Collection接口是List、Set和Queue接口的父接口,该接口里定义的方法既可以用于操作Set集合,也可用于操作List和Queue集合。

    Collection接口里定义了如下操作集合元素的方法:

    • boolean add(Object o):该方法用于向集合里添加一个元素。如果集合对象被添加操作改变了,则返回true。
    • boolean addAll(Collection c):该方法把集合c里的所有元素添加到指定集合里。如果集合对象被添加操作改变了,则返回true。
    • void clear():清除集合里的所有元素,将集合长度变为0.
    • boolean contains(Object o):返回集合里是否包含指定元素。
    • boolean containsAll(Collection c):返回集合里是否包含集合c里的所有元素。
    • boolean isEmpty():返回集合是否为空。当集合长度为0时返回true,否则返回false。
    • Iterator iterator():返回一个Iterator对象,用于遍历集合里的元素。
    • boolean remove(Object o):删除集合中指定元素o,当集合中包含了一个或多个元素o时,该方法只删除第一个符合条件的元素,该方法将返回true。
    • boolean removeAll(Collection c):从集合中删除集合c里包含的所有元素(相当于调用该方法的集合减集合c),如果删除了一个或一个以上的元素,则该方法返回true。
    • boolean retainAll(Collection c):从集合中删除集合c里不包含的元素(相当于把调用该方法的集合变成该集合和集合c的交集),如果该操作改变了调用该方法的集合,则该方法返回true。
    • int size():该方法返回集合里元素的个数。
    • Object[] toArray():该方法把集合转换成一个数组,所有的集合元素变成对应的数组元素。

    使用Lambda表达式遍历集合

    Java8为Iterable接口新增了一个forEach(Consumer action)默认方法,该方法所需参数的类型是一个函数式接口,而Iterable接口是Collection接口的父接口,因此Collection集合也可直接调用该方法。

    当程序调用Iterable的forEach(Consumer action)遍历集合时,程序会依次将集合元素传给Consumer的accept(T t)方法(该接口中唯一的抽象方法)。正因为Consumer是函数式接口,因此可以使用Lambda表达式来遍历集合元素。

    使用Java8增强的Iterator遍历集合元素

    Iterator接口也是Java集合框架的成员,但它与Collection系列、Map系列的集合不一样:Collection系列集合、Map系列集合主要用于盛装其他对象,而Iterator则主要用于遍历(即迭代访问)Collection集合中的元素,Iterator对象也被称为迭代器

    Iterator接口隐藏了各种Collection实现类的底层细节,向应用程序提供了遍历Collection集合元素的统一编程接口。

    Iterator接口里定义了如下4个方法:

    • boolean hasNext():如果被迭代的集合元素还没有被遍历完,则返回true。
    • Object next():返回集合里的下一个元素。
    • void remove():删除集合里的上一次next方法返回的元素。
    • void forEachRemainning(Consumer action):这是Java8为Iterator新增的默认方法,该方法可使用Lambda表达式来遍历集合元素。

    Iterator必须依附于Collection对象,若有一个Iterator对象,则必然有一个与之关联的Collection对象。

    当使用Iterato迭代访问Collection集合时,Collection集合里的元素不能被改变,只能通过Iterator的remove()方法删除上一次next()方法返回的集合元素才可以;否则将会引发java.util.ConcurrentModificationException异常。

    Iterator迭代器采用的是**快速失败(fail-fast)**机制,一旦在迭代过程中检测到该集合已经被修改(通常是程序中的其他线程修改),程序立即引发ConcurrentModificationException异常,而不是显示修改后的结果,这样可以避免共享资源而引发的潜在问题。

    使用Lambda表达式遍历Iterator

    Java8起为Iterator接口新增了一个forEachRemaining(Consumer action)方法,该方法所需的Consumer参数同样也是函数式接口。当程序调用Iterator的forEachRemaining(Consumer action)遍历集合元素时,程序会依次将集合元素传给Consumer的accept(T t)方法(该接口中唯一的抽象方法)。

    使用foreach循环遍历集合元素

    除可以使用Iterator接口迭代访问Collection集合里的元素之外,使用Java5提供的foreach循环迭代访问集合元素更加便捷。

    与使用Ierator接口迭代访问集合元素类似的是,foreach循环中的迭代变量也不是集合元素本身,系统只是依次把集合元素的值赋给迭代变量。

    同样,当使用foreach循环迭代访问集合元素时,该集合也不能被改变,否则将引发ConcurrentModificationException异常。

    使用Java8新增的Predicate操作集合

    Java8起为Collection集合新增了一个removeIf(Predicate filter)方法,该方法将会批量删除符合filter条件的所有元素。该方法需要一个Predicate谓词对象作为参数,Predicate也是函数式接口,因此可使用Lambda表达式作为参数。

    使用Java8新增的Stream操作集合

    Java8还新增了Stream、IntStream、LongStream、DoubleStream等流式API,这些API代表多个支持串行和并行聚集操作的元素。Stream是一个通用的流接口,而IntStream、LongStream、DoubleStream则代表元素为int、long、double的流。

    Java8还为上面的每个流式API提供了对应的Builder,例如Stream.Builder、IntStream.Builder、LongStream.Builder、DoubleStream.Builder,开发者可以通过这些Builder来创建对应的流。

    独立使用Stream的步骤如下:

    1. 使用Stream或XxxStream的builder()类方法创建该Stream对应Builder。
    2. 重复调用Builder的add()方法向该流中添加多个元素。
    3. 调用Builder的build()方法获取对应的Stream。
    4. 调用Stream的聚集方法。

    Stream提供了大量的方法进行聚集操作,这些方法既可以是中间的(intermediate),也可以是末端的(terminal)

    中间方法:中间操作允许流保持打开状态,并允许直接调用后继方法。

    末端方法:末端方法是对流的最终操作。当某个Stream执行末端方法后,该流将会被消耗且不可再用。

    除此之外,关于流的方法好有如下两个特征:

    • 有状态的方法:这种方法会给流增加一些新的属性,比如元素的唯一性、元素的最大数量、保证元素以排序的方式被处理等。有状态的方法往往需要更大的性能开销。
    • 短路方法:短路方法可以尽早结束对流的操作,不必检查所有的元素。

    Stream常用的中间方法

    • filter(Predicate predicate):过滤Stream中所有不符合predicate的元素。
    • mapToXxx(ToXxxFunction mapper):使用ToXxxFunction对流中的元素执行一对一的转换,该方法返回新流中包含了ToXxxFunction转换生成的所有元素。
    • peek(Consumer action):依次对每个元素执行一些操作,该方法返回的流与原有流包含相同的元素。该方法主要用于调试。
    • distinct():该方法用于排序流中所有重复的元素(判断元素重复的标准是使用equals()比较返回true)。这是一个有状态的方法。
    • sorted():该方法用于保证流中的元素在后继的访问中处于有序状态。这是一个有状态的方法。
    • limit(long maxSize):该方法用于保证对该流的后继访问中最大允许访问的元素个数。这是一个有状态的、短路方法。

    Stream常用的末端方法

    • forEach(Consumer action):遍历流中所有元素,对每个元素执行action。
    • toArray():将流中所有元素转换为一个数组。
    • reduce():该方法有三个重载的版本,都用于通过某种操作来合并流中的元素。
    • max():返回流中所有元素的最大值。
    • count():返回流中所有元素的数量。
    • anyMatch(Predicate predicate):判断流中是否至少包含一个元素符合Predicate条件。
    • allMatch(Predicate predicate):判断流中是否每个元素都符合Predicate条件。
    • noneMatch(Predicate predicate):判断流中是否所有元素都不符合Predicate条件。
    • findFirst():返回流中的第一个元素。
    • findAny():返回流中的任意一个元素。

    Java8允许使用流式API来操作集合,Collection接口提供了一个stream()默认方法,该方法返回该集合对应的流,接下来就即可通过流式API来操作集合元素。由于Stream可以对集合元素进行整体的聚集操作,因此Stream极大地丰富了集合的功能。

    Set集合

    Set集合与Collection基本相同,没有提供任何额外的方法。实际上Set就是Collection,只是行为略有不同(Set不允许包含重复元素)。

    Set集合不允许包含相同的元素,如果试图把两个相同的元素加入同一个Set集合中,则添加操作失败,add()方法返回false,且新元素不会被加入。

    HashSet类

    HashSet是Set接口的典型实现,大多数时候使用Set集合时就是使用这个实现类。HashSet按Hash算法来存储集合中的元素,因此具有很好的存取和查找性能。

    HashSet具有以下特点:

    • 不能保证元素的排列顺序,顺序可能与添加顺序不同,顺序也有可能发生变化。
    • HashSet是不同步的,如果多个线程同时访问一个HashSet,假设有两个或两个以上线程同时修改了HashSet集合时,则必须通过代码来保证其同步。
    • 集合元素值可以是null。

    当向HashSet集合中存入一个元素时,HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值,然后根据该hashCode值决定该对象在HashSet中的存储位置。

    如果两个元素通过equals()方法比较返回true,但它们的hashCode()方法返回值不相等,HashSet将会把它们存储到不同的位置,依然可以添加成功。

    也就是说,HashSet集合判断两个元素相等的标准是两个对象通过equals()方法比较相等,并且两个对象的hashCode()方法返回值也相等。

    当把一个对象放入HashSet中时,如果需要重写该对象对应类的equals()方法,则也应该重写其hashCode()方法。规则是:如果两个对象通过equals()方法比较返回true,这两个对象的hashCode值也应该相同。

    如果两个对象通过equals()方法比较返回true,但这两个对象的hashCode()方法返回不同的hashCode值时,这将导致HashSet会把这两个对象保存在Hash表的不同位置,从而使两个对象都可以添加成功,这就与Set集合规则冲突了。

    如果两个对象的hashCode()方法返回相同的hashCode值,但它们通过equals()方法比较返回false时将更麻烦:因为两个对象的hashCode值相同,HashSet将试图把他们保存到同一个位置,但又不行(否则将只剩下一个对象),所及实际上会在这个位置用链式结构来保存多个对象;而HashSet访问集合元素时也是根据元素的hashCode来快速定位的,如果HashSet中两个以上的元素具有相同的hashCode值,将会导致性能下降。

    HashSet中每个能存储元素的槽位(slot)通常称为桶(bucket),如果有多个元素的hashCode值相同,但它们通过equals()方法比较返回false,就需要在一个“桶”里放多个元素,这样会导致性能下降。

    重写hashCode()方法的基本规则:

    • 在程序运行过程中,同一个对象多次调用hashCode()方法应该返回相同的值。
    • 当两个对象通过equals()方法比较返回true时,这两个对象的hashCode()方法应该返回相等的值。
    • 对象中用作equals()方法比较标准的实例变量,都应该用于计算hashCode值。

    重写hashCode()方法的一般步骤:

    1. 把对象内每个有意义的实例变量(即每个参与equals()方法比较标准的实例变量)计算出一个int类型的hashCode值。
    • hashCode值的计算方式:
      • boolean:hashCode = (f ? 0 : 1);
      • (byte、short、char、int):hashCode = (int)f;
      • long:hashCode = (int)(f >>> 32));
      • float:hashCode = Float.floatToIntBits(f);
      • double:long l = Double.doubleToLongBits(f); hashCode = (int)(l ^ (l >>> 32));
      • 引用类型:hashCode = f.hashCode();
    1. 用第1步计算出的多个hashCode值组合计算除一个hashCode值返回。

    为了避免直接相加产生偶然相等(两个对象的f1、f2实例变量并不相等,但它们的hashCode的和恰好相等),可以通过为各实例变量的hashCode值乘以任意一个质数后再相加。

    如果向HashSet中添加一个可变对象后,后面程序修改了该可变对象的实例变量,则可能导致它与集合中的其他元素相同,这就有可能导致HashSet中包含两个相同的对象。

    当程序把可变对象添加到HashSet中之后,尽量不要去修改该集合元素中参与计算的hashCode()equals()的实例变量,否则将会导致HashSet无法正确操作这些集合元素。

    当向HashSet中添加可变对象时,必须十分小心。如果修改HashSet集合中的对象,有可能导致该对象与集合中的其他对象相等,从而导致HashSet无法精确访问该对象。

    LinkedHashSet类

    HashSet类还有一个子类LibkedHashSet,LinkedHashSet集合也是根据元素的hashCode值来决定元素的存储位置,但它同时使用链表维护元素的次序,当遍历LinkedHashSet集合里的元素时,LinkedHashSet将会按元素的添加顺序来访问集合里的元素。

    LinkedHashSet需要维护元素的插入顺序,因此性能略低于HashSet性能,但在迭代访问Set里的全部元素时将有很好的性能,因此它以链表来维护内部顺序。

    TreeSet类

    TreeSet是SortedSet接口的实现类,TreeSet可以确保集合元素处于排序状态。与HashSet集合相比,TreeSet还提供了如下几个额外的方法:

    • Comparator comparator():如果TreeSet采用了定制排序,则该方法返回定制排序所使用的Comparator;如果TreeSet采用了自然排序,则返回null。
    • Object first():返回集合中的第一个元素。
    • Object last():返回集合中的最后一个元素。
    • Object lower(Object e):返回集合中位于指定元素之前的元素(即小于指定元素的最大元素,参考元素不需要是TreeSet集合里的元素)。
    • Object higher(Object e):返回集合中位于指定元素之后的元素(即大于指定元素的最大元素,参考元素不需要是TreeSet集合里的元素)。
    • SortedSet subSet(Object fromElement, Object toElement):返回此Set的子集合,范围从fromElement(包含)到toElement(不包含)。
    • SortedSet headSet(Object toElement):返回此Set集合的子集,由小于toElement的元素组成。
    • SortedSet tailSet(Object fromElement):返回此Set的子集,由大于或等于fromElement的元素组成。

    TreeSet并不是根据元素的插入顺序进行排序,而是根据元素实际值的大小进行排序的。

    HashSet集合采用hash算法来决定元素的存储位置不同,TreeSet采用红黑树的数据结构来存储集合的元素。

    TreeSet支持两种排序方式:自然排序定制排序。默认情况下,TreeSet采用自然排序。

    自然排序

    TreeSet会调用集合元素的compareTo(Object obj)方法来比较元素之间的大小关系,然后将集合元素升序排序。

    Java提供了一个Comparable接口,该接口里定义了一个compareTo(Object obj)方法,该方法返回一个整数值,实现该接口的类必须实现该方法,实现了该接口的类的对象就可以比较大小。当一个对象obj1调用该方法与另一个对象obj2进行比较时,如果该方法返回0,则表明这两个对象相等;如果该方法返回一个正整数,则表明ob1大于obj2;如果该方法返回一个负整数,则表明ob1小于obj2。

    Java的一些常用类已经实现的Comparable接口,并提供了比较大小的标准。下面是实现了Comparable接口的常用类:

    • BigDecimal、BigInteger以及所有的数值型对应的包装类:按它们对应的数值大小进行比较。
    • Character:按字符的UNICODE值进行比较。
    • Boolean:true对应包装类实例大于false对应的包装类实例。
    • String:按字符串中字符的UNICODE值进行比较。
    • Date、Time:后面的时间、日期比前面的时间、日期大。

    如果试图把一个对象添加到TreeSet时,该对象的类必须实现Comparable接口,否则程序将会抛出异常。

    大部分类在实现compareTo(Object obj)方法时,都需要将被比较对象obj强制类型转换成相同类型,因为只有相同类的两个实例才会比较大小。

    如果希望TreeSet能正常运作,TreeSet只能添加同一种类型的对象。

    当把一个对象加入TreeSet集合中时,TreeSet调用该对象的compareTo(Object obj)方法与容器中的其他对象比较大小,然后根据红黑树结构找到它的存储位置。如果两个对象通过compareTo(Object obj)方法比较相等,新对象将无法添加到TreeSet集合中。

    TreeSet集合判断两个对象唯一标准就是compareTo(Object obj)方法。

    当需要把一个对象放入TreeSet中,重写该对象对应类的equals()方法时,应保证该方法与compareTo(Object obj)方法有一致的结果,其规则是:如果两个对象通过equals()方法比较返回true时,这两个对象通过compareTo(Object obj)方法比较应返回0。

    当执行了删除元素代码成功后,TreeSet会对集合中的元素重新索引(不是重新排序),接下来就可以删除TreeSet中的所有元素了,包括那些被修改过实例变量的值。与HashSet类似的是,如果TreeSet中包含了可变对象,当可变对象的实例变量被修改时,TreeSet在处理这些对象时将会非常复杂,而且容易出错。

    定制排序

    TreeSet的自然排序是根据集合元素的大小,TreeSet将它们以升序排序。

    如果需要实现定制排序,例如以降序排序,则可以通过Comparable接口的帮助。该接口里包含了一个int compare(T o1, T o2)方法,该方法用于比较o1和o2的大小:如果该方法返回正整数,则表明o1大于o2;如果该方法返回0,则表明o1等于o2;如果该方法返回负整数,则表明o1小于o2。

    如果需要实现定制排序,则需要在创建TreeSet集合对象时,提供一个Comparator对象与该TreeSet集合关联,由该Comparator对象负责集合元素的排序逻辑。由于Comparator是一个函数式接口,因此可使用Lambda表达式来代替Comparator对象。

    当通过Comparator对象(或Lambda表达式)来实现TreeSet的定制排序时,依然不可以向TreeSet中添加类型不同的对象,否则还会引发ClassCastException异常。使用定制排序时,TreeSet对集合元素排序不管集合元素本身的大小,而是由Comparator对象(或Lambda表达式)负责集合元素的排序规则。

    TreeSet判断两个集合元素的相等的标准是:通过Comparator(或Lambda表达式)比较两个元素返回了0,这样TreeSet不会把第二个元素添加到集合中。

    EnumSet类

    EnumSet是一个转为枚举类设计的集合类,EnumSet中的所有元素都必须是指定枚举类型的枚举值,该枚举类型在创建EnumSet时显示或隐式地指定。EnumSet的集合元素也是有序的,EnumSet以枚举值在Enum类内定义顺序来决定集合元素的顺序。

    EnumSet在内部以位向量的形式存储,这种存储形式非常紧凑、高效,因此EnumSet对象占用内存很小,而且运行效率很好。尤其是进行批量操作(如调用containsAll()retainAll()方法)时,如果其参数也是EnumSet集合,则该批量操作的执行速度也非常快。

    EnumSet集合不允许加入null元素,如果试图插入null元素,EnumSet将抛出NullPointerException异常。如果只是想判断EnumSet是否包含null元素或试图删除null元素都不会抛出异常,只是删除操作将返回false,因为没有任何null元素被删除。

    EnumSet类没有暴露任何构造器来创建该类的实例,程序应该通过它提供的类方法来创建EnumSet对象。EnumSet类它提供了如下常用的类方法来创建EnumSet对象:

    • EnumSet allOf(Class elementType):创建一个包含指定枚举类里所有枚举值的EnumSet集合。
    • EnumSet complementOf(EnumSet s):创建一个其元素类型与指定EnumSet里元素类型相同的EnumSet集合,新EnumSet集合包含原EnumSet集合所不包含的、此枚举类剩下的枚举值(即新EnumSet集合和原EnumSet集合的集合元素加起来就是该枚举类的所有枚举值)。
    • EnumSet copyOf(Collection c):使用一个普通集合来创建EnumSet集合。
    • EnumSet copyOf(EnumSet s):创建一个与指定EnumSet具有相同元素类型、相同集合元素的EnumSet集合。
    • EnumSet noneOf(Class elementType):创建一个元素类型为指定枚举类型的空EnumSet。
    • EnumSet Of(E first, E... rest):创建一个包含一个或多个枚举值的EnumSet集合,传入的多个枚举值必须属于同一个枚举类。
    • EnumSet range(E from, E to):创建一个包含从from枚举值到to枚举值范围内所有枚举值的EnumSet集合。

    当试图复制Collection集合里的元素来创建EnumSet集合时,必须保证Collection集合里的所有元素都是同一个枚举类的枚举值。

    各Set实现类的性能分析

    HashSet和TreeSet是Set的两个典型实现,到底如何选择HashSet和TreeSet?HashSet的性能总是比TreeSet好(特别是最常用的添加、查询元素等操作),因为TreeSet需要额外的红黑树算法来维护集合元素的次序。只有当需要一个保持排序的Set时,才应该使用TreeSet,否则都应该使用HashSet。

    HashSet还有一个子类:LinkedHashSet,对于普通的插入、删除操作,LinkedHashSet比HashSet要略微慢一点,这是由维护链表所带来的额外开销造成的,但由于有了链表,遍历LinkedHashSet会更快。

    EnumSet是所有Set实现类中性能最好的,但它只能保存同一个枚举类的枚举值作为集合元素。

    Set的三个实现类HashSet、TreeSet和EnumSet都是线程不安全的。如果有多个线程同时访问一个Set集合,并且有超过一个线程修改了该Set集合,则必须手动保证该Set集合的同步性。通常可以通过Collection工具类的synchronizedSortedSet方法来“包装”该Set集合。此操作最好再创建时进行,以防止对Set集合的意外非同步访问。例如:SortedSet s = Collections.synchronizedSortedSet(new TreeSet(...));

    List集合

    List集合代表一个元素有序、可重复的集合,集合中每个元素都有其对应的顺序索引。List集合允许使用重复元素,可以通过索引来访问指定位置的集合元素。List集合默认按元素的添加顺序设置元素的索引。

    Java8改进的List接口和ListIterator接口

    List作为Collection接口的子接口,当然可以使用Collection接口里的全部方法。而且由于List是有序集合,因此List集合里增加了一些根据索引来操作集合元素的方法。

    • void add(int index, Object element):将元素element插入到List集合的index处。
    • boolean addAll(int index, Collection c):将集合c所包含的所有元素都插入到List集合的index处。
    • Object get(int index):返回集合index索引处的元素。
    • int indexOf(Object o):返回对象o在List集合中第一次出现的位置索引。
    • int lastIndexOf(Object o):返回对象o在List集合中最后一次出现的位置索引。
    • Object remove(int index):删除并返回index索引处的元素。
    • Object set(int index, Object element):将index索引处的元素替换成element对象,返回被替换的旧元素。
    • List subList(int fromIndex, int toIndex):返回从索引fromIndex(包含)到索引toIndex(不包含)处所有集合元素组成的子集合。

    所有的List实现类都可以调用这些方法来操作集合元素。与Set集合相比,List增加了根据索引来插入、替换和删除集合元素的方法。除此之外,Java8还为List接口添加了如下两个默认方法。

    • void replaceAll(UnaryOperator operator):根据operator指定的计算规则重新设置List集合的所有元素。
    • void sort(Comparator c):根据Comparator参数对List集合的元素排序。

    Lisi判断两个对象相等只要通过equals()方法比较返回true即可。

    remove(new A());程序试图删除一个A对象,Lit将会调用该A对象的equals()方法依次与集合元素进行比较,如果该equals()方法以某个集合元素作为参数时返回true。

    当调用List的set(int index, Object element)方法来改变List集合指定索引处的元素时,指定的索引必须是List集合的有效索引。set(int index, Object element)方法不会改变List集合的长度。

    Java8为List集合增加了sort()replaceAll()两个常用的默认方法,其中sort()方法需要一个Comparator对象来控制元素排序,程序可使用Lambda表达式来作为参数;而replaceAll()方法则需要一个UnaryOperator来替换所有集合元素,UnaryOperator也是一个函数式接口,因此也可使用Lambda表示作为参数。

    与Set只提供了一个iterator()方法不同,List还额外提供了一个listIterator()方法,该方法返回一个ListIterator对象,ListIterator接口继承了Iterator接口,提供了专门操作List的方法。ListIterator接口在Iterator接口基础上增加了如下方法。

    • boolean hasPrevious():返回该迭代器关联的集合是否还有上一个元素。
    • Object previous():返回该迭代器的上一个元素。
    • void add(Object o):在指定位置插入一个元素。

    拿ListIterator与普通的Iterator进行对比,不难发现ListIterator增加了向前迭代的功能(Iterator只能向后迭代),而且ListIterator还可通过add()方法向List集合中添加元素(Iterator只能删除元素)。

    ArrayList和Vector实现类

    ArrayList和Vector类都是基于数组实现的List类,所以ArrayList和Vector类封装了一个动态的、允许再分配的Object[]数组。ArrayList和Vector对象使用initialCapacity参数来设置该数组的长度,当向ArrayList或Vector中添加元素超出了该数组的长度时,它们的initialCapacity会自动增加

    当向ArrayList或Vector集合中添加大量元素时,可使用ensureCapacity(int minCapacity)方法一次性地增加initialCapacity。这可以减少重分配的次数,从而提高性能。

    除此之外,ArrayList和Vector还提供了如下两个方法来重新分配Object[]数组。

    • void ensureCapacity(int minCapasity):将ArrayList或Vector集合的Object[]数组长度增加大于或等于minCapacity。
    • void trimToSize():调整ArrayList或Vector集合的Object[]数组长度为当前元素的个数。调用该方法可减少ArrayList或Vector集合对象占用的存储空间。

    ArrayList和Vector的显著区别是:ArrayList是线程不安全的,当多个线程访问同一个ArrayList集合时,如果有超过一个线程修改了ArrayList集合,则程序必须手动保证该集合的同步性;但Vector集合则是线程安全的,无须程序保证该集合的同步性。因为Vector是线程安全的,所以Vector的性能比ArrayList的性能要低。实际上,即使需要保证List集合线程安全的,也同样不推荐使用Vector实现类。会有一个Collections工具类,它可以将一个ArrayList变成线程安全的。

    Vector还提供了一个Stack子类,它用于模拟这种数据结构,“栈”通常是指后进先出(LIFO)的容器。最后“push”进栈的元素,将最先被“pop”出栈。与Java中的其他集合一样,进栈出栈都是Object,因此从栈中取出元素后必须进行类型转换,除非是使用Object具有的操作。所以Stack类里提供了如下几个方法。

    • Object peek():返回“栈”的第一个元素,但并不将该元素“pop”出栈。
    • Object pop():返回“栈”的第一个元素,并将该元素“pop”出栈。
    • void push(Object item):将一个元素“push”进栈,最后一个进“栈”的元素总是位于“栈“顶。

    由于Stack继承了Vector,因此它也是一个非常古老的Java集合类,它同样是线程安全的、性能较差的,因此应该尽量少用Stack类。如果程序需要使用”栈“这种数据结构,则可以考虑ArrayDeque。

    ArrayDeque也是List的实现类,ArrayDeque即实现了List接口,也实现了Deque接口,由于实现了Deque接口,因此可以作为栈来使用;而且ArrayDeque底层也是基于数组的实现,因此性能也很好。

    固定长度的List

    操作数组的工具类:Arrays,该工具类提供了asList(Object... a)方法,该方法可以把一个数组或指定个数的对象转换成一个List集合,这个List集合既不是ArrayList实现类的实例,也不是Vector实现类的实例,而是Arrays的内部类ArrayList的实例。

    Arrays.ArrayList是一个固定长度的List集合,程序只能遍历访问该集合里的元素,不可增加、删除该集合里的元素。

    Queue集合

    Queue用于模拟队列这种数据结构,队列通常是指**先进先出(FIFO)**的容器。队列的头部保存在队列存放时间最长的元素,队列的尾部保存在队列中存放时间最短的元素。新元素插入(offer)到队列的尾部,访问元素(poll)操作会返回队列头部的元素。通常,队列不允许随机访问队列中的元素。

    Queue接口中定义了如下几个方法。

    • void add(Object e):将指定元素加入此队列的尾部。
    • Object element():获取队列头部的元素,但是不删除该元素。
    • boolean offer(Object e):将指定元素加入此队列的尾部。当使用有容量限制的队列时,此方法通常比add(Object e)方法更好。
    • Object peek():获取队列头部的元素,但是不删除该元素。如果此队列为空,则返回null。
    • Object poll():获取队列头部的元素,并删除该元素。如果此队列为空,则返回null。
    • Object remove():获取队列头部的元素,并删除该元素。

    Queue接口有一个PriorityQueue实现类。除此之外,Queue还有一个Deque接口,Deque代表一个双端队列,双端队列可以同时从两端来添加、删除元素,因此Deque的实现类即可当成队列使用,也可当成栈使用。Java为Deque提供了ArrayDeque和LinlkedList两个实现类。

    PriorityQueue实现类

    PriorityQueue是一个比较标准的队列实现类。之所以说它是比较标准的队列实现,而不是绝对标准的队列实现,是因为PriorityQueue保存队列元素的顺序并不是按加入队列的顺序,而是按队列元素的大小进行重新排序。因此当调用peek()方法或者poll()方法取出队列中的元素时,并不是取出最先进入队列的元素,而是去除队列中最小的元素。

    PriorityQueue不允许插入null元素,它还需要对队列元素进行排序,PriorityQueue的元素有两种排序方式。

    • 自然排序:采用自然排序的PriorityQueue集合中的元素必须实现了Comparable接口,而且应该是同一个类的多个实例,否则可能导致ClassCastException异常。
    • 定制排序:创建PriorityQueue队列时,传入一个Comparable对象,该对象负责对队列中的所有元素进行排序。采用定制排序时不要求队列元素实现Comparable接口。

    PriorityQueue队列对元素的要求与TreeSet对元素的要求基本一致。

    Deque接口与ArrayDeque实现类

    Deque接口是Queue接口的子接口,它代表一个双端队列,Deque接口里定义了一些双端队列的方法,这些方法允许从两端来操作队列的元素。

    • void addFirst(Object e):将指定元素插入该双端队列的开头。
    • void addLast(Object e):将指定元素插入该队列的末尾。
    • Iterator descendingIterator():返回该双端队列对应的迭代器,该迭代器将以逆向顺序来迭代队列中的元素。
    • Object getFirst():获取但不删除双端队列的第一个元素。
    • Object getLast():获取但不删除双端队列的最后一个元素。
    • boolean offerFirst(Object e):将指定元素插入该双端队列的开头。
    • boolean offerLast(Object e):将指定元素插入该双端队列的末尾。
    • Object peekFirst():获取但不删除该双端队列的第一个元素;如果双端队列为空,则返回null。
    • Object peekLast():获取但不删除该双端队列的最后一个元素;如果双端队列为空,则返回null。
    • Object pollFirst():获取并删除该双端队列的第一个元素;如果此双端队列为空,则返回null。
    • Object pollLast():获取并删除该双端队列的最后一个元素;如果此双端队列为空,则返回null。
    • Object pop():栈方法,pop出该双端队列所表示的栈的栈顶元素。相当于removeFirst()
    • void push(Object e):栈方法,将一个元素push进该双端队列所表示的栈的栈顶。相当于addFirst(e)
    • Object removeFirst(Object e):获取并删除该双端队列的第一个元素。
    • Object removeFirstOccurrence(Object o):删除该双端队列的第一次出现的元素o。
    • Object removeLast(Object e):获取并删除该双端队列的最后一个元素。
    • Object removeLastOccurrence(Object o):删除该双端队列的最后一次出现的元素o。

    Deque不仅可以当成双端队列使用,而且可以被当成栈来使用,因为该类还包含了pop(出栈)、push(入栈)两个方法。

    Deque的方法与Queue的方法对照表

    Queue的方法 Deque的方法
    add(e)/offer(e) addLast(e)/offerLast(e)
    remove()/poll() removeFirst()/pollFirst()
    element()/peek() getFirst()/peekFirst()

    Deque的方法与Stack的方法对照表

    Stack的方法 Deque的方法
    push(e) addFirst(e)/offerFirst(e)
    pop() removeFirst()/pollFirst()
    peek() getFirst()/peekFirst()

    Deque接口提供了一个典型的实现类:ArrayDeque,从该名称就可以看出,它是一个基于数组实现的双端队列,创建Deque时同样可指定一个numElements参数,该参数用于指定Object[]数组的长度;如果不指定numElements参数,Deque底层的数组长度为16。

    ArrayList和ArrayDeque两个集合类的实现机制基本相似,它们底层都采用一个动态的、可重分配的Object[]数组来存储集合元素,当集合元素超出了该数组的容量时,系统会在底层重新分配一个Object[]数组来存储集合元素。

    因此程序中需要使用这种数据结构时,推荐使用ArrayDeque,尽量避免使用Stack——因为Stack是古老的集合,性能较差。

    LinkedList实现类

    LinkedList类是List接口的实现类,可以根据索引来随机访问集合中的元素。除此之外,LinkedList还实现了Deque接口,可以被当成双端队列来使用,因此既可以被当成来使用,也可以当成队列使用。

    LinkedList与ArrayList、ArrayDeque的实现机制完全不同,ArrayList、ArrayDeque内部以数组的形式来保存集合中的元素,因此随机访问集合元素时有较好的性能;而LinkedList内部以链表的形式来保存集合中的元素,因此随机访问集合元素时性能较差,但在插入、删除元素时性能比较出色(只需改变指针所指的地址即可)。虽然Vector也是以数组的形式来存储集合元素的,但因为它实现了线程的同步功能(而且实现机制也不好),所以各方面性能都比较差。

    对于所有的内部基于数组的集合实现,例如ArrayList、ArrayDeque等,使用随机访问的性能比使用Iterator迭代访问的性能要好,因为随机访问会被映射成对数组元素的访问。

    各种线性表的性能分析

    Java提供的List就是一个线性表接口,而ArrayList、LinkedList又是线性表的两种典型实现:基于数组的线性表和基于链的线性表。Queue代表队列,Deque代表了双端队列(既可作为队列使用,也可作为栈使用)。

    一般来说,由于数组以一块连续内存区来保存所有的数组元素,所以数组在随机访问时性能最好,所有的内部以数组作为底层实现的集合在随机访问时性能都比较好;而内部以链表作为底层实现的集合在执行插入、删除操作时有较好的性能。但总体来说,ArrayList的性能比LinkedList的性能要好,因此大部分时候应该考虑使用ArrayList。

    关于使用List集合的建议。

    • 如果需要遍历List集合元素,对于ArrayList、Vector集合,应该使用随机访问方法(get)来遍历集合元素,这样性能更好;对于LinkedList集合,则应该采用迭代器(Iterator)来遍历集合元素。
    • 如果需要经常执行插入、删除操作来改变包含大量数据的List集合的大小,可考虑使用LinkedList集合。使用ArrayList、Vector集合可能需要经常重新分配内部数组的大小,效果可能较差。
    • 如果有多个线程需要同时访问List集合中的元素,可考虑使用Collections将集合包装成线程安全的集合。

    Java8增强的Map集合

    Map体系图

    Map

    Map用于保存具有映射关系的数据,因此Map集合里保存着两组值,一组值用于保存Map里的key,另外一组值用于保存Map里的value,key和value都可以是任何引用类型的数据。Map里的key不允许重复,即同一个Map对象的任何两个key通过equals()方法比较总是返回false。

    key和value之间存在单向一对一关系,即通过指定的key,总能找到唯一的、确定的value。

    如果把Map里的所有key放在一起来看,它们就组成了Set集合(所有的key没有顺序,key与key之间不能重复),实际上Map包含了一个keySet()方法,用于返回Map里的所有key组成的Set集合。

    Map里key集和Set集合里的元素的存储形式很像,Map子类和Set子类在名字上也惊人地相似,比如Set接口下有HashSet、LinkedHashSet、SortedSet(接口)、TreeSet、EnumSet等子接口和实现类,而Map接口下则有HashMap、LinkedHashMap、SortedMap(接口)、TreeMap、EnumMap等子接口和实现类。Map的这些实现类和子接口中key集的存储形式和对应Set集合中元素的存储形式完全相同。

    Set和Map之间的关系非常密切。虽然Map中存放的元素是key-value对,Set集合中放的元素是单个对象,但如果把key-value对中的value当成key的附庸:key在哪里,value就跟在哪里。Map提供了一个Entry内部类来封装key-value对,而计算Entry存储时则只考虑Entry封装的key。从Java源码来看,Java是先实现了Map,然后通过包装一个所有value都为null的Mao就实现了Set。

    如果把Map里的所有value放在一起来看,它们有非常类似于一个List:元素与元素之间可以重复,每个元素可以根据索引来查找,只是Map中的索引不再使用整数值,而是以另一个对象作为索引。Map有时也被称为字典,或关联数组。Map接口中定义了如下常用的方法。

    • void clear():删除该Map对象中的所有key-value对。
    • boolean containsKey(Object key):查询Map中是否包含指定的key,如果包含则返回true。
    • boolean containsValue(Object value):查询Map中是否包含一个或多个value,如果包含则返回true。
    • Set entrySet():返回Map中包含的key-value对所组成的Set集合,每个集合元素都是Map.Entry(Entry是Map的内部类)对象。
    • Object get(Object key):返回指定key所对应的value;如果此Map中不包含该key,则返回null。
    • boolean isEmpty():查询该Map是否为空(即不包含任何key-value对),如果为空则返回true。
    • Set keySet():返回该Map中所有key组成的Set集合。
    • Object put(Object key, Object value):添加一个key-value对,如果当前Map中已有一个与该key相等的key-value对,则新的key-value对会覆盖原来的key-value对。
    • void putAll(Map m):将指定Map中的key-value对复制到本Map中。
    • Object remove(Object key):删除指定key所对应的key-value对,返回删除key所关联的value,如果该key不存在,则返回null。
    • Object remove(Object key, Object value):这是Java8新增的方法,删除指定key、value所对应的key-value对。如果该Map中成功地删除该key-value对,该方法返回true,否则返回false。
    • int size():返回该Map里的key-value对的个数。
    • Collection values():返回该Map里所有value组成的Collection。

    Map接口提供了大量的实现类,典型实现如HashMapHashtable等、HashMap的子类LinkedHashMap,还有SortedMap子接口及该接口的实现类TreeMap,以及WeakHashMapIdentityHashMap等。

    Map里包括了一个内部类Entry,该类封装了一个key-value对。Entry包含如下三个方法。

    • Object getKey():返回该Entry里包含的key值。
    • Object getValue():返回该Entry里包含的value值。
    • Object setValue(V value):设置该Entry里包含的value值,并返回新设置的value值。

    Map集合最典型的用法就是成对地添加、删除key-value对,接下来即可判断该Map中是否包含指定key,是否包含指定value,也可以通过Map提供的keySet()方法获取所有key组成的集合,进而遍历Map中所有的key-value对。

    添加key-value对时,Map允许多个value重复,但如果添加key-value对时Map中已有重复的key,那么新添加的value会覆盖原来对应的value,该方法会返回被覆盖的value。

    Java8为Map新增的方法

    Java8除为Map增加了remove(Object key, Object value)默认方法之外,还增加了如下方法。

    • Object compute(Object key, BiFunction remappingFunction):该方法使用remappingFunction根据原key-value对计算一个新的value。只要新的value不为null,就是用新的value覆盖原value;如果原value不为null,但新的value为null,则删除原key-value对;如果原value、新value同时为null,那么该方法不改变任何key-value对,直接返回null。
    • Object computeIfAbsent(Object key, Function mappingFunction):如果传给该方法的key参数在Map中对应的value为null,则使用mappingFunction根据key计算一个新的结果,如果计算结果不为null,则用计算结果覆盖原有的value。如果原Map原来不包括该key,那么该方法可能会添加一组key-value。
    • Object computeIfPresent(Object key, BiFunction remappingFcuntion):如果传给该方法的key参数在Map中对应的value不为null,该方法将使用remappingFunction根据原key-value计算一个新的结果,如果计算结果不为null,则使用该结果覆盖原来的value;如果计算结果为null,则删除原key-value对。
    • void forEach(BiConsumer action):该方法是Java8为Map新增的一个遍历key-value对的方法,通过该方法可以更简洁地遍历Map的key-value对。
    • Object getOrDefault(Object key, V defaultValue):获取指定key对应的value。如果该key不存在,则返回defaultValue。
    • Object merge(Object key, Object value, BiFunction remappingFunction):该方法会根据key参数获取该Map中对应的value。如果获取的value为null,则直接用传入的value覆盖原有的value(在这种情况下,可能要添加一组key-value对);如果获取的value不为null,则使用remappingFunction函数根据原value、新value计算一个新的结果,并用得到的结果去覆盖原有的value。
    • Object putIfAbsent(Object key, Object value):该方法会自动检测指定key对应的value是否为null,如果该key对应的value为null,该方法会用新的value代替原来的null值。
    • Object replace(Object key, Object value):将Map中指定key对应的value替换成新value。与传统put()方法不同的是,该方法不可能添加新的key-value对。如果尝试替换的key在原Map中不存在,该方法不会添加key-value,而是返回null。
    • boolean replace(K key, V oldValue, V newValue):将Map中指定key-value对原value替换成新value。如果在Map中找到指定的key-value对,则执行替换并返回true,否则返回false。
    • replaceAll(BiFunction function):该方法使用BiFunction对原key-value对执行计算,并将计算结果作为该key-value对的valu值。

    Java8改进的HashMap和Hashtable实现类

    HashMap和Hashtable都是Map接口的典型实现类,它们之间的关系完全类似于ArrayList和Vector的关系:Hashtable是一个古老的Map实现类,它从JDK1.0起就已经出现了,所以它包含了两个烦琐的方法,即elements()(类似于Map接口定义的values()方法)和keys()(类似于Map接口定义的keySet()方法),现在很少使用这两个方法。

    Java8改进了HashMap的实现,使用HashMap存在key冲突时依然具有较好的性能。

    除此之外,Hashtable和HashMap存在两点典型区别。

    • Hashtable是一个线程安全的Map实现,但HashMap是线程不安全的实现,所以HashMap比Hashtable的性能高一点;但如果有多个线程访问同一个Map对象时,使用Hashtable实现类会更好。
    • Hashtable不允许使用null作为key和value,如果试图把null值放进Hashtable中,将会引发NullPointerException异常;但HashMap可以使用null作为key或value。

    由于HashMap里的key不能重复,所以HashMap里最多只有一个key-value对key为null,但可以有无数多个key-value对的value为null。

    Hashtable是一个古老的类,它的命名甚至没有遵守Java的命名规范;与Vector类似的是,尽量少用Hashtable实现类,即使需要创建线程安全的Map实现类,也无须使用Hashtable实现类,可以通过Collections集合工具类把HashMap变成线程安全的。

    为了成功地在HashMap、Hashtable中存储、获取对象,用作key的对象必须实现hashCode()方法和equals()方法。

    与HashSet集合不能保证元素的顺序一样,HashMap、Hashtable也不能保证其中key-value对的顺序。类似于HashSet,HashMap、Hashtable判断两个key相等的标准也是:两个key通过equals()方法比较返回true,两个key的hashCode()值也相等。

    除此之外,HashMap、Hashtable中还包含一个containsValue()方法,用于判断是否包含指定的value。

    Hashtable判断value相等的标准是:value与另外一个对象通过equals()方法比较返回true即可。

    自定义类作为HashMap、Hashtable的key时,如果重写该类的equals(Object obj)hashCode()方法,则应该保证两个方法判断标准一致——当两个key通过equals()方法比较返回true时,两个key的hashCode()返回值也应该相同。

    与HashSet类似的是,如果使用可变对象作为HashMap、Hashtable的key,并且程序修改了作为key的可变对象,则也可能出现于HashSet类似的情形:程序再无法准确访问到Map中被修改过的key。

    LinkedHashMap实现类

    HashSet有一个LinkedHashSet子类,HashMap也有一个LinkedHashMap子类;LinkedHashMap也使用双向链表来维护key-value对的次序(其实只需要考虑key的次序),该链表复制维护Map的迭代顺序,迭代顺序与key-value对的插入顺序保持一致。

    LinkedHashMap可以避免对HashMap、Hashtable里的key-value对进行排序(只要插入key-value对时保持顺序即可),同时又可避免使用TreeMap所增加的成本。

    LinkedHashMap需要维护元素的插入顺序,因此性能略低于HashMap的性能;但因为它以链表来维护内部顺序,所以在迭代访问Map里的全部元素时将有较好的性能。

    使用Properties读写属性文件

    Properties类是Hashtable类的子类,该对象在处理属性文件时特别方便(Windows操作平台上的ini文件就是一种属性文件)。Properties类可以把Map对象和属性文件关联起来,从而把Map对象中的key-value对写入属性文件中,也可以把属性文件中的“属性名=属性值”加载到Map对象中。由于属性文件里的属性名、属性值都是字符串类型,所以Properties里的key、value都是字符串类型。该类提供了如下三个方法来修改Properties里的key、value值。Properties相当于一个key、value都是String类型的Map。

    • String getProperty(String key):获取Properties中指定属性名对应的属性值,类似于Map的get(Object key)方法。
    • String getProperty(String key, String defaultValue):如果Properties中不存在指定的key时,则该方法指定默认值。
    • Object setProperty(String key, String value):设置属性值,类似于Hashtable的put()方法。

    除此之外,它还提供了两个读写属性文件的方法。

    • void load(InputStream inStream):从属性文件(以输入流表示)中加载key-value对,把加载到key-value对追加到Properties里(Properties是Hashtable的子类,它不保证key-value对之间的次序)。
    • void store(OutputStream out, String comments):将Properties中的key-value对输出到指定的属性文件(以输出流表示)中。

    SortedMap接口和TreeMap实现类

    正如Set接口派生出SortedSet子接口,SortedSet接口有一个TreeSet实现类一样,Map接口也派生出一个SortedMap子接口,SortedMap接口也有一个TreeMap实现类。

    TreeMap就是一个红黑树数据结构,每个key-value对即作为红黑树的一个节点。TreeMap存储key-value对(节点)时,需要根据key对节点进行排序。TreeMap可以保证所有的key-value对处于有序状态。TreeMap也有两种排序方式。

    • 自然排序:TreeMap的所有key必须实现Comparable接口,而且所有的key应该是同一个类的对象,否则将抛出ClassCastException异常。
    • 定制排序:创建TreeMap时,传入一个Comparator对象,该对象负责对TreeMap中的所有key进行排序。采用定制排序时不要求Map的key实现Comparable接口。

    类似于TreeSet中判断两个元素相等的标准,TreeMap中判断两个key相等的标准是:两个key通过compareTo()方法时应保持一致的返回结果:两个key通过equals()方法比较返回true时,它们通过compareTo()方法比较应该返回0。如果equals()方法与compareTo()方法的返回结果不一致,TreeMap与Map接口的规则就会冲突。

    Set和Map的关系十分密切,Java源码就是先实现了HashMap、TreeMap等集合,然后通过包装一个所有的value都为null的Map集合实现了Set集合类。

    与TreeSet类似的是,TreeMap中也提供了一系列根据key顺序访问key-value对的方法。

    • Map.Entry firstEntry():返回该Map中最小key所对应的key-value对,如果该Map为空,则返回null。
    • Object firsrtKey():返回该Map中的最小key值,如果该Map为空,则返回null。
    • Map.Entry lastEntry():返回该Map中最大key所对应的key-value对,如果该Map为空或不存在这样的key-value对,则返回null。
    • Object lastKey():返回该Map中的最大key值,如果该Map为空或不存在这样的key-value对,则返回null。
    • Map.Entry higherEntry(Object key):返回该Map中位于key后一位的key-value对(即大于指定key的最小key所对应的key-value对)。如果该Map为空,则返回null。
    • Object higherKey(Object key):返回该Map中位于key后一位的key值(即大于指定key的最小key值)。如果该Map为空或不存在这样的key-value对,则都返回null。
    • Map.Entry lowerEntry(Object key):返回该Map中位于key前一位的key-value对(即小于指定key的最大key所对应的key-value对)。如果该Map为空或不存在这样的key-value对,则返回null。
    • Object lowerKey(Object key):返回该Map中位于key前一位的key值(即小于指定key的最大key值)。如果该Map为空或不存在这样的key-value对,则都返回null。
    • NavigableMap subMap(Object fromKey, boolean fromInclusive, Object toKey, boolean toInclusive):返回该Map的子Map,其key的范围是从fromKey(是否包括取决于第二个参数)到toKey(是否包括取决于第四个参数)。
    • SortedMap subMap(Object key, Object toKey):返回该Map的子Map,其key的范围是从fromKey(包括)到toKey(不包括)。
    • SortedMap tailMap(Object fromKey):返回该Map的子Map,其key的范围是大于fromKey(包括)到所有key。
    • NavigableMap tailMap(Object fromKey, boolean inclusive):返回该Map的子Map,其key的范围是大于fromKey(是否包括取决于第二个参数)的所有key。
    • SortedMap headMap(Object toKey):返回该Map的子Map,其key的范围是小于toKey(不包括)的所有key。
    • NavigableMap headMap(Object toKey, boolean inclusive):返回该Map的子Map,其key的范围是小于toKey(是否包括取决于第二个参数)的所有key。

    WeakHashMap实现类

    WeakHashMap与HashMap的用法基本相似。与HashMap的区别在于,HashMap的key保留了对实际对象的强引用,这意味着只要该HashMap对象不被销毁,该HashMap的所有key所引用的对象就不会被垃圾回收,HashMap也不会自动删除这些key所对应的key-value对;但WeakHashMap的key只保留了对实际对象的弱引用,这意味着如果WeakHashMap对象的key所引用的对象没有被其他强引用变量所引用,则这些key所引用的对象可能被垃圾回收,WeakHashMap也可能自动删除这些key所对应的key-value对。

    WeakHashMap中的每个key对象只持有对实际对象的弱引用,因此,当垃圾回收了该key所对应的实际对象之后,WeakHashMap会自动删除该key对应的key-value对。

    如果需要使用WeakHashMap的key来保留对象的弱引用,则不要让该key所引用的对象具有任何强引用,否则将失去WeakHashMap的意义。

    IdentityHashMap实现类

    这个Map实现类的实现机制与HashMap基本相似,但它在处理两个key相等时比较特殊:在IndentityHashMap中,当且仅当两个key严格相等(key1==key2)时,IdentityHashMap才认为两个key相等;对于普通的HashMap而言,只要key1和key2通过equals()方法比较返回true,且它们的hashCode值相等即可。

    IdentityHashMap提供了与HashMap基本相似的方法,也允许使用null作为key和value。与HashMap相似:IdentityHashMap也不保证key-value对之间的顺序,更不能保证它们的顺序随时间的推移保持不变。

    EnumMap实现类

    EnumMap是一个与枚举类一起使用的Map实现,EnumMap中的所有key都必须是单个枚举类的枚举值。创建EnumMap时必须显示或隐式指定它对应的枚举类。EnumMap具有如下特征。

    • EnumMap在内部以数组形式保存,所以这种实现形式非常紧凑、高效。
    • EnumMap根据key的自然顺序(即枚举值在枚举类中的定义顺序)来维护key-value对的顺序。当程序通过keySet()entrySet()values()等方法遍历EnumMap时可以看到这种顺序。
    • EnumMap不允许使用null作为key,但允许使用null作为value。如果试图使用null作为key时将抛出NullPointerException异常。如果只是查询是否包含值为null的key,或只是删除值为null的key,都不会抛出异常。

    与创建普通的Map所有区别的是,创建EnumMap时必须指定一个枚举类,从而将该EnumMap和指定枚举类关联起来。

    各Map实现类的性能分析

    对于Map常用实现类而言,虽然HashMap和Hashtable的实现机制几乎一样,但由于Hashtable是一个古老的、线程安全的集合,因此HashMap通常比Hashtable要快。

    TreeMap通常比HashMap、Hashtable要慢(尤其在插入、删除key-value对时更慢),因为TreeMap底层采用红黑树来管理key-value对(红黑树的每个结点就是一个key-value对)。

    使用TreeMap有一个好处:TreeMap中的key-value对总是处于有序状态,无序专门进行排序操作。当TreeMap被填充之后,就可以调用keySet(),取得由key组成的Set,然后使用toArray()方法生成key的数组,接下来使用Arrays的binarySearch()方法在已排序的数组中快速地查询对象。

    对于一般的应用场景,程序应该多考虑使用HashMap,因为HashMap正是为快速查询设计的(HashMap底层其实也是采用数组来存储key-value对)。但如果程序需要一个总是排好序的Map时,则可以考虑使用TreeMap。

    LinkedHashMap比HashMap慢一点,因为它需要维护链表来保持Map中的key-value时的添加顺序。IdentityHashMap性能没有特别出色之处,因为它采用HashMap基本相似的实现,只是它使用==而不是equals()方法来判断元素相等。EnumMap的性能最好,但它只能使用同一个枚举类的枚举值作为key。

    HashSet和HashMap的性能选项

    对于HashSet及其子类而言,他们采用hash算法来决定集合中元素的存储位置,并通过hash算法来控制集合的大小;对于HashMap、Hashtable及其子类而言,它们采用hash算法来决定Map中key的存储,并通过hash算法来增加key集合的大小。

    hsh表里可以存储元素的位置被称为(bucket),在通常情况,单个“桶”里存储一个元素,此时有最好的性能:hash算法可以根据hashCode值计算出“桶”存储位置,接着从“桶”中取出元素。但hahs表的状态时open的:在发生hash冲突的情况下,单个桶会存储多个元素。这些元素以链表形式存储。

    因为HashSet和HashMap、Hashtable都是用hash算法来决定其元素(HashMap则只考虑key)的存储,因此HashSet、HashMap的hash表包含如下属性。

    • 容量(capacity):hash表中桶的数量
    • 初始化容量(initial capacity):创建hash表时桶的数量。HashMap和HashSet都允许在构造器中指定初始化容量。
    • 尺寸(size):当前hash表中记录的数量。
    • 负载因子(load factor):负载因子等于size/capacity。负载因子为0时,表示空的hash表,0.5表示半满的hash表,以此类推。轻负载的hash表具有冲突少、适宜插入与查询的特点(但是使用Iterator迭代元素时比较慢)。

    除此之外,hash表里还有一个负载极限,负载极限是一个0~1的数值,负载极限决定了hash表的最大填满程度。当hash表中的负载因子达到指定的负载极限时,hash表会自动成倍地增加容量(桶的数量),并将原有的对象重新分配,放入新的桶内,这称为rehashing

    HashSet和HashMap、Hashtable的构造器允许指定一个负载极限,HashSet和HashMap、Hashtable默认的负载极限为0.75。

    负载极限的默认值(0.75)是时间和空间成本上的一种折中:较高的负载极限可以降低hash表所占用的内存空间,但会增加查询数据的时间开销,而查询是最频繁的操作(HashMap的get()put()方法都要用到查询);较低的负载极限会提高查询数据的性能,但会增加hash表所占用的内存开销。

    如果开始就知道HashSet和HashMap、Hashtable会保存很多记录,则可以在创建时就是用较大的初始化容量,如果初始化容量始终大于HashSet和HashMap、Hashtable所包含的最大记录数除以负载极限,就不会发生rehashing,使用足够大的初始化容量创建HashSet和HashMap、Hashtable时,可以更高效地增加记录,当将初始化容量设置太高可能会浪费空间。

    操作集合的工具类:Collections

    Java提供了一个操作Set、List和Map等集合的工具类:Collctions,该工具类里提供了大量方法对集合元素进行排序、查询和修改等操作。

    排序操作

    Collections提供了如下常用的类方法用于对List集合元素进行排序。

    • void reverse(List list):反转指定List集合中的元素顺序。
    • void shuffle(List list):对List集合元素进行随机排序(shuffle方法模拟了”洗牌“动作)。
    • void sort(List list)`:根根据元素的自然顺序对指定List集合的元素按升序进行排序。
    • void sort(List list, Comparator c):根据指定Comparator产生的顺序对List集合元素进行排序。
    • void swap(List list, int i, int j):将指定List集合中的i处元素和j处元素进行交换。
    • void rotate(List list, int distance):当distance为正数时,将list集合的后distance个元素”整体“移到前面;当distance为负数时,将list集合的前distance个元素”整体“移到后面。

    查找、替换操作

    Collections还提供了如下常用的用于查找、替换集合元素的类方法。

    • int binarySearch(List list, Object key):使用二分搜索法搜索指定的List集合,以获得指定对象在List集合中的索引。如果要使用该方法可以正常工作,则必须保证List中的元素已经处于有序状态。
    • Object max(Collection coll):根据元素的自然排序,返回给定集合中的最大元素。
    • Object max(Collection coll, Comparator comp):根据Comparator指定的顺序,返回给定集合中的最大元素。
    • Object min(Collection coll):根据元素的自然排序,返回给定集合中的最小元素。
    • Object min(Collection coll, Comparator comp):根据Comparator指定的顺序,返回给定集合中的最小元素。
    • void fill(List list, Object obj):使用指定元素obj替换指定List集合中的所有元素。
    • int frequency(Collection c, Object o):返回指定集合中指定元素的出现次数。
    • int indexOfSubList(List source, List target):返回子List对象在父List对象中第一次出现的位置索引;如果父List中没有出现这样的子List,则返回-1。
    • int lastIndexOfSubList(List source, List target):返回子List对象在父List对象中最后一次出现的位置索引;如果父List中没有出现这样的子List,则返回-1。
    • bollean replaceAll(List list, Object oldVal, Object newVal):使用一个新值newVal替换List对象的所有旧值oldVal。

    同步控制

    Collections类中提供了多个synchronizedXxx()方法,该方法将指定集合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题。

    Java中常用的集合框架中的实现类HashSet、TreeSet、ArrayList、ArrayDeque、LinkedList、HashMap和TreeMap都是线程不安全的。如果有多个线程访问它们,而且有超过一个的线程试图修改它们,则存在线程安全的问题。Collections提供了多个类方法可以把它们包装成线程同步的集合。

    设置不可变集合

    COllections提供了如下三类方法来返回一个不可变的集合。

    • emptyXxx():返回一个空的、不可变的集合对象,此处的集合既可以是List,也可以是SortedSet、Set,还可以是Map、SortedMap等。
    • singletonXxx():返回一个只包含指定对象(只有一个或一项元素)的、不可变的集合对象,此处的集合既可以是List,还可以是Map。
    • unmodifiableXxx():返回指定集合对象的不可变试图,此处的集合既可以是List,也可以是Set、SortedSet,还可以是Map、SortedMap等。

    上面三类方法的参数是原有的集合对象,返回值是该集合的只读版本。

    Java9新增的不可变集合

    Java9以前要创建一个包含6个元素的Set集合,程序需要先创建Set集合,然后6次调用add()方法向Set集合中添加元素。Java9对此进行了简化,程序直接调用Set、List、Map的of()方法即可创建包含N个元素的不可变的集合。

    不可变意味着程序不能向集合中添加元素,也不能从集合中删除元素。

    创建不可变的Map集合有两个方法:使用of()类方法时只要依次传入多个key-value对即可;还可使用ofEntries()类方法,该方法可接受多个Entry对象,因此程序显示使用Map.entry()方法来创建Map.Entry对象。

    烦琐的接口:Enumeration

    Enumeration接口是Iterator迭代器的古老版本,从JDK1.0开始,Enumeration接口就已经存在了(Iterator从JDK1.2出现)。Enumeration接口只有两个名字很长的方法。

    • boolean hasMoreElements():如果次迭代器还有剩下的元素,则返回true。
    • Object nextElement():返回该迭代器的下一个元素,如果还有的话(否则将抛出异常)。

    Enumeration接口中的方法名称冗长,难以记忆,而且没有提供Iterator的remove()方法。如果现在编写Java程序,应该尽量采用Iterator迭代器。

    Java之所以保留Enumeration接口,主要是为了照顾以前那些“古老”的程序,那些程序里大量使用了Enumeration接口,如果新版本的Java里直接删除Enumeration接口,将会导致那些程序全部出错。在计算机行业有一条规则:加入任何规则都必须谨慎,因为以后无法删除规则。

    实际上,Vector(包括其子类Stack)、Hashtable两个集合类,以及另一个极少使用的BitSet,都是从JDK1.0遗留下来的集合类,而Enumeration接口可用于遍历这些“古老”的集合类。对于ArrayList、HashMap等集合类,不再支持使用Enumeration。

    不一定每天 code well 但要每天 live well
  • 相关阅读:
    百度和谷歌,你选择谁?
    数据库的另一种设计方法
    超级IO操作类
    WEB工具类,很强很大
    JS在AJAX中获取鼠标坐标
    弃掉HTML标记的小巧代码
    XML工具操作类,很强大
    FTP 下载功能代码
    db4o开门之篇
    ASP.NET程序中常用代码汇总(转载)
  • 原文地址:https://www.cnblogs.com/geekfx/p/12423075.html
Copyright © 2020-2023  润新知