[Java] MAP、LIST、SET集合解析

[Java] MAP、LIST、SET集合解析

在JAVA的util包中有两个所有集合的父接口Collection和Map,它们的父子关系：
           java.util
        +Collection 这个接口extends自 --java.lang.Iterable接口
           +List 接口
              -ArrayList 类
              -LinkedList 类
              -Vector 类     此类是实现同步的
           +Queue 接口
              +不常用，在此不表.
           +Set 接口
              +SortedSet 接口
                 -TreeSet 类
              -HashSet
        +Map 接口
          -HashMap 类 (除了不同步和允许使用 null 键/值之外,与 Hashtable 大致相同.)
          -Hashtable 类此类是实现同步的,不允许使用 null 键值
          +SortedMap 接口
             -TreeMap 类
          以下对众多接口和类的简单说明：首先不能不先说一下数组（Array）
一、Array ， Arrays
Java所有“存储及随机访问一连串对象”的做法，array是最有效率的一种。
1、
效率高，但容量固定且无法动态改变。
array还有一个缺点是，无法判断其中实际存有多少元素，length只是告诉我们array的容量。
2、Java中有一个Arrays类，专门用来操作array。
       arrays中拥有一组static函数，
equals()：比较两个array是否相等。array拥有相同元素个数，且所有对应元素两两相等。
fill()：将值填入array中。
sort()：用来对array进行排序。
binarySearch()：在排好序的array中寻找元素。
System.arraycopy()：array的复制。
二、Collection ， Map
若撰写程序时不知道究竟需要多少对象，需要在空间不足时自动扩增容量，则需要使用容器类库，array不适用。
1、Collection 和 Map 的区别
容器内每个为之所存储的元素个数不同。
Collection类型者，每个位置只有一个元素。
Map类型者，持有 key-value pair，像个小型数据库。
2、Java2容器类类库的用途是“保存对象”，它分为两类，各自旗下的子类关系
Collection
       --List：将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
             --ArrayList / LinkedList / Vector
       --Set ：不能含有重复的元素
             --HashSet /TreeSet
Map
       --HashMap
    --HashTable
    --TreeMap
　 Map----一组成对的“键值对”对象，即其元素是成对的对象，最典型的应用就是数据字典，并且还有其它广泛的应用。另外，Map可以返回其所有键组成的Set和其所有值组成的Collection，或其键值对组成的Set，并且还可以像数组一样扩展多维Map，只要让Map中键值对的每个“值”是一个 Map即可。
Collection下 1.迭代器
　　迭代器是一种设计模式，它是一个对象，它可以遍历并选择序列中的对象，而开发人员不需要了解该序列的底层结构。迭代器通常被称为“轻量级”对象，因为创建它的代价小。
　　Java中的Iterator功能比较简单，并且只能单向移动：
　　(1) 使用方法iterator()要求容器返回一个Iterator。第一次调用Iterator的next()方法时，它返回序列的第一个元素。注意：iterator()方法是java.lang.Iterable接口,被Collection继承。
　　(2) 使用next()获得序列中的下一个元素。
　　(3) 使用hasNext()检查序列中是否还有元素。
　　(4) 使用remove()将迭代器新返回的元素删除。
　　Iterator是Java迭代器最简单的实现，为List设计的ListIterator具有更多的功能，它可以从两个方向遍历List，也可以从List中插入和删除元素。
　　2.List的功能方法
　　List(interface): 次序是List最重要的特点；它确保维护元素特定的顺序。List为Collection添加了许多方法，使得能够向List中间插入与移除元素(只推荐 LinkedList使用)。一个List可以生成ListIterator，使用它可以从两个方向遍历List，也可以从List中间插入和删除元素。
　　ArrayList: 由数组实现的List。它允许对元素进行快速随机访问，但是向List中间插入与移除元素的速度很慢。ListIterator只应该用来由后向前遍历ArrayList，而不是用来插入和删除元素，因为这比LinkedList开销要大很多。
　　LinkedList: 由列表实现的List。对顺序访问进行了优化，向List中间插入与删除得开销不大，随机访问则相对较慢(可用ArrayList代替)。它具有方法 addFirst()、addLast()、getFirst()、getLast()、removeFirst()、removeLast()，这些方法(没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用。
　　3.Set的功能方法
　　Set(interface): 存入Set的每个元素必须是唯一的，这也是与List不同的，因为Set不保存重复元素。加入Set的Object必须定义equals()方法以确保对象的唯一性。Set与Collection有完全一样的接口。Set接口不保证维护元素的次序。
　　HashSet: HashSet能快速定位一个元素，存入HashSet的对象必须定义hashCode()。
　　TreeSet: 保持次序的Set，底层为树结构。使用它可以从Set中提取有序的序列。
　　LinkedHashSet: 具有HashSet的查询速度，且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时，结果会按元素插入的次序显示。
　　HashSet采用散列函数对元素进行排序，这是专门为快速查询而设计的；TreeSet采用红黑树的数据结构进行排序元素；LinkedHashSet内部使用散列以加快查询速度，同时使用链表维护元素的次序，使得看起来元素是以插入的顺序保存的。需要注意的是，生成自己的类时，Set需要维护元素的存储顺序，因此要实现Comparable接口并定义compareTo()方法。
3、其他特征
*     List，Set，Map将持有对象一律视为Object型别。
*     Collection、List、Set、Map都是接口，不能实例化。
      继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class，这些才可被实例化。
*     vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。
三、Collections
Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各种集合的搜索、排序、线程完全化等操作。
相当于对Array进行类似操作的类——Arrays。
如，Collections.max(Collection coll); 取coll中最大的元素。
       Collections.sort(List list); 对list中元素排序
四、如何选择？
1、容器类和Array的区别、择取
      *     容器类仅能持有对象引用（指向对象的指针），而不是将对象信息copy一份至数列某位置。
      *     一旦将对象置入容器内，便损失了该对象的型别信息。
2、
     *     在各种Lists中，最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时，使用LinkedList()；
        Vector总是比ArrayList慢，所以要尽量避免使用。
     *     在各种Sets中，HashSet通常优于HashTree（插入、查找）。只有当需要产生一个经过排序的序列，才用TreeSet。
        HashTree存在的唯一理由：能够维护其内元素的排序状态。
     *     在各种Maps中
        HashMap用于快速查找。
     *     当元素个数固定，用Array，因为Array效率是最高的。
结论：最常用的是ArrayList，HashSet，HashMap，Array。而且，我们也会发现一个规律，用TreeXXX都是排序的。
注意：
1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
2、Set和Collection拥有一模一样的接口。
3、List，可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个，get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。
5、Map用 put(k,v) / get(k)，还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
      HashMap会利用对象的hashCode来快速找到key。
*     hashing
          哈希码就是将对象的信息经过一些转变形成一个独一无二的int值，这个值存储在一个array中。
          我们都知道所有存储结构中，array查找速度是最快的。所以，可以加速查找。
          发生碰撞时，让array指向多个values。即，数组每个位置上又生成一个梿表。
6、Map中元素，可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列，将map中的所有keys生成一个Set。
使用values()抽取value序列，将map中的所有values生成一个Collection。
为什么一个生成Set，一个生成Collection？那是因为，key总是独一无二的，value允许重复。

--------------------------------------

欢迎您，进入我系程序猿的cnBlog博客。

你不能改变你的过去，但你可以让你的未来变得更美好。一旦时间浪费了，生命就浪费了。

You cannot improve your past, but you can improve your future. Once time is wasted, life is wasted.

--------------------------------------
相关阅读:
【转】Git: There is no tracking information for the current branch.
【转】git多个远程仓库
 【转】python批量快速合并excel文件
 【转】HTML5-postMessage实现跨域
 Python3正则表达式search和findall差异讨论
 Python Segmentation fault错误定位办法
 Python3压缩和解压缩实现
 Python3+profile性能分析
 案例：ADG环境遇到redo日志member路径有误以及RMAN-6571错误
 CentOS7的udev的绑定规则
原文地址：https://www.cnblogs.com/jqmtony/p/3785659.html