一、数组VS集合
1.长度
数组长度固定;集合长度可变;
2.内容
数组存储的是同一类型元素;集合可以存储不同类型的元素;
3.元素的数据类型
数组可以存储基本数据类型,也可以存储引用类型;集合只能存储引用类型(基本数据类型会自动装箱成对象)
二、Collection体系
Collection基础功能:boolean add(Object obj); boolean addAll(Collection c);
1.添加 boolean add(Object obj); boolean addAll(Collection c); 2.删除 void clear(); boolean remove(Object); boolean removeAll(Collection c);//移出一个集合的元素,只要一个元素被移除了就返回true 3.判断 boolean contains(Object o); boolean containsAll(Collection c); boolean isEmpty(); 4.获取 Iterator<E> iterator();//迭代器 5.长度 int size(); 6.交集 boolean retainAll(Collection c);//只保留两集合交集,返回当前集合是否改变过
三、迭代器如何实现
Collection继承Iterable,实现Iterable中iterator()方法,Iterable中iterator方法只是声明了一下,未具体展开。
public interface Collection<E> extends Iterable<E> { Iterator<E> iterator(); }
Iterator也是一个接口,有四个方法,依然不具体。
public interface Iterator<E> { boolean hasNext(); E next(); default void remove() { throw new UnsupportedOperationException("remove"); } default void forEachRemaining(Consumer<? super E> action) { Objects.requireNonNull(action); while (hasNext()) action.accept(next()); } }
找底层实现--ArrayList,发现Iterator是以内部类的方式完成的
/** * An optimized version of AbstractList.Itr */ private class Itr implements Iterator<E> { int cursor; // index of next element to return int lastRet = -1; // index of last element returned; -1 if no such int expectedModCount = modCount; public boolean hasNext() { return cursor != size; } @SuppressWarnings("unchecked") public E next() { checkForComodification(); int i = cursor; if (i >= size) throw new NoSuchElementException(); Object[] elementData = ArrayList.this.elementData; if (i >= elementData.length) throw new ConcurrentModificationException(); cursor = i + 1; return (E) elementData[lastRet = i]; } public void remove() { if (lastRet < 0) throw new IllegalStateException(); checkForComodification(); try { ArrayList.this.remove(lastRet); cursor = lastRet; lastRet = -1; expectedModCount = modCount; } catch (IndexOutOfBoundsException ex) { throw new ConcurrentModificationException(); } } @Override @SuppressWarnings("unchecked") public void forEachRemaining(Consumer<? super E> consumer) { Objects.requireNonNull(consumer); final int size = ArrayList.this.size; int i = cursor; if (i >= size) { return; } final Object[] elementData = ArrayList.this.elementData; if (i >= elementData.length) { throw new ConcurrentModificationException(); } while (i != size && modCount == expectedModCount) { consumer.accept((E) elementData[i++]); } // update once at end of iteration to reduce heap write traffic cursor = i; lastRet = i - 1; checkForComodification(); } final void checkForComodification() { if (modCount != expectedModCount) throw new ConcurrentModificationException(); } }
在ArrayList类创建迭代器之后,除非通过迭代器自身remove或add对列表结构进行修改,否则在其他线程中以任何形式对列表进行修改,迭代器马上会抛出异常,快速失败。
四、List集合 - 有序存储(存储顺序和取出顺序一致),可重复
1.ArrayList
底层结构是数组,线程不安全
1.1 默认属性
//初始容量为10 private static final int DEFAULT_CAPACITY = 10; //用户指定该ArrayList容量为0时,返回该空数组 private static final Object[] EMPTY_ELEMENTDATA = {}; //当ArrayList容器为0时,返回该默认空数组。当调用无参构造方法,返回的是该数组。刚创建一个ArrayList 时其内数据量为0。 private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}; /** * 保存添加到ArrayList中的元素。 * ArrayList的容量就是该数组的长度。 * 该值为DEFAULTCAPACITY_EMPTY_ELEMENTDATA 时,当第一次添加元素进入ArrayList中时,数组将扩容值DEFAULT_CAPACITY。 * 被标记为transient,在对象被序列化的时候不会被序列化。
* 从这就可以看出ArrayList底层是一个数组
* 思考:elementData被标记为transient,那么它的序列化和反序列化是如何实现的呢?
* ArrayList自定义了它的序列化和反序列化方式。详情请查看writeObject(java.io.ObjectOutputStream s)和readObject(java.io.ObjectOutputStream s)方法。 */ transient Object[] elementData; //实际大小,逻辑长度并不是数组长度 private int size;
1.2 构造方法
1.2.1 无参ArrayList,默认指向的都是同一个Object数组。
如果构造多个无参
public ArrayList() { this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA; }
1.2.2 指定容量
/** * 构造一个指定初始化容量为capacity的空ArrayList。 * * @param initialCapacity ArrayList的指定初始化容量 * @throws IllegalArgumentException 如果ArrayList的指定初始化容量为负。 */ public ArrayList(int initialCapacity) { if (initialCapacity > 0) { this.elementData = new Object[initialCapacity]; } else if (initialCapacity == 0) { this.elementData = EMPTY_ELEMENTDATA; } else { throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); } }
1.2.3 指定元素
public ArrayList(Collection<? extends E> c) { elementData = c.toArray(); if ((size = elementData.length) != 0) { // c.toArray might (incorrectly) not return Object[] (see 6260652) if (elementData.getClass() != Object[].class) elementData = Arrays.copyOf(elementData, size, Object[].class); } else { // 如果size为0,可认为用户指定容量为0.
this.elementData = EMPTY_ELEMENTDATA; } }
1.3 方法
1.3.1 get(index) O(1)
public E get(int index) {
//越界检查
rangeCheck(index);
return elementData(index);
}
//越界检查
private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
//返回索引为index的元素
E elementData(int index) {
return (E) elementData[index];
}
1.3.2 add(E e)
public boolean add(E e) { ensureCapacityInternal(size + 1); // Increments modCount!! elementData[size++] = e; return true; } //数组容量检查,不够则扩容 minCapacity:想要的最小容量 private void ensureCapacityInternal(int minCapacity) { if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity); } ensureExplicitCapacity(minCapacity); } private void ensureExplicitCapacity(int minCapacity) { modCount++; //确保指定的最小容量大于当前数组缓冲区长度 // overflow-conscious code if (minCapacity - elementData.length > 0) grow(minCapacity); } //扩容 private void grow(int minCapacity) { // overflow-conscious code // 获取当前数组的容量 int oldCapacity = elementData.length; //扩容1.5倍 int newCapacity = oldCapacity + (oldCapacity >> 1); //如果扩容后的容量还是小于想要的最小容量,直接扩容到想要的容量 if (newCapacity - minCapacity < 0) newCapacity = minCapacity if (newCapacity - MAX_ARRAY_SIZE > 0) //如果扩容后的容量大于临界值,则进行大容量分配 newCapacity = hugeCapacity(minCapacity); // minCapacity is usually close to size, so this is a win: elementData = Arrays.copyOf(elementData, newCapacity); } //大容量分配, private static int hugeCapacity(int minCapacity) { if (minCapacity < 0) // overflow throw new OutOfMemoryError(); return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE; }
//扩容大体步骤
/**
1. 进行空间检查,决定是否进行扩容,以及确定最少需要的容量
2. 如果确定扩容,就执行grow(int minCapacity),minCapacity为最少需要的容量
3. 第一次扩容,逻辑为newCapacity = oldCapacity + (oldCapacity >> 1);即在原有的容量基础上增加一半。
4. 第一次扩容后,如果容量还是小于minCapacity,就将容量扩充为minCapacity。
5. 对扩容后的容量进行判断,如果大于允许的最大容量MAX_ARRAY_SIZE,则将容量再次调整为MAX_ARRAY_SIZE。至此扩容操作结束。
*/
1.3.3 add(int index, E element)
public void add(int index, E element) {
//1.越界检查
rangeCheckForAdd(index);
//2.确认list容量
ensureCapacityInternal(size + 1); // Increments modCount!
//3.对数组进行复制处理,目的就是空出index的位置插入element,并将index后的元素位移一个位置
System.arraycopy(elementData, index, elementData, index + 1, size - index);
//4.插入元素
elementData[index] = element;
size++;
}
1.3.4 remove(int index)
public E remove(int index) { //越界检查 rangeCheck(index); //修改次数+1 modCount++; //记录索引为inde处的元素 E oldValue = elementData(index); // 删除指定元素后,需要左移的元素个数 int numMoved = size - index - 1; //如果有需要左移的元素,就移动(移动后,该删除的元素就已经被覆盖了) if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); //size-1,末尾元素置为null elementData[--size] = null; // clear to let GC do its work return oldValue; }
2.LinkedList
底层数据结构是双向链表,线程不安全。可以使用LinkedList实现队列或者栈。
private static class Node<E> { E item; Node<E> next; Node<E> prev; Node(Node<E> prev, E element, Node<E> next) { this.item = element; this.next = next; this.prev = prev; } }
3.Vector
底层数据结构是数组,线程安全,方法被Synchronized修饰。如果需要ArrayList实现同步可以使用Collections.synchronized(new ArrayList(...))的方法,实现同步。
Vector每次扩容直接扩展一倍
五、Set集合-无序,元素不可重复
1.HashSet
底层数据结构是哈希表+红黑树。实现Set接口、不保证迭代顺序、允许元素为null、底层实际上是一个HashMap实、非同步、初始容量非常影响迭代性能。
1.1 构造方法-无参
private transient HashMap<E,Object> map; //由此可以看出底层使用hashmap实现的; public HashSet() { map = new HashMap<>(); }
1.2 既然底层实用hashmap实现的,那么键值对分别对应的是什么呢?
//HashSet底层使用hashmap实现,键:我们操作的元素,即集合中的数据,值:为同一个Object对象 private static final Object PRESENT = new Object(); public boolean add(E e) { return map.put(e, PRESENT)==null; } public boolean remove(Object o) { return map.remove(o)==PRESENT; } public boolean contains(Object o) { return map.containsKey(o); }
图示:
2.TreeSet
底层数据结构是红黑树,保证元素的排序方式。
-
实现NavigableSet接口
-
可以实现排序功能
-
底层实际上是一个TreeMap实例
-
非同步
- 不允许为null
3.LinkedHashSet
-
迭代是有序的
-
底层实际上是一个HashMap+双向链表实例(其实就是LinkedHashMap)…
-
非同步
-
性能比HashSet差一丢丢,因为要维护一个双向链表
-
初始容量与迭代无关,LinkedHashSet迭代的是双向链表
- 允许为null