• java集合框架使用原理分析


          集合是我们日常编程中可能用的很多的技术之一 使用频率极高 可能平时就会知道怎么去用 但是集合之间的关系与不同之处都不是很清楚 对它们的底层原理更甚 所以写词文章 让自己有一个更深的认识

    集合是一个庞大的家族 今天先来说说这几个 ArrayList、LinkedList、Vector 

     

            ArrayList  由于它的底层是数组 数组我们都知道它的查询修改都是效率很高的 ArrayList也是如此 但是为什么查询修改效率高 插入和删除效率低较低呢 这就跟它的数据结构有关系呢 接下啦我们来看看ArrayList数据结构模型

     插入、删除:如果我们要想集合中插入一个数100 它的操作步骤是 先在集合中把要插入的位置的数32复制一份 然后再把后面的数往后移  我们不仅要复制数据 而且还要将数据往后移 如果这个集合的数据很多的话 那效率就会很低  进行删除的话后面的数据复制一份 同时数据都要像前面移动 效率也很低

     查询、修改: 修改如果进行查询 我们只需要通过数组下标就可以定位到数据 所以效率高 实际开发中 我们大部分是进行查询数据 所以ArrayList使用很广泛

    任何事物都有两面性 不管是生活中 还是工作中 在编程也是同样适用的(因为编程也是人发明出来的嘛) 为了解决ArrayList的这一短板 聪明的程序员就使用另一个集合

     

     

     ArrayList 增删改查的源码

          从源码我们可以看出 不管是插入和删除元素的时候 ArrayList都会复制数组操作 这也就导致了它的效率不高

     

     1 //查询元素
     2  public E get(int index) {
     3 //检查元素是否越界
     4         rangeCheck(index);
     5 
     6         return elementData(index);
     7     }
     8 
     9 
    10 //按顺序添加元素
    11  public boolean add(E e) {
    12        //确认开启扩容机制 
    13         ensureCapacityInternal(size + 1);  // Increments modCount!!
    14         elementData[size++] = e;
    15         return true;
    16     }
    17 
    18 //在指定位置插入元素
    19  public void add(int index, E element) { 
    20        //检查索引是否越界
    21         rangeCheckForAdd(index);
    22        //确认开启扩容机制
    23          ensureCapacityInternal(size + 1);  // Increments modCount!!
    24        //复制数组
    25         System.arraycopy(elementData, index, elementData, index + 1,
    26                          size - index);
    27       //替换元素
    28         elementData[index] = element;
    29         size++;
    30     }
    31 
    32 
    33 
    34 
    35 //移除某个元素
    36  public E remove(int index) {
    37         rangeCheck(index);
    38 
    39         modCount++;
    40         E oldValue = elementData(index);
    41 
    42         int numMoved = size - index - 1;
    43         if (numMoved > 0)
    //复制数组 44 System.arraycopy(elementData, index+1, elementData, index, 45 numMoved); 46 elementData[--size] = null; // clear to let GC do its work 47 48 return oldValue; 49 } 50 51 52

      LinkedList 

           LinkedList它的底层是双向链表实现的非线程安全的集合,它是一个链表结构,不能像数组一样随机访问,必须是每个元素依次遍历直到找到元素为止。其结构的特殊性导致它查询数据慢。 接下来我们来看看它的结构模型

    插入、删除 :因为是链表结构 所以它的插入效率很高 (如果在14 和 18之间插入一个33 的话,链表直接会将连接到18的链子断开 然后连接上33所在的前节点  数据18的前节点再连接上33的后节点  如图2所示) 也就是说 插入一个数字我们只需要将(14 和 18 之间的)链表断开 再将14和33之间的链表连上即可  比ArrayList的数组复制效率高

    查询、修改 :LinkedList 查询速度慢 因为它要遍历整个整个集合 直到找到元素为止 如果集合数组多的话 消耗的资源就多 而ArrayList是通过数组下标定位速度快 同样他也是线程不安全的

       

    linkedList

          在执行查询时 先判断元素是靠近头部还是尾部 如果是头部 若靠近头部,则从头部开始依次查询判断 

          执行插入时 判断是插入到中间还是尾部 如果插入到尾部 直接将尾节点的下一个指针指向新增节点。如果插入到中间 获取到当前节点的上一个节点(D) 并将D节点的后指针指向新的节点头指针 然后新增节点的下一个指针指向当前节点。

     1   //查询元素   
     2   public E get(int index) {
     3       //检查所引是否越界
     4       checkElementIndex(index);
     5          return node(index).item;
     6      }
     7 
     8 // 返回指定索引处的节点
     9 Node<E> node(int index) {
    10   // 指定的索引值与链表大小右移一位,及除以 2 进行比较
    11    if (index < (size >> 1)) { // 索引小,则从首节点向后扫描,直到索引值处
    12    Node<E> x = first;
    13     for (int i = 0; i < index; i++)
    14      x = x.next;
    15     return x;
    16     } else { // 索引大,则从尾节点向前扫描,直到索引值处
    17     Node<E> x = last;
    18      for (int i = size - 1; i > index; i--)
    19     x = x.prev;
    20     return x;
    21   }
    22 }
    23 
    24 
    25   //移除指定元素
    26    public E remove(int index) {
    27          checkElementIndex(index);
    28          return unlink(node(index));
    29     }
    30  
    31  //在指定位置添加元素
    32    public void add(int index, E element) {
    33        //检查所引是否越界  
    34        checkPositionIndex(index);
    35        // 在链表末尾天添加
    36          if (index == size)
    37              linkLast(element);
    38          else
    39              linkBefore(element, node(index));
    40     }
    41  
    42    private static class Node<E> {
    43          E item;
    44          //头节点
    45          Node<E> next;
    46        //尾节点
    47          Node<E> prev;
    48          Node(Node<E> prev, E element, Node<E> next) {
    49             this.item = element;
    50              this.next = next;
    51              this.prev = prev;
    52          }
    53      }
    54  
    55   /**
    56       * Links e as last element.
    57       */
    58      void linkLast(E e) {
    59          //用l来临时保存未插入前的last节点
    60          final Node<E> l = last;
    61         //创建一个值为e的新节点 添加第一个元素时 l = null
    62          final Node<E> newNode = new Node<>(l, e, null);
    63          //将新节点赋值的last
    64         last = newNode;
    65         if (l == null)
    66              first = newNode;
    67          else
    68             l.next = newNode;
    69          size++;
    70          modCount++;
    71      }

      Vector 

           Vector的数据结构和使用方法 跟ArrayList相同 不同之处在于Vector是线程安全的 几乎所有的对数据操作的方法都被synchronized关键字修饰  synchronized是线程同步的 当一个线程获得Vector对象锁的时候 其它的线程必须等到它执行完毕之后(锁被释放)才能执行  

    总结

    1.ArrayList 它的底层是一个数组 查询修改数据快(通过下标定位) 但是插入删除数据比较慢 (插入数据慢是因为复制数组耗时)  为了改进这个缺点 于是就有了LinkedList数组 它是一个链表结构 插入和删除数据很快(只需要修改指针引用) 但是查询和修改数效率低(他要查询到整个链表从第一个开始寻找 一直找到为止)

    2.ArrayList 和LinkedList都是线程不安全的

    3.Vector是线程安全的 但是效率低 当我们执行单个线程的时候ArrayList的效率高于Vector 

     

  • 相关阅读:
    C 语言高效编程的几招——A few action of efficient C language programming
    UDP套接字——(DGRAM)
    初学数位DP--hdu 2089
    leetcode Reverse Nodes in k-Group
    CC+语言 struct 深层探索——CC + language struct deep exploration
    [置顶] JDK工具(一)–Java编译器javac
    非归档数据文件offline的恢复
    [置顶] OpenJDK源码研究笔记(九)-可恨却又可亲的的异常(NullPointerException)
    MSF溢出实战教程
    一些安全名词解释
  • 原文地址:https://www.cnblogs.com/hengly/p/11203494.html
Copyright © 2020-2023  润新知