• 【从今天开始好好学数据结构01】数组


    面试的时候,常常会问数组和链表的区别,很多人都回答说,“链表适合插入、删除,时间复杂度O(1);数组适合查找,查找时间复杂度为O(1)”。实际上,这种表述是不准确的。数组是适合查找操作,但是查找的时间复杂度并不为O(1)。即便是排好序的数组,你用二分查找,时间复杂度也是O(logn)。所以,正确的表述应该是,数组支持随机访问,根据下标随机访问的时间复杂度为O(1)。

    每一种编程语言中,基本都会有数组这种数据类型。不过,它不仅仅是一种编程语言中的数据类型,还是一种最基础的数据结构。尽管数组看起来非常基础、简单,但是我估计很多人都并没有理解这个基础数据结构的精髓。在大部分编程语言中,数组都是从0开始编号的,但你是否下意识地想过,为什么数组要从0开始编号,而不是从1开始呢? 从1开始不是更符合人类的思维习惯吗?带着这个问题来学习接下来的内容,带着问题去学习往往效果会更好!!!

    什么是数组?我估计你心中已经有了答案。不过,我还是想用专业的话来给你做下解释。数组(Array)是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据。这个定义里有几个关键词,理解了这几个关键词,我想你就能彻底掌握数组的概念了。下面就从我的角度分别给你“点拨”一下。

    第一是线性表(Linear List)。顾名思义,线性表就是数据排成像一条线一样的结构。每个线性表上的数据最多只有前和后两个方向。其实除了数组,链表、队列、栈等也是线性表结构。而与它相对立的概念是非线性表,比如二叉树、堆、图等。之所以叫非线性,是因为,在非线性表中,数据之间并不是简单的前后关系。

    第二个是连续的内存空间和相同类型的数据。正是因为这两个限制,它才有了一个堪称“杀手锏”的特性:“随机访问”。但有利就有弊,这两个限制也让数组的很多操作变得非常低效,比如要想在数组中删除、插入一个数据,数组为了保持内存数据的连续性,会导致插入、删除这两个操作比较低效,相反的数组查询则高效

    数组java代码:

    package array;
    
    /**
     * 1) 数组的插入、删除、按照下标随机访问操作;
     * 2)数组中的数据是int类型的;
     *
     * Author: Zheng
     * modify: xing, Gsealy
     */
    public class Array {
        //定义整型数据data保存数据
        public int data[];
        //定义数组长度
        private int n;
        //定义中实际个数
        private int count;
    
        //构造方法,定义数组大小
        public Array(int capacity){
            this.data = new int[capacity];
            this.n = capacity;
            this.count=0;//一开始一个数都没有存所以为0
        }
    
        //根据索引,找到数据中的元素并返回
        public int find(int index){
            if (index<0 || index>=count) return -1;
            return data[index];
        }
    
        //插入元素:头部插入,尾部插入
        public boolean insert(int index, int value){
            //数组中无元素 
    
            //if (index == count && count == 0) {
            //    data[index] = value;
            //    ++count;
            //    return true;
            //}
    
            // 数组空间已满
            if (count == n) {
                System.out.println("没有可插入的位置");
                return false;
            }
            // 如果count还没满,那么就可以插入数据到数组中
            // 位置不合法
            if (index < 0||index > count ) {
                System.out.println("位置不合法");
                return false;
            }
            // 位置合法
            for( int i = count; i > index; --i){
                data[i] = data[i - 1];
            }
            data[index] = value;
            ++count;
            return true;
        }
        //根据索引,删除数组中元素
        public boolean delete(int index){
            if (index<0 || index >=count) return false;
            //从删除位置开始,将后面的元素向前移动一位
            for (int i=index+1; i<count; ++i){
                data[i-1] = data[i];
            }
            //删除数组末尾元素  这段代码不需要也可以
            /*int[] arr = new int[count-1];
            for (int i=0; i<count-1;i++){
                arr[i] = data[i];
            }
            this.data = arr;*/
    
            --count;
            return true;
        }
        public void printAll() {
            for (int i = 0; i < count; ++i) {
                System.out.print(data[i] + " ");
            }
            System.out.println();
        }
    
        public static void main(String[] args) {
            Array array = new Array(5);
            array.printAll();
            array.insert(0, 3);
            array.insert(0, 4);
            array.insert(1, 5);
            array.insert(3, 9);
            array.insert(3, 10);
            //array.insert(3, 11);
            array.printAll();
        }
    }
    

    GenericArray数组代码

    public class GenericArray<T> {
        private T[] data;
        private int size;
    
        // 根据传入容量,构造Array
        public GenericArray(int capacity) {
            data = (T[]) new Object[capacity];
            size = 0;
        }
    
        // 无参构造方法,默认数组容量为10
        public GenericArray() {
            this(10);
        }
    
        // 获取数组容量
        public int getCapacity() {
            return data.length;
        }
    
        // 获取当前元素个数
        public int count() {
            return size;
        }
    
        // 判断数组是否为空
        public boolean isEmpty() {
            return size == 0;
        }
    
        // 修改 index 位置的元素
        public void set(int index, T e) {
            checkIndex(index);
            data[index] = e;
        }
    
        // 获取对应 index 位置的元素
        public T get(int index) {
            checkIndex(index);
            return data[index];
        }
    
        // 查看数组是否包含元素e
        public boolean contains(T e) {
            for (int i = 0; i < size; i++) {
                if (data[i].equals(e)) {
                    return true;
                }
            }
            return false;
        }
    
        // 获取对应元素的下标, 未找到,返回 -1
        public int find(T e) {
            for ( int i = 0; i < size; i++) {
                if (data[i].equals(e)) {
                    return i;
                }
            }
            return -1;
        }
    
    
        // 在 index 位置,插入元素e, 时间复杂度 O(m+n)
        public void add(int index, T e) {
            checkIndex(index);
            // 如果当前元素个数等于数组容量,则将数组扩容为原来的2倍
            if (size == data.length) {
                resize(2 * data.length);
            }
    
            for (int i = size - 1; i >= index; i--) {
                data[i + 1] = data[i];
            }
            data[index] = e;
            size++;
        }
    
        // 向数组头插入元素
        public void addFirst(T e) {
            add(0, e);
        }
    
        // 向数组尾插入元素
        public void addLast(T e) {
            add(size, e);
        }
    
        // 删除 index 位置的元素,并返回
        public T remove(int index) {
            checkIndexForRemove(index);
    
            T ret = data[index];
            for (int i = index + 1; i < size; i++) {
                data[i - 1] = data[i];
            }
            size --;
            data[size] = null;
    
            // 缩容
            if (size == data.length / 4 && data.length / 2 != 0) {
                resize(data.length / 2);
            }
    
            return ret;
        }
    
        // 删除第一个元素
        public T removeFirst() {
            return remove(0);
        }
    
        // 删除末尾元素
        public T removeLast() {
            return remove(size - 1);
        }
    
        // 从数组中删除指定元素
        public void removeElement(T e) {
            int index = find(e);
            if (index != -1) {
                remove(index);
            }
        }
    
        @Override
        public String toString() {
            StringBuilder builder = new StringBuilder();
            builder.append(String.format("Array size = %d, capacity = %d 
    ", size, data.length));
            builder.append('[');
            for (int i = 0; i < size; i++) {
                builder.append(data[i]);
                if (i != size - 1) {
                    builder.append(", ");
                }
            }
            builder.append(']');
            return builder.toString();
        }
    
    
        // 扩容方法,时间复杂度 O(n)
        private void resize(int capacity) {
            T[] newData = (T[]) new Object[capacity];
    
            for (int i = 0; i < size; i++) {
                newData[i] = data[i];
            }
            data = newData;
        }
    
        private void checkIndex(int index) {
            if (index < 0 || index > size) {
                throw new IllegalArgumentException("Add failed! Require index >=0 and index <= size.");
            }
        }
    
        private void checkIndexForRemove(int index) {
            if(index < 0 || index >= size) {
                throw new IllegalArgumentException("remove failed! Require index >=0 and index < size.");
            }
        }
    }
    

    到这里,就回溯最初的问题:

    从数组存储的内存模型上来看,“下标”最确切的定义应该是“偏移(offset)”。前面也讲到,如果用a来表示数组的首地址,a[0]就是偏移为0的位置,也就是首地址,a[k]就表示偏移k个type_size的位置,所以计算a[k]的内存地址只需要用这个公式:

    a[k]_address = base_address + k * type_size

    但是,如果数组从1开始计数,那我们计算数组元素a[k]的内存地址就会变为:

    a[k]_address = base_address + (k-1)*type_size

    对比两个公式,我们不难发现,从1开始编号,每次随机访问数组元素都多了一次减法运算,对于CPU来说,就是多了一次减法指令。那你可以思考一下,类比一下,二维数组的内存寻址公式是怎样的呢?有兴趣的可以在评论区评论出来哦QAQ

    数组作为非常基础的数据结构,通过下标随机访问数组元素又是其非常基础的编程操作,效率的优化就要尽可能做到极致。所以为了减少一次减法操作,数组选择了从0开始编号,而不是从1开始。
    不过我认为,上面解释得再多其实都算不上压倒性的证明,说数组起始编号非0开始不可。所以我觉得最主要的原因可能是历史原因。

    关于数组,它可以说是最基础、最简单的数据结构了。数组用一块连续的内存空间,来存储相同类型的一组数据,最大的特点就是支持随机访问,但插入、删除操作也因此变得比较低效,平均情况时间复杂度为O(n)。在平时的业务开发中,我们可以直接使用编程语言提供的容器类,但是,如果是特别底层的开发,直接使用数组可能会更合适。

    如果本文对你有一点点帮助,那么请点个赞呗,谢谢~

    最后,若有不足或者不正之处,欢迎指正批评,感激不尽!如果有疑问欢迎留言,绝对第一时间回复!

    欢迎各位关注我的公众号,一起探讨技术,向往技术,追求技术,说好了来了就是盆友喔...

    在这里插入图片描述

  • 相关阅读:
    KAFKA基础(四):Kafka架构深入(2)Kafka 生产者
    逆向工程,调试Hello World !程序(更新中)
    关于网络初级基础知识总结
    真!阿里P10整理的Java面试宝典,学了60%成功砍下了P8级Offer,真爽!
    【专升本计算机】甘肃省2020年专升本计算机测试题
    真!阿里P10整理的Java面试宝典,学了60%成功砍下了P8级Offer,真爽!
    python利用numpy存取文件
    泛在网技术考点整理
    [Python图像处理] 三十二.傅里叶变换(图像去噪)与霍夫变换(特征识别)万字详细总结
    汉诺塔问题
  • 原文地址:https://www.cnblogs.com/yichunguo/p/11864719.html
Copyright © 2020-2023  润新知