• 字典、顺序表、列表、hash树 实现原理


    1.1 python中字典对象实现原理

        注:字典类型是Python中最常用的数据类型之一,它是一个键值对的集合,字典通过键来索引,关联到相对的值,理论上它的查询复杂度是 O(1) 

      1、哈希表 (hash tables)

          1. 哈希表(也叫散列表),根据关键值对(Key-value)而直接进行访问的数据结构。

          2. 它通过把key和value映射到表中一个位置来访问记录,这种查询速度非常快,更新也快。

          3. 而这个映射函数叫做哈希函数,存放值的数组叫做哈希表。 

          4. 通过把每个对象的关键字k作为自变量,通过一个哈希函数h(k),将k映射到下标h(k)处,并将此对象存储在这个位置。

      2、具体操作过程

          1. 数据添加:把key通过哈希函数转换成一个整型数字,然后就将该数字对数组长度进行取余,取余结果就当作数组的下标,
                            将value存储在以该数字为下标的数组空间里。

          2. 数据查询:再次使用哈希函数将key转换为对应的数组下标,并定位到数组的位置获取value。

      3、{“name”:”zhangsan”,”age”:26} 字典如何存储的呢? 

          1. 比如字典{“name”:”zhangsan”,”age”:26},那么他们的字典key为name、age,假如哈希函数h(“name”) = 1、h(“age”)=3,

          2. 那么对应字典的key就会存储在列表对应下标的位置,[None, “zhangsan”, None, 26 ]

      4、解决hash冲突

          

    1.2 顺序表

      1、顺序表特点

          1. 线性表的逻辑顺序与物理顺序一致,数据元素之间的关系是以元素在计算机内“物理位置相邻”来体现。

          2. 对顺序表中的所有表项,即可以进行顺序的访问,也可以随机的访问,也就是说,
              既可以从表的第一个表项开始逐个访问表项也可以按照表项的序号(下标)直接的访问。

          3. 无需为表示结点间的逻辑关系而增加额外的存储空间,存储利用率提高。

          4. 可以方便的存储表中的任一结点,存储速度快。

          缺点:

            1)在表中插入新元素或删除无用元素时,为了保持其他元素的相对次序不变,平均需要移动一半元素,运行效率低
            2)由于顺序表要求占用连续的空间,如果预先进性存储分配,则当表长度变化较大时,难以确定合适的存储空间带大小
            3)若按可能达到的最大的长度预先分配表的空间,则容易造成一部分空间长期的限制而得不到充分的利用

      2、链表

          1. 链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。

          2. 链表由一系列结点(链表中每一个元素称为结点)组成,结点可以在运行时动态生成。

          3. 每个结点包括两个部分:数据域和指针域

          特点:

            1)可以方便的进行扩充。

            2)可以方便的删除和插入。

      3、顺序表的线性存储示意图   

          1. 假设线性表中有n个元素,每个元素占k个存储单元,第一个元素的地址为Loc(a1),则第i个元素的地址Loc(ai):

          2. Loc(ai) = Loc(a1) + (i-1) * k; # 其中Loc(a1)称为基地址。

            

      4、顺序表增删改查原理

    # 1、顺序表的初始化
        顺序表的初始化就是把顺序表 初始化为空的顺序表;只需把顺序表的长度length置为0即可;
    # 2、求顺序表的长度
        顺序表的长度就是就顺序表中的元素的个数,由于在插入和删除操作中都有对数据表的长度进行修改,所以求表长只需返回length的值即可;
    # 3、按序号查找
        查找顺序表中第i个元素的值(按序号查找),如果找到,将将该元素值赋给e。
        查找第i个元素的值时,首先要判断查找的序号是否合法,如果合法,返回第i个元素对应的值。
    # 4、插入元素
        在数据表的第i个位置插入元素,在顺序表的第i个位置插入元素e
        首先将顺序表第i个位置的元素依次向后移动一个位置,然后将元素e插入第i个位置,移动元素要从后往前移动元素,
        即:先移动最后一个元素,在移动倒数第二个元素,依次类推;
        插入元素之前要判断插入的位置是否合法,顺序表是否已满,在插入元素之后要将表长L->length++;
    # 5、删除操作
        删除表中的第i个元素e,删除数据表中的第i个元素,需要将表中第i个元素之后的元素依次向前移动一位,将前面的元素覆盖掉。
        移动元素时要想将第i+1个元素移动到第i个位置,在将第i+2个元素移动i+1的位置,直到将最后一个元素移动到它的前一个位置。
        进行删除操作之前要判断顺序表是否为空,删除元素之后,将表长L->length--;
    # 6、按内容查找
        查找数据元素e在表中的位置,可以从表头开始一直遍历表中元素。
        如果找到与要查找元素e相等的元素,则返回元素在表中的位置,数组下标从0开始。
        则元素在表中对应的位置序号值应为对应数组下标加1,没有找到则返回0。
    # 7、头插
        头插,即在表头插入元素e,在表头插入元素,需要将表中的元素依次后移一位,
        然后将要插入的元素e赋给数字的首元素,执行插入操作后将表长L->length++;
        需要注意的是移动元素要从顺序表的最后一个元素开始移动,
        如果从第1个元素开始移动,会使得第1个元素的值覆盖第2个元素的值,然后把第二个元素后移则会使第2个元素的值
        (原来第1个元素值)覆盖第3个元素的值,依次类推,最后出插入元素外,其余元素值均为原顺序表中第一个元素的值。
    # 8、头删
        删除顺序表中的第一个元素,只要将顺序表中的元素从第2个开始,依次向前移动1位,覆盖原来顺序表中元素对应位置的前一个值
        在删除元素之前要判断顺序表是否为空,删除顺序表元素之后将顺序表长度L->length--;
    # 9、尾插
        在顺序表表尾插入元素e,L->data[L->length] = e;将元素e的值赋给顺序表中最后一个元素的下一个元素;
        尾插操作,需要判断顺序表是否已满,尾插后将顺序表长度L->length++;
    # 10、尾删
        删除表尾元素,只需将顺序表的长度减1,类似于出栈操作,栈顶指针top –。
    # 11、清空顺序表
        清空顺序表就是将表中的元素删除。删除表中的元素只需将表的长度置为0。
    # 12、判断表是否为空
        如果顺序表的长度为0,则顺序表为空,返回1,否则,返回0;
    # 13、打印表中元素
        依次打印顺序表中的元素,如果顺序表为空则输出提示。
    顺序表增删改查原理

    1.3 python 列表(list)

      1、python列表

          1. 在CPython中,列表被实现为长度可变的数组。

          2. 列表对象在 C 程序中的数据结构:有一个指针数组用来保存列表元素的指针,和一个可以在列表中放多少元素的标记。

          3. 内存的槽的个数并不是当前列表就有这么多的元素,列表元素的个数和 len(列表)是一样,就是真正的元素的个数。

          4. 但分配的槽的大小,会比元素个数大一点,目的就是为了防止在每次添加元素的时候都去调用分配内存的函数。

      2、C中数组存储方式

          1. 必须牢记:定义并初始化一个数组后,在内存里分配了两个空间,一个用于存放数组的引用变量,一个用于存放数组本身。

          2. 数组引用变量只是一个引用,这个引用变量可以指向任何有效的内存,只有当该引用指向有效内存后,才可通过该数组变量来访问数组元素。

          3. 如果我们希望在程序中访问数组,则只能通过这个数组的引用变量来访问它。

          4. 实际的数组元素被存储在堆(heap)内存中;数组引用变量是一个引用类型的变量,被存储在栈(stack)内存中。

      3、python列表操作时间复杂度

          index() O(1)

          append O(1)

          pop() O(1)

          pop(i) O(n)

          insert(i,item) O(n)

          del operator O(n)

          reverse O(n)

          sort O(nlogn)

      4、列表和元组比较

          1. 列表是动态的,其大小可以改变(重新分配);
          2. 而元组是不可变的,一旦创建就不能修改。
          3. list和tuple在c实现上是很相似的,对于元素数量大的时候,都是一个数组指针,指针指向相应的对象,找不到tuple比list快的理由。
          4. 但对于小对象来说,tuple会有一个对象池,所以小的、重复的使用tuple还有益处的。

      5、tuple使用场景

          1. 实际情况中的确也有不少大小固定的列表结构,例如二维地理坐标等;

          2. 另外tuple也给元素天然地赋予了只读属性;

      6、列表与字典比较

          1. list是有序的,dict是无序的

          2. list通过索引访问,dict使用key访问

          3. list随着数量的正常增长要想查找元素的时间复杂度为O(n), dict不随数量而增长而变化,时间负责都为O(1)

      7、列表和字典应用场景

          1. list一般可作为队列、堆栈使用,而dict一般作为聚合统计或者快速使用特征访问等

          2. list 是记录简单有序数据的,就是一对一的那种,可以理解为一维数组.

          3. dict 是记录复杂无序数据,就是一对多,可以理解为多维数组.

  • 相关阅读:
    公有云数据库服务的申请与使用
    linux集群
    shell基础知识
    LNMP环境配置
    LAMP环境搭建与配置
    12月17日linux学习
    12月16日linux学习(文档的压缩与打包)
    12月13、14号linux学习
    12月12日linux学习
    目录结构
  • 原文地址:https://www.cnblogs.com/jiaxinzhu/p/12528831.html
Copyright © 2020-2023  润新知