• 深入理解python之二——python列表和元组


    从一开始学习python的时候,很多人就听到的是元组和列表差不多,区别就是元组不可以改变,列表可以改变。

    从数据结构来说,这两者都应当属于数组,元组属于静态的数组,而列表属于动态数组。稍后再内存的分配上也会体现这一点。对于这两种类型,除了能接受相同类型的值之外,也接受混合类型的值。

    元组

    说元组不能改变的,其实只是看到了操作结果显示出来的表面现象。可以来看一下下列的操作(输出结果截去了相同的高几位)。

    a = (1,2,3)
    b = (1,2,3)
    c = a+b
    id(a)
    >>>71845752
    id(b)
    >>>99964864
    id(c)
    >>>97883880
    

    这样的结果意味着,对于元组,即便元组组成的值是相同的,每次绑定一个变量都是重新开辟空间生成一个新的。在执行a+b的元组组合操作时,也是在重新创建一个新的元组,而不是在前一个的基础上拼接的。也就是说所有的内容都会被复制一份,所以这里的复杂度不是O(1),而是O(n)。

    此外,元组还有一个额外要注意的细节。在《Python高性能编程》一书中作者提到了1-20长度的小元组在被回收之后不会返还给操作系统处理,而是在程序内保留。这一细节可能是根据python2.7来说的,对于python3.x版本未验证。元组一般会缓存在Python的运行时环境中,使用的时候不用去访问内核来分配内存。

    列表

    列表主要的操作时增删,切片,查找,排序。前两者依赖于列表的组织结构。由于列表是可变的,所以列表除了本身的数据之外,每个数据单元还会额外消耗一个单位的单元用于保存结构信息,以便列表进行重新调整大小。所以假如同样保存10W数据,列表实际占用的数据单元是远大于10W这个数。

    对于列表的增加,主要是一个append()方法,涉及一个动态申请空间的算法。每次使用.append()操作的时候就会申请空间,申请总是按照一定的算法申请远不止一个空间,便于接下来的扩展。这点在初学数据结构的时候可能都会知道,一次申请最好申请一个差不多的,这要比一个一个申请更有效,不过具体数量是多少,这可能是一个奥卡姆剃刀的问题。预测式的空间申请算法,会带来一定的额外空间开销。

    列表的.index()方法提供了一种搜索调用,但它的实现是线性搜索,效率并不高。

    列表的排序方法使用的是Tim排序,相对来说是一种比较好的实现。

    列表在加载的时候,相对于元组的速度也是慢了许多。

    最后

    对于两者其实都可以通过自己编写安排引入算法来进行搜索或排序。如果自己编写有点困难,也可以借助内建的bisect模块。

  • 相关阅读:
    对C++虚函数、虚函数表的简单理解
    子数组最大累加和
    和为k的最长子数组及其延伸
    CentOS 安装codeblocks
    CentOS 6 安装chromium
    数组中累加和小于等于k的最长子数组
    数组最大矩形面积
    关于商品买卖最大收益的问题
    数组中只出现一次的数
    TinyHttpd代码解析
  • 原文地址:https://www.cnblogs.com/xiao3c/p/9629220.html
Copyright © 2020-2023  润新知