• Python中的集合类型分类和集合类型操作符解析


    集合类型
        数学上,把set称作由不同的元素组成的集合,集合(set)的成员通常被称作集合元素(set elements)。
        Python把这个概念引入到它的集合类型对象里。集合对象是一组无序排列的可哈希的值,集合成员可以做字典中的键。数学集合转为Python的集合对象很有效,集合关系测试和union、intersection等操作符在Python里也同样如我们所预想地那样工作。
        和其他容器类型一样,集合支持用in和not in操作符检查成员,由len()内建函数得到集合的基数(大小)用for循环迭代集合的成员。但是因为集合本身是无序的,不能为集合创建索引或执行切片(slice)操作,也没有键(keys)可用来获取集合中元素的值。
        集合(sets)有两种不同的类型:
               可变集合(set),可以添加和删除元素,不可哈希,不能用作字典的键也不能作为其他集合中的元素;
               不可变集合(frozenset),不可以添加和删除元素,有哈希值,能被用作字典的键或是作为集合中的一个成员。

    集合类型的实际操作:

    (1)如何创建集合类型和给集合赋值
            集合与列表( [ ] )和字典( { } ) 不同,没有特别的语法格式。列表和字典可以分别用他们自己的工厂方法 list() 和 dict() 创建,这也是集合被创建的唯一方法:用集合的工厂方法set()和frozenset()。

     1 >>> s = set('cheeseshop')                 # Python3.x
     2 >>> s
     3 {'s', 'o', 'h', 'e', 'c', 'p'}
     4 >>> t = frozenset('bookshop')
     5 >>> t
     6 frozenset({'b', 's', 'k', 'o', 'h', 'p'})
     7 >>> len(s),len(t)
     8 (6, 6)
     9 >>> s == t
    10 False
    11 >>> 
    create&assign

    (2)如何访问集合中的值
           可以遍历查看集合成员或检查某项元素是否是一个集合中的成员。

     1 >>> 'g' not in t
     2 True
     3 >>> 'k' in t
     4 True
     5 >>> for i in s:
     6     print(i)
     7 
     8     
     9 s
    10 o
    11 h
    12 e
    13 c
    14 p
    15 >>>
    in/not in

    (3)如何更新集合
             用各种集合内建的方法和操作符添加和删除集合的成员。只有可变集合能被修改,试图修改不可变集合会引发异常。

     1 >>> s
     2 {'s', 'o', 'h', 'e', 'c', 'p'}
     3 >>> s.add('z')
     4 >>> s
     5 {'s', 'o', 'h', 'e', 'c', 'p', 'z'}
     6 >>> t
     7 frozenset({'b', 's', 'k', 'o', 'h', 'p'})
     8 >>> t.add('x')
     9 Traceback (most recent call last):
    10   File "<pyshell#29>", line 1, in <module>
    11     t.add('x')
    12 AttributeError: 'frozenset' object has no attribute 'add'
    13 >>> s.update('pypi')
    14 >>> s
    15 {'s', 'o', 'h', 'e', 'c', 'p', 'i', 'y', 'z'}
    16 >>> s.remove('z')
    17 >>> s
    18 {'s', 'o', 'h', 'e', 'c', 'p', 'i', 'y'}
    19 >>> s -= set('pypi')
    20 >>> s
    21 {'s', 'o', 'h', 'e', 'c'}
    22 >>> 
    change_set

    (4)如何删除集合中的成员和集合
            删除集合成员remove()内建方法。删除集合本身,可以像删除任何Python对象一样,令集合超出它的作用范围或调用del将它们直接清除出当前的名字空间。如果它的引用计数为零,也会被标记以便被垃圾回收。如del s。

     1 >>> s.remove('c')
     2 >>> s
     3 {'s', 'o', 'h', 'e'}
     4 >>> del s
     5 >>> s
     6 Traceback (most recent call last):
     7   File "<pyshell#41>", line 1, in <module>
     8     s
     9 NameError: name 's' is not defined
    10 >>> 
    delete element or set

       集合操作符和关系符号: 

    2015819105825249.png (445×366)

    Python中的集合类型操作符的解析

    (1)标准类型操作符(所有的集合类型)
    成员关系 (in, not in)
            就序列而言,Python中的in和not in操作符决定某个元素是否是一个集合中的成员。
    集合等价/不等价
            等价/不等价被用于在相同或不同的集合之间做比较。两个集合相等是指,对每个集合而言,当且仅当其中一个集合中的每个成员同时也是另一个集合中的成员。也可以说每个集合必须是另一个集合的一个子集, 即s <= t 和s>= t 的值均为真(True),或(s <= t and s>= t) 的值为真(True)。集合等价/不等价与集合的类型或集合成员的顺序无关,只与集合的元素有关。
    子集/超集
            set用Python的比较操作符检查某集合是否是其他集合的超集或子集。“小于”符号(<、<=)用来判断子集,“大于”符号(>、 >= )用来判断超集。“小于” 和 “大于”意味着两个集合在比较时不能相等。等于号允许非严格定义的子集和超集。
            set支持严格( < )子集和非严格 ( <= ) 子集,也支持严格( > )超集和非严格 ( >= )超集。只有当第一个集合是第二个集合的严格子集时,我们才称第一个集合“小于”第二个集合。同理,只有当第一个集合是第二个集合的严格超集时,我们才称第一个集合“大于”第二个集合。

        对象值的比较

    任何相同类型的对象都可以比较,格式为:a == b,在python2.3之前类型不具有布尔值,返回值为1 0;2.3版本之后返回只为 True False

        对象身份的比较

    obj1 is obj2               return True False

    obj1 is not obj2         return True False

    布尔类型--python中的与、或、非

    布尔类型的优先级依次为:not

                 and

                or

                  --实现功能为逻辑 非 与 或

     标准类型的内建函数

    cmp(obj1, obj2)       1 > 2 return i>0
    
                    1 < 2 return i<0
    
                   1 == 2 return i=0
    

    repr(obj)/repr('obj')--返回一个对象的字符串表示

    str(obj)--返回对象可读性好的字符串表示

    type(obj)--返回对象的类型

     1 >>> s = set('cheeseshop')
     2 >>> t = set('cheeseshop')
     3 >>> s is t
     4 False
     5 >>> s is not t
     6 True
     7 >>> repr(s)
     8 "{'s', 'o', 'h', 'e', 'c', 'p'}"
     9 >>> str(s)
    10 "{'s', 'o', 'h', 'e', 'c', 'p'}"
    11 >>> type(s)
    12 <class 'set'>
    13 >>> s == t
    14 True
    View Code

    (2)集合类型操作符(所有的集合类型)
    联合( | )
            联合(union)操作和集合的 OR(又称可兼析取(inclusive disjunction))其实是等价的,两个集合的联合是一个新集合,该集合中的每个元素都至少是其中一个集合的成员,即属于两个集合其中之一的成员。联合符号有一个等价的方法:union()。
    交集( & )
           可以把交集操作比做集合的AND(或合取)操作。两个集合的交集是一个新集合,该集合中的每个元素同时是两个集合中的成员,即属于两个集合的成员。交集符号有一个等价的方法:intersection()。
    差补/相对补集( – )
            两个集合(s 和 t)的差补或相对补集是指一个集合 C,该集合中的元素,只属于集合 s,而不属于集合 t。差符号有一个等价的方法:difference()。
    对称差分( ^ )
           和其他的布尔集合操作相似,对称差分是集合的XOR(又称“异或” (exclusive disjunction))。两个集合(s 和 t)的对称差分是指另外一个集合C,该集合中的元素,只能是属于集合 s 或者集合t的成员,不能同时属于两个集合。对称差分有一个等价的方法:symmetric_difference()。
    混合集合类型操作
            如果左右两个操作数的类型相同,既都是可变集合或不可变集合,则所产生的结果类型是相同的。但如果左右两个操作数的类型不相同(左操作数是 set,右操作数是 frozenset,或相反情况),则所产生的结果类型与左操作数的类型相同 。

           注意:加号不是集合类型的运算符。

        集合操作符示意图

     1 >>> t = frozenset('bookshop')
     2 >>> t
     3 frozenset({'b', 's', 'k', 'o', 'h', 'p'})
     4 >>> s = set('cheeseshop')
     5 >>> s
     6 {'s', 'o', 'h', 'e', 'c', 'p'}
     7 >>> t | s
     8 frozenset({'b', 's', 'k', 'o', 'h', 'e', 'p', 'c'})
     9 >>> t ^ s
    10 frozenset({'b', 'c', 'e', 'k'})
    11 >>> s | t
    12 {'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'}
    13 >>> s ^ t
    14 {'b', 'k', 'c', 'e'}
    15 >>> 
    View Code

    (3)集合类型操作符(仅适用于可变集合)
    (Union) Update ( |= )
           这个更新方法从已存在的集合中添加(可能多个)成员,此方法和update()等价。

     1 >>> s = set('cheeseshop')
     2 >>> id(s)
     3 57600488
     4 >>> s |= set('pypi')
     5 >>> s
     6 {'s', 'o', 'h', 'e', 'c', 'p', 'i', 'y'}
     7 >>> id(s)
     8 57600488
     9 >>> 
    10 >>> s.update('hello')
    11 >>> s
    12 {'s', 'o', 'h', 'e', 'l', 'c', 'p', 'i', 'y'}
    13 >>> id(s)
    14 57600488
    15 >>> 
    |= and update

    保留/交集更新( &= )
           保留(或交集更新)操作保留与其他集合的共有成员,此方法和 intersection_update()等价。
    差更新 ( –= )
           对集合s和t进行差更新操作s-=t,差更新操作会返回一个集合,该集合中的成员是集合s去除掉集合t中元素后剩余的元素。此方法和difference_update()等价。
    对称差分更新( ^= )
            对集合s和t进行对称差分更新操作(s^=t),对称差分更新操作会返回一个集合,该集合中的成员仅是原集合s或仅是另一集合t中的成员。此方法和symmetric_difference_update()等价。

     1 >>> s = set('cheeseshop')
     2 >>> t = set('bookshop')
     3 >>> s
     4 {'s', 'o', 'h', 'e', 'c', 'p'}
     5 >>> t
     6 {'b', 's', 'k', 'o', 'h', 'p'}
     7 >>> id(s)
     8 48141032
     9 >>> id(t)
    10 57892936
    11 >>> s | t
    12 {'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'}
    13 >>> id(s | t)              # 分配了新的内存
    14 57893384
    15 >>> s
    16 {'s', 'o', 'h', 'e', 'c', 'p'}
    17 >>> t
    18 {'b', 's', 'k', 'o', 'h', 'p'}
    19 >>> 
    20 >>> s |= t
    21 >>> s
    22 {'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'}
    23 >>> t
    24 {'b', 's', 'k', 'o', 'h', 'p'}
    25 >>> id(s)
    26 48141032
    27 >>> id(t)
    28 57892936
    29 >>> 
    30 
    31 
    32 >>> s = frozenset('cheeseshop')
    33 >>> t = frozenset('bookshop')
    34 >>> s
    35 frozenset({'s', 'o', 'h', 'e', 'c', 'p'})
    36 >>> t
    37 frozenset({'b', 's', 'k', 'o', 'h', 'p'})
    38 >>> id(s)
    39 48141032
    40 >>> id(t)
    41 57600488
    42 >>> s | t               # 操作值存储于新分配的内存中
    43 frozenset({'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'})
    44 >>> id(s)
    45 48141032
    46 >>> id(t)
    47 57600488
    48 >>> s
    49 frozenset({'s', 'o', 'h', 'e', 'c', 'p'})
    50 >>> t
    51 frozenset({'b', 's', 'k', 'o', 'h', 'p'})
    52 >>> 
    53 >>> s |= t
    54 >>> s                 # 操作值由s索引
    55 frozenset({'b', 's', 'k', 'o', 'h', 'e', 'c', 'p'})
    56 >>> t
    57 frozenset({'b', 's', 'k', 'o', 'h', 'p'})
    58 >>> id(s)             # s 指向了新的内存地址
    59 57892936
    60 >>> id(t)
    61 57600488
    62 >>> 
    View Code

    而上述(|,&,-,^)等操作则会给执行结果分配新的内存空间存储(s,t值不变),故适用于所有集合。

    由以上代码可知:(|=,&=,-=,^=)各操作时s的值即为操作的结果(即s值改变),对于不可变集合,s指向新的内存地址;对于可变集合,s指向的地址不变。

    (以上均基于Python3.x的测试)。

  • 相关阅读:
    获取股票行情API 接口
    使用百度地图来展示自定义的GPS点,用pyechart 框架实例
    C 语言基础笔记
    GPS 测试汇总和python GPS 导航地图实现
    用python 来炒股二 BeautifulSoup爬虫信息新闻文章
    Python tkinter 笔记 [pack,place,grid 布局管理]
    RSS 订阅精选 2020
    用python来炒股<三> 炒股交易系统(法则)
    使用python 来实现炒股
    鼠须管输入法的配置介绍
  • 原文地址:https://www.cnblogs.com/ant-colonies/p/6618063.html
Copyright © 2020-2023  润新知