• Python集合详解


    集合介绍:

    集合(set)是一个无序的不重复元素序列。
    可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
    创建格式:
    parame = {value01,value02,...}
    或者
    set(value)

    在{}内用逗号分隔开多个元素,多个元素满足以下三个条件
    # 1. 集合内元素必须为不可变类型
    # 2. 集合内元素无序
    # 3. 集合内元素没有重复

    //集合的用途:

    去重和关系运算

    关系运算

    实例(Python 3.0+)
    >>>basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
    >>> print(basket)                      # 这里演示的是去重功能
    {'orange', 'banana', 'pear', 'apple'}
    >>> 'orange' in basket                 # 快速判断元素是否在集合内
    True
    >>> 'crabgrass' in basket
    False
    
    >>> # 下面展示两个集合间的运算.
    ...
    >>> a = set('abracadabra')
    >>> b = set('alacazam')
    >>> a                                  
    {'a', 'r', 'b', 'c', 'd'}
    >>> a - b                              # 求差集(只有a中拥有的而b集合没有的元素)
    {'r', 'd', 'b'}
    >>> a | b                              # 并集(集合a或b中包含的所有元素)
    {'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
    >>> a & b                             # a和b的交集(集合a和b中都包含了的元素)
    {'a', 'c'}
    >>> a ^ b            # 元素在a或b中,但不会同时出现在a和b的集合之中(对称差集)
    {'r', 'd', 'b', 'm', 'z', 'l'}

    去重:

    集合去重复有局限性 

    1. 只能针对不可变类型  2. 集合本身是无序的,去重之后无法保留原来的顺序

    示例如下
    >>> l=['a','b',1,'a','a']
    >>> s=set(l)
    >>> s # 将列表转成了集合 {'b', 'a', 1}
    >>> l_new=list(s) # 再将集合转回列表
    >>> l_new ['b', 'a', 1] # 去除了重复,但是打乱了顺序
    # 针对不可变类型,并且保证顺序则需要我们自己写代码实现,例如
    l=[
      {'name':'lili','age':18,'sex':'male'},
      {'name':'jack','age':73,'sex':'male'},
      {'name':'tom','age':20,'sex':'female'},
      {'name':'lili','age':18,'sex':'male'},
      {'name':'lili','age':18,'sex':'male'},
    ]
    
    new_l=[]
    
    for dic in l:
      if dic not in new_l:
        new_l.append(dic)
    print(new_l)
    # 结果:既去除了重复,又保证了顺序,而且是针对不可变类型的去重
    [
      {'age': 18, 'sex': 'male', 'name': 'lili'},
      {'age': 73, 'sex': 'male', 'name': 'jack'},
      {'age': 20, 'sex': 'female', 'name': 'tom'}
    ]

    类似列表推导式,同样集合支持集合推导式(Set comprehension):

    实例(Python 3.0+)
    //代码
    a = {x for x in 'abracadabra' if x not in 'abc'}      
    print(a)
    //执行结果
    {'r', 'd'}
    //解释
    a = {x for x in 'abracadabra' if x not in 'abc'}
    从'abracadabra'中用for循环,取出,如果x不在其中则x存到a集合中

    将列表转换为集合(但凡能被for循环的遍历的数据类型(强调:遍历出的每一个值都必须为不可变类型)都可以传给set()转换成集合类型)

    list1=['1','2','3','3']
    b=set(list1)
    print(b,type(b))
    //执行结果
    {'2', '3', '1'} <class 'set'>

    集合的基本操作

    1:添加元素

    语法格式如下:
    s.add( x ) #添加一项
    将元素 x 添加到集合 s 中,如果元素已存在,则不进行任何操作。

    实例(Python 3.0+)
    >>>thisset = set(("Google", "Runoob", "Taobao"))
    >>> thisset.add("Facebook")
    >>> print(thisset)
    {'Taobao', 'Facebook', 'Google', 'Runoob'}

    还有一个方法,也可以添加元素,且参数可以是列表,元组,字典等,语法格式如下:

    s.update( x ) #添加多项

    x 可以有多个,用逗号分开。

    实例(Python 3.0+)
    >>>thisset = set(("Google", "Runoob", "Taobao"))
    >>> thisset.update({1,3})
    >>> print(thisset)
    {1, 3, 'Google', 'Taobao', 'Runoob'}
    >>> thisset.update([1,4],[5,6])  
    >>> print(thisset)
    {1, 3, 4, 5, 6, 'Google', 'Taobao', 'Runoob'}
    >>>

    2:移除元素

    //语法格式如下:

    s.remove( x )
    将元素 x 从集合 s 中移除,如果元素不存在,则会发生错误。
    //实例(Python 3.0+)
    >>>thisset = set(("Google", "Runoob", "Taobao"))
    >>> thisset.remove("Taobao")
    >>> print(thisset)
    {'Google', 'Runoob'}
    >>> thisset.remove("Facebook") # 不存在会发生错误
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    KeyError: 'Facebook'
    >>>
    此外还有一个方法也是移除集合中的元素,且如果元素不存在,不会发生错误。格式如下所示:
    s.discard( x )
    实例(Python 3.0+)
    >>>thisset = set(("Google", "Runoob", "Taobao"))
    >>> thisset.discard("Facebook") # 不存在不会发生错误
    >>> print(thisset)
    {'Taobao', 'Google', 'Runoob'}
    我们也可以设置随机删除集合中的一个元素,语法格式如下:

    s.pop()
    脚本模式实例(Python 3.0+)
    thisset = set(("Google", "Runoob", "Taobao", "Facebook"))
    x = thisset.pop()
    print(x)
    输出结果:
    Runoob
    多次执行测试结果都不一样。
    然而在交互模式,pop 是删除集合的第一个元素(排序后的集合的第一个元素)。
    实例(Python 3.0+)
    >>>thisset = set(("Google", "Runoob", "Taobao", "Facebook"))
    >>> thisset.pop()
    'Facebook'
    >>> print(thisset)
    {'Google', 'Taobao', 'Runoob'}
    >>>

    3:计算集合元素个数

    语法格式如下:
    len(s)
    计算集合 s 元素个数。
    实例(Python 3.0+)
    >>>thisset = set(("Google", "Runoob", "Taobao"))
    >>> len(thisset)
    3

    4:清空集合

    语法格式如下:
    s.clear()
    清空集合 s。
    实例(Python 3.0+)
    >>>thisset = set(("Google", "Runoob", "Taobao"))
    >>> thisset.clear()
    >>> print(thisset)
    set()

    5:判断元素是否在集合中存在

    语法格式如下:
    x in s
    判断元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。
    实例(Python 3.0+)
    >>>thisset = set(("Google", "Runoob", "Taobao"))
    >>> "Runoob" in thisset
    True
    >>> "Facebook" in thisset
    False
    >>>

    集合内置方法完整列表

    add() 为集合添加元素

    //描述
    add() 方法用于给集合添加元素,如果添加的元素在集合中已存在,则不执行任何操作。
    //语法
    add()方法语法:
    set.add(elmnt)
    //参数
    elmnt -- 必需,要添加的元素。
    //返回值
    无。

    //实例
    以下实例展示了 add() 方法的使用:

    //实例 1
    fruits = {"apple", "banana", "cherry"}
    fruits.add("orange") 
    print(fruits)
    输出结果为:
    {'apple', 'banana', 'orange', 'cherry'}
    已存在的元素,则不执行添加操作:
    //实例 2
    fruits = {"apple", "banana", "cherry"}
    fruits.add("apple")
    print(fruits)
    输出结果为:
    {'apple', 'banana', 'cherry'}

    clear() 移除集合中的所有元素

    //描述
    clear() 方法用于移除集合中的所有元素。
    //语法
    clear()方法语法:
    set.clear()
    //参数
    无。
    //返回值
    无。

    //实例
    移除 fruits 集合中的所有元素:

    //实例 1
    fruits = {"apple", "banana", "cherry"}
    fruits.clear()
    print(fruits)
    输出结果为:
    set()

    copy() 拷贝一个集合

    //描述
    copy() 方法用于拷贝一个集合。
    //语法
    copy() 方法语法:
    set.copy()
    //参数
    无。
    //返回值
    无。
    //实例
    拷贝 fruits 集合:

    //实例 1
    fruits = {"apple", "banana", "cherry"}
    x = fruits.copy()
    print(x)
    输出结果为:
    {'cherry', 'banana', 'apple'}

    difference() 返回集合间的差集

    //描述
    difference() 方法用于返回集合的差集,即返回的集合元素包含在第一个集合中,但不包含在第二个集合(方法的参数)中。
    //语法
    difference() 方法语法:
    set.difference(set)
    //参数
    set -- 必需,用于计算差集的集合
    //返回值
    返回一个新的集合。

    //实例
    返回一个集合,元素包含在集合 x ,但不在集合 y :

    //实例 1
    x = {"apple", "banana", "cherry"}
    y = {"google", "microsoft", "apple"} 
    z = x.difference(y) 
    print(z)
    输出结果为:
    {'cherry', 'banana'}

    difference_update() 移除集合中的元素,该元素在指定的集合也存在。

    //描述
    difference_update() 方法用于移除两个集合中都存在的元素。
    difference_update() 方法与 difference() 方法的区别在于 difference() 方法返回一个移除相同元素的新集合,而 difference_update() 方法是直接在原来的集合中移除元素,没有返回值。

    //语法
    difference_update() 方法语法:
    set.difference_update(set)
    //参数
    set -- 必需,用于计算差集的集合
    //返回值
    无。

    //实例
    移除两个集合都包含的元素:

    实例 1
    x = {"apple", "banana", "cherry"}
    y = {"google", "microsoft", "apple"}
    x.difference_update(y) 
    print(x)
    输出结果为:
    {'cherry', 'banana'}

    discard() 删除集合中指定的元素

    //描述
    discard() 方法用于移除指定的集合元素。

    该方法不同于 remove() 方法,因为 remove() 方法在移除一个不存在的元素时会发生错误,而 discard() 方法不会。
    //语法
    discard() 方法语法:
    set.discard(value)
    //参数
    value -- 必需,要移除的元素
    //返回值(如果要移除的元素不存在,则返回None)
    None。

    //实例
    移除集合中的元素 banana:

    实例 1
    fruits = {"apple", "banana", "cherry"}
    print(fruits.discard("name"))
    输出结果为:
    None

    intersection() 返回集合的交集

    //描述
    intersection() 方法用于返回两个或更多集合中都包含的元素,即交集。
    //语法
    intersection() 方法语法:
    set.intersection(set1, set2 ... etc)
    //参数
    set1 -- 必需,要查找相同元素的集合
    set2 -- 可选,其他要查找相同元素的集合,可以多个,多个使用逗号 , 隔开
    //返回值
    返回一个新的集合。

    //实例
    返回一个新集合,该集合的元素既包含在集合 x 又包含在集合 y 中:

    实例 1
    x = {"apple", "banana", "cherry"}
    y = {"google", "runoob", "apple"}
    z = x.intersection(y) 
    print(z)
    输出结果为:
    {'apple'}

    计算多个集合:

    //实例 2
    x = {"a", "b", "c"}
    y = {"c", "d", "e"}
    z = {"f", "g", "c"}
    result = x.intersection(y, z)
    print(result)
    输出结果为:
    {'c'}

    intersection_update() 删除集合中的元素,该元素在指定的集合中不存在。

    //描述
    intersection_update() 方法用于移除两个或更多集合中都不重叠的元素,即计算交集。
    intersection_update() 方法不用于 intersection() 方法,因为 intersection() 方法是返回一个新的集合,而 intersection_update() 方法是在原始的集合上移除不重叠的元素(两个集合间除去不是交集的部分,也就是只留下交集的元素)。
    //语法
    intersection_update() 方法语法:
    set.intersection_update(set1, set2 ... etc)
    //参数
    set1 -- 必需,要查找相同元素的集合
    set2 -- 可选,其他要查找相同元素的集合,可以多个,多个使用逗号 , 隔开
    //返回值
    无。

    //实例
    返回一个新集合,该集合的元素既包含在集合 x 又包含在集合 y 中:

    //实例 1
    x = {"apple", "banana", "cherry"}
    y = {"google", "runoob", "apple"}
    x.intersection_update(y) 
    print(x)
    输出结果为:
    {'apple'}

    计算多个集合的交集:

    //实例 2
    x = {"a", "b", "c"}
    y = {"c", "d", "e"}
    z = {"f", "g", "c"}
    x.intersection_update(y, z)
    print(x)
    输出结果为:
    {'c'}

    isdisjoint() 判断两个集合是否包含相同的元素(是否有交集),如果没有返回 True,否则返回 False。

    //描述
    isdisjoint() 方法用于判断两个集合是否包含相同的元素,如果没有返回 True,否则返回 False。。
    //语法
    isdisjoint() 方法语法:
    set.isdisjoint(set)
    //参数
    set -- 必需,要比较的集合
    //返回值
    返回布尔值,如果不包含返回 True,否则返回 False。
    //实例
    判断集合 y 中是否有包含 集合 x 的元素:

    //实例 1
    x = {"apple", "banana", "cherry"}
    y = {"google", "runoob", "facebook"}
    z = x.isdisjoint(y) 
    print(z)
    输出结果为:
    True

    如果包含返回 False:

    //实例 2
    x = {"apple", "banana", "cherry"}
    y = {"google", "runoob", "apple"}
    z = x.isdisjoint(y) 
    print(z)
    输出结果为:
    False

    issubset() 判断指定集合是否为该方法参数集合的子集。

    //描述
    issubset() 方法用于判断集合的所有元素是否都包含在指定集合中,如果是则返回 True,否则返回 False。
    //语法
    issubset() 方法语法:
    set.issubset(set)
    //参数
    set -- 必需,要比查找的集合
    //返回值
    返回布尔值,如果都包含返回 True,否则返回 False。
    //实例
    判断集合 x 的所有元素是否都包含在集合 y 中:

    //实例 1
    x = {"a", "b", "c"}
    y = {"f", "e", "d", "c", "b", "a"} 
    z = x.issubset(y) 
    print(z)
    输出结果为:
    True

    如果没有全部包含返回 False:

    //实例 2
    x = {"a", "b", "c"}
    y = {"f", "e", "d", "c", "b"}
    z = x.issubset(y) 
    print(z)
    输出结果为:
    False

    issuperset() 判断该方法的参数集合是否为指定集合的子集(也就是指定集合是否是方法参数集合的父集)

    //描述
    issuperset() 方法用于判断指定集合的所有元素是否都包含在原始的集合中,如果是则返回 True,否则返回 False。
    //语法
    issuperset() 方法语法:
    set.issuperset(set)
    //参数
    set -- 必需,要比查找的集合
    //返回值
    返回布尔值,如果都包含返回 True,否则返回 False。
    //实例
    判断集合 y 的所有元素是否都包含在集合 x 中(x是否是y的父集)

    //实例 1
    x = {"f", "e", "d", "c", "b", "a"}
    y = {"a", "b", "c"}
    z = x.issuperset(y) 
    print(z)
    输出结果为:
    True

    如果没有全部包含返回 False:

    //实例 2
    x = {"f", "e", "d", "c", "b"}
    y = {"a", "b", "c"}
    z = x.issuperset(y) 
    print(z)
    输出结果为:
    False

    pop() 随机移除元素

    //描述
    pop() 方法用于随机移除一个元素。
    //语法
    pop() 方法语法:
    set.pop()
    //参数

    //返回值
    返回移除的元素。
    //实例
    随机移除一个元素:

    //实例 1
    fruits = {"apple", "banana", "cherry"}
    fruits.pop() 
    print(fruits)
    输出结果为:
    {'apple', 'banana'}

    输出返回值:

    //实例 2
    fruits = {"apple", "banana", "cherry"}
    x = fruits.pop() 
    print(x)
    输出结果为:
    banana

    remove() 移除指定元素

    //描述
    remove() 方法用于移除集合中的指定元素。
    该方法不同于 discard() 方法,因为 remove() 方法在移除一个不存在的元素时会发生错误,而 discard() 方法不会。

    //语法
    remove() 方法语法:
    set.remove(item)
    //参数
    item -- 要移除的元素
    //返回值
    返回移除的元素。
    //实例
    移除元素 banana:

    //实例 1
    fruits = {"apple", "banana", "cherry"}
    fruits.remove("banana") 
    print(fruits)
    输出结果为:
    {'cherry', 'apple'}

    symmetric_difference() 返回两个集合中不重复的元素集合。(对称差集)

    //描述
    symmetric_difference() 方法返回两个集合中不重复的元素集合,即会移除两个集合中都存在的元素。(除去交集的部分)
    //语法
    symmetric_difference() 方法语法:
    set.symmetric_difference(set)
    //参数
    set -- 集合
    //返回值
    返回一个新的集合。
    //实例
    返回两个集合组成的新集合,但会移除两个集合的重复元素:

    //实例 1
    x = {"apple", "banana", "cherry"}
    y = {"google", "runoob", "apple"}
    z = x.symmetric_difference(y) 
    print(z)
    输出结果为:
    {'google', 'cherry', 'banana', 'runoob'}

    symmetric_difference_update()移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。

    //描述

    symmetric_difference_update() 方法移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。

    //语法

    symmetric_difference_update() 方法语法:

    set.symmetric_difference_update(set)

    //参数

    set -- 要检测的集合

    //返回值

    无。

    //实例

    在原始集合 x 中移除与 y 集合中的重复元素,并将不重复的元素插入到集合 x 中:

    //实例 1
    x = {"apple", "banana", "cherry"}
    y = {"google", "runoob", "apple"} 
    x.symmetric_difference_update(y)  
    print(x)
    输出结果为:
    {'google', 'cherry', 'banana', 'runoob'}

    union()返回两个集合的并集

    //描述

    union() 方法返回两个集合的并集,即包含了所有集合的元素,重复的元素只会出现一次。

    //语法

    union() 方法语法:

    set.union(set1, set2...)

    //参数

    set1 -- 必需,合并的目标集合

    set2 -- 可选,其他要合并的集合,可以多个,多个使用逗号 , 隔开。

    //返回值

    返回一个新集合。

    //实例

    合并两个集合,重复元素只会出现一次:

    //实例 1
    x = {"apple", "banana", "cherry"}
    y = {"google", "runoob", "apple"} 
    z = x.union(y)  
    print(z)
    输出结果为:
    {'cherry', 'runoob', 'google', 'banana', 'apple'}

    合并多个集合:

    //实例 2
    x = {"a", "b", "c"}
    y = {"f", "d", "a"}
    z = {"c", "d", "e"}
    result = x.union(y, z) 
    print(result)
    输出结果为:
    {'c', 'd', 'f', 'e', 'b', 'a'}

    update()给集合添加元素

    //描述

    update() 方法用于修改当前集合,可以添加新的集合到当前集合中(括号中是集合)

    //语法

    update() 方法语法:

    set.update(set)

    //参数

    set -- 必需,可以是元素或集合

    //返回值

    无。

    //实例

    合并两个集合,重复元素只会出现一次:

    //实例 1
    
    x = {"apple", "banana", "cherry"}
    y = {"google", "runoob", "apple"}
    x.update(y) 
    print(x)
    输出结果为:
    {'banana', 'apple', 'google', 'runoob', 'cherry'}
  • 相关阅读:
    word查找与替换
    细说ASP.NET Windows身份认证
    防钓鱼代码
    sql触发器
    url地址栏参数
    sql递归查询
    认识TWICImage类
    尝试发个贴
    泛型单元
    [学习官方例子]TArray
  • 原文地址:https://www.cnblogs.com/baicai37/p/12365614.html
Copyright © 2020-2023  润新知