集合
在已经学过的数据类型中:
- 能够索引的,如list/str,其中的元素可以重复
- 可变的,如list/dict,即其中的元素/键值对可以原地修改
- 不可变的,如str/int,即不能进行原地修改
- 无索引序列的,如dict,即其中的元素(键值对)没有排列顺序
现在要介绍另外一种类型的数据,英文是set,翻译过来叫做“集合”。
它的特点是:有的可变,有的不可变;元素无次序,不可重复。
创建set
tuple算是list和str的杂合,那么set则可以堪称是list和dict的杂合.
set拥有类似dict的特点:可以用{}花括号来定义;其中的元素没有序列,也就是是非序列类型的数据;而且,set中的元素不可重复,这就类似dict的键.
set也有一点list的特点:有一种集合可以原处修改.
>>> set_study = set('pingqiang')
>>> set_study
set(['a', 'g', 'i', 'n', 'q', 'p'])
把str中的字符拆解开,形成set.特别注意观察:'pingqiang'中有两个i,但是在set_study中,只有一个i,也就是集合中元素不能重复。
在创建集合的时候,如果发现了重复的元素,就会过滤一下,剩下不重复的。而且集合中的元素没有序列。
除了用set()来创建集合。还可以使用{}的方式,但是这种方式不提倡使用,因为在某些情况下,python搞不清楚是字典还是集合。
>>> s3 = {"facebook",123} #通过{}直接创建
>>> s3
set([123, 'facebook'])
set的方法
- add, update
- pop, remove, discard, clear
不变的集合
以set()来建立集合,这种方式所创立的集合都是可原处修改的集合,或者说是可变的,也可以说是unhashable。
还有一种集合,不能在原处修改。这种集合的创建方法是用frozenset(),顾名思义,这是一个被冻结的集合,当然是不能修改了,那么这种集合就是hashable类型——可哈希。
集合运算
- 元素与集合的关系
- 只存在两种关系,属于或者不属于
>>> aset set(['h', 'o', 'n', 'p', 't', 'y']) >>> "a" in aset False >>> "h" in aset True
- 集合与集合的关系
- A是否等于B,即两个集合的元素完全一样
- A是否是B的子集,或者反过来,B是否是A的超集。即A的元素也都是B的元素,但是B的元素比A的元素数量多。
- A、B的并集,即A、B所有元素
- A、B的交集,即A、B所公有的元素
- A相对B的差(补),即A相对B不同的部分元素
- A、B的对称差集