集合性质:
可变的,无序的,不重复的元素集合
集合定义
s = set() s = set(range(10)) #set(iterable)
集合元素
set的元素要求必须可以hash 目前学过的不可hash的类型有list、set 元素不可以索引 set可以迭代
集合的method
add(elem) 增加一个元素到set中 如果元素存在,什么都不做 update(*others) #Update a set with the union of itself and others 合并其他元素到set集合中来 参数others必须是可迭代对象 就地修改 remove(elem) #Remove an element from a set; it must be a member 从set中移除一个元素 元素不存在,抛出KeyError异常。为什么是KeyError? discard(elem) 从set中移除一个元素 元素不存在,什么都不做 pop() -> item 移除并返回任意的元素。为什么是任意元素? 空集返回KeyError异常 clear() 移除所有元素
线性结构
线性结构的查询时间复杂度是O(n),即随着数据规模的增大而增加耗时 set、dict等结构,内部使用hash值作为key,时间复杂度可以做到O(1),查询时间和数据规模无关
可hash:不可变
数值型int、float、complex 布尔型True、False 字符串string、bytes tuple None 以上都是不可变类型,成为可哈希类型,hashable
集合基本概念
全集 所有元素的集合。例如实数集,所有实数组成的集合就是全集 子集subset和超集superset 一个集合A所有元素都在另一个集合B内,A是B的子集,B是A的超集 真子集和真超集 p A是B的子集,且A不等于B,A就是B的真子集,B是A的真超集 并集:多个集合合并的结果 交集:多个集合的公共部分 差集:集合中除去和其他集合公共部分
并集
将两个集合A和B的所有的元素合并到一起,组成的集合称作集合A与集合B的并集 union(*others) 返回和多个集合合并后的新的集合 |:运算符重载 等同union update(*others) 和多个集合合并,就地修改 |= 等同update
交集
集合A和B,由所有属于A且属于B的元素组成的集合 intersection(*others) 返回和多个集合的交集 & 等同于intersection intersection_update(*others) 获取和多个集合的交集,并就地修改 &= 等同于intersection_update
差集
集合A和B,由所有属于A且不属于B的元素组成的集合 difference(others) 返回和多个集合的差集 - 等同于difference difference_update(others*) 获取和多个集合的差集并就地修改 -= 等同difference_update
对称差集
集合A和B,由所有不属于A和B的交集元素组成的集合,记作(A-B)∪(B-A) symmetric_differece(other) 返回和另一个集合的差集 ^ 等同于symmetric_differece symmetric_differece_update(other) 获取和另一个集合的差集并就地修改 ^= 等同symmetric_differece_update
集合运算
issubset(other)、<= p 判断当前集合是否是另一个集合的子集 set1 < set2 判断set1是否是set2的真子集 issuperset(other)、>= 判断当前集合是否是other的超集 set1 > set2 判断set1是否是set的真超集 isdisjoint(other) 当前集合和另一个集合没有交集 没有交集,返回True