set(集合)是一个非常有用的数据结构。它与列表(list)的行为类似,区别在于set不能包含重复的值。
这在很多情况下非常有用。例如你可能想检查列表中是否包含重复的元素,你有两个选择,第一个需要使用for循环,就像这样:
#使用for循环,检查重复的元素 some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n','b'] dup = [] for value in some_list: if some_list.count(value)>2: if value not in dup: dup.append(value) print dup,
输出结果:
C:Python27python.exe E:/python/testspider/fibon.py ['b']
但还有一种更简单更优雅的解决方案,那就是使用集合(sets),你直接这样做:
#使用set函数查找重复元素 some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n','b'] dup = set([x for x in some_list if some_list.count(x)>2]) print(dup)
输出:
C:Python27python.exe E:/python/testspider/fibon.py set(['b'])
set函数还可以查找元素中的交集
#set查找交集 valid = set(['yellow','red','blue','green','black']) input_set = set(['red','brown']) print(input_set.intersection(valid))
输出
C:Python27python.exe E:/python/testspider/fibon.py set(['red'])
set函数查找两个元素差集
#set查找差集 valid = set(['yellow','red','blue','green','black']) input_set = set(['red','brown']) print(input_set.difference(valid))
输出:
C:Python27python.exe E:/python/testspider/fibon.py set(['brown'])