Defaultdict 默认字典
- collections 模块中的 defaultdict(默认字典),可以用来构造“一个键映射多个值”这样的字典
- 如果你想保持元素的插入顺序就应该使用list, 如果想去掉重复元素就使用set
import collections import defaultdict
d=defaultdict(list) / e=defaultdict(set)
d = {
'a' : [1, 2, 3],
'b' : [4, 5]
}
e = {
'a' : {1, 2, 3},
'b' : {4, 5}
}
- 要注意,defaultdict会自动为将要访问的键(就算目前字典中并不存在这样的键)创建映射实体
from collections import defaultdict
d=defaultdict(list)
d[1].append('a')
d[1].append('b')
d[2].append('a')
print(d[0])
[] //即使我们没有为d[0]赋值,但依旧为这个位置占了个坑
print(d)
defaultdict(<class 'list'>, {0: [], 1: ['a', 'b'], 2: ['a']})
q=defaultdict(set)
q[0].add('a0')
q[0].add('b0')
q[0].add('c0')
q[1].add('d1')
print(q)
defaultdict(<class 'set'>, {0: {'b0', 'c0', 'a0'}, 1: {'d1'}})
- 如果我们想根据某一个字段将数据分组到一个大的数据结构中,并且允许随机访问,可以考虑使用defaultdict( )来构建一个多值字典
rows = [
{'address': '5412 N CLARK', 'date': '07/01/2012'},
{'address': '5148 N CLARK', 'date': '07/04/2012'},
{'address': '5800 E 58TH', 'date': '07/02/2012'},
{'address': '2122 N CLARK', 'date': '07/03/2012'},
{'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'},
{'address': '1060 W ADDISON', 'date': '07/02/2012'},
{'address': '4801 N BROADWAY', 'date': '07/01/2012'},
{'address': '1039 W GRANVILLE', 'date': '07/04/2012'},
]
from collections import defaultdict
rows_by_date=defaultdict(list)
for row in rows:
rows_by_date[row['date']].append(row)
print(rows_by_date)
defaultdict(<class 'list'>,
{'07/04/2012': [{'date': '07/04/2012', 'address': '5148 N CLARK'}, {'date': '07/04/2012', 'address': '1039 W GRANVILLE'}],
'07/02/2012': [{'date': '07/02/2012', 'address': '5800 E 58TH'}, {'date': '07/02/2012', 'address': '5645 N RAVENSWOOD'}, {'date': '07/02/2012', 'address': '1060 W ADDISON'}],
'07/03/2012': [{'date': '07/03/2012', 'address': '2122 N CLARK'}],
'07/01/2012': [{'date': '07/01/2012', 'address': '5412 N CLARK'}, {'date': '07/01/2012', 'address': '4801 N BROADWAY'}]})
setdefault
p={}
p.setdefault('1',[]).append('a')
p.setdefault('1',[]).append('b')
p.setdefault('2',[]).append('c')
print(p[0])
KeyError: 0 #和上面相反,这个并不会占坑
print(p) {'2': ['c'], '1': ['a', 'b']}
创建一个多值映射字典
d = {}
for key, value in pairs:
if key not in d:
d[key] = []
d[key].append(value)
d = defaultdict(list)
for key, value in pairs:
d[key].append(value)