python基础之dict、set及字符串处理
本节内容
- 字典介绍及内置方法
- 集合介绍
- 字符串处理
1.字典介绍及内置方法
字典是python中唯一的映射类型,采用键值对(key-value)的形式存储数据。python对key进行哈希函数运算,根据计算的结果决定value的存储地址,所以字典是无序存储的,且key必须是可哈希的。可哈希表示key必须是不可变类型,如:数字、字符串、元组。
字典(dictionary)是除列表以外python之中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。
字典创建方法
第一种创建方法
1 dic1={"name":"xxx","age":22}
第二种创建方法,使用dict()类(工厂函数)创建,dict里面传递的参数可以是字典,列表或者其他可迭代的对象
1 dic1=dict((("name","xxx"),)) 2 dic1=dict([["name","xxx"]]) 3 a=[1,2,3] 4 b=["a","b","c"] 5 dic1=dict(zip(a,b))
字典的操作
-
增
1 dic1={"name":"xxx","age":22} 2 dic1["hobby"]="girl" 3 dic2=dic1.setdefault("age",18) #使用setdefault方法假如字典中有该key,则返回原来的value并不修改value 4 dic2=dic1.setdefault("hobby","girl")#假如字典中没有该key,则添加该key,value对并返回新增加的value
-
查
1 dic2={"name":"xxx","age":22} 2 dic2["name"] #通过key获取value 3 print(dic2.keys())#返回所有的key 4 print(dic2.values())#返回所有的value 5 print(dic2.items())#返回所有的item 6 print(dic2.get("name"))#通过get方法获取某个key对应的value
-
改
1 dic3={"name":"xxx","age":22} 2 dic4={"age":33,"hobby":"girl"} 3 dic3.update(dic4)#假如dic4中的key在dic3中存在,那么覆盖dit3中的value,否则添加这个键值对到dic3中 4 dic3["name"]="alex2"#修改字典中对应key的value 5 dic3["name"]="abc"#通过key对字典进行修改
-
删
1 dic5={"name":"xxx","age":22} 2 dic5.clear()#清空该字典内容 3 del dic5['name']#通过key删除某个键值对 4 print(dic5.popitem())#popitem将随机删除字典中的一个item并将该item返回 5 print(dic5.pop("name"))#删除指定key对应的键值对,并返回该键对应的value 6 del dic5#删除该字典
-
其他操作及方法
dict.fromkeys方法也可以创建字典,创建字典方式如下:
1 dic6=dict.fromkeys(['host1','host2','host3'],'test') 2 print(dic6)#{'host3': 'test', 'host1': 'test', 'host2': 'test'} 3 dic6['host2']='abc' 4 print(dic6)
但是通过这种方式创建的字典的value初始都是同一个值,假如下面这种情况就会出现异常:
1 dic6=dict.fromkeys(['host1','host2','host3'],['test1','tets2']) 2 print(dic6) 3 {'host2': ['test1', 'tets2'], 'host3': ['test1', 'tets2'], 'host1': ['test1', 'tets2']} 4 dic6['host2'][1]='test3' 5 print(dic6) 6 {'host3': ['test1', 'test3'], 'host2': ['test1', 'test3'], 'host1': ['test1', 'test3']}
说明这里面的value类似于浅拷贝一样的效果,修改value中的列表的内容的时候,所有value都修改了。
dict.copy()方法是对字典的浅拷贝,返回一个和之前字典有相同内容的新字典
dict没有内置sort方法,要对字典进行排序需要使用sorted(dict)方式,默认是根据key来进行排序,也可以根据value或者自定义方式来排序。如sorted(dict.values())就是根据value进行排序。
2.集合介绍
集合定义:把不同的可hash的元素放在一起就是一个集合。
集合的特点:没有重复值,值必须是可hash的。
集合的声明:a=set(“序列”) 里面的序列可以是一个字符串,可以是一个列表,也可以是一个字典(是字典的话,只能存储字典的key)
不可变集合:通过frozenset(“序列”)可以创建不可变集合,不可变集合和集合之间的关系和list和tuple之间的关系差不多
集合方法:
1 a = set([1, 2, 3, 4, 5]) a.add(6) # 没有返回值,添加一个元素,如果添加的元素在set里面的话,set的内容将不会被改变 2 3 a.update("hello") # Update a set with the union of itself and others将一个序列转换成set并取并集给原来的set 4 5 a.clear() # 清空集合的内容 6 7 a.remove(4) # 删除集合里面指定的key 8 9 a.pop() # 随机删除集合中的一个key并返回这个key
集合间的关系:
1 a=set([1,2,3,4,5]) 2 3 b=set([4,5,6,7,8]) 4 5 求交集:intersection 6 7 print(a.intersection(b)) 8 9 print(a&b) 10 11 求并集:union 12 13 print(a.union(b)) 14 15 print(a|b) 16 17 求差集:difference 18 19 print(a.difference(b)) 20 21 print(b-a) 22 23 求对称差集 反向交集:symmetric_difference 24 25 print(a.symmetric_difference(b)) 26 27 print(a^b) 28 29 print((a | b)-(a&b)) # 使用并集减去交集也能得到相同结果 集合之间可以有-运算,但是没有+运算 30 31 求父集 超集:issuperset父集 issubset子集 32 33 print(a.issuperset(b)) # a>=b 34 35 print(a>=b) 36 37 print(a.issubset(b)) # a<=b 38 39 print(a<=b) 40 41 print(a=>b) # a包含b 42 43 print(a<=b) # b包含a 44 45 print(a==b) # a和b等价
3.字符串处理
字符串处理方法比较多,下面通过分类来进行解释字符串的一些方法:
字母处理方法:
全部大写:str.upper()
全部小写:str.lower()
大小写互换:str.swapcase()
整个字符串首字母大写,其余小写:str.capitalize()
每个单词的首字母大写:str.title()
格式化相关
获取固定长度,右对齐,左边不够用默认用空格补齐,可自行在第二个参数中设置补充字符:str.rjust(width,"*") 获取固定长度,左对齐,右边不够用默认用空格补齐,可自行在第二个参数中设置补充字符:str.ljust(width,"*") 获取固定长度,中间对齐,两边不够用默认空格补齐,可自行在第二个参数中设置补充字符:str.center(width,"*") 获取固定长度,右对齐,左边不足用0补齐:str.zfill(20) 使用format格式化输出,用{}包裹变量,(如果字符串中含有{}的话,左括号弄成{{,右括号弄成}}实现大括号转义):str.format(变量名=值) 使用format_map格式化输出,用{}包裹变量,(如果字符串中含有{}的话,左括号弄成{{,右括号弄成}}实现大括号转义)和format区别是传递参数形式不一样:str.format_map(dict)
字符串搜索相关
搜索指定字符串,没有返回-1:str.find('t') 指定起始位置搜索:str.find('t',start) 指定起始及结束位置搜索:str.find('t',start,end) 从右边开始查找:str.rfind('t') 上面所有方法都可用index代替,不同的是使用index查找不到会抛异常,而find返回-1 搜索到多少个指定字符串:str.count('t')
字符串替换相关
替换old为new:str.replace('old','new') 替换指定次数的old为new:str.replace('old','new',maxReplaceTimes)
字符串去空格及去指定字符
去两边空格,换行符,制表符等:str.strip() 去左空格,换行符,制表符等:str.lstrip() 去右空格,换行符,制表符等:str.rstrip() 去两边字符串:str.strip('d'),相应的也有lstrip,rstrip
按指定字符分割字符串为数组:
默认按空格分隔,也可按照自定义分隔符分隔,第二个参数可以指定最大分隔次数:str.split(' ',maxnum) 从右往左默认按空格分隔,也可按照自定义分隔符分隔,第二个参数可以指定最大分隔次数:str.rsplit(' ',maxnum)
字符串判断相关
是否以start开头:str.startswith('start') 是否以end结尾:str.endswith('end') 是否全为字母或数字:str.isalnum() 是否全字母:str.isalpha() 是否全数字:str.isdigit() 是否全小写:str.islower() 是否全大写:str.isupper()