一起看一下python中的四种存储结构
在python3中, 一共有4种基本的容器类型, list,tuple,dict,set
一:list
list相当于js中的array. array能做的事情, 差不多list都可以做到, 比如什么可变性,删除,添加,转变为字符串等基本操作
(一):我们来看一下,怎么声明一个list
name = ['sam','jimmy']
(二):在python中也是很有用的三个函数 len,max,min.
1,len(): 用来获取list的长度
>>> len(lists)
5
2,max(list|Numbers): 用来判断list中,最大的数字.
>>> max(lists)
5
>>> max(1,2,3,4,5)
5
3,min(list|Numbers): 用来判断list中,最小的数字
另外, 这里补充一个生成有序list最快捷的方式, 使用list comprehension.即,在括号里面使用 for statement. 实际上, 就是一个list 派生出另外一个list. 看一个demo
>>> lists = [x for x in range(10)]
>>> lists
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
range就是用来生成一个iterable
补充:
range(start, stop[, step]) -> range object
具体含义就是born 一定范围的值. 比如range(10): 0~10.
回到 list comprehension, 这个表达式x for x in range(10) 实际上, 就相当于
lists = []
for x in range(10):
lists.append(x)
了解了LC 之后,我们就可以脱离手码lists的困扰了. python 很方便有木有
(三): python中的两个特性 切片, 迭代
1,切片
通常,我们想要获取list中的某个元素,直接使用下标即可.但是,如果你想要取出list中间连续的几个,那么就会用到切片这一神奇的功能.
>>> my_list = ['p','r','o','g','r','a','m']
>>> my_list[2:5] # elements 3rd to 5th
['o', 'g', 'r']
>>> my_list[:-5] # 可以使用负数的index
['p', 'r', 'o', 'g']
>>> my_list[5:] # 从5一直到最末
['a', 'm', 'i', 'z']
>>> my_list[:] # 获取所有的ele
['p', 'r', 'o', 'g', 'r', 'a', 'm']
关于切片,值得补充一下就是colon两边的数字代表的意义特么还不一样:比如: my_list[2:5]实际表现的意义是,获取list中[2,5-1]的元素,Ps: 下标从0开始)实际上, 关于切片,还有一个隐藏的parameter.
>>> len[0:5:2]
[1, 3, 5]
第三个的参数的相当于设置步长,x+step,比如,你可以获得,奇数元素或者偶数元素等等.
2,迭代
实际上,这里的迭代,我们理解为for...in...循环就好.如下格式
>>> for v in len:
print(v)
v就代表len中的每一个元素,然后你就可以执行相关的操作即可。另外, 如果你的list是这样的
>>> lists = [[1,2],[2,3]]
>>> for [a,b] in lists:
print(a,b)
套用同样的格式即可
(四):关于python里相关操作list的方法.
list方法
1,添加
在python中, 常有append,extend,insert 3个方法用来进行添加. 不过,在介绍这3个方法之前,我们先要体会一下python flexibility--+,*,切片. 利用这3个trick来进行添加.
+
我们使用+, 来对list进行扩展.但实际上,他并不会修改原始的list。 所以这就有点尴尬了
>>> lists+[1]
[1, 2, 3, 4, 5, 1]
*
使用*进行翻倍扩展.但,同样不会改变原值
>>> lists * 2
[1, 2, 3, 4, 5, 1, 2, 3, 4, 5]
(1),append
这里就是向list中,尾加一个ele.
>>> lists.append(1)
(2),extend
用来向list中,添加多个ele.
>>> lists.extend([1,2,3,4])
他和+操作的区别就是, +不会改变原始的list,而extend会!
(3),insert
用来往指定index后添加一个ele.
>>> lists.insert(0,123)
>>> lists.insert(0,[1,23])
2,切片
使用切片,来对list直接修改.
>>> lists[1:3]=[1,2,3] //只能使用另外一个list进行替代
>>> lists
[1, 1, 2, 3, 4, 5]
这里简要说一下分片的原理吧. 分片实际上是,内部创建一个list,然后进行替换, 所以,对应的类型只能是list.
比如下面, 就会报错
>>> lists[1:3]=1
TypeError: can only assign an iterable
3,删除
list里面的移除也是有很多讲究的, 常用的方法有pop,remove,del,clear
(1),pop
这里,我们就要将list理解为一个栈(Ps:一种数据结果). 他的结果就是先进后出(FILO). 相当于一个瓶子,你最后放的,会被最先拿出来. 实际上, 他和append是完全相反的.
append->入栈
pop->出栈
使用pop时, 他会返回被删除的元素
>>> lists = [1,2,3,4]
>>> lists.pop()
4
>>> lists
[1, 2, 3]
我们对比看一下,append
>>> lists.append(4)
>>> lists
[1, 2, 3, 4]
另外, pop还可以用来删除指定index的ele.
//删除第一个元素
>>> lists.pop(0)
(2),remove
remove是用来移除指定值. 并且,一次只会移除一个
>>> lists = [1,2,3,1,1,1]
>>> lists.remove(1)
>>> lists
[2, 3, 1, 1, 1]
(3),del && clear
前面说了pop,用来删除最新的栈元素, 但是我怎么删除list中最先放入, 也就是 list[0]的元素呢?
一个是用remove()造一个trick. 或者上面的pop例子
>>> lists.remove(lists[0])
>>> lists.pop(0)
不过使用remove的可读性超级差(pop的还可以), 所以, 我们可以使用 python中的内置函数, del 进行删除
del lists[0]
这里,我们来对比一下,3者的复杂度
del O(n - i)
pop O(n - i)
remove O(n)
很容器看出, del和pop的复杂度,比remove小, 所以,如果你想删除以下标开始的list的话,pop和del都行.
最后,我们如果想删除list的所有元素的话, 直接刚他. 使用clear()即可.
>>> lists.clear()
>>> lists
[]
4,排序操作
实际上, 这应该算是一切算法的根源了, 算法做的工作就是筛选和排序. 在list中,提供了两个方法供我们选择 sort, reverse.
(1),reverse()
实际上就是倒叙, 将你现在的list的顺序,逆向一遍
>>> lists
[1, 2, 3, 4]
>>> lists.reverse()
>>> lists
[4, 3, 2, 1]
sort([fn])
(2),sort
他根据fn的返回值来判断你原来顺序中的大小. fn接受两个参数fn(pre,next). 代表按照顺序的list的相邻两个元素.
fn>0: 则保持现在的顺序
fn<0: 交换两者顺序继续比较
fn=0: 保留两者的顺序
你可以自定义函数, 也可以直接使用默认的从小到大的排列.
即:
>>> lists = [1,3,2,4,2,3]
>>> lists.sort()
>>> lists
[1, 2, 2, 3, 3, 4]
注: sort本身自带了两个参数,可以用来决定排列的顺序: key,reverse
>>> lists=['ss','sss','s','ss']
>>> lists.sort(key=len)
>>> lists
['s', 'ss', 'ss', 'sss']
或者指明使用reverse=True
>>> lists=['ss','sss','s','ss']
>>> lists.sort(reverse=True)
>>> lists
['sss', 'ss', 'ss', 's']
当然, 如果你不想对原来的list进行改变, 可以使用sorted方法,返回一个新的list进行相关操作.
我们使用,help(sorted)来看一下具体用法
sorted(iterable, key=None, reverse=False)
Return a new list containing all items from the iterable in ascending order.
同样, 他默认情况下也是升序表示
>>> lists
[5, 4, 3, 2, 1]
>>> sorted(lists)
[1, 2, 3, 4, 5]
同样,你也可以使用reverse和key进行相关指定. 同,list这里就不赘述了.
5,查询
在list 查询中, python也提供了我们两个方法, index,count.
(1),index(ele): 用来查找具体ele,在list中的序号,没有则会出现ValueError的错误.具体表达式为:
L.index(value, [start, [stop]])
看到这个表示之后,我们大概就可以猜到index的基本用法了, 限定范围查找, 也是很重要的一个feature
(2),count(ele):
用来统计具体ele在list中出现的次数.
>>> lists.count(2)
1
当然, 如果有同学相到, in 关键字能否实现这个查询的功能呢?答案 is yes!!!
即, 我们判断一个ele 是否存在于list 可以使用in 来判断
>>> if 1 in lists:
... print(1)
...
1
//或者使用index
>>> if lists.index(1):
print(1)
1
这都是完全行得通的
6,复制
(1),分片
如果你想复制一个list最快的方法就是使用分片. 即
>>> lists
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> newOne = lists[0:3]
>>> newOne
[0, 1, 2]
(2),copy()
newOne = lists.copy();
//或者使用
newOne = lists[:]
这样,就避免了 内存地址重叠的problem了.
7,额外方法
除了上面说了的max,min,list等转换方法外, python 内置的还有sum,all,any.
(1),sum()
返回 list中所有元素之和
sum(lists)
(2),all()
是为了判断, lists中所有元素通过bool(ele)之后都为True,则返回True,所以,当list元素中有'',0,[]的话,则会返回False。另外,如果list为空的话,返回的也是True
(3),any()
使用bool(ele) 判断list中的每一个元素, 如果有一个为ture的话, 返回True, 相当于或的意思. 如果list为空的话返回的是False
>>> lists
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> any(lists)
True
>>> all(lists) //存在0
False
>>> lists = []
>>> any(lists) //没有元素,不通过
False
>>> all(lists) //没有元素,通过
True
二:Tuple
另外, 还有一个和list 很像的数据tuple.中文叫元组.他和list的主要区别就是, tuple是一开始就定义好的, 即, assign first,之后就永远不能被改变了. 所以, 一般全局比较重要的数据,我们都是使用tuple进行存放的.
(一)我们来创建一个Tuple
创建一个Tuple
通常来说,Tuple是放在parentheses 即, 圆括号() 内部.
>>> tub = (1,2,3)
>>> type(tub)
<class 'tuple'>
不过, 最近很流行的是 without parentheses. 即, 不加括号的方式. show:
>>> tub = 1,2,3
>>> type(tub)
<class 'tuple'>
这个名叫, tuple packing. 个人翻译为元组包.
不过在, 使用tuple的时候,需要注意,只有一个元素的tuple的创建(md,一个元素你还创建tuple干嘛,浪费内存?)一个元素的tuple创建, 需要在末尾+, 进行相关标识
>>> tub = 1,
// 或者
>>> tub = (1,)
>>> type(tub)
<class 'tuple'>
如果,你想访问tuple的话, 和访问list 是一个道理
>>> tub = (1,2,3,4,5,6,7)
>>> tub[0]
1
//当然,你也可以取负值
>>> tub[-1]
7
所以,这里我们也可以使用for...in...进行 遍历.
(二):不变的Tuple
一般创建了一个tuple, 之后你就用于无法改变他的值了, 也就是你不能删除,或者添加。不过,如果你的tuple里面放一些可变的内容的话, 比如,list的话,那情况就不一样了。基于这一点,我们理解tuple 应该说为 shallow不变形。即,不能改变值类型,但可以改变引用类型.
>>> tup
(1, 2, 3, [2, 3], 5)
>>> tup[3]
[2, 3]
>>> tup[3].append(1)
>>> tup
(1, 2, 3, [2, 3, 1], 5)
//删除tup, 会报错
>>> del tup[0]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'tuple' object doesn't support item deletion
虽然,我们不能对tuple执行CD操作, 但相关的查询方法我们还是可以使用的
(三):Tuple 查询
在tuple里面有两个查询方法, index和count, 另外你使用in也是没有问题的
>>> my_tuple = ('a','p','p','l','e',)
>>> my_tuple.count('p')
2
>>> my_tuple.index('l')
3
>>> 'a' in my_tuple
True
同样, 关于list的一些built-in methond. 在tuple身上也是使用的, 有 max,min,sum,all,any,len,sorted. 这几个, 都是木有问题的
总结一下: tuple方法什么时候我们用Tuple?
tuple就是用来放不变的数据,并且tuple在内部中有遍历加速(因为不变).
三:dict
(一):dict的特性
dict是python中的一个可变的数据类型,用{}表示,dict的key必须是不可变的数据类型,而value的数据类型可以任意。
格式:{key:value,key:value,key:value}
注: 键值对如果是字符串使用单引号,最后一个键值对没有逗号
dict的优点:
①:查询速度快,可以二分查找
②:key是不可以重复的
注:
不可变数据类型: 元组,bool,int , str 可以hash
可变数据类型: dict ,list, set
(二),dict的方法:
1,增加的方法:dict有两种增加的方法
(1),如果没有的键值对,则进行添加,如果有,则将值进行覆盖
dict1={'name':'jinxin','age':18,'male':'男'}
print(dict1)
dict1['high']=185
print(dict1) # {'name': 'jinxin', 'age': 18, 'male': '男', 'high': 185}
dict1['age']=16
print(dict1) # {'name': 'jinxin', 'age': 16, 'male': '男', 'high': 185}
(2),如果有键值对,不做任何改变,没有键值对,才进行添加
dict1.setdefault("weight")
print(dict1) #{'name': 'jinxin', 'age': 16, 'male': '男', 'high': 185, 'weight': None}
dict1.setdefault('weight','65kg')
print(dict1) #{'name': 'jinxin', 'age': 16, 'male': '男', 'high': 185, 'weight': None}
dict1.setdefault('address','北京')
print(dict1) #{'name': 'jinxin', 'age': 16, 'male': '男', 'high': 185, 'weight': None, 'address': '北京'}
2,dict的删除方法
(1),使用pop()删除,如果有键,则删除,如果没有则会报错,如果不希望出现报错信息,可以在删除的后面添加信息
delDict={'name': 'jinxin', 'age': 16, 'male': '男', 'high': 185, 'weight': None, 'address': '北京'}
# delDict.pop('age') #dict的删除操作是有返回值的
print(delDict.pop('age')) # 16
print(delDict) #{'name': 'jinxin', 'male': '男', 'high': 185, 'weight': None, 'address': '北京'}
print(delDict.pop('职业','没有此键')) #没有此键
(2),使用popitem()删除,随机删除,返回的是一个元组,元组里面存储的删除的键值,推荐使用pop()方法进行删除
print(delDict.popitem()) # ('address', '北京')
随机删除,返回值是删除的键值对
print(delDict) #{'name': 'jinxin', 'male': '男', 'high': 185, 'weight': None}
(3),使用del()删除,del()可以删除整个字典,也可以删除字典的某个键,如果删除的键不存在,则会出现报错
del delDict['name']
print(delDict) #{'male': '男', 'high': 185, 'weight': None}
#使用del清空列表
del delDict
print(delDict) #delDict已经删除,报错
(4),清空列表也可以使用clear()
4,dict的修改
#直接修改
updateDict={'name':'jinxin','age':18,'male':'男'}
updateDict['name']='Jordan'
print(updateDict['name']) #Jordan
#调用update()修改
dictDemo={'name':"Jordan",'age':18}
dictDemo1={'address':'北京海淀','age':22}
dictDemo.update(dictDemo1)
print(dictDemo)
4,字典的查询
(1)查询字典的键:调用keys()方法
查询字典的值:调用values()方法
# 字典的查
dict1={'name':'jinxin','age':18,'male':'男'}
print(dict1.keys()) #dict_keys(['name', 'age', 'male'])
print(dict1.values()) #dict_values(['jinxin', 18, '男'])
print(dict1.items())# dict_items([('name', 'jinxin'), ('age', 18), ('male', '男')])
#打印dict1的键
for i in dict1.keys():
print(i ) # name age value
#打印dict的值
for v in dict1.values():
print(v) #jinxin 18 男
#打印字典的键值:
dict1={'name':'jinxin','age':18,'male':'男'}
for i in dict1.items():
print(i) # ('name', 'jinxin') ('age', 18) ('male', '男')
for k,v in dict1.items():
print(k,v) # name jinxin age 18 male 男
(2),字典的get()方法:使用get()方法可以查询某个键是否存在,如果不存在此键,则会返回None,但是可以在get()方法中添加信息避免出现None
dict1={'name':'jinxin','age':18,'male':'男'}
print(dict1.get('name')) #jinxin
print(dict1.get('address')) # None
print(dict1.get('address','没有此键')) #没有此键
四:set
python的set和其他语言类似,是一个无序不重复元素集,基本功能包括关系测试和消除重复元素.集合对象还支持union(联合),intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算,sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合,sets不记录元素位置或者插入点。因此,sets不支持indexing,slicing,或其它类序列(sequence-like)的操作。
下面来点简单的小例子说明吧。
>>> x = set('spam')
>>> y = set(['h','a','m'])
>>> x, y
(set(['a', 'p', 's', 'm']), set(['a', 'h', 'm']))
再来些小应用。
>>> x & y # 交集
set(['a', 'm'])
>>> x | y # 并集
set(['a', 'p', 's', 'h', 'm'])
>>> x - y # 差集
set(['p', 's'])
去除列表里重复元素,用hash来解决也行,只不过感觉在性能上不是很高,用set解决还是很不错的,示例如下:
>>> a = [11,22,33,44,11,22]
>>> b = set(a)
>>> b
set([33, 11, 44, 22])
>>> c = [i for i in b]
>>> c
[33, 11, 44, 22]
一:集合
集合用于包含一组无序的对象。要创建集合,可使用set()函数并像下面这样提供一系列的项:
s = set([3,5,9,10]) #创建一个数值集合
t = set("Hello") #创建一个唯一字符的集合
注: 与列表和元组不同,集合是无序的,也无法通过数字进行索引。此外,集合中的元素不能重复。例如,如果检查前面代码中t集合的值,结果会是:
>>> t
set(['H', 'e', 'l', 'o'])
注意: 只出现了一个'l'。
二:集合操作
集合支持一系列标准操作,包括并集、交集、差集和对称差集,例如:
a = t | s # t 和 s的并集
b = t & s # t 和 s的交集
c = t – s # 求差集(项在t中,但不在s中)
d = t ^ s #对称差集(项在t或s中,但不会同时出现在二者中)
基本操作:
(1),add()
使用add()可以添加一项:
t.add('x') # 添加一项
s.update([10,37,42]) # 在s中添加多项
(2),remove()
使用remove()可以删除一项:
t.remove('H')
(3),len()
len(s)#s的长度
(4),in
x in s #测试 x 是否是 s 的成员
(5),not in
x not in s
测试 x 是否不是 s 的成员
(6),<= >=
s.issubset(t)
s <= t # 测试是否 s 中的每一个元素都在 t 中
s.issuperset(t)
s >= t # 测试是否 t 中的每一个元素都在 s 中
(7),|
s.union(t)
s | t # 返回一个新的 set 包含 s 和 t 中的每一个元素
(8),&
s.intersection(t)
s & t #返回一个新的 set 包含 s 和 t 中的公共元素
(9),-
s.difference(t)
s - t #返回一个新的 set 包含 s 中有但是 t 中没有的元素
(10),^
s.symmetric_difference(t)
s ^ t #返回一个新的 set 包含 s 和 t 中不重复的元素
(11),copy()
s.copy() #返回 set “s”的一个浅复制
请注意: union(), intersection(), difference() 和 symmetric_difference() 的非运算符(non-operator,就是形如 s.union()这样的)版本将会接受任何 iterable 作为参数。相反,它们的运算符版本(operator based counterparts)要求参数必须是sets。这样可以避免潜在的错误,如:为了更可读而使用set('abc')&'cbs'来替代set('abc').intersection('cbs')。从 2.3.1 版本中做的更改:以前所有参数都必须是 sets。
另外,Set 和 ImmutableSet 两者都支持 set 与 set之间的比较。两个 sets 在也只有在这种情况下是相等的:每一个set中的元素都是另一个中的元素(二者互为subset)。一个set比另一个set小,只有在第一个et 是第二个 set 的subset时(是一个subset,但是并不相等)。一个set 比另一个set打,只有在第一个set是第二个set的superset时(是一个superset,但是并不相等)。子set和相等比较并不产生完整的排序功能。例如:任意两个sets都不相等也不互为子set,因此以下的运算都会返回 False:a<b, a==b, 或者a>b。因此,sets 不提供 cmp 方法。
因为 sets 只定义了部分排序功能(subset 关系),list.sort() 方法的输出对于 sets 的列表没有定义。
运算符
运算结果
hash(s) #返回 s 的 hash 值
下面这个表列出了对于 Set 可用二对于 ImmutableSet 不可用的运算:
运算符(voperator)
等价于
运算结果
s.update(t)
s |= t
返回增加了 set “t”中元素后的 set “s”
s.intersection_update(t)
s &= t
返回只保留含有 set “t”中元素的 set “s”
s.difference_update(t)
s -= t
返回删除了 set “t”中含有的元素后的 set “s”
s.symmetric_difference_update(t)
s ^= t
返回含有 set “t”或者 set “s”中有而不是两者都有的元素的 set “s”
s.add(x)
向 set “s”中增加元素 x
s.remove(x)
从 set “s”中删除元素 x, 如果不存在则引发 KeyError
s.discard(x)
如果在 set “s”中存在元素 x, 则删除
s.pop()
删除并且返回 set “s”中的一个不确定的元素, 如果为空则引发 KeyError
s.clear()
删除 set “s”中的所有元素
请注意: 非运算符版本的 update(), intersection_update(), difference_update()和symmetric_difference_update()将会接受任意 iterable 作为参数。从 2.3.1 版本做的更改:以前所有参数都必须是 sets。这个模块还包含一个 union_update() 方法,它是 update() 方法的一个别名。包含这个方法是为了向后兼容。程序员们应该多使用 update() 方法,因为这个方法也被内置的 set() 和 frozenset() 类型支持。
五:list,tuple,dict,set特点对比总结:
1 .list
1),list是一个使用方括号括起来的有序元素集合;
2),List 可以作为以 0 下标开始的数组,任何一个非空 list 的第一个元素总是 L[0],负数索引从 list 的尾部开始向前计数来存取元素。任何一个非空的 list 最后一个元素总是 L[-1];
3),有分片功能,两个list可以相加;
4),append 向 list 的末尾追加单个元素;
5),insert 将单个元素插入到 list 中;
6),extend 用来连接 list,使用一个 list 参数进行调用;
7),append 接受一个参数,这个参数可以是任何数据类型,并且简单地追加到 list 的尾部;
8),index 在 list 中查找一个值的首次出现并返回索引值;
9),要测试一个值是否在 list 内, 使用 in, 如果值存在, 它返回 True, 否则返为 False ;
10),remove 从 list 中删除一个值的首次出现;
11),pop 可以删除list的最后一个元素,然后返回删除元素的值,用索引删除制定位置的值;
2.tuple
1),tuple是不可变的list,创建了一个tuple就不能以任何方式改变它;
2),定义tuple是将整个元素集是用小括号括起来,是有序集合;
3),tuple的索引与list一样从0开始,所以一个非空的tuple的第一个元素总是t[0];
4),负数索引与 list 一样从 tuple 的尾部开始计数;
5),与 list 一样分片 (slice) 也可以使用。分割一个 tuple 时, 会得到一个新的 tuple;
6),没有 append、extend、remove或pop方法以及index方法;
7),可以使用in来查看一个元素是否存在于tuple 中。
3.dict
1),dict定义了键和值之间的一一对应关系,每个元素都是一个key-value对;
2),整个元素集合用大括号括起来,有序集合;可以通过 key 得到value, 但不能通过vaule获取 key;在一个 dict中不能有重复的 key, 并且 key 是大小写敏感的;
3),键可以是数字、字符串或者是元组等不可变类型;
4),用del使用key可以删除dict中的独立元素;
5),用clear可以清除dict中的所有元素。
4.set
1),set是建立一系列无序的,不重复的元素;
2),创建set的方式是调用set()并传入一个list,list的元素将作为set的元素;
3),set和dict的唯一区别仅在于没有存储对应的value。