python中列表的内置函数sort()可以对列表中的元素进行排序,而全局性的sorted()函数则对所有可迭代的序列都是适用的;
并且sort()函数是内置函数,会改变当前对象,而sorted()函数只会返回一个排序后的当前对象的副本,而不会改变当前对象。
sort
原型:sort(fun,key,reverse=False)
参数fun是表明此sort函数是基于何种算法进行排序的,一般默认情况下python中用的是归并排序,并且一般情况下我们是不会重写此参数的,所以基本可以忽略;
参数key用来指定一个函数,此函数在每次元素比较时被调用,此函数代表排序的规则,也就是你按照什么规则对你的序列进行排序;
参数reverse是用来表明是否逆序,默认的False情况下是按照升序的规则进行排序的,当reverse=True时,便会按照降序进行排序。
1 #coding:utf-8 2 from operator import attrgetter,itemgetter 3 4 list1 = [(2,'huan',23),(12,'the',14),(23,'liu',90)] 5 6 #使用默认参数进行排序,即按照元组中第一个元素进行排序 7 list1.sort() 8 print list1 9 #输出结果为[(2, 'huan', 23), (12, 'the', 14), (23, 'liu', 90)] 10 11 #使用匿名表达式重写key所代表的函数,按照元组的第二个元素进行排序 12 list1.sort(key=lambda x:(x[1])) 13 print list1 14 #[(2, 'huan', 23), (23, 'liu', 90), (12, 'the', 14)] 15 16 #使用匿名表达式重写key所代表的函数,按照元组的第三个元素进行排序 17 list1.sort(key=lambda x:(x[2])) 18 print list1 19 #[(12, 'the', 14), (2, 'huan', 23), (23, 'liu', 90)] 20 21 #使用匿名函数重写key所代表的函数,先按照元组中下标为2的进行排序, 22 # 对于下标2处元素相同的,则按下标为0处的元素进行排序 23 list1.sort(key=lambda x:(x[2],x[0])) 24 print list1 25 #[(12, 'the', 14), (2, 'huan', 23), (23, 'liu', 90)] 26 27 #使用operator模块中的itemgetter函数进行重写key所代表的函数,按照下标为1处的元素进行排序 28 list1.sort(key=itemgetter(1)) 29 print list1 30 #[(2, 'huan', 23), (23, 'liu', 90), (12, 'the', 14)] 31 32 #使用operator模块中的itemgetter函数进行重写key所代表的函数,按照下标为2处的元素进行排序 33 list1.sort(key=itemgetter(2)) 34 print list1 35 # [(12, 'the', 14), (2, 'huan', 23), (23, 'liu', 90)] 36 37 # 此处可以类比lambda中的排序方法,就不再解释 38 list1.sort(key=itemgetter(2,0)) 39 print list1 40 #[(12, 'the', 14), (2, 'huan', 23), (23, 'liu', 90)]
sorted
原型sorted(iterable, cmp=None, key=None, reverse=False)
对于sorted()函数中key的重写,和sort()函数中是一样的,所以刚刚对于sort()中讲解的方法,都是适用于sorted()函数中
cmp函数:
1 # 排序算法: 2 # 排序也是在程序中经常用到的算法。 3 # 无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。 4 # 如果是数字,我们可以直接比较,但如果是字符串或者两个dict呢?直接比较数学上的大小是没有意义的,因此,比较的过程必须通过函数抽象出来。 5 # 通常规定,对于两个元素x和y,如果认为x < y,则返回-1,如果认为x == y,则返回0,如果认为x > y,则返回1, 6 # 这样,排序算法就不用关心具体的比较过程,而是根据比较结果直接排序 7 8 # Python内置的sorted()函数就可以对list进行排序: 9 print(sorted([34, 5, 7, 2, 8, 13])) 10 11 print('-----------------------------------------------------------------------------------') 12 13 # sorted()函数也是一个高阶函数,它还可以接收一个比较函数来实现自定义的排序。 14 # 比如,如果要倒序排序,我们就可以自定义一个reversed_self函数 15 # 传入自定义的比较函数reversed_self,就可以实现倒序排序 16 def reversed_self(x, y): 17 if x > y: 18 return -1 19 if x < y: 20 return 1 21 return 0 22 res = sorted([34, 5, 7, 2, 8, 13], reversed_self) 23 print(res) 24 25 print('-----------------------------------------------------------------------------------') 26 27 # 默认情况下,对字符串排序,是按照ASCII的大小比较的,由于'Z' < 'a',结果,大写字母Z会排在小写字母a的前面。 28 # 现在,我们提出排序应该忽略大小写,按照字母序排序。要实现这个算法,不必对现有代码大加改动,只要我们能定义出忽略大小写的比较算法就可以 29 # Python upper() 方法将字符串中的小写字母转为大写字母。 30 def ignore_case(x1, x2): 31 u1 = x1.upper() 32 u2 = x2.upper() 33 if u1 < u2: 34 return -1 35 if u1 > u2: 36 return 1 37 return 0 38 # 忽略大小写来比较两个字符串,实际上就是先把字符串都变成大写(或者都变成小写),再比较 39 res1 = sorted(['bob', 'about', 'Zoo', 'Credit'], ignore_case) 40 print(res1)
sort与sorted函数比较
sorted() 作用于任意可迭代的对象,而 sort() 一般作用于列 表。
因此下面的例子中针对元组使用 sort() 方法会抛出 AttributeError,而使用 sorted() 函数则 没有这个问题。
>>> a = (1,2,4,2,3) >>> a.sort() Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 'tuple' object has no attribute 'sort' >>> sorted(a) [1, 2, 2, 3, 4]
当排序对象为列表的时候两者适合的场景不同。sorted() 函数会返回一个排序后的列表,原有列表保持不 变;而 sort() 函数会直接修改原有列表,函数返回为 None。
>>> a=['1',1,'a',3,7,'n'] >>> sorted(a) [1, 3, 7, '1', 'a', 'n'] >>> a ['1', 1, 'a', 3, 7, 'n'] >>> print a.sort() None >>> a [1, 3, 7, '1', 'a', 'n']
因此如果实际应用过程中需要保留原有列表,使用 sorted() 函数较为适合,否则可以选 择 sort() 函数,因为 sort() 函数不需要复制原有列表,消耗的内存较少,效率也较高。
无论是 sort() 还是 sorted() 函数,传入参数 key 比传入参数 cmp 效率要高。cmp 传入 的函数在整个排序过程中会调用多次,函数开销较大;而 key 针对每个元素仅作一次处理, 因此使用 key 比使用 cmp 效率要高。
sorted的强大功能
-
对字典进行排序(中根据字典的值进行排序)
>>> phonebook = {'Linda': '7750', 'Bob': '9345', 'Carol': '5834'} >>> from operator import itemgetter >>> sorted_pb = sorted(phonebook.iteritems(),key=itemgetter(1)) >>> print sorted_pb [('Carol', '5834'), ('Linda', '7750'), ('Bob', '9345')]
ps: iteritems()方法返回字典的迭代器对象。 operator.itemgetter()函数用于获取对象的哪些维的数据,参数为一些序号(即需要获取的数据在对象中的序号)。看例子
a = [1,2,3] >>> b=operator.itemgetter(1) //定义函数b,获取对象的第1个域的值 >>> b(a) 2 >>> b=operator.itemgetter(1,0) //定义函数b,获取对象的第1个域和第0个的值 >>> b(a) (2, 1) 要注意,operator.itemgetter函数获取的不是值,而是定义了一个函数,通过该函数作用到对象上才能获取值。
-
多维list排序
实际情况下也会碰到需要对多个字段进行排序的情况,如根据学生的成绩、对应的等级依次排序。当然这在 DB 里面用 SQL 语句很容易做到,但使用多维列表联合 sorted() 函数也可以轻易达到类似的效果。
>>> from operator import itemgetter >>> gameresult = [['Bob',95.00,'A'],['Alan',86.0,'C'['Mandy',82.5,'A'],['Rob',86,'E']] # 分别表示学生的姓名,成绩,等级 >>> sorted(gameresult , key=operator.itemgetter(2, 1)) [['Mandy', 82.5, 'A'], ['Bob', 95.0, 'A'], ['Alan', 86.0, 'C'], ['Rob', 86, 'E']] # 当第二个字段成绩相同的时候按照等级从低到高排序
-
字典中混合list排序
如果字典中的 key 或者值为列表,需要对列表中的某一个位置 的元素排序也是可以做到的。看例子:
针对字典 mydict 的 value 结构 [n,m] 中的 m 按照从小到大的顺序排列。
>>> mydict = { 'Li' : ['M',7], ... 'Zhang': ['E',2], ... 'Wang' : ['P',3], ... 'Du' : ['C',2], ... 'Ma' : ['C',9], ... 'Zhe' : ['H',7] } >>> >>> from operator import itemgetter >>> sorted(mydict.iteritems(), key=lambda (k,v): operator.itemgetter(1)(v)) [('Zhang', ['E', 2]), ('Du', ['C', 2]), ('Wang', ['P', 3]), ('Li',['M', 7]), ('Zhe', ['H', 7]), ('Ma', ['C', 9])]
-
字典中混合list排序
列表中的每一个元素为字典形式,需要针对字典的多个key 值进行排序也不难实现。 看例子: 针对 list 中的字典元素按照 rating 和 name进行排序的实现方法。
>>> gameresult = [ { "name":"Bob", "wins":10, "losses":3, "rating":75.00 }, ... { "name":"David", "wins":3, "losses":5, "rating":57.00 }, ... { "name":"Carol", "wins":4, "losses":5, "rating":57.00 }, ... { "name":"Patty", "wins":9, "losses":3, "rating": 71.48 }] >>> from operator import itemgetter >>> sorted(gameresult , key=operator.itemgetter("rating","name")) [ {'wins': 4, 'losses': 5, 'name': 'Carol', 'rating': 57.0}, {'wins': 3, 'losses': 5, 'name': 'David', 'rating': 57.0}, {'wins': 9, 'losses': 3, 'name': 'Patty','rating': 71.48}, {'wins': 10, 'losses': 3, 'name': 'Bob', 'rating': 75.0}]
PS python2 与python3区别
-
sorted(iterable, cmp=None, key=None,reverse=False) ## Python 2.x sorted(iterable, key=None,reverse=False) ## Python 3.x
由此可看出,Python3.x取消了 cmp参数, 所以如果想给 sorted()函数传参的话,就剩下 key,和reverse了。
也就是说我们无法直接传入多个参数的函数进行排序
如果直接写的话,会发现
## 报错信息如下:
TypeError: must use keyword argument
for
key function
类型错误: 必须使用关键字参数。
那么我们该如何解决这个问题呢?
那就是使用functools中的cmp_to_key,即在开头加上
from functools import cmp_to_key
-
from functools import cmp_to_key
def desc(color1_list,color2_list): if len(color1_list) == 0: return -1 else: if len(color2_list) == 0: return 1 if color1_list[0] > color2_list[0]: return 1 else: return -1 sameList = sorted(sameTypeList,key = cmp_to_key(desc))