在实际开发中,经常遇到下面的需求:在线性表(数组)中提取若干个元素的操作,提取规则有很多,比如说提取前5个、提取后5个、提取奇数/偶数位元素等等。
在抽样检测提取样本时,经常遇到每隔100箱牛奶,取其中一瓶作为样本进行检测。
在其他语言中,实现上述操作是依靠for循环来实现。
//例 C++取数组偶数位元素
len = (sizeof(arrray)) / (sizeof(array[0])); //C++没有Python的len函数
for(int i=0, i < len; i += 2) { //即从0开始,每2个取一个 也即取偶数位元素
cout << array[i] << endl;
}
Python为了简便这些常见操作,提供了切片(slice)操作符, 切片是Python高级特性之一。
Python 切片(Slice)
格式(以list为例):
#a是起始索引,b是结束索引,因为python支持负数索引,所以a、b可以小于0
l[a:b] #意为取从a到b但不包括b的元素
#a、b都大于0时也可以理解为取b-a个元素
l[a:b:n] #意为从a到b的元素中 每n个元素取第一个
#备注:a、b、n都可以省略
#a默认值是0;b默认值是len(l);n默认值是1
#即省略a表示从第一个元素起,省略b表示到最后一个元素止,省略n表示一个个取
实例:
C:UsersSolo>python
Python 3.6.3 (v3.6.3:2c5fed8, Oct 3 2017, 17:26:49) [MSC v.1900 32 bit (Intel)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> l = list(range(100))
>>> l
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
>>> l[0:3] #从0开始取到3,但不包括3 0可以省略
[0, 1, 2]
>>> l[:3] #从0开始取到3,但不包括3 也可以理解为取3个元素
[0, 1, 2]
>>> l[2:4] #从2开始取到4,但不包括4 也可以理解为取4-2个元素
[2, 3]
>>> l[:10] #从0开始取到10,但不包括10
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> l[-10:] #取倒数前10个
[90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
>>> l[:-10] #取0到倒数第10个元素
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89]
>>> l[:10:2] #从0开始,到10为止,每2个取一个
[0, 2, 4, 6, 8]
>>> l[2:10:2] #从2开始,到10为止,每2个取一个
[2, 4, 6, 8]
>>> l[::5] #全部元素中 每5个取第一个
[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]
>>> l[55::5] #从55开始,每5个取第一个元素
[55, 60, 65, 70, 75, 80, 85, 90, 95]
tuple也支持切片格式,set不支持切片,想想看,为什么?
很显然,切片是依赖索引来实现的,所以只要可以索引的数据结构都支持切片操作,str也支持切片。
>>> 'abcdefg'[:3]
'abc'
>>> 'abcdefg'[1:5:2]
'bd'
>>>