Python的切片操作

前段由于工作内容相对较少,利用了空闲(mo yu)时间简单把Python这一语言学了一下。之后除了看老赵的项目外,自己写算法题也尽量在使用Python,以期自己能尽快上手。这之中其实有不少可以记录的内容,但工作自上上周开始突然忙了起来。这一篇(包括一些别的想记录的内容)其实也是很早之前就想记录的。关于Python的切片操作。

问题引入

最初有在教程和书上看到这个,但由于还未使用,对这个特性的感觉还不明显。开始写题的时候就有明显需求,比如对某个数组或者string要进行各种去索引或者切割之类的操作,这些在之前使用cpp结题时有自己熟悉的接口和算法函数。一开始Python还比较陌生,在看过几次Python题解后,发现直接使用切片操作非常简单快捷,故这边做一篇专门的切片操作学习记录。

可切片对象的索引方式

切片操作包含正负两种索引,如下图所示,以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:

切片操作的一般方式

一个完整的切片表达式包含两个“:”,**用于分隔三个参数(start_index、end_index、step)**。当只有一个“:”时,默认第三个参数step=1;当一个“:”也没有时,start_index=end_index,表示切取start_index指定的那个元素。

step:正负数均可,其绝对值大小决定了切取数据时的‘‘步长”,而正负号决定了“切取方向”,正表示“从左往右”取值,负表示“从右往左”取值。当step省略时,默认为1,即从左往右以步长1取值。“切取方向非常重要!”“切取方向非常重要!”“切取方向非常重要!”,重要的事情说三遍!

start_index:表示起始索引(包含该索引对应值);该参数省略时,表示从对象“端点”开始取值,至于是从“起点”还是从“终点”开始,则由step参数的正负决定,step为正从“起点”开始,为负从“终点”开始。

end_index:表示终止索引(不包含该索引对应值);该参数省略时,表示一直取到数据“端点”,至于是到“起点”还是到“终点”,同样由step参数的正负决定,step为正时直到“终点”,为负时直到“起点”。

一些例子

以下示例均以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:

1.获取单个元素

1
2
3
4
>>> a[0]
0
>>> a[-2]
8

2.切取完整对象

1
2
3
4
5
6
>>> a[:] #从左到右
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> a[::] #从左到右
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> a[::-1] #从右到左
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

3.切取时使用默认值的一些情况

1
2
3
4
5
>>> a[1:6] #step=1,从左往右取值,start_index=1到end_index=6同样表示从左往右取值。
[1, 2, 3, 4, 5]
>>> a[1:6:-1]
[] #输出为空列表,说明没取到数据。
#step=-1,决定了从右往左取值,而start_index=1到end_index=6决定了从左往右取值,两者矛盾,所以为空。
1
2
3
4
5
6
7
8
9
10
11
>>> a[6:2]
[]
>>> a[:6]
[0, 1, 2, 3, 4, 5]
>>> a[:6:-1]
[9, 8, 7]
>>> a[6:]
[6, 7, 8, 9]
>>> a[6::-1]
[6, 5, 4, 3, 2, 1, 0]
# 上面几个例子也是简单的表现出,切片中使用默认值的一些结果,没有太多好解释的

4.正负索引混搭

1
2
3
4
5
6
7
8
9
10
>>> a[1:-6]
[1, 2, 3]
>>> a[1:-6:-1]
[]
>>> a[-1:6]
[]
>>> a[-1:6:-1]
[9, 8, 7]

#上面几个例子简单展示了正负混合的情况,其实就是对应到具体索引位置,和使用正负索引没太大关系,只是任需记住end_index是不被包含的。

5.多层切片操作

1
2
3
4
5
6
7
>>>a[:8][2:5][-1:]
>>> [4]
# 相当于:
a[:8]=[0, 1, 2, 3, 4, 5, 6, 7]
a[:8][2:5]= [2, 3, 4]
a[:8][2:5][-1:] = [4]
# 理论上可无限次多层切片操作,只要上一次返回的是非空可切片对象即可。

6.其他对象

上面一直是在拿list进行说明举例,实际上可以进行Python切片操作的数据类型非常多。常用的还包括元组、字符串等。

使用切片拷贝对象

1.拷贝整个对象

1
2
3
4
5
6
7
8
>>> b = a[:] 
>>> print(b)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

>>> print(id(a))
1803294322432
>>> print(id(b))
1803293517056

以上代码表明切片可直接深拷贝一个对象给到一个新对象。其中id函数可以返回对象的唯一标识符,标识符是一个整数。以上赋值代码也可以使用b = a.copy()代替。

2.深浅拷贝

需要注意的是:**[:]和.copy()只拷贝最外层元素,内层嵌套元素则通过引用方式共享,而非独立分配内存,即“浅拷贝”**,如果需要彻底拷贝则需采用“深拷贝”方式,如下例所示:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
>>>a = [1,2,['A','B']]
>>>print('a={}'.format(a))
>>>b = a[:]
>>>b[0] = 9 #修改b的最外层元素,将1变成9
>>>b[2][0] = 'D' #修改b的内嵌层元素
>>>print('a={}'.format(a))
>>>print('b={}'.format(b))
>>>print('id(a)={}'.format(id(a)))
>>>print('id(b)={}'.format(id(b)))
a=[1, 2, ['A', 'B']] #原始a
a=[1, 2, ['D', 'B']] #b修改内部元素A为D后,a中的A也变成了D,说明共享内部嵌套元素,但外部元素1没变。
b=[9, 2, ['D', 'B']] #修改后的b
id(a)=38669128
id(b)=38669192

总结

  1. 切片操作中三个参数均可正负混合使用。只需要遵循一个原则,即:当start_index表示的实际位置在end_index的左边时,从左往右取值,此时step必须是正数(同样表示从左往右);当start_index表示的实际位置在end_index的右边时,表示从右往左取值,此时step必须是负数(同样表示从右往左),即两者的取值顺序必须相同。
  2. 当start_index或end_index省略时,取值的起始索引和终止索引由step的正负来决定,这种情况不会有取值方向矛盾(即不会返回空列表[]),但正和负取到的结果顺序是相反的,因为一个向左一个向右。
  3. step的正负是必须要考虑的,尤其是当step省略时。比如a[-1:],很容易就误认为是从“终点”开始一直取到“起点”,即a[-1:]= [9, 8, 7, 6, 5, 4, 3, 2, 1, 0],但实际上a[-1:]=[9](注意不是9),原因在于step省略时step=1表示从左往右取值,而起始索引start_index=-1本身就是对象的最右边元素了,再往右已经没数据了,因此结果只含有9一个元素。
  4. “取单个元素(不带“:”)”时,返回的是对象的某个元素,其类型由元素本身的类型决定,而与母对象无关,如a[0]=0、a[-4]=6,元素0和6都是int,而母对象a却是list;“取连续切片(带“:”)”时,返回结果的类型与母对象相同,哪怕切取的连续切片只包含一个元素,如上面的a[-1:]=[9],返回的是一个只包含元素“9”的list,而非int的“9”。

参考文章

彻底搞懂Python切片操作

心情

今天由于社区直接就能接种疫苗了,再犯懒也得去一下了。下午1点半出门,包括留观半小时3点不到就结束了,还是蛮方便的。这边社区接种送的是一张刮刮乐,没想到还中了5块钱hhhh