详解Python进阶之切片的误区与高级用法

2020-01-04 13:43:53

字体：大中小

来源：转载

供稿：网友

众所周知，我们可以通过索引值（或称下标）来查找序列类型（如字符串、列表、元组...）中的单个元素，那么，如果要获取一个索引区间的元素该怎么办呢？

切片（slice）就是一种截取索引片段的技术，借助切片技术，我们可以十分灵活地处理序列类型的对象。通常来说，切片的作用就是截取序列对象，然而，它还有一些使用误区与高级用法，都值得我们注意。所以，本文将主要跟大家一起来探讨这些内容，希望你能学有所获。

事先声明，切片并非列表的专属操作，但因为列表最具有代表性，所以，本文仅以列表为例作探讨。

1、切片的基础用法

列表是 Python 中极为基础且重要的一种数据结构，我曾写过一篇汇总文章（链接见文末）较全面地学习过它。文中详细地总结了切片的基础用法，现在回顾一下：

切片的书写形式：[i : i+n : m] ；其中，i 是切片的起始索引值，为列表首位时可省略；i+n 是切片的结束位置，为列表末位时可省略；m 可以不提供，默认值是1，不允许为0 ，当m为负数时，列表翻转。注意：这些值都可以大于列表长度，不会报越界。

切片的基本含义是：从序列的第i位索引起，向右取到后n位元素为止，按m间隔过滤。

li = [1, 4, 5, 6, 7, 9, 11, 14, 16]# 以下写法都可以表示整个列表，其中 X >= len(li)li[0:X] == li[0:] == li[:X] == li[:] == li[::] == li[-X:X] == li[-X:]li[1:5] == [4,5,6,7] # 从1起，取5-1位元素li[1:5:2] == [4,6] # 从1起，取5-1位元素，按2间隔过滤li[-1:] == [16] # 取倒数第一个元素li[-4:-2] == [9, 11] # 从倒数第四起，取-2-(-4)=2位元素li[:-2] == li[-len(li):-2] == [1,4,5,6,7,9,11] # 从头开始，取-2-(-len(li))=7位元素# 步长为负数时，列表先翻转，再截取li[::-1] == [16,14,11,9,7,6,5,4,1] # 翻转整个列表li[::-2] == [16,11,7,5,1] # 翻转整个列表，再按2间隔过滤li[:-5:-1] == [16,14,11,9] # 翻转整个列表，取-5-(-len(li))=4位元素li[:-5:-3] == [16,9] # 翻转整个列表，取-5-(-len(li))=4位元素，再按3间隔过滤# 切片的步长不可以为0li[::0] # 报错（ValueError: slice step cannot be zero）

上述的某些例子对于初学者（甚至很多老手）来说，可能还不好理解。我个人总结出两条经验：（1）牢牢记住公式 [i : i+n : m] ，当出现缺省值时，通过想象把公式补全；（2）索引为负且步长为正时，按倒数计算索引位置；索引为负且步长为负时，先翻转列表，再按倒数计算索引位置。

2、切片是伪独立对象

切片操作的返回结果是一个新的独立的序列（PS：也有例外，参见《 Python是否支持复制字符串呢？》）。以列表为例，列表切片后得到的还是一个列表，占用新的内存地址。

当取出切片的结果时，它是一个独立对象，因此，可以将其用于赋值操作，也可以用于其它传递值的场景。但是，切片只是浅拷贝，它拷贝的是原列表中元素的引用，所以，当存在变长对象的元素时，新列表将受制于原列表。

li = [1, 2, 3, 4]ls = li[::]li == ls # Trueid(li) == id(ls) # Falseli.append(li[2:4]) # [1, 2, 3, 4, [3, 4]]ls.extend(ls[2:4]) # [1, 2, 3, 4, 3, 4]# 下例等价于判断li长度是否大于8if(li[8:]):  print("not empty")else:  print("empty")# 切片列表受制于原列表lo = [1,[1,1],2,3]lp = lo[:2] # [1, [1, 1]]lo[1].append(1) # [1, [1, 1, 1], 2, 3]lp # [1, [1, 1, 1]]

由于可见，将切片结果取出，它可以作为独立对象使用，但是也要注意，是否取出了变长对象的元素。

3、切片可作为占位符

切片既可以作为独立对象被“取出”原序列，也可以留在原序列，作为一种占位符使用。

在写《详解Python拼接字符串的七种方式》的时候，我介绍了几种拼接字符串的方法，其中三种格式化类的拼接方法（即 %、format()、template）就是使用了占位符的思想。对于列表来说，使用切片作为占位符，同样能够实现拼接列表的效果。特别需要注意的是，给切片赋值的必须是可迭代对象。

li = [1, 2, 3, 4]# 在头部拼接li[:0] = [0] # [0, 1, 2, 3, 4]# 在末尾拼接li[len(li):] = [5,7] # [0, 1, 2, 3, 4, 5, 7]# 在中部拼接li[6:6] = [6] # [0, 1, 2, 3, 4, 5, 6, 7]# 给切片赋值的必须是可迭代对象li[-1:-1] = 6 # （报错，TypeError: can only assign an iterable）li[:0] = (9,) # [9, 0, 1, 2, 3, 4, 5, 6, 7]li[:0] = range(3) # [0, 1, 2, 9, 0, 1, 2, 3, 4, 5, 6, 7]

上述例子中，若将切片作为独立对象取出，那你会发现它们都是空列表，即 li[:0]==li[len(li):]==li[6:6]==[] ，我将这种占位符称为“ 纯占位符 ”，对纯占位符赋值，并不会破坏原有的元素，只会在特定的索引位置中拼接进新的元素。删除纯占位符时，也不会影响列表中的元素。

与“纯占位符”相对应，“ 非纯占位符 ”的切片是非空列表，对它进行操作（赋值与删除），将会影响原始列表。如果说纯占位符可以实现列表的拼接，那么，非纯占位符可以实现列表的替换。

li = [1, 2, 3, 4]# 不同位置的替换li[:3] = [7,8,9] # [7, 8, 9, 4]li[3:] = [5,6,7] # [7, 8, 9, 5, 6, 7]li[2:4] = ['a','b'] # [7, 8, 'a', 'b', 6, 7]# 非等长替换li[2:4] = [1,2,3,4] # [7, 8, 1, 2, 3, 4, 6, 7]li[2:6] = ['a'] # [7, 8, 'a', 6, 7]# 删除元素del li[2:3] # [7, 8, 6, 7]

切片占位符可以带步长，从而实现连续跨越性的替换或删除效果。需要注意的是，这种用法只支持等长替换。

li = [1, 2, 3, 4, 5, 6]li[::2] = ['a','b','c'] # ['a', 2, 'b', 4, 'c', 6]li[::2] = [0]*3 # [0, 2, 0, 4, 0, 6]li[::2] = ['w'] # 报错，attempt to assign sequence of size 1 to extended slice of size 3del li[::2] # [2, 4, 6]

4、更多思考

其它编程语言是否有类似于 Python 的切片操作呢？有什么差异？

我在交流群里问了这个问题，小伙伴们纷纷说 Java、Go、Ruby......在查看相关资料的时候，我发现 Go 语言的切片是挺奇怪的设计。首先，它是一种特殊类型，即对数组（array）做切片后，得到的竟然不是一个数组；其次，你可以创建和初始化一个切片，需要声明长度（len）和容量（cap）；再者，它还存在超出底层数组的界限而需要进行扩容的动态机制，这倒是跟 Python 列表的超额分配机制有一定相似性......

在我看来，无论是用意，还是写法和用法，都是 Python 的切片操作更明了与好用。所以，本文就不再进行跨编程语言的比较了（唔，好吧我承认，其实是我不怎么懂其它编程语言......）

最后，还有一个问题： Python 的切片操作有什么底层原理呢？ 我们是否可以自定义切片操作呢？限于篇幅，我将在下次推文中跟大家一起学习，敬请期待。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持VEVB武林网。

注：相关教程知识阅读请移步到python教程频道。

上一篇：Python二叉树的遍历操作示例【前序遍历,中序遍历,后序遍历,层序遍历】

下一篇：Python数据抓取爬虫代理防封IP方法