Python的list循环遍历中，删除数据的正确方法

Python的list循环遍历中，删除数据的正确方法
在遍历list，删除符合条件的数据时，总是报异常，代码如下：
```
 1 num_list = [1, 2, 3, 4, 5]
 2 print(num_list)
 3 
 4 for i in range(len(num_list)):
 5     if num_list[i] == 2:
 6         num_list.pop(i)
 7     else:
 8         print(num_list[i])
 9 
10 print(num_list)
```
会报异常：IndexError: list index out of range

原因是在删除list中的元素后，list的实际长度变小了，但是循环次数没有减少，依然按照原来list的长度进行遍历，所以会造成索引溢出。

修改代码如下：
```
 1 num_list = [1, 2, 3, 4, 5]
 2 print(num_list)
 3 
 4 for i in range(len(num_list)):
 5     if i >= len(num_list):
 6         break
 7 
 8     if num_list[i] == 2:
 9         num_list.pop(i)
10     else:
11         print(num_list[i])
12 
13 print(num_list)
```
这回不会报异常了，但是打印结果如下：
```
[1, 2, 3, 4, 5]
1
4
5
[1, 3, 4, 5]
```
虽然最后，list中的元素[2]确实被删除掉了，但是，在循环中的打印结果不对，少打印了[3]。

思考了下，知道了原因，当符合条件，删除元素[2]之后，后面的元素全部往前移，于是[3, 4, 5]向前移动，那么元素[3]的索引，就变成了之前[2]的索引（现在[3]的下标索引变为1了），后面的元素以此类推。可是，下一次for循环的时候，是从下标索引2开始的，于是，取出了元素[4]，就把[3]漏掉了。

再次修改代码，结果一样，丝毫没有改观：
```
 1 num_list = [1, 2, 3, 4, 5]
 2 print(num_list)
 3 
 4 for item in num_list:
 5     if item == 2:
 6         num_list.remove(item)
 7     else:
 8         print(item)
 9 
10 print(num_list)
```
找出问题的根本原因所在，想要找到正确的方法，也并不难，再次修改代码：
```
 1 num_list = [1, 2, 3, 4, 5]
 2 print(num_list)
 3 
 4 i = 0
 5 while i < len(num_list):
 6     if num_list[i] == 2:
 7         num_list.pop(i)
 8         i -= 1
 9     else:
10         print(num_list[i])
11 
12     i += 1
13 
14 print(num_list)
```
执行结果，完全正确：
```
[1, 2, 3, 4, 5]
1
3
4
5
[1, 3, 4, 5]
```
我的做法是，既然用for循环不行，那就换个思路，用while循环来搞定。每次while循环的时候，都会去检查list的长度（i < len(num_list)），这样，就避免了索引溢出，然后，在符合条件，删除元素[2]之后，

手动把当前下标索引-1，以使下一次循环的时候，通过-1后的下标索引取出来的元素是[3]，而不是略过[3]。

当然，这还不是最优解，所以，我搜索到了通用的解决方案：

　　1、倒序循环遍历；

　　2、遍历拷贝的list，操作原始的list。

1、倒序循环：
```
 1 num_list = [1, 2, 3, 4, 5]
 2 print(num_list)
 3 
 4 for i in range(len(num_list)-1, -1, -1):
 5     if num_list[i] == 2:
 6         num_list.pop(i)
 7     else:
 8         print(num_list[i])
 9 
10 print(num_list)
```
执行结果完全正确

解释正序循环时删除就有问题，而倒序循环时删除就ok

删除元素[2]之后，下一次循环的下标索引为2，但此时，里面存放的是[4]，于是就把[3]给漏了。

2）倒序循环时删除

删除元素[2]后，[3, 4, 5]往前挤，但是没关系，因为下一次循环的下标索引为0，里面存放的是[1]，所以正是我们所期望的正确的元素值。

2、遍历拷贝的list，操作原始的list
```
 1 num_list = [1, 2, 3, 4, 5]
 2 print(num_list)
 3 
 4 for item in num_list[:]:
 5     if item == 2:
 6         num_list.remove(item)
 7     else:
 8         print(item)
 9 
10 print(num_list)
```
原始的list是num_list，那么其实，num_list[:]是对原始的num_list的一个拷贝，是一个新的list，所以，我们遍历新的list，而删除原始的list中的元素，则既不会引起索引溢出，最后又能够得到想要的最终结果。此方法的缺点可能是，对于过大的list，拷贝后可能很占内存。那么对于这种情况，可以用倒序遍历的方法来实现
相关阅读:
工厂模式
 不错公众号
 linux 下的正则表达式（awk,sed,awk）学习
 CentOS 7 中安装 bcc-tools
docker
Python爬去知乎上问题下所有图片
 过滤重复数据取一条
 阿里云80端口被系统占用
 过滤重复项取时间最近的数据
 Layui的几个问题记录一下
原文地址：https://www.cnblogs.com/zhouziyuan/p/10137086.html