一、序列式容器(数组式容器)
对于序列式容器(如vector,deque),序列式容器就是数组式容器,删除当前的iterator会使后面所有元素的iterator都失效。这是因为vetor,deque使用了连续分配的内存,删除一个元素导致后面所有的元素会向前移动一个位置。所以不能使用erase(iter++)的方式,还好erase方法可以返回下一个有效的iterator。
1 for (iter = cont.begin(); iter != cont.end();) 2 { 3 (*it)->doSomething(); 4 if (shouldDelete(*iter)) 5 iter = cont.erase(iter); //erase删除元素,返回下一个迭代器 6 else 7 ++iter; 8 }
迭代器失效:
1 void vectorTest() 2 { 3 vector<int> container; 4 for (int i = 0; i < 10; i++) 5 { 6 container.push_back(i); 7 } 8 9 vector<int>::iterator iter; 10 for (iter = container.begin(); iter != container.end(); iter++) 11 { 12 if (*iter > 3) 13 container.erase(iter); 14 } 15 16 for (iter = container.begin(); iter != container.end(); iter++) 17 { 18 cout<<*iter<<endl; 19 } 20 }
报错是:vectoriterator not incrementable.
迭代器在执行++操作时报错!已经失效的迭代器不能再进行自增运算了。++代码大致实现如下:
1 _Myiter operator++(int) 2 { 3 _Myiter _Tmp=*this; 4 ++*this; 5 return (_Tmp); 6 }
对于序列式容器,比如vector,删除当前的iterator会使后面所有元素的iterator都失效。这是因为顺序容器内存是连续分配(分配一个数组作为内存),删除一个元素导致后面所有的元素会向前移动一个位置。(删除了一个元素,该元素后面的所有元素都要挪位置,所以,iter++,已经指向的是未知内存)。
但是erase方法可以返回下一个有效的iterator。所以代码做如下修改,就OK了。
1 void vectorTest() 2 { 3 vector<int> container; 4 for (int i = 0; i < 10; i++) 5 { 6 container.push_back(i); 7 } 8 9 vector<int>::iterator iter; 10 for (iter = container.begin(); iter != container.end();) 11 { 12 if (*iter > 3) { 13 iter = container.erase(iter); 14 } 15 else { 16 iter ++; 17 } 18 19 } 20 21 for (iter = container.begin(); iter != container.end(); iter++) 22 { 23 cout<<*iter<<endl; 24 } 25 }
总结:vector是一个顺序容器,在内存中是一块连续的内存,当删除一个元素后,内存中的数据会发生移动,以保证数据的紧凑。所以删除一个数据后,其他数据的地址发生了变化,之前获取的迭代器根据原有的信息就访问不到正确的数据。
所以为了防止vector迭代器失效,常用如下方法:
1 for (iter = container.begin(); iter != container.end(); ) 2 { 3 if (*iter > 3) 4 iter = container.erase(iter); //erase的返回值是删除元素下一个元素的迭代器 5 else{ 6 iter++; 7 } 8 }
这样删除后iter指向的元素后,返回的是下一个元素的迭代器,这个迭代器是vector内存调整过后新的有效的迭代器。
二、关联式容器
对于关联容器(如map, set,multimap,multiset),删除当前的iterator,仅仅会使当前的iterator失效,只要在erase时,递增当前iterator即可。这是因为map之类的容器,使用了红黑树来实现,插入、删除一个结点不会对其他结点造成影响。erase迭代器只是被删元素的迭代器失效,但是返回值为void,所以要采用erase(iter++)的方式删除迭代器。
1 for (iter = cont.begin(); it != cont.end();) 2 { 3 (*iter)->doSomething(); 4 if (shouldDelete(*iter)) 5 cont.erase(iter++); 6 else 7 ++iter; 8 } 9 10 //测试错误的Map删除元素 11 void mapTest() 12 { 13 map<int, string> dataMap; 14 15 16 for (int i = 0; i < 100; i++) 17 { 18 string strValue = "Hello, World"; 19 20 stringstream ss; 21 ss<<i; 22 string tmpStrCount; 23 ss>>tmpStrCount; 24 strValue += tmpStrCount; 25 dataMap.insert(make_pair(i, strValue)); 26 } 27 28 cout<<"MAP元素内容为:"<<endl; 29 map<int, string>::iterator iter; 30 for (iter = dataMap.begin(); iter != dataMap.end(); iter++) 31 { 32 int nKey = iter->first; 33 string strValue = iter->second; 34 cout<<strValue<<endl; 35 } 36 37 cout<<"内容开始删除:"<<endl; 38 //删除操作引发迭代器失效 39 for (iter = dataMap.begin(); iter != dataMap.end();iter++) 40 { 41 int nKey = iter->first; 42 string strValue = iter->second; 43 44 if (nKey % 2 == 0) 45 { 46 dataMap.erase(iter); //错误 47 48 } 49 /* cout<<iter->second<<endl;*/ 50 } 51 }
出错:
解析:dataMap.erase(iter)之后,iter就已经失效了,所以iter无法自增,即iter++就会出bug.解决方案,就是在iter失效之前,先自增。
1 void mapTest() 2 { 3 map<int, string> dataMap; 4 5 6 for (int i = 0; i < 100; i++) 7 { 8 string strValue = "Hello, World"; 9 10 stringstream ss; 11 ss<<i; 12 string tmpStrCount; 13 ss>>tmpStrCount; 14 strValue += tmpStrCount; 15 dataMap.insert(make_pair(i, strValue)); 16 } 17 18 cout<<"MAP元素内容为:"<<endl; 19 map<int, string>::iterator iter; 20 for (iter = dataMap.begin(); iter != dataMap.end(); iter++) 21 { 22 int nKey = iter->first; 23 string strValue = iter->second; 24 cout<<strValue<<endl; 25 } 26 27 cout<<"内容开始删除:"<<endl; 28 for (iter = dataMap.begin(); iter != dataMap.end();) 29 { 30 int nKey = iter->first; 31 string strValue = iter->second; 32 33 if (nKey % 2 == 0) 34 { 35 dataMap.erase(iter++); 36 auto a = iter; 37 38 } 39 else { 40 iter ++; 41 } 42 } 43 }
解析:dataMap.erase(iter++);这句话分三步走,先把iter传值到erase里面,然后iter自增,然后执行erase,所以iter在失效前已经自增了。
map是关联容器,以红黑树或者平衡二叉树组织数据,虽然删除了一个元素,整棵树也会调整,以符合红黑树或者二叉树的规范,但是单个节点在内存中的地址没有变化,变化的是各节点之间的指向关系。
所以在map中为了防止迭代器失效,在有删除操作时,常用如下方法:
1 for (iter = dataMap.begin(); iter != dataMap.end(); ) 2 { 3 int nKey = iter->first; 4 string strValue = iter->second; 5 6 if (nKey % 2 == 0) 7 { 8 map<int, string>::iterator tmpIter = iter; 9 iter++; 10 dataMap.erase(tmpIter); 11 //dataMap.erase(iter++) 这样也行 12 13 }else 14 { 15 iter++; 16 } 17 }
三、链表式容器
对于链表式容器(如list),删除当前的iterator,仅仅会使当前的iterator失效,这是因为list之类的容器,使用了链表来实现,插入、删除一个结点不会对其他结点造成影响。只要在erase时,递增当前iterator即可,并且erase方法可以返回下一个有效的iterator。
方式一:递增当前iterator
1 for (iter = cont.begin(); it != cont.end();) 2 { 3 (*iter)->doSomething(); 4 if (shouldDelete(*iter)) 5 cont.erase(iter++); 6 else 7 ++iter; 8 }
方式二:通过erase获得下一个有效的iterator
1 for (iter = cont.begin(); iter != cont.end();) 2 { 3 (*it)->doSomething(); 4 if (shouldDelete(*iter)) 5 iter = cont.erase(iter); //erase删除元素,返回下一个迭代器 6 else 7 ++iter; 8 }
四、总结
迭代器失效分三种情况考虑,也是分三种数据结构考虑,分别为数组型,链表型,树型数据结构。
数组型数据结构:该数据结构的元素是分配在连续的内存中,insert和erase操作,都会使得删除点和插入点之后的元素挪位置,所以,插入点和删除掉之后的迭代器全部失效,也就是说insert(*iter)(或erase(*iter)),然后在iter++,是没有意义的。解决方法:erase(*iter)的返回值是下一个有效迭代器的值。 iter =cont.erase(iter);
链表型数据结构:对于list型的数据结构,使用了不连续分配的内存,删除运算使指向删除位置的迭代器失效,但是不会失效其他迭代器.解决办法两种,erase(*iter)会返回下一个有效迭代器的值,或者erase(iter++).
树形数据结构: 使用红黑树来存储数据,插入不会使得任何迭代器失效;删除运算使指向删除位置的迭代器失效,但是不会失效其他迭代器.erase迭代器只是被删元素的迭代器失效,但是返回值为void,所以要采用erase(iter++)的方式删除迭代器。
注意:经过erase(iter)之后的迭代器完全失效,该迭代器iter不能参与任何运算,包括iter++,*ite