在公司做项目需要求两个集合的补集,考虑到collection类有removeAll方法,决定采用这种方式;结果程序一直卡在那儿不动了;
数据量是两个集合的数据差不多都有60万,直接导致程序处于假死状态(程序当然是还在运行);
出现问题始终要解决的,我又给程序修改为先用retainAll求交集,然后再removeAll的方式,效果不明显(事实是也假死了),我的应用场景还要求实时性,没办法只能从其他方面找寻思路了;
- 既然removeAll执行效率低,我就改成循环remove试试看,结果是效率上有了一定的提升(在此需要注意list要倒序循环,因为remove是删除了下标,删除了之后后边的元素会前移),但是效果仍然不明显;
- 另外一种是采用Iterator迭代器,这种方式我们仅需要对iterator进行循环,然后对需要删除的元素执行iterator.remove(iterator.next()),而无需关注下标的问题;
结合list的特性,LinkedList插入删除效率高,ArrayList查询效率高,对这里的使用场景我们显然需要将集合转换成LinkedList,小集合需要查询换成ArrayList。
以下是我对list的优化工具类,执行结果较其他方法不是一个数量级的提升!,代码如下
public static List removeAll(List src,List oth){ List result = new LinkedList(src);//大集合用linkedlist ArrayList othHash = new ArrayList(oth);//小集合用ArrayList Iterator iter = result.iterator();//采用Iterator迭代器进行数据的操作 while(iter.hasNext()){ if(othHash.contains(iter.next())){ iter.remove(); } } return result; }
50w对比数据30w的数据量用时128毫秒