JavaCollection-003⾼效的出两个List中的不同元素
如题:有List<String> list1和List<String> list2,两个集合各有上万个元素,怎样取出两个集合中不同的元素?
⽅法1:遍历两个集合
1public static void main(String[] args) {
2        List<String> list1 = new ArrayList<String>();
3        List<String> list2 = new ArrayList<String>();
4
5for(int i = 0; i < 10000; i++){
6            list1.add("test" + i);
7            list2.add("test" + i*2);
8        }
9        getDifferent(list1, list2);
10        getDiffrent2(list1, list2);
11        getDiffrent3(list1, list2);
12        getDiffrent4(list1, list2);
13    }
14
15private static List<String> getDifferent(List<String> list1, List<String> list2){
16long startTime = System.currentTimeMillis();
17        List<String> diff = new ArrayList<String>();
18for(String str : list1){
19if(!ains(str)){
20                diff.add(str);
21            }
22        }
23        System.out.println("Total Time: " + (System.currentTimeMillis() - startTime));
24return diff;
25    }
千万不要采⽤这种⽅法,总共要循环的次数是两个List的size相乘的积,从输出看耗时也是⽐较长的,那么我们有没有其他的⽅法呢?当然有.
⽅法2:采⽤List提供的retainAll()⽅法:
1public static void main(String[] args) {
2        List<String> list1 = new ArrayList<String>();
3        List<String> list2 = new ArrayList<String>();
4
5for (int i = 0; i < 10000; i++) {
6            list1.add("test" + i);
7            list2.add("test" + i * 2);
8        }
9        getDifferent(list1, list2);
10    }
11
12private static List<String> getDiffrent2(List<String> list1, List<String> list2) {
13long startTime = System.currentTimeMillis();
14        ainAll(list2);
15        System.out.println("Total Time: " + (System.currentTimeMillis() - startTime));
16return list1;
17    }
很遗憾,这种⽅式虽然只要⼏⾏代码就搞定,但是这个却更耗时,查看retainAll()的源码:
1public boolean retainAll(Collection<?> c) {
2boolean modified = false;
3 Iterator<E> e = iterator();
4while (e.hasNext()) {
5if (!c.())) {
ve();
7 modified = true;
8 }
9 }
10return modified;
11 }
⽆需解释这个耗时是必然的,那么我们还有没有更好的办法呢?仔细分析以上两个⽅法中我都做了mXn次循环,其实完全没有必要循环这么多次,我们的需求是出两个List中
的不同元素,那么我可以这样考虑:⽤⼀个map存放lsit的所有元素,其中的key为lsit1的各个元素,value为该元素出现的次数,接着把list2的所有元素也放到map⾥,如果已经存在
则value加1,最后我们只要取出map⾥value为1的元素即可,这样我们只需循环m+n次,⼤⼤减少了循环的次数。
1private static List<String> getDiffrent3(List<String> list1, List<String> list2) {
2long startTime = System.currentTimeMillis();
怎么截取一个字符串的后两位3        Map<String, Integer> map = new HashMap<String, Integer>(list1.size() + list2.size());
4        List<String> diff = new ArrayList<String>();
5for (String string : list1) {
6            map.put(string, 1);
7        }
8for (String string : list2) {
9            Integer cc = (string);
10if (cc != null) {
11                map.put(string, ++cc);
12continue;
13            }
14            map.put(string, 1);
15        }
16for (Map.Entry<String, Integer> entry : Set()) {
17if (Value() == 1) {
18                diff.Key());
19            }
20        }
21        System.out.println("Total Time: " + (System.currentTimeMillis() - startTime));
22return list1;
23    }
显然,这种⽅法⼤⼤减少耗时,是⽅法1的1/4,是⽅法2的1/40,这个性能的提升时相当可观的,但是,
这不是最佳的解决⽅法,观察⽅法3我们只是随机取了⼀个list作为⾸次添加的标准,这样⼀旦我们的list2⽐list1的size⼤,则我们第⼆次put时的if判 1private static List<String> getDiffrent4(List<String> list1, List<String> list2) {
2long st = System.nanoTime();
3        Map<String,Integer> map = new HashMap<String,Integer>(list1.size()+list2.size());
4        List<String> diff = new ArrayList<String>();
5        List<String> maxList = list1;
6        List<String> minList = list2;
7if(list2.size()>list1.size())
8        {
9            maxList = list2;
10            minList = list1;
11        }
12for (String string : maxList) {
13            map.put(string, 1);
14        }
15for (String string : minList) {
16            Integer cc = (string);
17if(cc!=null)
18            {
19                map.put(string, ++cc);
20continue;
21            }
22            map.put(string, 1);
23        }
24for(Map.Entry<String, Integer> Set())
25        {
Value()==1)
27            {
28                diff.Key());
29            }
30        }
31        System.out.println("getDiffrent4 total times "+(System.nanoTime()-st));
32return diff;
33
34    }
这⾥对连个list的⼤⼩进⾏了判断,⼩的在最后添加,这样会减少循环⾥的判断,性能⼜有了⼀定的提升,正如⼀位朋友所说,编程是⽆⽌境的,只要你认真去思考了,总会到更好的⽅法!
⾮常感谢binglian的指正,针对List有重复元素的问题,做以下修正,⾸先明确⼀点,两个List不管有多少个重复,只要重复的元素在两个List都能到,则不应该包含在返回值⾥⾯,所以在做第⼆次循环时,这样判断:如果当前元素在map中不到,则肯定需要添加到返回值中,如果能到则value++,遍历完之后diff⾥⾯已经包含了只在list2⾥⽽没在list2⾥的元素,剩下的⼯作就是到list1⾥有list2⾥没有的元素,遍历map取value为1的即可:
1private static List<String> getDiffrent5(List<String> list1, List<String> list2) {
2long st = System.nanoTime();
3          List<String> diff = new ArrayList<String>();
4          List<String> maxList = list1;
5          List<String> minList = list2;
6if(list2.size()>list1.size())
7          {
8              maxList = list2;
9              minList = list1;
10          }
11          Map<String,Integer> map = new HashMap<String,Integer>(maxList.size());
12for (String string : maxList) {
13              map.put(string, 1);
14          }
15for (String string : minList) {
(string)!=null)
17              {
18                  map.put(string, 2);
19continue;
20              }
21              diff.add(string);
22          }
23for(Map.Entry<String, Integer> Set())
24          {
Value()==1)
26              {
27                  diff.Key());
28              }
29          }
30        System.out.println("getDiffrent5 total times "+(System.nanoTime()-st));
31return diff;
32
33    }

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。