多个集合快速找出重复数据的两种方法

多个集合如何取出交集 (重复的数据)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
import java.util.*;
import java.util.function.Function;
import java.util.stream.Collectors;
import java.util.stream.Stream;

public class CollectionDuplicates {
public static void main(String[] args) {


// 方法1
List<Integer> list1 = Arrays.asList(1, 2, 3, 4, 5);
List<Integer> list2 = Arrays.asList(4, 5, 6, 7, 8);
List<Integer> list3 = Arrays.asList(5, 6, 8, 9);

Set<Integer> set1 = new HashSet<>(list1);
Set<Integer> set2 = new HashSet<>(list2);
Set<Integer> set3 = new HashSet<>(list3);

set1.retainAll(set2);
set1.retainAll(set3);

System.out.println("重复元素: " + set1);

// 方法2
List<Integer> duplicates = Stream.of(list1, list2, list3)
.flatMap(Collection::stream)
.collect(Collectors.groupingBy(Function.identity(), Collectors.counting()))
.entrySet()
.stream()
.filter(e -> e.getValue() > 1)
.map(Map.Entry::getKey)
.collect(Collectors.toList());

System.out.println("重复元素: " + duplicates);

}
}

结果

1
2
重复元素: [5]
重复元素: [4, 5, 6, 8]

注意

方法1:三个List集合(list1、list2和list3),然后将它们分别转换为Set集合(set1、set2和set3)。接下来,我们使用set1的retainAll()方法依次取交集,并将结果存储回set1中。最后,我们打印出set1中的元素,即为重复出现的元素。

可以将此代码用于任意数量的列表,只需将它们添加到数组中并转换为Set集合,并使用Set的retainAll()方法依次取交集即可。这种方法是集合依次取交集,list1 和 list3 重复的元素就不能打印出。

方法2:使用Stream.of()方法将它们转换为一个Stream。接下来,我们使用flatMap()方法将所有元素连接到一个单独的Stream中,并使用groupingBy()方法将它们分组并计算它们的出现次数。然后,我们过滤出出现次数大于1的元素,并使用map()方法将它们转换为一个List集合。最后,我们打印出这个List集合,即为重复出现的元素。

这种方法的好处是代码简洁、易于阅读和理解,并且在处理大型数据集时具有较好的性能。