面试中经常被问到的list如何去重,用来考察你对list数据结构,以及相关方法的掌握,体现你的java基础学的是否牢固。
我们大家都知道,set集合的特点就是没有重复的元素。如果集合中的数据类型是基本数据类型,可以直接将list集合转换成set,就会自动去除重复的元素,这个就相对比较简单。如下示例:
1 public class Test { 2 public static void main(String[] args) { 3 List list = new ArrayList(); 4 list.add(11); 5 list.add(12); 6 list.add(13); 7 list.add(14); 8 list.add(15); 9 list.add(11); 10 System.out.println(list); 11 Set set = new HashSet(); 12 List newList = new ArrayList(); 13 set.addAll(list); 14 newList.addAll(set); 15 System.out.println(newList); 16 } 17 }
输出结果为:
我们可以看到去重成功了。
在面试中被问到list去重问题,大部分回答都会是list和set互转,利用set自动去除重复属性的方法去重,但是这样的回答并不会得分。当list集合中存储的类型是对象类型的时候,我们就不能简单的只把list集合转换成set集合。我们定义一个对象类:
1 public class People { 2 3 private String name; 4 private String phoneNumber; 5 6 public String getName() { 7 return name; 8 } 9 10 public void setName(String name) { 11 this.name = name; 12 } 13 14 public String getPhoneNumber() { 15 return phoneNumber; 16 } 17 18 public void setPhoneNumber(String phoneNumber) { 19 this.phoneNumber = phoneNumber; 20 } 21 22 public People(String name, String phoneNumber) { 23 super(); 24 this.name = name; 25 this.phoneNumber = phoneNumber; 26 } 27 28 @Override 29 public String toString() { 30 return "People{" + 31 "name='" + name + '\'' + 32 ", phoneNumber='" + phoneNumber + '\'' + 33 '}'; 34 } 35 36 }
我们使用上面的set去重的方法去重:
1 public static void main(String[] args) { 2 ListlistPeople = new ArrayList (); 3 listPeople.add(new People("张三", "11111")); 4 listPeople.add(new People("张三", "22222")); 5 listPeople.add(new People("李四", "33333")); 6 listPeople.add(new People("张三", "22222")); 7 8 Set setData = new HashSet (); 9 setData.addAll(listPeople); 10 System.out.println("list:" + listPeople.toString()); 11 System.out.println("set:" + setData.toString()); 12 13 }
运行后输出的结果为:
我们可以看到第二个张三和最后一个张三,信息都一样,却没有被去重。
当list集合中存储的是对象时,我们需要在对象的实体类中去重写equals()方法和hashCode()方法,如下:
1 public class People { 2 3 private String name; 4 private String phoneNumber; 5 6 public String getName() { 7 return name; 8 } 9 10 public void setName(String name) { 11 this.name = name; 12 } 13 14 public String getPhoneNumber() { 15 return phoneNumber; 16 } 17 18 public void setPhoneNumber(String phoneNumber) { 19 this.phoneNumber = phoneNumber; 20 } 21 22 public People(String name, String phoneNumber) { 23 super(); 24 this.name = name; 25 this.phoneNumber = phoneNumber; 26 } 27 28 @Override 29 public String toString() { 30 return "People{" + 31 "name='" + name + '\'' + 32 ", phoneNumber='" + phoneNumber + '\'' + 33 '}'; 34 } 35 36 @Override 37 public boolean equals(Object arg0) { 38 // TODO Auto-generated method stub 39 People p = (People) arg0; 40 return name.equals(p.name) && phoneNumber.equals(p.phoneNumber); 41 } 42 43 @Override 44 public int hashCode() { 45 // TODO Auto-generated method stub 46 String str = name + phoneNumber; 47 return str.hashCode(); 48 } 49 50 }
时运行上面的test方法,去重就成功了。最后,我们拿出String中的equals()方法和hashCode()方法源码来加深认识:
equals()
1 public boolean equals(Object anObject) { 2 if (this == anObject) { 3 return true; 4 } 5 if (anObject instanceof String) { 6 String anotherString = (String)anObject; 7 int n = count; 8 if (n == anotherString.count) { 9 char v1[] = value; 10 char v2[] = anotherString.value; 11 int i = offset; 12 int j = anotherString.offset; 13 while (n-- != 0) { 14 if (v1[i++] != v2[j++]) 15 return false; 16 } 17 return true; 18 } 19 } 20 return false; 21 }
比较两个对象时,首先先去判断两个对象是否具有相同的地址,如果是同一个对象的引用,则直接放回true;如果地址不一样,则证明不是引用同一个对象,接下来就是挨个去比较两个字符串对象的内容是否一致,完全相等返回true,否则false。
hashCode()
1 public int hashCode() { 2 int h = hash; 3 if (h == 0 && count > 0) { 4 int off = offset; 5 char val[] = value; 6 int len = count; 7 for (int i = 0; i < len; i++) { 8 h = 31*h + val[off++]; 9 } 10 hash = h; 11 } 12 return h; 13 }
hashCode()官方定义:
hashcode方法返回该对象的哈希码值。支持该方法是为哈希表提供一些优点,例如,java.util.Hashtable 提供的哈希表。
hashCode 的常规协定是:
在 Java 应用程序执行期间,在同一对象上多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是对象上 equals 比较中所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。如果根据 equals(Object) 方法,两个对象是相等的,那么在两个对象中的每个对象上调用 hashCode 方法都必须生成相同的整数结果。以下情况不是必需的:如果根据 equals(java.lang.Object) 方法,两个对象不相等,那么在两个对象中的任一对象上调用 hashCode 方法必定会生成不同的整数结果。但是,程序员应该知道,为不相等的对象生成不同整数结果可以提高哈希表的性能。实际上,由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。(这一般是通过将该对象的内部地址转换成一个整数来实现的,但是 JavaTM 编程语言不需要这种实现技巧。)当equals方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。
当然,List去重的方法很多,可以用for循环或者使用java8新特性stream等等,下面分别介绍一下五种方法:
1 //新建一个list数组: 2 List list = new ArrayList(); 3 list.add(26); 4 list.add(39); 5 list.add(5); 6 list.add(40); 7 list.add(39); 8 list.add(25); 9 System.out.println(list); 10 //方法一:使用java8新特性stream进行List去重 11 List newList = list.stream().distinct().collect(Collectors.toList()); 12 System.out.println(“java8新特性stream去重:”+newList); 13 list.add(39); 14 //方法二:双重for循环去重 15 for (int i = 0; i < list.size(); i++) { 16 for (int j = 0; j < list.size(); j++) { 17 if(i!=j&&list.get(i)==list.get(j)) { 18 list.remove(list.get(j)); 19 } 20 } 21 } 22 System.out.println(“双重for循环去重:”+list); 23 list.add(39); 24 //方法三:set集合判断去重,不打乱顺序 25 Set set1 = new HashSet(); 26 List newList1 = new ArrayList(); 27 for (Integer integer : list) { 28 if(set1.add(integer)) { 29 newList1.add(integer); 30 } 31 } 32 System.out.println(“set集合判断去重:”+list); 33 list.add(39); 34 //方法四:遍历后判断赋给另一个list集合 35 List newList2 = new ArrayList(); 36 for (Integer integer : list) { 37 if(!newList2.contains(integer)){ 38 newList2.add(integer); 39 } 40 } 41 System.out.println(“赋值新list去重:”+newList2); 42 list.add(39); 43 //方法五:set和list转换去重 44 Set set2 = new HashSet(); 45 List newList3 = new ArrayList(); 46 set2.addAll(list); 47 newList3.addAll(set2); 48 System.out.println(“set和list转换去重:”+newList3);