HashSet通过hashCode()和equals()实现去重,添加元素时先计算哈希值定位存储位置,若存在冲突则调用equals()判断是否重复,重复则不插入。对于自定义对象如Person,必须重写hashCode()和equals()方法以确保逻辑正确;内置类型如String、Integer已实现相关方法,可直接去重。示例中字符串数组{"apple", "banana", "apple", "orange", "banana"}去重后结果为[banana, orange, apple](顺序不保证);Person类重写后可基于name和age去重,相同属性的对象被视为重复。注意事项:HashSet不保证顺序,可用LinkedHashSet保持插入顺序;允许一个null元素;应合理重写hashCode()减少哈希冲突;推荐使用IDE自动生成equals()和hashCode()方法。掌握这些原则即可高效利用HashSet实现去重。

在Java中,HashSet 是基于哈希表实现的 Set 接口的集合类,它天然支持元素的唯一性,也就是说,不允许重复元素。因此,使用 HashSet 实现去重非常简单高效。
HashSet 去重的基本原理
HashSet 通过对象的 equals() 和 hashCode() 方法来判断两个对象是否相等。当添加一个元素时:
- 先调用该对象的
hashCode()方法计算哈希值,确定存储位置。 - 如果该位置已有元素,则进一步调用
equals()方法判断是否为重复对象。 - 若判定为重复,则不会插入新元素,从而实现去重。
因此,要确保自定义对象能正确去重,必须重写 hashCode() 和 equals() 方法。
基本类型去重示例
对于 String、Integer 等 Java 内置类型,已经实现了正确的 hashCode() 和 equals(),可直接用于去重:
立即学习“Java免费学习笔记(深入)”;
import java.util.HashSet; import java.util.Arrays;public class DedupExample { public static void main(String[] args) { String[] data = {"apple", "banana", "apple", "orange", "banana"}; HashSet
set = new HashSet<>(Arrays.asList(data)); System.out.println(set); // 输出:[banana, orange, apple](顺序不保证) }}
自定义对象去重的关键步骤
如果你有一个自定义类(如 Person),需要手动重写 equals() 和 hashCode() 才能实现去重:
class Person {
private String name;
private int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (!(o instanceof Person)) return false;
Person person = (Person) o;
return age == person.age && name.equals(person.name);
}
@Override
public int hashCode() {
return name.hashCode() * 31 + age;
}
@Override
public String toString() {
return "Person{" + "name='" + name + '\'' + ", age=" + age + '}';
}}
使用示例:
HashSetpeople = new HashSet<>(); people.add(new Person("Alice", 25)); people.add(new Person("Bob", 30)); people.add(new Person("Alice", 25)); // 重复对象 System.out.println(people.size()); // 输出:2 System.out.println(people); // 不会包含重复的 Alice,25
注意事项与建议
- HashSet 不保证元素顺序,如需有序去重,可使用
LinkedHashSet。 - HashSet 允许一个 null 元素。
- 重写
hashCode()时,应确保相同对象返回相同哈希值,不同对象尽量避免哈希冲突。 - IDE(如 IntelliJ 或 Eclipse)通常提供自动生成
equals()和hashCode()的功能,可节省时间。
基本上就这些。只要理解了哈希机制和方法重写的重要性,用 HashSet 去重就很自然了。










