Java中Set适用于去重、判断存在性及集合运算场景,底层由HashSet(哈希表)、TreeSet(红黑树)或LinkedHashSet(链表+哈希表)实现,自动拒绝重复元素,不维护顺序(TreeSet除外),时间复杂度接近O(1),但不适用于需索引访问、计数或键值映射的场景。

Java中的Set适合处理需要去重、不关心顺序、只关注元素是否存在的数据场景。它底层通过哈希表(HashSet)、红黑树(TreeSet)或链表+哈希表(LinkedHashSet)实现,天然拒绝重复元素,是判断“有无”而非“多少”或“先后”的首选。
去重:自动过滤重复数据
当从数据库查出一批用户ID、日志中提取唯一IP、或合并多个列表时,重复项不仅冗余,还可能引发逻辑错误。Set在add时自动判断并忽略重复元素,无需手动遍历比对。
- HashSet.add()时间复杂度接近O(1),插入10万个字符串也能快速完成去重
- 注意:自定义对象需正确重写hashCode()和equals(),否则同一语义对象可能被当作不同元素存入
- 示例:List
raw = Arrays.asList("a", "b", "a", "c"); Set unique = new HashSet(raw); // 结果为[a, b, c](顺序不定)
成员判断:高效检查元素是否存在
相比List.contains()的O(n)遍历,HashSet.contains()平均只需O(1),适合高频查询场景,比如权限校验、黑名单拦截、缓存key存在性检测。
- if (roleSet.contains("ADMIN")) { ... } 比遍历角色列表快得多
- TreeSet支持范围查询(如subSet("A", "M")),适合按字典序做区间筛选
- LinkedHashSet保留插入顺序,contains()同样高效,且迭代结果可预测
集合运算:简洁实现交集、并集、差集
Set接口原生支持retainAll()(交集)、addAll()(并集)、removeAll()(差集),代码直观,避免嵌套循环。
立即学习“Java免费学习笔记(深入)”;
- Set
usersInBeijing = new HashSet(userDao.findByCity("北京")); Set vipUsers = new HashSet(userDao.findVipIds()); usersInBeijing.retainAll(vipUsers); // 得到北京的VIP用户ID - 操作前建议用new HashSet(original)复制一份,避免修改原始集合
- 不可变场景可用Collections.unmodifiableSet()封装,防止意外修改
不适合的场景要避开
Set不是万能容器。若需按插入顺序遍历且频繁查下标、统计某元素出现次数、或依赖索引操作(如get(5)),应选List;若需键值映射,用Map更合适。
- 想记录“用户登录了3次”,用Map
计数,而非往Set里加3个相同User(只会存1个) - 需要“第2次登录的用户是谁”,List
保留全部记录,再用Stream.distinct()或Set辅助去重 - TreeSet虽有序,但排序开销比HashSet大,纯去重优先选HashSet
基本上就这些。用对Set,代码更简洁,性能更稳;用错地方,反而绕弯路。关键记住三个字:不重复。










