set是基于哈希表的无序唯一可变容器,要求元素可哈希;list不可哈希故无法入set;tuple可哈希需其元素皆可哈希;去重可转可哈希表示;&与intersection行为一致但后者更灵活;set无索引,pop随机移除元素;遍历时修改会报错;带_update的方法原地修改。

Python 的 set 不是“更轻量的列表”,它是基于哈希表实现的无序、唯一、可变容器,底层依赖对象的 __hash__ 和 __eq__ 行为——这意味着自定义类想进 set,必须同时满足可哈希且逻辑相等判断合理。
为什么 set([1, 2, 3]) 能用,但 set([[1], [2]]) 直接报错?
因为 list 是可变类型,默认不可哈希,其 __hash__ 方法被设为 None。尝试放入 set 会触发 TypeError: unhashable type: 'list'。
- 只有不可变内置类型(
int、str、tuple、frozenset)默认可哈希 -
tuple可哈希的前提是其所有元素都可哈希((1, [2])也不行) - 若需对可变结构去重,先转成可哈希表示:比如
set(tuple(x) for x in list_of_lists)
用 set.intersection() 还是 &?性能和语义有区别吗?
两者行为完全一致,但调用方式影响可读性和灵活性:
-
a & b & c更紧凑,适合已知固定数量集合的链式交集 -
a.intersection(b, c)支持传入任意可迭代对象(如range、生成器),不强制要求是set实例 - 性能上无差异,底层都走同一 C 函数;但
intersection()在传入非set时会内部临时构造set,有轻微开销
valid_ids = {101, 102, 103}
user_input = range(100, 105)
# ✅ 推荐:支持任意可迭代对象
result = valid_ids.intersection(user_input)
⚠️ 下面会报错,因为 range 不支持 & 运算符重载
result = valid_ids & user_input # TypeError
为什么修改集合元素时不能用索引,但 pop() 却能删元素?
set 是无序结构,没有位置概念,因此不支持 my_set[0] 或切片。但 pop() 并不是“弹出最后一个”,而是**随机移除并返回一个元素**(CPython 中实际是按哈希桶顺序取第一个非空桶的首个元素,但不应依赖此行为)。
立即学习“Python免费学习笔记(深入)”;
-
pop()在空集合上调用会抛KeyError,和dict.pop()一致 - 需要确定性删除时,不要用
pop(),改用remove(x)(不存在时报错)或discard(x)(安静忽略) - 遍历中修改集合会触发
RuntimeError: Set changed size during iteration,必须用list(my_set)快照再操作
真正容易被忽略的是:集合运算返回新对象,但 update()、intersection_update() 等带 _update 后缀的方法是原地修改——混用时若没注意是否改变了原集合,后续逻辑可能意外失效。










