Python中对象比较与排序需区分值相等(==,调用__eq__)和同一性(is,比较id);sorted()返回新列表,list.sort()原地排序;set无序不可排序,去重后需转list再排序。

Python中对象的比较与排序,核心在于明确“值相等”和“顺序大小”的区别;集合(set)本身无序且不支持排序,但可与其他数据结构配合实现去重、交并差等逻辑。关键不是硬套规则,而是理解底层机制再选合适工具。
对象比较:== 与 is 的本质区别
== 判断两个对象的值是否相等,调用的是 __eq__ 方法;is 判断是否为同一内存对象(即 id 是否相同)。自定义类若未重写 __eq__,默认行为等同于 is。
- 字符串、数字等不可变类型,小范围整数(-5 到 256)和短字符串可能被缓存,导致 is 偶尔返回 True,但这不是规范保证,切勿依赖
- 列表、字典、自定义实例默认 == 比较内容(递归),但 is 几乎总为 False,除非显式赋值引用同一对象
- 需自定义比较逻辑时,在类中实现 __eq__(和 __hash__ 若需放入 set/dict)
排序基础:sorted() 与 list.sort()
sorted() 返回新列表,原对象不变;list.sort() 就地排序,返回 None。两者都接受 key 参数指定排序依据,reverse 控制升/降序。
- key 应为函数,接收单个元素,返回用于比较的值。例如 sorted(data, key=lambda x: x.name) 按 name 属性排
- 若元素本身不支持直接比较(如含 None、混合类型或自定义对象无 __lt__),必须提供 key,否则报 TypeError
- 稳定排序:相同 key 值的元素保持原有相对顺序,Python 的 sort 保证稳定
集合(set)的正确使用场景
set 是无序、唯一、可变的哈希容器,不支持索引、切片或排序操作。它适合快速查重、成员判断、集合运算,而非存储有序数据。
立即学习“Python免费学习笔记(深入)”;
- 创建:s = {1, 2, 3} 或 s = set([1, 2, 3]);空集合只能用 set(),{} 是空字典
- 常见操作:s.add(x)、s.discard(x)(不存在不报错)、s.remove(x)(不存在报错)、s.pop()(随机删一个)
- 集合运算:s1 & s2(交集)、s1 | s2(并集)、s1 - s2(差集)、s1 ^ s2(对称差);也可用方法形式如 s1.intersection(s2)
- 若需“去重后排序”,先转 list 再 sorted(list(s)),不要试图对 set 排序
混合使用:排序 + 集合去重的典型组合
实际开发常需“去重后按某规则排序”。此时应分两步:先用 set 或 dict.fromkeys() 去重(保持插入顺序可用 dict.fromkeys(lst).keys()),再排序。
- 例:对用户列表按年龄去重(同名同龄算重复)后按分数降序:sorted(set(users), key=lambda u: u.score, reverse=True)
- 注意:set(users) 要求 users 中对象已实现 __eq__ 和 __hash__,否则报错;更稳妥做法是提取关键字段构造 frozenset 或 tuple 去重
- 大数据量时,用 set 记录已见 key(如 name),遍历原列表筛选,再排序,避免全量构造中间集合










