std::set底层是红黑树,插入自动排序且去重;需为自定义类型提供严格弱序比较;支持O(log n)查找/删除/插入,但遍历缓存不友好;不保留插入顺序,需顺序去重时应选其他容器。

std::set 本质就是红黑树,插入即排序且去重
std::set 在 C++ 标准库中底层实现为红黑树(Red-Black Tree),这意味着它天然支持:插入时自动按 operator 排序、自动跳过重复元素、查找/删除/插入平均时间复杂度为 O(log n)。你不需要手动调用排序函数,也不需要额外做去重逻辑——只要用 std::set 存储,这两件事就已由容器完成。
插入元素后无需 sort,但要注意自定义类型的比较规则
对内置类型(如 int、std::string)直接可用;但若存自定义结构体或类,必须提供严格弱序(strict weak ordering)的比较方式,否则编译失败或行为未定义:
- 最常用的是重载
operator 成员函数,要求逻辑自洽(比如不能出现a 同时为真) - 也可传入仿函数(functor)或 lambda(C++17 起支持,但需注意 lambda 类型无法作为模板参数直接写进
std::set,通常用std::function或独立 struct 更稳妥) - 误用
==或实现比较会导致插入异常或查找失效
struct Point {
int x, y;
bool operator<(const Point& other) const {
return x != other.x ? x < other.x : y < other.y;
}
};
std::set s = {{2,3}, {1,5}, {2,3}}; // {1,5} 和 {2,3} 共存,重复 {2,3} 被忽略
查找比 vector + find 快,但遍历不如 vector 局部性好
当你频繁执行「是否存在某值」或「找大于某值的最小元素」这类操作时,std::set::find()、lower_bound()、upper_bound() 都是 O(log n);而 std::vector 即使已排序,也需手写二分(std::lower_bound)才能达到同样效率,且无法自动去重。
-
s.find(x) != s.end()是标准的存在性检查写法 -
s.lower_bound(x)返回第一个>= x的迭代器,比先find再++更安全 - 不要用
std::set存大量数据后反复遍历——红黑树节点分散在堆上,缓存不友好,std::vector+std::sort+std::unique在只读场景下可能更快
想保留插入顺序又去重?std::set 不适合,换 std::unordered_set 或 pair+vector
std::set 强制按关键字排序,完全放弃原始插入顺序。如果你实际要的是「第一次出现的元素保留,后续重复跳过,且按插入顺序遍历」,那 std::set 就不是解法:
Easily find JSON paths within JSON objects using our intuitive Json Path Finder
立即学习“C++免费学习笔记(深入)”;
-
std::unordered_set提供O(1)平均查找和去重,但无序;可配合std::vector记录唯一元素的插入顺序 - 或者用
std::map记录首次出现位置,再按位置排序——但这已脱离「自动排序」需求 - 别试图用
std::set存std::pair来模拟顺序:破坏了 key 的语义,find(value)失效,得改用lower_bound配合自定义比较,徒增复杂度
红黑树的「自动排序」和「去重」是一体两面,启用其中一个,另一个就不可绕过。真正要权衡的从来不是「能不能做到」,而是「这个有序性是否恰好匹配你的访问模式」。









