std::unique仅移除相邻重复元素并返回新逻辑结尾迭代器,不改变容器大小;需先排序、再unique、最后erase才能真正去重。

std::unique 本身不会真正删除元素
std::unique 只是把重复元素“挤到后面”,并返回一个指向新逻辑结尾的迭代器;它不改变容器大小,也不会自动调用 erase。如果你只调用 std::unique 而不配合 erase,向量长度和内容看起来都没变。
- 必须先对容器排序(否则
unique只能去除**相邻重复项**) - 必须用返回的迭代器配合
erase才算真正删掉重复元素 - 对
std::vector操作时,典型写法是:vec.erase(std::unique(vec.begin(), vec.end()), vec.end())
为什么必须先 sort 再 unique
std::unique 只比较相邻元素:它从头开始遍历,跳过与前一个相同的元素。如果原始数据是 {3, 1, 3, 2, 1},不排序直接 unique 得到的是 {3, 1, 3, 2, 1}(无变化),因为没一对相邻元素相等。
- 排序后变成
{1, 1, 2, 3, 3},这时unique才能把相邻重复项合并为{1, 2, 3, ?, ?} - 如果不关心原始顺序,
sort + unique + erase是最常用组合 - 如果要保序去重(如按首次出现顺序),就不能用
sort,得换哈希表辅助,unique不适用
完整可运行示例(C++11 及以上)
std::vectorv = {5, 1, 3, 1, 5, 2, 3}; std::sort(v.begin(), v.end()); // → {1, 1, 2, 3, 3, 5, 5} auto last = std::unique(v.begin(), v.end()); // → {1, 2, 3, 5, ?, ?, ?},last 指向第5个元素 v.erase(last, v.end()); // 真正截断,v 变成 {1, 2, 3, 5}
注意自定义类型去重的陷阱
对 struct 或 class 使用 std::unique,前提是已定义好 operator==;若用 std::sort,还必须提供 operator 或传入比较函数。否则编译失败。
- 比如
std::vector<:string>没问题,因为标准库已重载 - 但
std::vector需要你手动实现bool operator==(const MyPoint& a, const MyPoint& b) - 如果比较逻辑复杂(如浮点近似相等),不能直接用
==,得传自定义谓词给unique和sort
sort + unique 这个组合动作,单独看任何一个都没法完成“去重”目标;最容易漏掉的是 erase 这一步,或者误以为 unique 能处理非相邻重复。










