去重需先排序再用std::unique与erase组合,或用unordered_set配合remove_if保持顺序。std::unique仅移除连续重复元素并返回新末尾,需erase清理内存;保持顺序时使用哈希表记录已见元素,遍历一次完成去重,时间复杂度O(n)。

在C++中,对vector进行去重是一个常见需求。最高效且常用的方法是结合使用std::unique和vector::erase。需要注意的是,std::unique并不会真正删除元素,它只是将重复的元素“移到”容器末尾,因此必须配合erase才能实现真正的内存清理。
使用unique与erase组合去重
std::unique要求容器中的元素是已排序的,否则只会去除连续重复的元素。因此,在使用前通常需要先排序。
基本步骤如下:
- 调用
std::sort对vector排序,使相同元素相邻 - 使用
std::unique将重复元素移动到末尾,并返回新的逻辑结尾迭代器 - 用
erase删除从该迭代器到实际末尾的所有元素
#include#include #include int main() { std::vector vec = {5, 2, 8, 2, 1, 5, 3}; // 排序使相同元素相邻 std::sort(vec.begin(), vec.end()); // 去重并擦除 vec.erase(std::unique(vec.begin(), vec.end()), vec.end()); // 输出结果:1 2 3 5 8 for (int n : vec) std::cout << n << " "; }
保持原始顺序的去重方法
如果不想改变原vector的元素顺序,就不能先排序。此时可以借助std::unordered_set记录已出现的元素,然后使用std::remove_if配合自定义谓词来标记重复项。
立即学习“C++免费学习笔记(深入)”;
示例代码(保持顺序):std::vectorvec = {5, 2, 8, 2, 1, 5, 3}; std::unordered_set seen; vec.erase( std::remove_if(vec.begin(), vec.end(), [&seen](const int& value) { if (seen.count(value)) { return true; // 标记为待移除 } seen.insert(value); return false; }), vec.end() );
这种方法遍历一次vector,利用哈希表快速查找,时间复杂度为O(n),适合对顺序敏感的场景。
unique函数的工作原理说明
std::unique会比较相邻元素,若相等则跳过后面的元素,只保留第一个。它返回一个迭代器,指向去重后的新末尾。原容器大小不变,被“去重”的元素仍存在于内存中,直到手动erase。
关键点:
-
std::unique不改变容器大小 - 只对连续重复元素有效,因此常需预排序
- 可用于自定义比较函数,如忽略大小写去重字符串
基本上就这些。掌握unique和erase的组合用法,能高效处理大多数去重场景。是否排序取决于是否需要保持原有顺序。不复杂但容易忽略细节。










