类型擦除是C++中通过统一接口隐藏具体类型、实现运行时多态的惯用法,典型应用有std::function、std::any等;其核心是控制块封装构造/拷贝/析构/调用函数指针,并常结合小对象优化避免堆分配。

类型擦除(Type Erasure)是 C++ 中一种实现“运行时多态但不依赖继承”的高级技巧,核心思想是:**把具体类型的接口统一包装成某个固定接口,在外部完全隐藏底层类型信息**。它不是语言特性,而是一套惯用法(idiom),std::function、std::any、std::variant(部分)、boost::any 等都是其典型应用。
为什么需要类型擦除?
传统虚函数多态要求所有类型继承同一基类,且必须在编译期确定继承关系;而 std::function 要能存储任意可调用对象(lambda、函数指针、bind 表达式、仿函数类……),它们彼此毫无继承关系,类型千差万别。类型擦除绕开了继承约束,靠“间接层 + 统一接口 + 动态分发”达成泛化存储与调用。
std::function 是怎么做到“装下任意 callable”的?
std::function 的关键在于内部持有一个指向**类型无关的虚函数表(vtable)风格函数指针集合**的指针,以及一块能容纳各种大小对象的缓冲区(小对象优化 SOO)。它不直接存 T,而是存一个“类型擦除后的控制块(control block)”,该控制块里封装了:构造、拷贝、析构、调用这四类操作的函数指针。
例如,当你写:
立即学习“C++免费学习笔记(深入)”;
std::function
编译器会为这个 lambda 生成一个匿名类型(比如 lambda_abc123),然后在堆上(或栈内 SOO 区域)构造一个控制块,其中:
- construct 指向一个函数:负责在指定内存位置 placement-new 构造该 lambda 实例
- copy 指向一个函数:调用该 lambda 的拷贝构造
- destroy 指向一个函数:显式调用析构函数
- invoke 指向一个函数:从内存中取出 lambda 并调用 operator()
std::function 对象本身只保存一个 void* 指针(指向数据)和一组函数指针(指向上述操作),对外彻底屏蔽了 lambda 的真实类型。
手写一个极简 Type Erasure 示例(仿 std::function)
以下是一个仅支持无参无返回值 callable 的简化版:
class any_callable {
struct concept {
virtual ~concept() = default;
virtual void invoke() = 0;
virtual concept* clone() const = 0;
};
template
struct model : concept {
T data;
model(T&& x) : data(std::move(x)) {}
void invoke() override { data(); }
concept* clone() const override { return new model{data}; }
};
std::unique_ptr
public:
template
any_callable(F&& f) : p(std::make_unique
void operator()() { p->invoke(); }
};
这就是类型擦除的本质:用基类指针(concept*)抹去 T 的身份,靠模板特化(model
现代优化:小对象优化(SOO)与避免堆分配
真实 std::function 通常不总用 new —— 它会在对象内部预留一小段内存(如 32 字节),若待存 callable 的大小 ≤ 该阈值,就直接 placement-new 到内部缓冲区,避免堆分配开销。这需要对齐计算、类型大小/对齐检查、手动调用构造/析构等底层操作,也是其实现复杂的关键原因之一。
SOO 带来两个关键判断逻辑:
- 是否足够小?→ sizeof(T) ≤ buffer_size && alignof(T) ≤ buffer_alignment
- 如何构造?→ 用 ::new(buffer) T(std::move(t)),而非 new T(std::move(t))
std::function 的 move 构造/赋值也高度依赖 SOO 状态,需区分“堆上对象”和“内嵌对象”分别处理。
基本上就这些。类型擦除不是魔法,它是以空间换灵活、以间接换通用的工程权衡——理解它,你就看懂了现代 C++ 泛型库的骨架之一。











