用位运算替代if判断可避免分支预测失败:uint8_t flags = 0b00001011;bool has_read = flags & (1

用 & 和 | 替代 if 判断布尔状态
当多个布尔标志需要紧凑存储(比如配置项、权限位),直接用整数的每一位表示一个开关,比用 std::vector 或一堆 bool 成员更省内存且访问更快。关键不是“省那几个字节”,而是避免分支预测失败带来的性能抖动。
常见错误是手动写 if (flag == true) ... else ...,其实只要用掩码提取再转为布尔即可:
uint8_t flags = 0b00001011; // 第0、1、3位为1 bool has_read = flags & (1 << 0); // true bool has_write = flags & (1 << 1); // true bool has_exec = flags & (1 << 2); // false
1 是最安全的掩码构造方式,比硬写0x04更易读、不易错位- 不要用
== 1判断,因为flags & (1 结果可能是非零整数,直接当bool用即可 - 如果需原子更新,优先用
std::atomic等,别自己加锁::fetch_or
用 ^ 实现无临时变量交换和状态翻转
x ^= y; y ^= x; x ^= y; 这种三步异或交换在现代编译器下基本没优势,反而可能干扰优化器;但它在嵌入式或寄存器受限场景仍有价值。更实用的是用 ^ 翻转特定位——比先 & ~mask 再 | new_val 更简洁。
uint32_t config = 0x12345678; config ^= (1 << 5); // 翻转第5位(0-indexed) config ^= 0xFF00FF00; // 翻转所有在 0xFF00FF00 中为1的位
- 翻转单一位时,
config ^= (1U 比config = config ^ (1U 更清晰,且U后缀防 int 溢出 - 异或翻转是可逆操作:执行两次等于没变,适合 toggle 场景(如调试开关)
- 注意符号扩展风险:对
int8_t做^=会先提升为int,结果可能不符合预期;统一用无符号类型
用 __builtin_popcount 替代循环统计比特数
统计一个整数里有多少个 1(即汉明重量),手写循环在大数组上很慢。GCC/Clang 提供 __builtin_popcount(对应 x86 的 popcnt 指令),速度提升 5–10 倍。
立即学习“C++免费学习笔记(深入)”;
uint32_t v = 0b10101010101010101010101010101010; int ones = __builtin_popcount(v); // 返回 16 // 注意:__builtin_popcountl 用于 long,__builtin_popcountll 用于 long long
- MSVC 用户用
_mm_popcnt_u32(需#include),并确保编译时开启/arch:AVX2或类似选项 - 若目标平台不支持
popcnt指令(如老 Atom),__builtin_popcount会退化为查表或 SWAR 算法,仍比手写快 - 别对负数用它:传入
int时符号位会被当数据位统计;一律用unsigned类型入参
左移右移慎用:>> 对有符号数是实现定义行为
int x = -8; x >> 1; 在大多数平台得到 -4(算术右移),但 C++ 标准只规定“实现定义”,不能依赖。一旦代码跨平台或换编译器,可能出错。
真正安全的做法是:所有位运算对象都用无符号类型。
int32_t signed_val = -128; uint32_t unsigned_val = static_cast(signed_val); // 补码解释为 uint uint32_t shifted = unsigned_val >> 3; // 明确逻辑右移,高位补0
- 左移
对有符号数溢出是未定义行为,哪怕结果能被表示(如int16_t(1) ) - 用
std::make_unsigned_t可泛化处理类型转换,避免硬编码uint32_t - 如果必须处理有符号输入且需算术右移语义,显式判断符号:
(x > n) : x >> n,但通常说明设计已偏离位运算初衷
& | ^ 后,记得用 objdump 或 Compiler Explorer 看一眼生成的汇编——有时候你写的“优化”,只是给编译器添了麻烦。










