0

0

C++如何使用atomic操作实现自旋锁

P粉602998670

P粉602998670

发布时间:2025-10-12 23:59:01

|

993人浏览过

|

来源于php中文网

原创

自旋锁利用原子操作避免上下文切换开销,适用于短临界区;通过std::atomic_flag实现lock-free的加解锁,结合PAUSE指令优化自旋等待性能,在多核环境下提升效率。

c++如何使用atomic操作实现自旋锁

C++中利用atomic操作实现自旋锁,核心思想是借助原子变量的不可中断性,让线程在一个循环中不断尝试获取锁,直到成功。这种锁机制在多核处理器环境下,对于保护非常短小的临界区代码,可以避免操作系统上下文切换的开销,从而在特定场景下提供更高的性能。

解决方案

实现一个C++自旋锁,我们通常会用到std::atomic_flag或者std::atomicstd::atomic_flag是C++11中最简单的原子类型,它保证是lock-free的,并且只有两个基本操作:test_and_set()clear(),非常适合用来实现自旋锁。

下面是一个基于std::atomic_flag的自旋锁实现:

#include 
#include  // For std::this_thread::yield() or _mm_pause
#include 

// 针对x86/x64平台的_mm_pause指令,用于优化自旋等待
#if defined(__GNUC__) || defined(__clang__)
#define PAUSE_INSTRUCTION() __asm__ __volatile__("pause" ::: "memory")
#elif defined(_MSC_VER)
#include 
#define PAUSE_INSTRUCTION() _mm_pause()
#else
#define PAUSE_INSTRUCTION() /* Fallback for other platforms */
#endif

class SpinLock {
public:
    void lock() {
        // test_and_set()会原子地将flag设置为true,并返回其旧值。
        // 如果旧值为true,说明锁已经被占用,当前线程需要继续自旋。
        // 如果旧值为false,说明成功获取锁。
        while (flag.test_and_set(std::memory_order_acquire)) {
            // 在自旋等待时,加入PAUSE指令可以降低CPU功耗,
            // 减少缓存一致性协议的流量,提高性能。
            // 也可以考虑使用std::this_thread::yield()让出CPU时间片,
            // 但对于短临界区,PAUSE通常更优。
            PAUSE_INSTRUCTION();
        }
    }

    void unlock() {
        // 原子地将flag设置为false,释放锁。
        // memory_order_release确保在释放锁之前,所有对受保护资源的修改都已完成并对其他线程可见。
        flag.clear(std::memory_order_release);
    }

private:
    std::atomic_flag flag = ATOMIC_FLAG_INIT; // 初始化为false(未锁定状态)
};

// 示例用法
// int shared_data = 0;
// SpinLock my_spinlock;

// void increment() {
//     for (int i = 0; i < 100000; ++i) {
//         my_spinlock.lock();
//         shared_data++;
//         my_spinlock.unlock();
//     }
// }

// int main() {
//     std::thread t1(increment);
//     std::thread t2(increment);

//     t1.join();
//     t2.join();

//     std::cout << "Final shared_data: " << shared_data << std::endl;
//     return 0;
// }

这个SpinLock类通过std::atomic_flagtest_and_setclear方法,实现了基本的自旋加锁和解锁逻辑。test_and_set在尝试获取锁时会一直循环,直到成功将flagfalse变为trueclear则将flag重置为false,允许其他线程获取锁。这里特别加入了PAUSE_INSTRUCTION(),这在x86/x64架构上是至关重要的优化,它能显著提升自旋锁的效率和降低CPU功耗。

立即学习C++免费学习笔记(深入)”;

自旋锁与互斥锁:何时选择,为何选择?

在多线程编程中,保护共享资源是永恒的主题,自旋锁和互斥锁(如std::mutex)是两种常见的手段。我个人觉得,理解它们之间的差异和适用场景,远比盲目选择一个“看起来更快”的方案重要。

说白了,互斥锁在无法获取锁时,会把当前线程置于休眠状态,然后由操作系统调度器唤醒。这个过程涉及上下文切换,开销不小。而自旋锁呢,它就“死等”,在一个循环里不断地检查锁是否可用,不休眠,不放弃CPU。

那么,什么时候用自旋锁呢?在我看来,它最适合那些临界区代码执行时间极短,而且线程争用不那么激烈的场景。比如说,你只是修改一个计数器,或者更新一个指针,这些操作可能只需要几十个CPU周期。如果用互斥锁,上下文切换的开销可能比执行临界区代码本身还要大好几倍,那显然不划算。在多核处理器上,如果一个线程短暂地持有锁,另一个线程自旋等待,可能很快就能拿到锁,避免了昂贵的上下文切换。

反之,如果临界区代码执行时间比较长,或者线程争用非常激烈,那么自旋锁就会变成一个“CPU杀手”。它会让等待线程白白消耗CPU资源,而没有做任何有意义的工作。这种情况下,互斥锁让等待线程休眠,把CPU时间让给其他线程去做有用的事情,反而更高效。有时候我会想,很多人一上来就觉得自旋锁“快”,但忽略了它“忙等”的本质,这搞不好会适得其反,反而拖慢整个系统的性能。所以,选择哪个,真的要看具体场景和性能分析。

C++ atomic_flagatomic:实现自旋锁的异同与考量

在C++中实现自旋锁,std::atomic_flagstd::atomic都是可行的选择,但它们之间确实存在一些细微但重要的差异。理解这些差异,能帮助我们做出更明智的选择。

千图设计室AI海报
千图设计室AI海报

千图网旗下的智能海报在线设计平台

下载

std::atomic_flag,就像我们前面示例中用的那样,是C++11标准库中最“原始”的原子类型。它的设计目标就是为了实现自旋锁这种简单的“锁住/解锁”机制。它的特点是:

  1. 保证lock-free:标准明确规定std::atomic_flag的操作是lock-free的,这意味着它不会依赖于操作系统级别的互斥量来实现原子性。
  2. API极简:只有test_and_set()clear()两个操作。test_and_set()原子地将flag设为true并返回旧值,clear()原子地将flag设为false。这种简洁性降低了出错的可能性。
  3. 默认内存序test_and_set()默认使用std::memory_order_acquireclear()默认使用std::memory_order_release。这正是实现自旋锁所需要的内存序,确保了在获取锁前后的内存同步。

std::atomic则是一个更通用的原子类型,它可以存储布尔值,并支持更多的原子操作,比如load()store()exchange()compare_exchange_weak()compare_exchange_strong()

  1. 不保证lock-free:虽然在大多数现代平台上,std::atomic通常也是lock-free的,但标准并没有强制要求。你可以通过is_lock_free()方法来检查。
  2. 更灵活的API:你可以用compare_exchange_weak()compare_exchange_strong()来实现自旋锁。例如:
    // 使用atomic实现自旋锁
    std::atomic lock_val = false;
    // lock()
    bool expected = false;
    while (!lock_val.compare_exchange_weak(expected, true, std::memory_order_acquire, std::memory_order_relaxed)) {
        expected = false; // compare_exchange_weak可能会失败,需要重置expected
        PAUSE_INSTRUCTION();
    }
    // unlock()
    lock_val.store(false, std::memory_order_release);

    这里,compare_exchange_weak会尝试将lock_valexpectedfalse)原子地改为true。如果成功,说明获取了锁;如果失败,说明锁已经被占用,lock_val的值会被更新为当前值(true),所以我们需要在循环内重置expected

  3. 内存序需要手动指定:虽然这提供了更大的灵活性,但也意味着你需要更清楚地知道每种操作应该使用哪种内存序,否则容易引入内存序错误。

在我看来,如果你仅仅需要一个最简单的自旋锁,std::atomic_flag是更直接、更安全的选择,因为它天生就是为此设计的,并且保证lock-free。它的API也更不容易出错。如果你需要更复杂的原子操作,或者对内存序有更精细的控制需求,那么std::atomic会提供更大的灵活性,但同时也要求你对原子操作和内存模型有更深入的理解。对于自旋锁这种特定用途,我通常会倾向于atomic_flag

优化自旋锁性能:std::this_thread::yield()_mm_pause指令

纯粹的自旋等待,也就是在一个while循环里什么都不做,只是不断检查锁状态,这其实是非常低效的。它不仅会白白消耗CPU周期,还会导致缓存一致性协议的流量激增,甚至可能因为CPU乱序执行的特性,导致性能进一步下降。所以,优化自旋等待是实现高性能自旋锁的关键。

这里主要有两种常见的优化策略:std::this_thread::yield()和处理器特定的_mm_pause指令。

  1. std::this_thread::yield(): 这个函数的作用是向操作系统调度器发一个“软提示”,告诉它:“嘿,我这个线程现在愿意放弃我当前的CPU时间片,如果你有其他就绪的线程,可以考虑让它们先运行。”它并不能保证线程一定会立即让出CPU,这取决于操作系统的调度策略和当前系统的负载情况。 在自旋锁的循环中加入std::this_thread::yield(),可以在一定程度上缓解CPU空转的问题。当锁被长时间占用,或者系统负载较高时,yield()有机会让当前线程暂时休息一下,让出CPU给持有锁的线程或其他有用线程。这对于降低CPU使用率和提高系统整体响应性是有帮助的。 然而,yield()的开销相对_mm_pause要大,因为它涉及与操作系统的交互。对于那些临界区极短,预期锁争用时间也极短的场景,yield()的开销可能反而会抵消自旋锁的优势。

  2. _mm_pause指令 (x86/x64): 这是针对x86和x64处理器架构的一个内在函数(intrinsic),它编译后会生成PAUSE汇编指令。这个指令是专门为自旋等待设计的,它做了几件重要的事情:

    • 降低功耗PAUSE指令会告诉CPU,当前核心正在自旋等待,可以进入低功耗状态,减少能耗。
    • 优化乱序执行:现代CPU为了提高性能会进行乱序执行。在自旋循环中,PAUSE指令可以作为内存屏障,防止CPU在循环内部进行过度的乱序猜测执行,从而避免不必要的缓存行失效和总线流量。它能有效地将CPU流水线“暂停”一小段时间,让CPU有机会重新加载缓存,避免重复的失败猜测。
    • 减少总线流量:通过优化乱序执行和降低功耗,PAUSE间接减少了处理器之间通过总线进行的缓存一致性协议(MESI等)通信,这在多核系统中尤为重要。

    在前面的SpinLock实现中,我们正是加入了PAUSE_INSTRUCTION()宏来利用这个指令。这在x86/x64平台上几乎是实现高效自旋锁的必备优化。如果没有它,即使是短临界区,自旋锁的性能也可能远低于预期,甚至不如互斥锁。

总结一下我的看法:在实现自旋锁时,_mm_pause(或其他架构的等效指令)是首选的优化手段,尤其是在你确定目标平台支持且临界区极短时。它的开销非常小,且直接作用于硬件层面。而std::this_thread::yield()则更像是一个“备用方案”或者“补充策略”,在无法使用PAUSE指令的平台,或者在自旋等待时间可能稍长的情况下,可以考虑加入它来降低CPU占用。一个健壮的自旋锁实现,往往会优先考虑平台特定的PAUSE指令,并在必要时结合yield()或者更复杂的退让策略(比如指数退避)。

相关专题

更多
while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

81

2023.09.25

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

81

2023.09.25

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

81

2023.09.25

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

472

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

108

2025.12.24

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

65

2025.12.31

php网站源码教程大全
php网站源码教程大全

本专题整合了php网站源码相关教程,阅读专题下面的文章了解更多详细内容。

45

2025.12.31

视频文件格式
视频文件格式

本专题整合了视频文件格式相关内容,阅读专题下面的文章了解更多详细内容。

40

2025.12.31

不受国内限制的浏览器大全
不受国内限制的浏览器大全

想找真正自由、无限制的上网体验?本合集精选2025年最开放、隐私强、访问无阻的浏览器App,涵盖Tor、Brave、Via、X浏览器、Mullvad等高自由度工具。支持自定义搜索引擎、广告拦截、隐身模式及全球网站无障碍访问,部分更具备防追踪、去谷歌化、双内核切换等高级功能。无论日常浏览、隐私保护还是突破地域限制,总有一款适合你!

41

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 5.7万人学习

C 教程
C 教程

共75课时 | 3.8万人学习

C++教程
C++教程

共115课时 | 10.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号