0

0

Linux内核13-进程切换

蓮花仙者

蓮花仙者

发布时间:2025-07-13 10:36:02

|

247人浏览过

|

来源于php中文网

原创

进程切换,也称为任务切换、上下文切换或任务调度,本文将探讨linux内核中进程切换的实现。我们首先理解几个关键概念。

1.1 硬件上下文

每个进程都有自己的地址空间,但所有进程共享CPU寄存器。因此,在恢复进程执行前,内核必须确保挂起时的寄存器值被重新加载到CPU寄存器中。

这些需要加载到CPU寄存器中的值称为硬件上下文。硬件上下文是进程执行上下文的一个子集,包含进程执行所需的所有信息。在Linux中,进程的硬件上下文部分存储在进程描述符中,另一部分存储在内核态栈中。

在下文中,我们假设prev指向旧进程,next指向新进程。因此,进程切换就是保存prev进程的硬件上下文,然后加载next进程的硬件上下文。由于进程切换非常频繁,缩短保存和加载硬件上下文的时间至关重要。

旧版本的Linux利用x86架构提供的硬件支持,通过远程跳转指令(GNU-ljump;Intel-jmp far)进行进程切换,跳转到下一个进程的任务状态段(TSS)描述符。执行这条跳转指令时,CPU会自动执行硬件上下文切换,保存旧的硬件上下文,加载新的硬件上下文。然而,Linux 2.6版本以后,通过软件进行进程切换,原因如下:

通过一系列的mov指令逐步执行切换,可以更好地控制加载数据的合法性。特别是dses段寄存器的值,可能会被恶意用户篡改。使用远程跳转指令无法进行数据检查。新旧方法所需的时间大致相同。但是,优化硬件上下文切换是不可能的,因为这是由CPU完成的,而Linux使用软件替代硬件上下文切换,因此有优化的空间,以提高执行时间。进程切换只能在内核态发生。在进程切换之前,用户态进程使用的所有寄存器内容都已经包含在内核态栈中,其中包括指定用户态进程栈指针地址的ssesp寄存器内容。

1.2 任务状态段-TSS

x86架构包含一个特殊的段寄存器,称为任务状态段(TSS),用来保存硬件上下文内容。尽管Linux不使用硬件上下文切换,但还是为每个不同CPU建立一个TSS。这么做的原因有两个:

  • 当x86架构的CPU从用户态切换到内核态时,会从TSS中获取内核态的栈地址。
  • 用户态进程想要访问I/O端口时,CPU需要访问存储在TSS中的I/O权限位,判断进程是否被允许访问该I/O端口。

当用户态进程执行inout指令时,I/O控制单元会检查eflags寄存器中的IOPL位(2位)。如果等于3,也就是超级用户权限,进程对于该I/O端口来说就是一个超级用户,直接执行I/O指令。否则,继续执行检查。访问tr寄存器,确定当前的TSS,以及正确的I/O访问权限。它检查I/O端口对应的访问权限位。如果清零,指令被执行;否则,控制单元发出常规保护的异常。内核中使用tss_struct结构体描述TSS。init_tss数组为系统中的每一个CPU包含一个tss_struct结构。每一次进程切换,内核更新TSS相关内容,使CPU控制单元能够安全地检索自己想要的信息。因此,TSS反映了当前运行在CPU上的进程的特权级别,但当进程不运行时,无需维护这些信息。

每个TSS具有8个字节长度的任务状态段描述符(TSSD)。这个描述符包含一个32位的基地址,指向TSS的起始地址,以及20位的Limit域,表示页的大小。TSSD的S标志被清零,说明这是一个系统段(参见第2章的段描述符)。

Type域设置为9或11都可以,表明该段是一个TSS段即可。Intel最初的设计中,系统中的每个进程都应该引用自己的TSS:Type域的低第2个有效位称为Busy位,如果被设为1,进程正在CPU上执行;设为0,没有执行。在Linux的设计中,每个CPU只有一个TSS,所以,Busy位总是设为1。换句话说,Linux中Type域一般为11。

创建的这些TSSD存储在全局描述符表(GDT)中,该表的基地址存储在CPU的gdtr寄存器中。每个CPU的tr寄存器包含对应TSS的TSSD选择器,还包含两个隐藏的、不可编程的域:TSSD的BaseLimit域。使用这种方法,CPU可以直接寻址TSS,而不必非得访问GDT中TSS的地址。

1.3 线程域

每当进程切换时,将要被替换掉的进程硬件上下文内容都应该被保存到某个地址。显然不能保存在TSS中,因为Linux为每个CPU建立了一个TSS,而不是为每个进程建立TSS。

因此,进程描述符中添加了一个类型为thread_struct的结构,通过它,内核保存旧进程的硬件上下文。后面我们会看到,该数据结构包含了大部分的CPU寄存器,除了通用目的寄存器,比如eaxebx等,它们被存储在内核态栈中。

2 执行进程切换

进程切换的时机:在中断处理程序中直接调用schedule()函数,实现进程调度。内核线程是一个特殊的进程,只有内核态没有用户态。因此既可以主动调用schedule()函数进行调度,也可以被中断处理程序调用。内核态进程无法直接主动调度,因为schedule()是一个内核函数,不是系统调用。因此只能在中断处理程序中进行调度。关键代码梳理如下:

网趣购物系统加强升级版
网趣购物系统加强升级版

新版本程序更新主要体现在:完美整合BBS论坛程序,用户只须注册一个帐号,即可全站通用!采用目前流行的Flash滚动切换广告 变换形式多样,受人喜爱!在原有提供的5种在线支付基础上增加北京云网支付!对留言本重新进行编排,加入留言验证码,后台有留言审核开关对购物系统的前台进行了一处安全更新。在原有文字友情链接基础上,增加LOGO友情链接功能强大的6种在线支付方式可选,自由切换。对新闻列表进行了调整,

下载

首先,schedule()函数会调用next = pick_next_task(rq, prev);,根据调度算法策略,选取要执行的下一个进程。其次,根据调度策略得到要执行的进程后,调用context_switch(rq, prev, next);,完成进程上下文切换。其中,最关键的switch_to(prev,next, prev);切换堆栈和寄存器的状态。我们假设prev指向被切换掉的进程描述符,next指向将要执行的进程描述符。我们将会在第7章发现,prevnext正是schedule()函数的局部变量。

2.1 switch_to

进程硬件上下文的切换是由宏switch_to完成的。该宏的实现与硬件架构息息相关,要想理解它需要下一番功夫。下面是基于X86架构下的该宏实现的汇编代码:

#define switch_to(prev, next, last)                             \
do {                                                            \
    /* 进程切换可能会改变所有的寄存器,所以我们通过未使用的输出变量显式地修改它们。 */ \
    /* EAX和EBP没有被列出,是因为EBP是为当前进程访问显式地保存和恢复的寄存器, */ \
    /* 而EAX将会作为函数__switch_to()的返回值。 */              \
    unsigned long ebx, ecx, edx, esi, edi;                      \
                                                                \
    asm volatile("pushfl\n\t"               /* save    flags */ \
             "pushl %%ebp\n\t"              /* save    EBP   */ \
             "movl %%esp,%[prev_sp]\n\t"    /* save    ESP   */ \
             "movl %[next_sp],%%esp\n\t"    /* restore ESP   */ \
             "movl $1f,%[prev_ip]\n\t"      /* save    EIP   */ \
             "pushl %[next_ip]\n\t"         /* restore EIP   */ \
             __switch_canary                                    \
             __retpoline_fill_return_buffer                     \
             "jmp __switch_to\n"            /* regparm call  */ \
             "1:\t"                                             \
             "popl %%ebp\n\t"               /* restore EBP   */ \
             "popfl\n"                      /* restore flags */ \
                                                                \
             /* 输出参数 */                                     \
             : [prev_sp] "=m" (prev->thread.sp),                \
               [prev_ip] "=m" (prev->thread.ip),                \
               "=a" (last),                                     \
                                                                \
               /* 列出所有可能会修改的寄存器  */                \
               "=b" (ebx), "=c" (ecx), "=d" (edx),              \
               "=S" (esi), "=D" (edi)                           \
                                                                \
               __switch_canary_oparam                           \
                                                                \
               /* 输入参数 */                                   \
             : [next_sp]  "m" (next->thread.sp),                \
               [next_ip]  "m" (next->thread.ip),                \
                                                                \
               /* 为函数__switch_to()设置寄存器参数 */          \
               [prev]     "a" (prev),                           \
               [next]     "d" (next)                            \
                                                                \
               __switch_canary_iparam                           \
                                                                \
             : /* reloaded segment registers */                 \
            "memory");                                          \
} while (0)

首先,该宏具有3个参数,prevnextlastprevnext这两个参数很容易理解,分别指向新旧进程的描述符地址;last是一个输出参数,用来记录是从哪个进程切换来的。为什么需要last参数呢?当进程切换涉及到3个进程的时候,3个进程分别假设为A、B、C。假设内核决定关掉A进程,激活B进程。在schedule函数中,prev指向A的描述符,而next指向B的描述符。只要switch_to宏使A失效,A的执行流就会冻结。后面,当内核想要重新激活A,必须关掉C进程,就要再执行一次switch_to宏,此时prev指向C,next指向A。当A进程想要继续执行之前的执行流时,会查找原先的内核态栈,发现prev等于A进程描述符,next等于B进程描述符。此时,调度器失去了对C进程的引用。保留这个引用非常有用,我们后面再讨论。图3-7分别展示了进程A、B和C内核态栈的内容,及寄存器eax的值。还展示了last的值,随后被eax中的值覆盖。

Linux内核13-进程切换

switch_to宏的处理过程如下:

  • 将新旧进程描述符存放到CPU寄存器中。
  • 保存旧进程的内核态栈,比如eflagsebp寄存器的内容。
  • 保存旧进程栈指针espprev->thread.esp中。
  • 操作数484(%eax)表明目的地址是寄存器eax中的地址加上484
  • 将新进程的栈指针加载到esp寄存器中。
movl 484(%edx), %esp
  • 保存标签1的地址->prev->thread.eip
movl $1f, 480(%eax)
  • 加载新进程的指令流。意义和第5步差不多,就是执行顺序相反。
  • 跳转到__switch_to()函数执行,是一个C函数。

至此,进程A被进程B取代:开始执行B进程的指令。第一步应该是先弹出eflagsebp寄存器的值。

  • 拷贝eax寄存器的内容(第一步加载的)到last变量中。也就是说,last记录了被取代的进程。

2.2 __switch_to()函数

实际上,大部分的进程切换工作是由__switch_to()函数完成的,它的参数是prev_pnext_p,分别指向旧进程和新进程。这个函数和普通的函数有些差别,因为__switch_to()函数从eaxedx寄存器中获取prev_pnext_p这两个参数(在分析switch_to宏的时候已经讲过),而不是像普通函数那样,从栈中获取参数。为了强制函数从寄存器中获取参数,内核使用__attribute__regparm进行声明。这是gcc编译器对C语言的一个非标准扩展。__switch_to()函数定义在include/asm-i386/system.h文件中:

__switch_to(struct task_struct *prev_p, struct task_struct *next_p) __attribute__((regparm(3)));

这个函数执行的内容:

  • 执行__unlazy_fpu()宏,保存旧进程的FPU、MMX和XMM寄存器。
  • 执行smp_processor_id()宏,获取正在执行代码的CPU的ID。从thread_info结构的cpu成员中获取。
  • 加载新进程的next_p->thread.esp0到当前CPU的TSS段中的esp0成员中。通过调用sysenter汇编指令从用户态切换到内核态引起的任何特权级别的改变都会导致将这个地址拷贝到esp寄存器中。
  • 将新进程的线程本地存储(TLS)段加载到当前CPU的GDT中。3个段选择器存储在进程描述符的tls_array数组中。
  • 存储fsgs段寄存器的内容到旧进程的prev_p->thread.fsprev_p->thread.gs中。汇编指令如下:

寄存器esi指向prev_p->thread结构。gs寄存器用来存放TLS段的地址。fs寄存器实际上Windows使用。

  • 加载新进程的fsgs寄存器内容。数据来源是新进程的thread_struct描述符中对应的值。汇编语言如下:

ebx寄存器指向next_p->thread结构。

  • 载入新进程的调试寄存器中的信息。
  • 更新TSS中的I/O权限位(如果有必要的话)。也就是如果新旧进程对I/O访问有自己特殊的要求的话就需要更改。
  • __switch_to()函数结束。

相应的汇编语言就是:

因为switch_to总是假设eax寄存器保存旧进程的进程描述符的地址。所以,这里把prev_p变量再次写入到eax寄存器中。

相关专题

更多
C语言变量命名
C语言变量命名

c语言变量名规则是:1、变量名以英文字母开头;2、变量名中的字母是区分大小写的;3、变量名不能是关键字;4、变量名中不能包含空格、标点符号和类型说明符。php中文网还提供c语言变量的相关下载、相关课程等内容,供大家免费下载使用。

379

2023.06.20

c语言入门自学零基础
c语言入门自学零基础

C语言是当代人学习及生活中的必备基础知识,应用十分广泛,本专题为大家c语言入门自学零基础的相关文章,以及相关课程,感兴趣的朋友千万不要错过了。

608

2023.07.25

c语言运算符的优先级顺序
c语言运算符的优先级顺序

c语言运算符的优先级顺序是括号运算符 > 一元运算符 > 算术运算符 > 移位运算符 > 关系运算符 > 位运算符 > 逻辑运算符 > 赋值运算符 > 逗号运算符。本专题为大家提供c语言运算符相关的各种文章、以及下载和课程。

348

2023.08.02

c语言数据结构
c语言数据结构

数据结构是指将数据按照一定的方式组织和存储的方法。它是计算机科学中的重要概念,用来描述和解决实际问题中的数据组织和处理问题。数据结构可以分为线性结构和非线性结构。线性结构包括数组、链表、堆栈和队列等,而非线性结构包括树和图等。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

255

2023.08.09

c语言random函数用法
c语言random函数用法

c语言random函数用法:1、random.random,随机生成(0,1)之间的浮点数;2、random.randint,随机生成在范围之内的整数,两个参数分别表示上限和下限;3、random.randrange,在指定范围内,按指定基数递增的集合中获得一个随机数;4、random.choice,从序列中随机抽选一个数;5、random.shuffle,随机排序。

584

2023.09.05

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

519

2023.09.20

c语言get函数的用法
c语言get函数的用法

get函数是一个用于从输入流中获取字符的函数。可以从键盘、文件或其他输入设备中读取字符,并将其存储在指定的变量中。本文介绍了get函数的用法以及一些相关的注意事项。希望这篇文章能够帮助你更好地理解和使用get函数 。

631

2023.09.20

c数组初始化的方法
c数组初始化的方法

c语言数组初始化的方法有直接赋值法、不完全初始化法、省略数组长度法和二维数组初始化法。详细介绍:1、直接赋值法,这种方法可以直接将数组的值进行初始化;2、不完全初始化法,。这种方法可以在一定程度上节省内存空间;3、省略数组长度法,这种方法可以让编译器自动计算数组的长度;4、二维数组初始化法等等。

595

2023.09.22

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

62

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
c语言项目php解释器源码分析探索
c语言项目php解释器源码分析探索

共7课时 | 0.3万人学习

Vue.js 微实战--十天技能课堂
Vue.js 微实战--十天技能课堂

共18课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号