作业要求
阅读学习教材《庖丁解牛Linux 操作系统分析》第9章,遇难题优先使用chatgpt等智能工具。也可在蓝墨云班课中提问,确保24小时内得到回复,鼓励帮助他人解答问题,提问前请参阅《如何提问》。
深入研究豆列《Linux内核及安全》中的内容。
观看并学习蓝墨云班课第九周视频《Linux系统架构和执行过程概览》,并完成配套实验八。请注意从底部向上阅读。基于树莓派或其他平台完成ARM相关部分。
作业标题:“学号《Linux内核原理与分析》第X周作业”,重点记录遇到的问题及其解决方案,内容应涵盖教材学习和视频资料,提交格式采用Markdown,并同时提交转换成的PDF(VSCode提供相应插件)。
实验八:理解进程调度时机跟踪分析进程调度与进程切换的过程
根据本周所学知识分析并理解 Linux 中进程调度与进程切换过程:
- 理解 Linux 系统中进程调度的时机,可在内核代码中搜索 schedule() 函数,查看其被调用的位置,评估课程总结的准确性;
- 利用 gdb 跟踪分析一个 schedule() 函数,验证你对 Linux 系统进程调度与进程切换过程的理解;建议在实验楼 Linux 虚拟机环境中完成此实验。
- 特别关注并细致解析 switch_to 中的汇编代码,理解进程上下文的切换机制,以及它与中断上下文切换的关系;
1、理解 Linux 系统中进程调度的时机
在 Linux 系统中搜索 schedule() 函数,具体步骤如下:
- 使用 grep 命令,在指定的内核源代码目录中递归搜索包含“schedule(”字符串的文件:
grep -r "schedule(" /path/to/kernel/source //这里的/path/to/kernel/source是你的内核文件路径 - 使用 find 和 grep 命令,在指定的内核源代码目录中递归搜索所有 .c 文件,并查找包含“schedule(”的行:
find /path/to/kernel/source -name "*.c" -exec grep -H "schedule(" {} \; - 使用 ctags 和 grep 命令,ctags 可生成一个标签文件,之后可在该文件中搜索 schedule(:
ctags -R /path/to/kernel/source grep -n "schedule(" tags
这里使用 grep 进行查找展示:
grep -r "schedule()" /home/shiyanlou/LinuxKernel/linux-3.9.4/kernel
结合云班课内容,分析得出进程调度的时机如下:
- 中断处理过程(包括时钟中断、I/O中断、系统调用和异常)中,直接调用 schedule(),或在返回用户态时依据 need_resched 标记调用 schedule()。
- 内核线程可直接调用 schedule() 进行进程切换,也可在中断处理过程中进行调度,即内核线程作为一种特殊进程可主动调度。
- 用户态进程无法主动调度,只能通过陷入内核态后的某个时间点进行调度,即在中断处理过程中进行调度。
进程切换如下:
为了管理进程的执行,内核需具备暂停当前 CPU 上运行的进程,并恢复之前暂停的某个进程的能力,这称为进程切换、任务切换、上下文切换,即进程上下文切换。暂停当前 CPU 上的进程与中断时保存现场不同,中断前后仍在同一进程上下文中,只是从用户态转向内核态执行。进程上下文包含进程执行所需的所有信息。
其中,Linux 系统执行过程中的几种特殊情况如下:
- 通过中断处理过程中的调度时机,用户态进程与内核线程之间互换及内核线程之间的互换,与最常见的情况非常相似,只是内核线程运行过程中发生的中断没有涉及进程用户态和内核态的转换;
- 用户态进程不能主动调用 schedule(),但内核线程可以主动调用 schedule(),仅有进程上下文的切换,未发生中断上下文的切换,比最常见的情况略简单;
- 创建子进程的系统调用在子进程中执行的起点及返回用户态时,不是从标号1开始执行,而是从用户态开始执行,next ip=ret from work,例如 fork;
- 加载新的可执行程序后返回用户态的情况,例如 execve。
2、使用 gdb 跟踪分析一个 schedule() 函数
(1) 基础搭建部分
首先完成以下代码,将 test.c 文件更改为 test_exec.c
cd LinuxeKernel
rm -rf menu
git clone https://github.com/mengning/menu.git
cd menu
mv test_exec.c test.c
make rootfs
启动一个冻结的内核,再开启一个 shell 进行 gdb 分析调试
cd LinuxKernel
qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S //冻结内核的启动
新开一个空白 shell,进入 gdb 调试模式,并建立连接:
cd LinuxKernel
gdb
(gdb)file linux-3.18.6/vmlinux
(gdb)target remote:1234
基础部分搭建完成后,开始 gdb 分析 schedule() 函数
(2) gdb 调试部分
分别在 schedule(进程调度的主要函数)、context_switch(实现进程切换的函数)和 pick_next_task(根据调度策略和算法选择下一个进程的函数)三个位置设置断点,而 switch_to 为宏定义,无法设置断点,需在 context_switch 函数中逐行执行查看调用。
b schedule
b context_switch
b pick_next_task
下面是具体的分析:
由于 switch_to 无法设置断点,需要进行汇编级别代码的分析。
3、解析 switch_to 中的汇编代码,理解进程上下文切换机制与中断上下文切换的联系
汇编代码及其分析如下:
asm volatile(
"pushfl\n\t" //保存当前进程flags
"pushl %%ebp\n\t" //当前进程堆栈基址压栈
"movl %%esp,%[prev_sp]\n\t" //保存ESP,将当前堆栈栈顶保存起来
"movl %[next_sp],%%esp\n\t" //更新ESP,将下一栈顶保存到ESP中
// 完成内核堆栈的切换
"movl $1f,%[prev_ip]\n\t" //保存当前进程的EIP
"pushl %[next_ip]\n\t" //将next进程起点压入堆栈,即next进程的栈顶为起点
__switch_canary //next_ip一般为$1f,对于新创建的子进程是ret_from_fork
"jmp __switch_to\n" //prve进程中,设置next进程堆栈,jmp与call不同,是通过寄存器传递参数(call通过堆栈),所以ret时弹出的是之前压入栈顶的next进程起点
//完成EIP的切换
"1:\t" //next进程开始执行
"popl %%ebp\n\t" //restore EBP
"popfl\n" //restore flags
//输出量
: [prev_sp] "=m" (prev->thread.sp), //保存当前进程的esp
[prev_ip] "=m" (prev->thread.ip), //保存当前进仓的eip
"=a" (last),
//要破坏的寄存器
"=b" (ebx), "=c" (ecx), "=d" (edx),
"=S" (esi), "=D" (edi)
__switch_canary_oparam
//输入量
: [next_sp] "m" (next->thread.sp), //next进程的内核堆栈栈顶地址,即esp
[next_ip] "m" (next->thread.ip), //next进程的eip
// regparm parameters for __switch_to():
[prev] "a" (prev),
[next] "d" (next)
__switch_canary_iparam
: //重新加载段寄存器
"memory");
在整个流程中,涉及到了堆栈的转换、指令指针的变更,以及寄存器的存储和恢复。
进程上下文切换的关键机制,涵盖了堆栈转换、指令指针变更,以及寄存器的存储与恢复,这些步骤共同确保了进程间切换时的运行连贯性和准确性。
其与中断上下文切换的关联表现在,两者都需要通过存储和恢复寄存器的操作,实现上下文的平滑过渡,保证切换前后执行状态的一致性不受影响。
4、运用AI解答疑问



雷达卡


京公网安备 11010802022788号







