进程的切换——switch_to函数
1. 前⾔
在很多⾼级语⾔中,都有多线程的实现,所谓的多线程指的就是通过分时技术,线程不断切换运⾏,达到多个线程近似同时运⾏的效果。现在很多⽹站都有很⾼的并发,⽽⾼并发的基础,就是操作系统对于多进程多线程的调度与切换的优秀实现,本⽂就基于linux0.11版本,分析linux进程切换函数switch_to的实现。
2. 汇编
由于switch_to函数是汇编语⾔实现⽽不是c语⾔,所以阅读switch_to的源码之前,需要了解⼀点汇编的知识,由于汇编太难,博主也仅仅懂得⼀点点…
先来看⼀段汇编代码:
__asm__ __volatile__(
LOCK "addl %1, %0"
:"=m"(v->counter)
:"ir"(i),"m"(v->counter));
这是⼀段asm嵌⼊式汇编,⼀般来说,asm嵌⼊式汇编分四个部分,每个部分以 ":"隔开,这是基本的格式:
指令部 : 输出部 :输⼊部 :损坏部
根据这个格式,可以对上⾯的代码做⼀个划分:
指令部 : “addl %1, %0”
输出部 : “=m” (v->counter)
输⼊部 : “ir” (i), “m” (v->counter))
损坏部: ⽆
⾸先看指令部,addl指令是加法指令,⽽%+数字这种格式,这些数字代表着⼀个编号,也就是cpu的通⽤寄存器的编号,这个编号的由来是,从输⼊部开始算,每个操作数(变量)依次编号,第⼀个操作数对应%0,第⼆个对应%1。
switch函数用法举例
这么说可能有点难理解,结合代码来说就是,输⼊部第⼀个操作数是"ir" (i),因此它就对应%0,第⼆个操作数是"m" (v->counter)),因此它就对应%1,依次类推,这个数字能⽤的最⼤值就是cpu的通⽤寄存器个数。
另外我们可以看到,每个操作数前会有“m”,"r"这种的字母前缀,这是汇编的约束,约束就是规定了操作数的存储地址,表⽰约束的字母有
"m","v","o"                    ——表⽰内存单元;
"r"                            ——表⽰任何寄存器;
"q"                            ——表⽰eax,ebx,ecs,edx 之⼀;
"i"和"h"                        ——表⽰直接操作数;
"E"和"F"                        ——表⽰浮点数;
"g"                            ——表⽰“任意”;
"a","b","c","d"              ——表⽰使⽤寄存器eax,ebx,ecx,edx
"S"和"D"                        ——表⽰要求使⽤寄存器esi和edi
"I"                            ——表⽰常数(0⾄31)
所以对应我们的事例代码,就可以看懂了。%0对应输⼊部第⼀个参数i,操作数i是⼀个直接操作数,%1对应v->counter,这是内存单元中的⼀个操作数,指令addl将⼆者相加,相加的结果输出到输出部,⽽输出部就是内存单元中的v->counter。
简单来说就是将⼀个内存中的操作数v->counter加上⼀个直接操作数i,结果再输出到v->count。
3. switch_to
#define switch_to(n){\
struct{long a,b;} __tmp;\
__asm__(\
"cmpl %%ecx,current\n\t"\
"je 1f\n\t"\
"movw %%dx,%1\n\t"\
"xchgl %%ecx,current\n\t"\
"ljmp *%0\n\t"\
"cmpl %%ecx,last_task_used_math\n\t"\
"jne 1f\n\t"\
"clts\n"\
"1:"\
::"m"(*&__tmp.a),"m"(*&__tmp.b),\
"d"(_TSS(n)),"c"((long) task[n]));\
}
这是switch_to的源码,它存在于kernel的sched.h头⽂件中。
⾸先定义了⼀个结构体_tmp,_tmp中只有两个long型变量a,b,这两个变量后⾯会⽤到。
根据第⼆节的汇编语⾔的结构,可以对switch_to的源码做以下分解:
指令部:
"cmpl %%ecx,current\n\t" \
"je 1f\n\t" \
"movw %%dx,%1\n\t" \
"xchgl %%ecx,current\n\t" \
"ljmp *%0\n\t" \
"cmpl %%ecx,last_task_used_math\n\t" \
"jne 1f\n\t" \
"clts\n" \
"1:" \
输出部: ⽆
输⼊部: "m" (*&__tmp.a),"m" (*&__tmp.b), \"d" (_TSS(n)),"c" ((long) task[n]))
同时我们也可以对指令部⽤到的参数和输⼊部做⼀个匹配:
%ecx  —————— ecx寄存器,也就是输⼊的task[n],也就是要切换到的新进程
%dx  —————— edx寄存器,也就是输⼊的_TSS(n)
%1  —————— "m"(*&__tmp.b)
%0  —————— "m"(*&__tmp.a)
有了这些准备我们就可以来逐步分析switch_to的代码了。
指令部⾸先执⾏了这⼀句
"cmpl %%ecx,current\n\t"\
cmpl指令是⽐较指令,current是⼀个代表当前正在运⾏的进程的结构体变量task_struct,这个task_struct我们之前提到过,它代表着⼀个进程的⼀些属性,如进程id,进程状态等等。这条指令就是将当前正在运⾏的进程和要切换过去运⾏的进程做⼀个⽐较,如果⼆者是相同的,则下⼀条指令je 1f\n\t"会跳转到标号为1的地⽅执⾏,⽽标号为1的地⽅是"1:" \,也就是什么都不做。
这个容易理解,如果要切换过去的进程和当前进程是同⼀个进程,那就不⽤切换睐,等着重新调度吧。
接着下⼀条指令"movw %%dx,%1\n\t" \,movw指令是⼀条传送指令,就是将⼀个操作数传送到⽬的地址。因此这条指令的含义就是将
_TSS(n)的值赋给_tmp.b。
这个_TSS(n)⼤有来头,扮演了⾮常重要的⾓⾊。我们都知道TSS是进程的状态段,它⽤来保存进程切换的现场,以便于进程的恢复。
_TSS的定义
/*
* Entry into gdt where to find first TSS. 0-nul, 1-cs, 2-ds, 3-syscall
* 4-TSS0, 5-LDT0, 6-TSS1 etc ...
*/
#define FIRST_TSS_ENTRY 4
#define_TSS(n)((((unsigned long) n)<<4)+(FIRST_TSS_ENTRY<<3))
为了更好的理解_TSS(n),先介绍⼀下全局描述符GDT的结构。上⽂中我们介绍过,Linux⽤⼀个数组GDT来保存全局的⼀些地址,如进程的LDT段,TSS段等等,它的构成如下:
从图中可以看出,第⼀个tss段的索引是4,对应这FIRST_TSS_ENTRY,⽽tss段的结构为:
前三位⽆⽤,因此FIRST_TSS_ENTRY左移3作为基地址,加上n作为偏移地址到切换的进程的tss段。
因此_TSS(n)就代表了进程号为n的进程的状态段tss,movw %%dx,%1\n\t"这条指令就是将当前进程的状态段信息保存到_tmp.b变量中。
tss保存以后,执⾏了这⼀句:
xchgl %%ecx,current\n\t"
xchgl指令是交换指令,将ecx寄存器的值和current值交换,⽽ecx寄存器前⾯讲过对应的是task[n],是要切换过去的进程的
task_struct,current是当前进程的task_struct,⼆者交换,就是将指向正在运⾏的进程的指针current
指向task[n],这个current指针在进程调度中⼤有⽤处。
接下来到了进程切换的最核⼼的⼀条指令了:
"ljmp *%0\n\t"
ljmp指令是⼀条跳转指令,它可以从cpu从⼀⾏代码跳转到另⼀⾏代码执⾏,跳转分为代码段段内跳转和段间跳转。
段内跳转就是说在同⼀个代码段中跳转,汇编中可以通过段内跳转实现分⽀,循环等操作。段间跳转指的是⼀个进程的代码段跳转到另⼀个进程的代码段执⾏。
在汇编语⾔中,ljmp指令有两种形式:
直接操作数跳转,此时操作数即为⽬标逻辑地址(选择⼦,偏移量), 即形如:ljmp $seg_selector, $offset的⽅式
使⽤内存操作数,按照AS⼿册规定,内存操作数必须使⽤’‘做前缀,即形如:ljmp mem48,其中内存位置mem48存放⽬标逻辑地址:⾼16bit存放的是set_selector, 低32bit存放的是offset.注意,这条指令的’‘只是表⽰间接跳转的意思,与C语⾔的’'完全不同
回到"ljmp *%0\n\t",展开⼀下就是"ljmp *_tmp.a\n\t",跳转到_tmp.a的⾼48位地址,根据struct tmp的定义,_tmp.a就是逻辑地址的偏移地址,_tmp.b就是段选择⼦,⽽之前已经执⾏过movw %%dx,%1\n\t" \,_tmp.b的就是进程n的tss段基址,因此ljmp会跳转到进程n的tss段。
ljmp⼤致过程是:ljmp判断为TSS类型,于是就告诉硬件要切换任务,硬件⾸先要将当前的PC,esp, eax等现场信息保存在⾃⼰的TSS端描述符中,然后再将⽬标TSS段描述符中的pc, esp, eax的值拷贝⾄对应寄存器中,这些⼯作全部做完以后,内核就实现了进程上下⽂环境的切换。
执⾏完ljmp以后,cpu就跳转到新的进程的代码段执⾏了,当前switch_to的代码将暂停执⾏直到进程恢复。⽽ljmp后续的代码只是判断当前进程有没有⽤到协处理器,不需要关注。
4. 总结
总结⼀下进程切换的过程
1. ⽐较要切换的进程和当前进程是不是⼀致,如果⼀致就不做切换
2. 将要切换的进程的tss段放进_tmp.b变量中
3. 将要切换的进程和当前进程的task_struct交换
4. 执⾏ljmp指令跳转,ljmp指令判断跳转的地址是tss段,就通知硬件保存当前进程的esp,eax等寄存器值保存到⾃⼰的tss段,然后将
要切换过去的进程的tss段加载到相应的cpu寄存器完成上下⽂切换,最后cpu从当前进程代码段切换到新的进程的代码段执⾏,进程切换完成。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。