- 论坛徽章:
- 2
|
常识告诉我们,线程既可以在内核空间挂起(传统Unix在内核空间时不能被打断,但是不要忘了我们现在的FreeBSD6.0里),也可以在用户空间挂起,所以存在如下的情况。
因为内核地址空间对所有进程是共享的,所以在内核空间时不需要转换CR3寄存器。
因为如果线程使用相同地址空间(废话,线程的存在就是为了共享地址空间嘛,也就是说这里检查的是old和new两个线程是否属于两个不同进程),页目录基址也不需要变换,我们自然也不需要操作CR3寄存器。
但是现在检测到线程既不处于内核空间,也不使用相同的地址空间,所以需要做下面的工作。
否则直接跳过174-181行。
- 174 movl %eax,%cr3 /* new address space */
- /* 我们开始使用164行得到的new线程的CR3
- 开始使用新的CR3,因此从现在开始地址映射关系改变。
- 改变后不会影响下面的操作吗?因为下面还要访问内存阿?!
- 不要忘了,我们在内核里,所有线程共享内核空间,下面的存储器
- 访问,虽然CR3变了,但是从虚拟地址经过上述的三维数组遍历之后
- 仍然访问的相同的地址。概念上和C语言的指针alias很相似。
- [debug me]
- */
- 176 /* Release bit from old pmap->pm_active */
- 177 movl PCPU(CURPMAP), %ebx /* %fs:PC_CURPMAP = %fs:0x3c */
- 181 btrl %esi, PM_ACTIVE(%ebx) /* clear old */
- /* esi在161行赋值 */
- /* 清除活动位标志,由于old线程分配的虚存
- * 在new线程活动期间不再需要,标志为不活动
- * 可以让换页守护进程在存储空间不足时将之
- * 交换出主存
- */
复制代码
显然,我们弄死了一个,就要复活一个。我们下面需要设置new线程的虚拟页面为活动页面。
- 183 /* Set bit in new pmap->pm_active */
- 184 movl TD_PROC(%ecx),%eax /* newproc,取得new线程的进程结构 */
- 185 movl P_VMSPACE(%eax), %ebx /* 这是一个vmspace结构的指针 */
- 186 addl $VM_PMAP, %ebx /* 现在ebx代表new线程中pmap结构的首
- 地址vm/vm_map.h
- */
- 187 movl %ebx, PCPU(CURPMAP)
- 191 btsl %esi, PM_ACTIVE(%ebx) /* set new */
复制代码
如下面194-197行的代码注释那样,我们现在已经切换了new线程的地址空间。
- 193 sw1:
- 194 /*
- 195 * At this point, we've switched address spaces and are ready
- 196 * to load up the rest of the next context.
- 197 */
复制代码
pcb扩展,意思是每个进程有自己的TSS,反正都是TSS,因此是不是它自己的并不影响对线程切换行为的理解。差别不过是自己的TSS自己用,公用的TSS大家用。TSS: Task-State segment [7]:第6章。
注意FreeBSD中并没有使用Intel硬件提供的任务切换机制(将在下面解释为什么还要出现TSS),所以暂时忽略这段代码的分析。
- 198 cmpl $0, PCB_EXT(%edx) /* has pcb extension? */
- 199 je 1f /* If not, use the default */
- 200 btsl %esi, private_tss /* mark use of private tss */
- 201 movl PCB_EXT(%edx), %edi /* new tss descriptor */
- 202 jmp 2f /* Load it up */
- 204 1: /*
- 205 * Use the common default TSS instead of our own.
- 206 * Set our stack pointer into the TSS, it's set to just
- 207 * below the PCB. In C, common_tss.tss_esp0 = &pcb - 16;
- 208 */
- 209 leal -16(%edx), %ebx /* leave space for vm86 */
- 210 movl %ebx, PCPU(COMMON_TSS) + TSS_ESP0
- 211
- 212 /*
- 213 * Test this CPU's bit in the bitmap to see if this
- 214 * CPU was using a private TSS.
- 215 */
- 216 btrl %esi, private_tss /* Already using the common? */
- 217 jae 3f /* if so, skip reloading */
- 218 PCPU_ADDR(COMMON_TSSD, %edi)
复制代码
我们可以看见227行的ltr装载task register的操作。但是,FreeBSD是不依赖intel的硬件机制来实施任务切换。因此,上面保留的问题在这里回答。要回答这个问题,需要看看tss的大致结构:
![]()
[7]:图6-1
里面的各项域都是在使用intel硬件提供的任务切换时自动保存的。由于不使用TSS进行任务切换,我们忽略大部分域,只关心三个域(Stack Priv Level 0),( Stack Priv Level 1),( Stack Priv Level 2),其时还有第四个域I/Omap,我还不熟悉,就不讲述I/O map的东西,希望有人可以补充下。
这三个域代表了处理器在0-2三个ring级别执行时的堆栈段及栈顶(SSx:ESPx,x代表ring级别)。还有一个ring3的堆栈,那自然在用户级大家经常看见的esp,ss就可以表示了。所以这里只需要记录四个ring级别中的三个。
由于80x86的处理器下降ring权限时,比如ring3(用户级)下降到0,或1,或2,(或者从ring2下降到0或1,等)处理器自动从TSS数据结构里面得相应ring级别找出堆栈。并在相应的级别中操作堆栈。为什么?因为我们不可以让低优先的东西使用高优先级堆栈,堆栈需要保护。所以我们可以看见下面的图示:
![]()
[7]:图5-4
图上半部是同级别的入栈操作,下面是跨级别的入栈。可以看出来,在ring下降(也就是优先级升高)的时候,很多东西都是记录在高优先级的堆栈中。(虽然这里是用的中断处理的图,但是抛开中断或是任务切换的表象,我们解释的是不同ring级别堆栈的使用。当然,从低优先级到高优先级的访问,也只有中断,异常等几种方式可以做到)。由于什么信息都已经记载,从高优先级退出时返回是很容易的。正是由于这个自动操作的存在,使得我们虽然不使用TSS这个东西,还是必须填充它,随任务切换时切换。
- 219 2:
- 220 /* Move correct tss descriptor into GDT slot, then reload tr. */
- 221 movl PCPU(TSS_GDT), %ebx /* entry in GDT */
- 222 movl 0(%edi), %eax
- 223 movl 4(%edi), %esi
- 224 movl %eax, 0(%ebx)
- 225 movl %esi, 4(%ebx)
- 226 movl $GPROC0_SEL*8, %esi /* GSEL(entry, SEL_KPL) */
- 227 ltr %si
- 228 3:
- 229
- 230 /* Copy the %fs and %gs selectors into this pcpu gdt */
- 231 leal PCB_FSD(%edx), %esi
- 232 movl PCPU(FSGS_GDT), %edi
- 233 movl 0(%esi), %eax /* %fs selector */
- 234 movl 4(%esi), %ebx
- 235 movl %eax, 0(%edi)
- 236 movl %ebx, 4(%edi)
- 237 movl 8(%esi), %eax /* %gs selector, comes straight after */
- 238 movl 12(%esi), %ebx
- 239 movl %eax, 8(%edi)
- 240 movl %ebx, 12(%edi)
复制代码
恢复new线程的寄存器。是107-114行的逆过程
- 242 /* Restore context. */
- 243 movl PCB_EBX(%edx),%ebx
- 244 movl PCB_ESP(%edx),%esp
- 245 movl PCB_EBP(%edx),%ebp
- 246 movl PCB_ESI(%edx),%esi
- 247 movl PCB_EDI(%edx),%edi
- 248 movl PCB_EIP(%edx),%eax
- 249 movl %eax,(%esp)
- 250 pushl PCB_PSL(%edx)
- 251 popfl /* 恢复了很多寄存器,包括处理器状态字EFLAGS */
复制代码
记录当前处理器的当前进程和当前线程。恩,平铺直叙的表达手法。
- 253 movl %edx, PCPU(CURPCB)
- 254 movl %ecx, PCPU(CURTHREAD) /* into next thread */
复制代码
设置new线程的LDT描述符表,和GDT差不多,差别在于一个是公用的,一个是私有的。270行之下的USER_LDT在NetBSD中用来模拟windows,呵呵,我猜想FreeBSD也差不多吧,晕,猜想。。。。汗一个先。
- 256 /*
- 257 * Determine the LDT to use and load it if is the default one and
- 258 * that is not the current one.
- 259 */
- 260 movl TD_PROC(%ecx),%eax
- 261 cmpl $0,P_MD+MD_LDT(%eax)
- 262 jnz 1f
- 263 movl _default_ldt,%eax
- 264 cmpl PCPU(CURRENTLDT),%eax
- 265 je 2f
- 266 lldt _default_ldt
- 267 movl %eax,PCPU(CURRENTLDT)
- 268 jmp 2f
- 269 1:
- 270 /* Load the LDT when it is not the default one. */
- 271 pushl %edx /* Preserve pointer to pcb. */
- 272 addl $P_MD,%eax /* Pointer to mdproc is arg. */
- 273 pushl %eax
- 274 call set_user_ldt
- 275 addl $4,%esp
- 276 popl %edx
- 277 2:
- 278
- 279 /* This must be done after loading the user LDT. */
- 280 .globl cpu_switch_load_gs
- 281 cpu_switch_load_gs:
- 282 movl PCB_GS(%edx),%gs
复制代码
恢复调试寄存器。
- 284 /* Test if debug registers should be restored. */
- 285 testl $PCB_DBREGS,PCB_FLAGS(%edx)
- 286 jz 1f
- 287
- 288 /*
- 289 * Restore debug registers. The special code for dr7 is to
- 290 * preserve the current values of its reserved bits.
- 291 */
- 292 movl PCB_DR6(%edx),%eax
- 293 movl %eax,%dr6
- 294 movl PCB_DR3(%edx),%eax
- 295 movl %eax,%dr3
- 296 movl PCB_DR2(%edx),%eax
- 297 movl %eax,%dr2
- 298 movl PCB_DR1(%edx),%eax
- 299 movl %eax,%dr1
- 300 movl PCB_DR0(%edx),%eax
- 301 movl %eax,%dr0
- 302 movl %dr7,%eax
- 303 andl $0x0000fc00,%eax
- 304 movl PCB_DR7(%edx),%ecx
- 305 andl $~0x0000fc00,%ecx
- 306 orl %ecx,%eax
- 307 movl %eax,%dr7
复制代码
还记得249 movl %eax,(%esp)这句吗?我们在堆栈返回地址填充了new线程的eip,ret就返回到new线程上一次(因为它那个时候被剥夺了执行权)call cpu_switch之下的一条语句去执行。
Now, a new world, enjoy.
小结:
可以看出,FreeBSD的调度机制与策略分隔的十分明显,数据流参数全部包括在thread结构变量old,new中,也就是说,如果我们在上层替换掉调度策略的话,就可能提供一种新的调度器。
参考
[1] sys/i386/i386/swtch.s
[2] FreeBSD操作系统设计与实现
[3] ULE: A Modern Scheduler for FreeBSD
[4] Operation System concept(the six edition)
[5] Computer Systems: A Programmer's Perspective (CS:APP)
[6] A guide to how the FreeBSD kernel manages the IA32 processors in Protected Mode
[7] IA-32 Intel® ArchitectureSoftware Developer’s Manual
[ 本帖最后由 gvim 于 2006-4-10 10:52 编辑 ] |
|