408/912-notes

Fork 0

Files

Shine wOng 3ca37f2ec1 create lab5_report.md, not finished yet.

2019-09-09 16:54:46 +08:00

24 KiB

Raw Blame History

Lab4 Report

实验目的

了解内核线程创建/执行的管理过程
了解内核线程的切换和基本调度过程

实验内容

实验2/3完成了物理和虚拟内存管理，这给创建内核线程（内核线程是一种特殊的进程）打下了提供内存管理的基础。当一个程序加载到内存中运行时，首先通过ucore OS的内存管理子系统分配合适的空间，然后就需要考虑如何分时使用CPU来“并发”执行多个程序，让每个运行的程序（这里用线程或进程表示）“感到”它们各自拥有“自己”的CPU。

本次实验将首先接触的是内核线程的管理。内核线程是一种特殊的进程，内核线程与用户进程的区别有两个：

内核线程只运行在内核态
用户进程会在在用户态和内核态交替运行
所有内核线程共用ucore内核内存空间，不需为每个内核线程维护单独的内存空间
而用户进程需要维护各自的用户内存空间

练习

对实验报告的要求：

基于markdown格式来完成，以文本方式为主
填写各个基本练习中要求完成的报告内容
完成实验后，请分析ucore lab中提供的参考答案，并请在实验报告中说明你的实现与参考答案的区别
列出你认为本实验中重要的知识点，以及与对应的OS原理中的知识点，并简要说明你对二者的含义，关系，差异等方面的理解（也可能出现实验中的知识点没有对应的原理知识点）
列出你认为OS原理中很重要，但在实验中没有对应上的知识点

lab4 整体实验流程概述

lab4 相对于前面的实验，就是增加了一个内核线程，即kern/process文件夹里面的内容。此外其他的文件也有一些细微的修改，比如增加了一些函数供后续调用等，这种变化目前可以忽略啊。

在增加的kern/process中，主要就是完成了三件事情，即建立第零个内核线程，建立第一个内核线程，以及将CPU的控制权从第零个线程转交给第一个线程，这也分别对应了本实验的三个练习。将在下面分别详细阐述。

建立第零个内核线程

在原理课中有讲到，在实际的操作系统中，例如在linux中，当一个用户进程希望创建一个子进程时，可以通过fork系统调用，由操作系统代劳为其建立一个子进程。在fork系统调用中，主要进行的操作是，将当前的进程拷贝到新创建的进程中，即将占用的各类资源，一些状态信息，复制到新创建的进程中，然后再在后续的操作中，更新其地址空间，更新子进程要执行的代码等。

但是这些操作都不适用于第零号内核线程，因为上面进程的创建，是在已经有了一个进程的基础上进行的，对于第零号进程则不然。我们这里讨论的，就是如何实现这种由零到一的转变。

操作系统通过进程控制块（PCB, Process Control Block），或者称为线程控制块（TCB, Thread Control Block）来管理进程。第零号内核线程的创建，其实就是手动构造它的TCB，将它的各个属性设置为合适的值，使它可以正常运行。

此外还需要明确，第零号内核线程究竟是干什么的？实际上，它什么也不干，即所谓的idleproc，它的主要作用就是在操作系统没有其它进程可以运行的时候，让操作系统运行这个线程。而它的主函数体如下：

// cpu_idle - at the end of kern_init, the first kernel thread idleproc will do below works
void
cpu_idle(void) {
    while (1) {
        if (current->need_resched) {
            schedule();
        }
    }
}

可以看到，它的工作就是不断地调用调度函数（schedule），以试图找到一个处于就绪队列的进程，将其放到CPU运行。

构造第零号内核线程

构造第零号内核线程就是手动构造它的TCB，让它成为一个合法的线程。那么，应该如何构造呢？具体步骤如下：

首先为它的TCB分配一个内存空间，这可以通过alloc_proc函数实现。
接下来就可以为它的TCB的各字段赋值了，主要包括
- pid：需要给它设置唯一的进程id，这里设置为零，以表现出它的特殊性
- state:标记它的状态为就绪态(PROC_RUNNABLE);
- kstack:设置内核堆栈，关于什么是内核堆栈，会在后面提到。这里直接设置它的内核堆栈为UCORE建立的内核堆栈bootstack。
- need_resched:是否需要被调度。当然要被调度啦！它就是个无所事事的idle线程啊。
- name:给它个名字，就叫idle吧。
- cr3：在alloc_proc中进行了设置，将其赋值为boot_cr3，即内核虚拟地址空间的页表，这是因为内核线程和操作系统共享内核地址空间。
此外，还有一些字段是没有设置的，比如
- parent:父进程，你说它有没有父进程？
- mm:用户虚拟地址空间。它是内核线程啊，没有用户地址空间。
- 一些状态信息，如tf，flags，context：它作为第一个运行的线程可以不用设置的，因为它是第一个运行的啊，后面在它被打断的时候，会通过中断机制设置这些信息。而别的线程就不行。会在后面说线程切换的时候详细说明。

上面就说清楚了应该如何构造第一个内核线程，具体的代码如下：

void
proc_init(void) {
    int i;

    list_init(&proc_list);
    for (i = 0; i < HASH_LIST_SIZE; i ++) {
        list_init(hash_list + i);
    }

    if ((idleproc = alloc_proc()) == NULL) {
        panic("cannot alloc idleproc.\n");
    }

    idleproc->pid = 0;
    idleproc->state = PROC_RUNNABLE;
    idleproc->kstack = (uintptr_t)bootstack;
    idleproc->need_resched = 1;
    set_proc_name(idleproc, "idle");
    nr_process ++;

    current = idleproc;
......

在前面还进行了进程列表的初始化(proc_list)，该列表用来保存所有进程，用于进程调度算法的。一旦运行了current = idleproc，第零个内核线程就投入运行了，后续代码的执行，后续的系统初始化工作，都可以看做它的运行过程。

练习1：分配并初始化一个进程控制块（需要编码）

alloc_proc函数（位于kern/process/proc.c中）负责分配并返回一个新的struct proc_struct结构，用于存储新建立的内核线程的管理信息。ucore需要对这个结构进行最基本的初始化，你需要完成这个初始化过程。

【提示】在alloc_proc函数的实现中，需要初始化的proc_struct结构中的成员变量至少包括：state/pid/runs/kstack/need_resched/parent/mm/context/tf/cr3/flags/name。

请在实验报告中简要说明你的设计实现过程。请回答如下问题：

请说明proc_struct中struct context context和struct trapframe *tf成员变量含义和在本实验中的作用是什么？（提示通过看代码和编程调试可以判断出来）

`alloc_proc`函数的实现

在进程的三状态模型中，我们说进程的状态除了就绪，运行，等待（挂起）以外，还有两个特殊的状态，即创建和退出。进程的创建态就涉及到这里的alloc_proc函数，因此，在alloc_proc函数中，除了为了新的进程控制块申请一块空闲的内存空间外，还要为其中的字段进行一些初步的设置，来表示该进程还未完成创建，处于创建态，此时还不可以被调度，亦不可以被杀死。

进程控制块中各个字段的初始化如下：

state: 处于创建态，这里用PROC_UNINIT表示，即“尚未初始化完成”。
pid：因为此时还不是一个合法的进程，所以给它的pid赋负值，来表示这种不合法。这里简单设置为-1。
runs: 运行时间，为零。
kstack: 内核堆栈。这个进程还刚在初始化啊，相关资源还没有分配，内核堆栈也还没有建立好，设置为空指针NULL = 0。此外的资源信息都没有，即mm = NULL。
need_resched: 不可调度。
parent：它这里是设置为NULL，然后推迟到后面的do_fork中再设置为当前进程current。我觉得直接设置为current应该也没问题吧。
context和tf和flags：是用于恢复进程现场的信息，这还没有现场啊，都设置为零。
cr3：由于是内核线程，和操作系统共用页表，设置为boot_cr3。

大体上就是这样，具体的代码如下：

alloc_proc(void) {
    struct proc_struct *proc = kmalloc(sizeof(struct proc_struct));
    if (proc != NULL) {
    proc->state  = PROC_UNINIT;
	proc->pid    = -1;
	proc->runs   = 0;
	proc->kstack = 0;
	proc->cr3    = boot_cr3;
	proc->flags  = 0;
	proc->parent = NULL;
	proc->mm     = NULL;
	proc->tf     = NULL;
	set_proc_name(proc, "undefined");
	proc->need_resched = 0;
	proc->context.eip = 0;
	proc->context.esp = 0;
	proc->context.ebx = 0;
	proc->context.ecx = 0;
	proc->context.edx = 0;
	proc->context.esi = 0;
	proc->context.edi = 0;
	proc->context.ebp = 0;
    }
    return proc;
}

这只是我的版本，基本和老师的标准答案差不多，只是我的实现不优雅而已，比如说老师的代码里面对context的设置只有一句

memset(&(proc->context), 0, sizeof(struct context));

就完成了，我就比较蠢了。当然了，我不蠢谁蠢啊。

`tf`和`context`的作用

这俩的作用在第零号内核线程还看不出来啊，其实主要是为了完成线程的切换的，只有合理设置了这两个字段，才能使新建立的线程被正确调度运行；以及可以在被其他进程打断以后，可以正确恢复现场。具体的还是在练习3里面会详细说明。

建立第一个内核线程

在有了第零个内核线程后，我们就可以通过该线程，来建立新的内核线程了。创建内核线程在函数kern/process/proc.c::kernel_thread中实现：

// kernel_thread - create a kernel thread using "fn" function
// NOTE: the contents of temp trapframe tf will be copied to 
//       proc->tf in do_fork-->copy_thread function
int
kernel_thread(int (*fn)(void *), void *arg, uint32_t clone_flags) {
    struct trapframe tf;
    memset(&tf, 0, sizeof(struct trapframe));
    tf.tf_cs = KERNEL_CS;
    tf.tf_ds = tf.tf_es = tf.tf_ss = KERNEL_DS;
    tf.tf_regs.reg_ebx = (uint32_t)fn;
    tf.tf_regs.reg_edx = (uint32_t)arg;
    tf.tf_eip = (uint32_t)kernel_thread_entry;
    return do_fork(clone_flags | CLONE_VM, 0, &tf);
}

可以看到，kernel_thread函数采用了局部变量tf来放置保存内核线程的临时中断帧，并把中断帧的指针传递给do_fork函数，而do_fork函数会调用copy_thread函数来在新创建的进程内核栈上专门给进程的中断帧分配一块空间。以下对tf的字段设置的值进行一定的解释：

由于这里是创建内核线程，该内核线程中断恢复后仍然是在内核中的运行，因此将tf.tf_cs设置为KERNEL_CS，tf.tf_df设置为KERNEL_DS，表示它在内核空间中运行。
tf.tf_eip表示该内核线程中断恢复后，应该执行的下一条语句。由于它这不还没开始执行吗，因此这里设置为它要执行的第一条语句，即kern/process/entry.S中定义的全局函数kernel_thread_entry。
转到kernel_thread_entry，我们就可以看懂tf.tf_regs.reg_ebx(edx)为什么要这样设置了：

kernel_thread_entry:        # void kernel_thread(void)

    pushl %edx              # push arg
    call *%ebx              # call fn

    pushl %eax              # save the return value of fn(arg)
    call do_exit            # call do_exit to terminate current thread

可以看到，在kernal_thread_entry中，我们的第一个内核线程是调用*%ebx，即fn函数，该函数作为kernel_thread的参数传入；该fn函数的参数，即刚刚被压栈的%edx，就是这里作为kernel_thread的参数传入的arg。至此，在kernel_thread的上半部分，就已经设置好了第一个内核线程的中断恢复点，不过此时这些信息还保存在局部变量tf中，需要在后续的copy_thread函数中，才能将相关信息拷贝到该进程自己的proc_struct.tf中。

创建第一个内核线程的接下来的操作都在do_fork中完成。

为新创建的内核线程分配资源（需要编码）

创建一个内核线程需要分配和设置好很多资源。kernel_thread函数通过调用do_fork函数完成具体内核线程的创建工作。do_fork函数会调用alloc_proc函数来分配并初始化一个进程控制块，但alloc_proc只是找到了一小块内存用以记录进程的必要信息，并没有实际分配这些资源。ucore一般通过do_fork实际创建新的内核线程。do_fork的作用是，创建当前内核线程的一个副本，它们的执行上下文、代码、数据都一样，但是存储位置不同。在这个过程中，需要给新内核线程分配资源，并且复制原进程的状态。你需要完成在kern/process/proc.c中的do_fork函数中的处理过程。它的大致执行步骤包括：

调用alloc_proc，首先获得一块用户信息块。
为进程分配一个内核栈。
复制原进程的内存管理信息到新进程（但内核线程不必做此事）
复制原进程上下文到新进程
将新进程添加到进程列表
唤醒新进程
返回新进程号

请在实验报告中简要说明你的设计实现过程。请回答如下问题：

请说明ucore是否做到给每个新fork的线程一个唯一的id？请说明你的分析和理由。

do_fork函数的实现

在前面的alloc_proc函数中，只是建立的一个新的线程控制块（TCB），并且对其中的字段做了一些预初始化操作，并没有实际地为新建立的线程分配资源。相关的操作留到do_fork函数中完成。所以do_fork函数的主要功能就是为新建立的线程分配资源，并且设置相关的标识与状态信息。按理说，do_fork函数创建的新线程应该是当前线程current的一个拷贝，它们应该具有相同的数据，代码，执行上下文等，只有pid标志符不同而已，但是事实好像并不是这样，我将慢慢分析。

do_fork函数就是进行资源的分配，这些资源包括

为新的线程控制块分配内存空间，调用alloc_proc来完成。
为该线程分配内核地址空间，来作为它的内核堆栈。这个步骤可以通过调用setup_kstack来完成。
为新的线程分配虚拟用户地址空间，这个步骤可以通过copy_mm来完成。copy_mm可以选择新的线程是共享父线程的地址空间（CLONE_VM），还是将父线程的地址空间拷贝到一个新的虚拟用户地址空间。当然，由于这里还只有内核线程，它们都没有用户地址空间，这里还不需要关注这个问题。

在分配这些内存空间的时候，都有可能因为内存空间不足而失败，因此应该对失败的情况进行检测，一旦发生失败，即将已经分配的资源归还给操作系统。

此外，需要设置新线程的状态标志，如pid，并且将state转变为就绪态PROC_RUNNABLE，然后将新的线程添加到线程队列中，以供操作系统统一管理。至此，已经将do_fork的具体实现阐述清楚，代码如下：

int
do_fork(uint32_t clone_flags, uintptr_t stack, struct trapframe *tf) {
    int ret = -E_NO_FREE_PROC;
    struct proc_struct *proc;
    if (nr_process >= MAX_PROCESS) {
        goto fork_out;
    }
    ret = -E_NO_MEM;
	proc = alloc_proc();
    setup_kstack(proc);
    proc->pid = get_pid();
    copy_mm(clone_flags, proc);
    copy_thread(proc, stack, tf);
    hash_proc(proc);
    list_add(&proc_list, &(proc->list_link));
    wakeup_proc(proc);
    ++nr_process;
    ret = proc->pid;
fork_out:
    return ret;

bad_fork_cleanup_kstack:
    put_kstack(proc);
bad_fork_cleanup_proc:
    kfree(proc);
    goto fork_out;
}

我这里的代码也是不对的，首先是我忘了设置proc->parent = current，还好测试用例里面没有相关的测试......此外，就是没有做失败情况的判断以及资源的回收。这是非常致命的问题啊，操作系统越用内存空间越少，需要引起重视。此外，还有一个问题是参考答案中的某些操作，是取消了中断的，即是不允许被中断的。这个我还没有什么研究啊，不知道为什么要这样进行。

所以，最终把参考答案也贴一下：

int
do_fork(uint32_t clone_flags, uintptr_t stack, struct trapframe *tf) {
    int ret = -E_NO_FREE_PROC;
    struct proc_struct *proc;
    if (nr_process >= MAX_PROCESS) {
        goto fork_out;
    }
    ret = -E_NO_MEM;
    if ((proc = alloc_proc()) == NULL) {
        goto fork_out;
    }

    proc->parent = current;

    if (setup_kstack(proc) != 0) {
        goto bad_fork_cleanup_proc;
    }
    if (copy_mm(clone_flags, proc) != 0) {
        goto bad_fork_cleanup_kstack;
    }
    copy_thread(proc, stack, tf);

    bool intr_flag;
    local_intr_save(intr_flag);
    {
        proc->pid = get_pid();
        hash_proc(proc);
        list_add(&proc_list, &(proc->list_link));
        nr_process ++;
    }
    local_intr_restore(intr_flag);

    wakeup_proc(proc);

    ret = proc->pid;
fork_out:
    return ret;

bad_fork_cleanup_kstack:
    put_kstack(proc);
bad_fork_cleanup_proc:
    kfree(proc);
    goto fork_out;
}

每个新fork的线程是否获得唯一的id？

的确是的，新创建的线程，是通过get_pid函数，来生成一个新的pid的。并且由于MAX_PID > MAX_PROCESS，即可用的pid数量大于可以存在的进程数，每个线程都可以获得一个唯一的pid。具体的可以查看get_pid函数的具体实现。

练习3：阅读代码，理解`proc_run`函数和它调用的函数如何完成进程切换的。（无编码工作）

请在实验报告中简要说明你对proc_run函数的分析。并回答如下问题：

在本实验的执行过程中，创建且运行了几个内核线程？
语句local_intr_save(intr_flag);....local_intr_restore(intr_flag);在这里有何作用?请说明理由

线程切换过程分析

第一个内核线程创建好了以后，第零个内核线程就可以通过调用调度函数schedule来将CPU的控制权交给第一个内核线程了。接下来，就是慢慢分析这个过程。

调度函数schedule

schedule的主要功能，就是根据预先设置好的进程调度算法（这里是先入先出的FIFO算法），来从就绪队列中选择一个进程，并且调用proc_run函数使该进程开始运行。

proc_run函数

proc_run函数的功能是可以使一个线程开始在CPU上运行。为了让CPU开始运行一个新的线程，需要做哪些工作呢？

首先，运行一个新的线程，肯定需要更新ss:eip寄存器，使其指向新的线程要执行的下一条语句，对于还未投入运行的线程，即指向它的第一条语句；对于执行了一段时间被调度出CPU的线程，就是指向它上一次执行的中断点。此外，其他的寄存器也要做相应的更新，更新为该线程上一次执行被中断时的情形，即恢复它的执行上下文。所有这些信息都保存在proc_struct.context里面。

除了一些寄存器的信息以外，运行一个新的线程，还需要切换到该线程的用户空间堆栈中，为此需要更新cr3寄存器的值为该线程的proc_struct.cr3。除了用户空间，该线程应该还具有一个虚拟内核空间，用来保存中断时所需要的信息，线程的切换还需要加载该线程的虚拟内核空间，ts.esp0即是保存这个信息的寄存器。

最后，将current赋值为被切换的进程，标志进程切换完成。至此，我们已经分析出proc_run的主要实现步骤，具体的代码如下：

// proc_run - make process "proc" running on cpu
// NOTE: before call switch_to, should load  base addr of "proc"'s new PDT
void
proc_run(struct proc_struct *proc) {
    if (proc != current) {
        bool intr_flag;
        struct proc_struct *prev = current, *next = proc;
        local_intr_save(intr_flag);
        {
            current = proc;
            load_esp0(next->kstack + KSTACKSIZE);
            lcr3(next->cr3);
            switch_to(&(prev->context), &(next->context));
        }
        local_intr_restore(intr_flag);
    }
}

由于在做线程切换时，不允许被调度的，否则会产生进程的嵌套调度，这里的操作需要首先关闭中断。可以看到，其中的语句就是上面分析的那些，其中的上下文切换在switch_to中实现。

switch_to的实现

switch_to是完成了进程上下文的切换。由于我们说上下文的切换主要就是更新一些寄存器里的值，都是比较底层的操作，因此switch_to用汇编代码来实现。具体的代码如下：

switch_to:                      # switch_to(from, to)

    # save from's registers
    movl 4(%esp), %eax          # eax points to from
    popl 0(%eax)                # save eip !popl
    movl %esp, 4(%eax)
    movl %ebx, 8(%eax)
    movl %ecx, 12(%eax)
    movl %edx, 16(%eax)
    movl %esi, 20(%eax)
    movl %edi, 24(%eax)
    movl %ebp, 28(%eax)

    # restore to's registers
    movl 4(%esp), %eax          # not 8(%esp): popped return address already
                                # eax now points to to
    movl 28(%eax), %ebp
    movl 24(%eax), %edi
    movl 20(%eax), %esi
    movl 16(%eax), %edx
    movl 12(%eax), %ecx
    movl 8(%eax), %ebx
    movl 4(%eax), %esp

    pushl 0(%eax)               # push eip

    ret

switch_to包含两部分的内容，即保存被切换的线程的上下文，以及将新的线程的上下文加载到寄存器中。它们两个的上下文信息保存在4(%esp)和8(%esp)中，因为之前是函数调用switch_to(&(prev->context), &(next->context))的参数，在eip之前被压入到栈中。还需要注意的是，这里压入栈的并不是整个context结构体，而是两个context结构体的地址，因此后面都是利用这个地址做内存访问。

还需要注意的点是，在将context.eip压入栈中后pushl 0(%eax)，switch_to调用了ret。这其实是手动模拟了函数调用返回，因为在执行ret命令时，硬件会将刚刚压栈的0(%eax)弹栈到eip中，随后就跳转到cs:eip指示的位置去执行。那么问题来了，第一个内核线程的context.eip是被设置为了多少呢？

这个可以在copy_thread中找到答案，其代码如下：

static void
copy_thread(struct proc_struct *proc, uintptr_t esp, struct trapframe *tf) {
    proc->tf = (struct trapframe *)(proc->kstack + KSTACKSIZE) - 1;
    *(proc->tf) = *tf;
    proc->tf->tf_regs.reg_eax = 0;
    proc->tf->tf_esp = esp;
    proc->tf->tf_eflags |= FL_IF;

    proc->context.eip = (uintptr_t)forkret;
    proc->context.esp = (uintptr_t)(proc->tf);
}

可以看到，在copy_thread中，首先是将当前线程的中断帧tf设置在了其内核堆栈的顶部，并且将此前设置的tf拷贝到了线程自己的中断帧中。此外，第一个内核线程的context.eip是被设置为了forkret，forkret转而调用了forkrets，这个函数可以在kern/trap/trapentry.S中找到。

forkrets

在forkrets中的操作非常简单，代码如下：

forkrets:
    # set stack to this new process's trapframe
    movl 4(%esp), %esp
    jmp __trapret

即将栈顶指针指向我们已经设置好了的proc_struct.tf，然后跳转到__trapret，这里的思想和前面手动模拟函数调用返回一样，只不过这里是手动模拟了中断返回。此后，在__trapret中，就可以通过中断返回，将程序的控制权转交到中断帧中所指示的ss:eip，并且将堆栈切换到中断帧设置好了的用户堆栈（如果是用户线程的话）。这样，中断返回后，执行的语句就是tf中设置好了的kernel_thread_entry了，在前面我们已经对它进行了分析。至此，已经完成了CPU控制权的切换。

线程切换总结

线程的切换，主要有依赖proc_struct.context和proc_struct.tf，即上下文信息和中断帧信息。首先通过上下文信息，跳转到了中断返回函数，在其中通过模拟中断返回机制，使程序的控制权最终转交到中断帧中所指示的位置。值得注意的是，这是线程第一个投入运行时的情况，在经过调度后重新恢复运行时，只需要上下文信息context就足够了，因为在此前的被切换的过程中，context已经保存了恢复的地址和状态信息了。

24 KiB Raw Blame History Unescape Escape