# Lab10: mmap # mmap(hard) `mmap`和`munmap`系统调用允许UNIX程序对其地址空间进行详细控制。它们可用于在进程之间共享内存,将文件映射到进程地址空间,并作为用户级页面错误方案的一部分,如本课程中讨论的垃圾收集算法。在本实验室中,您将把`mmap`和`munmap`添加到xv6中,重点关注内存映射文件(memory-mapped files)。 获取实验室的xv6源代码并切换到`mmap`分支: ```bash $ git fetch $ git checkout mmap $ make clean ``` 手册页面(运行`man 2 mmap`)显示了`mmap`的以下声明: ```c void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset); ``` 可以通过多种方式调用`mmap`,但本实验只需要与内存映射文件相关的功能子集。您可以假设`addr`始终为零,这意味着内核应该决定映射文件的虚拟地址。`mmap`返回该地址,如果失败则返回`0xffffffffffffffff`。`length`是要映射的字节数;它可能与文件的长度不同。`prot`指示内存是否应映射为可读、可写,以及/或者可执行的;您可以认为`prot`是`PROT_READ`或`PROT_WRITE`或两者兼有。`flags`要么是`MAP_SHARED`(映射内存的修改应写回文件),要么是`MAP_PRIVATE`(映射内存的修改不应写回文件)。您不必在`flags`中实现任何其他位。`fd`是要映射的文件的打开文件描述符。可以假定`offset`为零(它是要映射的文件的起点)。 允许进程映射同一个`MAP_SHARED`文件而不共享物理页面。 `munmap(addr, length)`应删除指定地址范围内的`mmap`映射。如果进程修改了内存并将其映射为`MAP_SHARED`,则应首先将修改写入文件。`munmap`调用可能只覆盖`mmap`区域的一部分,但您可以认为它取消映射的位置要么在区域起始位置,要么在区域结束位置,要么就是整个区域(但不会在区域中间“打洞”)。 > [!TIP|label:YOUR JOB] > 您应该实现足够的`mmap`和`munmap`功能,以使`mmaptest`测试程序正常工作。如果`mmaptest`不会用到某个`mmap`的特性,则不需要实现该特性。 完成后,您应该会看到以下输出: ```bash $ mmaptest mmap_test starting test mmap f test mmap f: OK test mmap private test mmap private: OK test mmap read-only test mmap read-only: OK test mmap read/write test mmap read/write: OK test mmap dirty test mmap dirty: OK test not-mapped unmap test not-mapped unmap: OK test mmap two files test mmap two files: OK mmap_test: ALL OK fork_test starting fork_test OK mmaptest: all tests succeeded $ usertests usertests starting ... ALL TESTS PASSED $ ``` **提示:** - 首先,向`UPROGS`添加`_mmaptest`,以及`mmap`和`munmap`系统调用,以便让***user/mmaptest.c***进行编译。现在,只需从`mmap`和`munmap`返回错误。我们在***kernel/fcntl.h***中为您定义了`PROT_READ`等。运行`mmaptest`,它将在第一次`mmap`调用时失败。 - 惰性地填写页表,以响应页错误。也就是说,`mmap`不应该分配物理内存或读取文件。相反,在`usertrap`中(或由`usertrap`调用)的页面错误处理代码中执行此操作,就像在lazy page allocation实验中一样。惰性分配的原因是确保大文件的`mmap`是快速的,并且比物理内存大的文件的`mmap`是可能的。 - 跟踪`mmap`为每个进程映射的内容。定义与第15课中描述的VMA(虚拟内存区域)对应的结构体,记录`mmap`创建的虚拟内存范围的地址、长度、权限、文件等。由于xv6内核中没有内存分配器,因此可以声明一个固定大小的VMA数组,并根据需要从该数组进行分配。大小为16应该就足够了。 - 实现`mmap`:在进程的地址空间中找到一个未使用的区域来映射文件,并将VMA添加到进程的映射区域表中。VMA应该包含指向映射文件对应`struct file`的指针;`mmap`应该增加文件的引用计数,以便在文件关闭时结构体不会消失(提示:请参阅`filedup`)。运行`mmaptest`:第一次`mmap`应该成功,但是第一次访问被`mmap`的内存将导致页面错误并终止`mmaptest`。 - 添加代码以导致在`mmap`的区域中产生页面错误,从而分配一页物理内存,将4096字节的相关文件读入该页面,并将其映射到用户地址空间。使用`readi`读取文件,它接受一个偏移量参数,在该偏移处读取文件(但必须lock/unlock传递给`readi`的索引结点)。不要忘记在页面上正确设置权限。运行`mmaptest`;它应该到达第一个`munmap`。 - 实现`munmap`:找到地址范围的VMA并取消映射指定页面(提示:使用`uvmunmap`)。如果`munmap`删除了先前`mmap`的所有页面,它应该减少相应`struct file`的引用计数。如果未映射的页面已被修改,并且文件已映射到`MAP_SHARED`,请将页面写回该文件。查看`filewrite`以获得灵感。 - 理想情况下,您的实现将只写回程序实际修改的`MAP_SHARED`页面。RISC-V PTE中的脏位(`D`)表示是否已写入页面。但是,`mmaptest`不检查非脏页是否没有回写;因此,您可以不用看`D`位就写回页面。 - 修改`exit`将进程的已映射区域取消映射,就像调用了`munmap`一样。运行`mmaptest`;`mmap_test`应该通过,但可能不会通过`fork_test`。 - 修改`fork`以确保子对象具有与父对象相同的映射区域。不要忘记增加VMA的`struct file`的引用计数。在子进程的页面错误处理程序中,可以分配新的物理页面,而不是与父级共享页面。后者会更酷,但需要更多的实施工作。运行`mmaptest`;它应该通过`mmap_test`和`fork_test`。 运行`usertests`以确保一切正常。