xv6源码解析（四）——进程管理

2023年6月27日上午12:36 • 人工智能 • 阅读 81

01 进程管理

进程管理：添加了常见的IPC通信模块（共享内存、消息队列）；以进程上下文切换为基础，实现了时间片轮转调度算法；设计了自旋锁Spinlock，为用户进程提供互斥机制。

02 进程通信

共享内存

设计的简化版本的共享内存，远达不到Linux共享内存的通用程度,但也能将共享内存的核心思想体现出来。

简化后的限制包括：

（1）整个系统只有固定的若干个共享内存区

（2）进程不允许一个共享内存区反复映射到自己的虚存空间

（3）进程退出时自动解除共享映射

（4）共享内存作为进程最高端的空间从而避免与xv6原来的sbrk操作冲突

共享内存需要实现不同进程访问同一块物理内存，其核心机制是不同进程分配pte指向相同物理页帧（物理内存地址），从而使该页帧在不同进程中都是可见的

系统中一共有8个共享内存区，因此系统中每个共享内存使用一个引用计数来表明是否启用。

每个进程则使用一个8位掩码或者一个编号来指示其中一个区域，其中，shmkeymask用于记录本进程对这些共享内存区的启用情况，key用于指出一个共享内存区的编号，而i往往用作遍历这些内存区时的循环变量

实现步骤：

（1）首先需要定义一个sharemem结构体，里面的成员包括了 引用计数、共享内存区间大小、本区间所映射的物理页帧。

（2）新增一个系统调用sharememoryget，用于指定获取8个共享内存区的哪一个，分配对应的物理内存，建立页表映射后返回该内存的虚拟地址。然后把共享内存映射到进程空间

若共享内存被映射过，直接返回退出。不允许共享内存在同一个进程被多次映射！！！
共享内存区还未创建，引用技术还为0，创建该内存区
已有对应的共享内存区，直接映射到进程空间即可

（3）进程退出时，接触共享内存区的映射，引用计数减一，解除页表映射。如果引用计数为0，还需要释放物理内存。

消息队列

（1）首先使用一个msg结构体描述一个消息，消息队列存储了消息msg，对应的key，引用数，所有消息队列构成一个链表。

（2）消息队列的实现涉及初始化、创建mqget和撤销消息队列、消息的发送msgsend和接收msgrecv。 5个步骤

初始化需要将各个消息队列状态设置为空闲未使用，同时进行锁的初始化。若被使用，引用计数加1
创建消息队列每个消息队列使用一个页的内存空间，各个消息都存储于该页的4kb空间内
发送消息需要指出哪个消息队列，消息缓冲区首地址以及消息长度三个参数。接收消息类似，也需要指出哪个消息队列，消息缓冲区首地址以及消息长度三个参数
引用计数为0时，回收内存

03 进程上下文切换

中断上下文切换

用户程序陷入到内核通过中断INT指令，在xv6中系统调用的号为64

操作系统在初始化的时候会建立IDT表以及GDT表

通过INT找到IDT中的项，通过IDT中的项找到GDT中的项，最后定位到代码。

在执行陷入指令的时候首先会到trapasm.S中的alltraps中，将trapframe存入到应用程序的内核栈中。将esp的地址存入栈中作为trap函数的输入，然后调用trap。注意trapframe中有的字段会自动存入，比如int指令会通过CPU存入ss,esp,eflags,cs,eip,errorcode,trapno。系统调用号存在寄存器eax中。应用程序在初始化的时候操作系统会为每个应用程序保留一个内核栈，其中TSS断记录内核栈的一些信息比如内核栈的入口地址esp0。

系统调用将返回值存入到寄存器eax中。返回的时候通过trapret将原来的状态返回。最后一条指令iret回到用户程序。

; 内核进程上下文切换

xv6在进程调度中主要通过切换context上下文结构进行的：

struct context {
  uint edi;
  uint esi;
  uint ebx;
  uint ebp;
  uint eip;
};

context保存着被调用函数必须手动保存的寄存器的值，Intel规定以上寄存器发生过程调用时必须由被调用者保存，同时eip保存的被调用函数的返回地址，正常情况下c函数被调用时编译器会自动为其加上保存context的代码，xv6使用context切换来完成进程切换操作。

每个进程都有一个指向自己context结构的指针，当发生进程切换时，通过保存旧的context，然后将恢复另一个context来切换到另一个进程，swich汇编代码是所有进程切换的基础，旧进程调用swich时首先保存自己的context，然后将栈指针指向新的context，弹出恢复寄存器，当switch返回时返回的地址则是新的进程返回swich的代码，也就是说，进程总是调用swich来切换新进程，而swich从此并不会返回，只有当进程再次被调度时才能恢复到返回swich的”状态”，进程的状态总是被恢复在swich返回时状态。
在这里需要注意的是为什么context只保存部分寄存器的值，因为swich的操作总是让一个进程返回到调用swich应该返回的地方，也就是说，在调用swich之前，Intel的寄存器使用规范已经保证调用者保存寄存器能够被被调用的过程破坏，所以就算当切换到另一个进程时寄存器或许是旧进程的，但是对于新进程来说，它或者总是不会读取这些数据已经被破换的寄存器（Intel体系规定了寄存器使用惯例，所有编程人员都应该注意这个问题）。

04 进程调度

时间片轮转

xv6永远不会直接从一个进程的上下文切换到另一个进程的上下文，这些都是通过一个中间的内核线程实现的：内核调度器线程。具体如图：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-c8pvedk5-1668171607564)(https://image-1312312327.cos.ap-shanghai.myqcloud.com/20170123135047439)]

在前面讲过当进程用完它的CPU时间片时，时钟中断会调用yield函数来让出CPU给新的进程，yield调用sched函数，sched调用swich来切换都调度器线程：

调度器线程从进程表中找到一个就绪进程，并初始化进程运行环境，然后调用swich切换到新的进程：

  swtch(&proc->context, cpu->scheduler);

调度器线程从进程表中找到一个就绪进程，并初始化进程运行环境，然后调用swich切换到新的进程：

  swtch(&cpu->scheduler, p->context);

调度器线程仅仅是简单地进行轮转调度，一旦找到就绪线程便切换到新的线程。
调度器完整代码如下：

// Loop over process table looking for process to run.

acquire(&ptable.lock);
for(p = ptable.proc; p < &ptable.proc[NPROC]; p++){
  if(p->state != RUNNABLE)
    continue;

  // Switch to chosen process.  It is the process's job
  // to release ptable.lock and then reacquire it
  // before jumping back to us.

  proc = p;
  switchuvm(p);
  p->state = RUNNING;
  swtch(&cpu->scheduler, p->context);
  switchkvm();

  // Process is done running for now.

  // It should have changed its p->state before coming back.

  proc = 0;
}
release(&ptable.lock);

}
}

05 进程互斥、同步

自旋锁

因为 xv6是多核操作系统，因此在进程唤醒睡眠的时候要加上自旋锁，保证在进程进程睡眠和唤醒进程时不会发生自旋锁拿不到的情况。

先贴上自旋锁的实现代码


static inline uint xchg(volatile uint *addr, uint newval) {
  uint result;

  asm volatile("lock; xchgl %0, %1" :
               "+m" (*addr), "=a" (result) :
               "1" (newval) :
               "cc");
  return result;
}


struct spinlock {
  uint locked;
};

void acquire(struct spinlock *lk) {
  pushcli();
  if(holding(lk))
    panic("acquire");

  while(xchg(&lk->locked, 1) != 0)
    ;
  __sync_synchronize();
}

void release(struct spinlock *lk) {
  if(!holding(lk))
    panic("release");

  lk->pcs[0] = 0;
  lk->cpu = 0;
  __sync_synchronize();
  asm volatile("movl $0, %0" : "+m" (lk->locked) : );
  popcli();
}

void pushcli(void) {
  int eflags;

  eflags = readeflags();
  cli();
  if(mycpu()->ncli == 0)
    mycpu()->intena = eflags & FL_IF;
  mycpu()->ncli += 1;
}

void popcli(void) {
  if(readeflags()&FL_IF)
    panic("popcli - interruptible");
  if(--mycpu()->ncli < 0)
    panic("popcli");
  if(mycpu()->ncli == 0 && mycpu()->intena)
    sti();
}

在自旋锁获取和释放中会出现pushcli()和popcli()的两个函数，这是为何？当然，这也是自旋锁的疑点，下面我来解释一下。

xv6是多核系统，要实现互斥，可以先关闭中断，然后获取自旋锁，这样临界区的代码的执行就不会被时钟中断所中断。

不可把关中断和获取自旋锁的顺序颠倒，因为如果当获取自旋锁在前时，某个内核线程获取了自旋锁，但是此时产生了时钟中断而被换下CPU，此时剩下所有的CPU都不会获得自旋锁，一直无限的while，产生死锁。

那cpu->ncli ++是为何？这是因为某个cpu可能持有不止一把锁，如空闲链表锁，进程描述符表锁等等，假设先获取锁a，后获取锁b，那么释放锁b的时候就会打开中断，但此时还持有锁a，然后又因为时钟中断被换下，又会让剩下的cpu无限的自旋……

所以我们希望直到持有的最后一把自旋锁被释放的时候，才开中断，这可以通过一个计数器ncli实现，但这还不够，当产生中断的时候会执行某个中断处理程序，在关中断之前可能这个中断处理程序在处理过程中，因此我们还应该把第一次锁的处理器中断情况记录下来，最后一次解锁的时候把中断状态恢复到最开始的状态


struct cpu {
  uchar apicid;
  struct context *scheduler;
  struct taskstate ts;
  struct segdesc gdt[NSEGS];
  volatile uint started;
  int ncli;
  int intena;
  struct proc *proc;
};

Original: https://blog.csdn.net/qq_41945053/article/details/127813113
Author: -特立独行的猪-
Title: xv6源码解析（四）——进程管理

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/653911/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

系统认识数据分析

文章目录前言一、观测 * 1.观测 – 1.1采集数据 1.2存储数据 1.3展示数据 2.测量 – 2.1设定标准 2.2发现异常 2.3研究关系二…

人工智能 2023年7月17日
0046
AI 音辨世界：艺术小白的我，靠这个AI模型，速识音乐流派选择音乐

💡 作者：韩信子@ShowMeAI📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40📘 机器学习实战系列：https://www.s…

人工智能 2023年6月11日
0079
python error tokenizing data_python 问题杂烩

python 问题杂烩 python problem cookbook ParserError: Error tokenizing data. C error: Calling r…

人工智能 2023年7月8日
0076
解决问题：import torch失败和torch.cuda.is_available()返回false

安装过程比较曲折，阅读了很多dl的博客，并不是每一种都能顺利解决我自己的问题，但好在费尽周折之后安装成功了，于是将遇到的一些问题记录在这里，表述有问题的地方还请各位指出。零、几点…

人工智能 2023年6月16日
00123
标准正态变换（SPSS统计描述分析）

题目：对 CCSS_Sample中的总指数、现状指数和预期指数进行标准正态变换，对变换后的变量进行统计描述。数据文件：CCSS_Sample.csv 本篇文章小玥各位学习SPSS软…

人工智能 2023年7月16日
00120
TensorFlow 1.15.0 + Keras 2.3.1 on Python 3.6安装教程

TensorFlow 1.15.0 + Keras 2.3.1 on Python 3.6安装教程 TensorFlow 1.15.0 + Keras 2.3.1 on Pytho…

人工智能 2023年5月26日
00107
labelImg和labelme的区别、安装和基本使用

文章目录 labelImg和labelme的区别 * labelImg labelme 区别 CV的四大基本任务 labelImg的安装和使用 * labelImg的安装——Win…

人工智能 2023年5月26日
0082
31.使用model.fit训练中保存检查点

目录 1 保存检查点 2 加载检查点 3 保存整个模型我们使用回调函数 tf.keras.callbacks.ModelCheckpoint()来保存检查点让我们先来看看这个回…

人工智能 2023年5月25日
0080
什么是递归神经网络（RNN）中的梯度消失问题

什么是递归神经网络（RNN）中的梯度消失问题递归神经网络（Recurrent Neural Network，RNN）是一种用于处理序列数据的神经网络结构。与传统前馈神经网络不同，…

人工智能 2024年1月1日
0037
【机器学习】：Xgboost和GBDT的不同与比较

【与传统GBDT相比，XGBoost有何不同】基函数不同。GBDT只用CART树，XGBoost除了CART，也支持线性函数。目标不同。具体体现在结点分裂策略与正则化。GBDT…

人工智能 2023年6月6日
0095
SV基础知识—覆盖率 (概念理解)

功能覆盖率是用来衡量哪些设计特征已经被测试程序测试过的一个指标。使用反馈环路来分析覆盖的结果，并决定采取哪种行动来达到100%的覆盖率。首要的选择式使用更多的种子来运行…

人工智能 2023年6月27日
00108
Redis数据库 —- 五种数据类型常用命令汇总

❤️ 作者简介：大家好我是小鱼干儿♛是一个热爱编程、热爱算法的大三学生，蓝桥杯国赛二等奖获得者 🐟 个人主页：https://blog.csdn.net/qq_52007481 …

人工智能 2023年7月30日
0052
【超详细】支持向量机（SVM）数学推导

目录一、硬间隔SVM（Hard Margin SVM) 二、对偶问题（Dual Problem) 1.将有约束问题转变为无约束问题 2.强对偶关系 3.计算拉格朗日函数的最小值 …

人工智能 2023年6月24日
00109
目标检测：RetinaNet算法细节以及代码部分

一、背景目标检测算法一般分为单阶段算法和多阶段算法。 [En] Target detection algorithms are generally divided into si…

人工智能 2023年5月23日
0098
深度学习研究生第一年之际，前来谈谈自己的感受

前言在即将结束研究生第一年之际，前来谈谈自己的感受。你可以把这篇文章当做深度学习者、程序员、研究生的简短自白。可能会有点啰嗦，会有点无趣。但如果有时间、感兴趣，不妨阅读阅读，或…

人工智能 2023年6月4日
00126
ubuntu18.04安装Autoware1.14—GPU版最全环境配置说明

ubuntu18.04安装Autoware1.14—GPU版最全环境配置说明本机配置所需软件配置配置安装 * 1. Nvidia 驱动安装 2 .cmake安装…

人工智能 2023年7月19日
0064

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31