操作系统实战45讲- 02 几行汇编几行C:实现一个最简单的内核

本节源代码位置https://gitee.com/lmos/cosmos/tree/master/lesson02/HelloOS

Hello OS 之前,我们先要搞清楚 Hello OS 的引导流程,如下图所示:

PC 机 BIOS 固件是固化在 PC 机主板上的 ROM 芯片中的,掉电也能保存,PC 机上电后的第一条指令就是 BIOS 固件中的,它负责检测和初始化 CPU、内存及主板平台,然后加载引导设备(大概率是硬盘)中的第一个扇区数据,到 0x7c00 地址开始的内存空间,再接着跳转到 0x7c00 处执行指令,在我们这里的情况下就是 GRUB 引导程序。

C 作为通用的高级语言,不能直接操作特定的硬件,而且 C 语言的函数调用、函数传参,都需要用栈。

C语言用到了下层操作系统/部分汇编程序创造的内存的数据结构比如栈,所以C语言运行之前必然要先运行下部分汇编程序,而汇编的下层是CPU的硬件逻辑。

栈简单来说就是一块内存空间,其中数据满足后进先出的特性,它由 CPU 特定的栈寄存器指向,所以我们要先用汇编代码处理好这些 C 语言的工作环境。

/lesson02/HelloOS/entry.asm

   3  MBT_HDR_FLAGS   EQU 0x00010003
     4  MBT_HDR_MAGIC   EQU 0x1BADB002 ;多引导协议头魔数
     5  MBT_HDR2_MAGIC  EQU 0xe85250d6 ;第二版多引导协议头魔数
     6  global _start ;导出_start符号
     7  extern main ;导入外部的main函数符号
     8
     9  [section .start.text] ;定义.start.text代码节
    10  [bits 32] ;汇编成32位代码
    11  _start:
    12          jmp _entry
    13  ALIGN 8
    14  mbt_hdr:
    15          dd MBT_HDR_MAGIC
    16          dd MBT_HDR_FLAGS
    17          dd -(MBT_HDR_MAGIC+MBT_HDR_FLAGS)
    18          dd mbt_hdr
    19          dd _start
    20          dd 0
    21          dd 0
    22          dd _entry
    23
    24  ;以上是GRUB所需要的头
    25  ALIGN 8
    26  mbt2_hdr:
    27          DD      MBT_HDR2_MAGIC
    28          DD      0
    29          DD      mbt2_hdr_end - mbt2_hdr
    30          DD      -(MBT_HDR2_MAGIC + 0 + (mbt2_hdr_end - mbt2_hdr))
    31          DW      2, 0
    32          DD      24
    33          DD      mbt2_hdr
    34          DD      _start
    35          DD      0
    36          DD      0
    37          DW      3, 0
    38          DD      12
    39          DD      _entry
    40          DD      0
    41          DW      0, 0
    42          DD      8
    43  mbt2_hdr_end:
    44  ;以上是GRUB2所需要的头
    45  ;包含两个头是为了同时兼容GRUB、GRUB2
    46
    47  ALIGN 8
    48
    49  _entry:
    50          ;关中断
    51          cli
    52          ;关不可屏蔽中断
    53          in al, 0x70
    54          or al, 0x80
    55          out 0x70,al
    56          ;重新加载GDT
    57          lgdt [GDT_PTR]
    58          jmp dword 0x8 :_32bits_mode
    59
    60  _32bits_mode:
    61          ;下面初始化C语言可能会用到的寄存器
    62          mov ax, 0x10
    63          mov ds, ax
    64          mov ss, ax
    65          mov es, ax
    66          mov fs, ax
    67          mov gs, ax
    68          xor eax,eax
    69          xor ebx,ebx
    70          xor ecx,ecx
    71          xor edx,edx
    72          xor edi,edi
    73          xor esi,esi
    74          xor ebp,ebp
    75          xor esp,esp
    76          ;初始化栈,C语言需要栈才能工作
    77          mov esp,0x9000
    78          ;调用C语言函数main
    79          call main
    80          ;让CPU停止执行指令
    81  halt_step:
    82          halt
    83          jmp halt_step
    84
    85
    86  GDT_START:
    87  knull_dsc: dq 0
    88  kcode_dsc: dq 0x00cf9e000000ffff
    89  kdata_dsc: dq 0x00cf92000000ffff
    90  k16cd_dsc: dq 0x00009e000000ffff
    91  k16da_dsc: dq 0x000092000000ffff
    92  GDT_END:
    93
    94  GDT_PTR:
    95  GDTLEN  dw GDT_END-GDT_START-1
    96  GDTBASE dd GDT_START

以上的entry.asm汇编代码en分为 4 个部分:

上面的汇编代码调用了 main 函数,而在其代码中并没有看到其函数体,而是从外部引入了一个符号。

那是因为这个函数是用 C 语言写的在(/lesson02/HelloOS/main.c)中,最终它们分别由 nasm 和 GCC 编译成可链接模块,由 LD 链接器链接在一起,形成可执行的程序文件:

main.c

#include "vgastr.h"
void main()
{
    printf("Hello OS!");
    return;
}

这不是应用程序的 main 函数,而是 Hello OS 的 main 函数。其中的 printf 也不是应用程序库中的那个 printf 了,而是需要我们自己实现了。

计算机屏幕显示往往是显卡的输出,显卡有很多形式:集成在主板的叫集显,做在 CPU 芯片内的叫核显,独立存在通过 PCIE 接口连接的叫独显,性能依次上升,价格也是

我们要在屏幕上显示字符,就要编程操作显卡。

其实无论我们 PC 上是什么显卡,它们都支持一种叫 VESA 的标准,这种标准下有两种工作模式:字符模式和图形模式。显卡们为了兼容这种标准,不得不自己提供一种叫 VGABIOS 的固件程序。

它把屏幕分成 24 行,每行 80 个字符,把这(24*80)个位置映射到以 0xb8000 地址开始的内存中,每两个字节对应一个字符,其中一个字节是字符的 ASCII 码,另一个字节为字符的颜色值。如下图所示:

C 语言字符串是以 0 结尾的,其字符编码通常是 utf8,而 utf8 编码对 ASCII 字符是兼容的,即英文字符的 ASCII 编码和 utf8 编码是相等的。utf8标准

vgastr.c

void _strwrite(char* string)
{
    char* p_strdst = (char*)(0xb8000);
    while (*string)
    {

        *p_strdst = *string++;
        p_strdst += 2;
    }
    return;
}

void printf(char* fmt, ...)
{
    _strwrite(fmt);
    return;
}

printf 函数直接调用了 _strwrite 函数,而 _strwrite 函数正是将字符串里每个字符依次定入到 0xb8000 地址开始的显存中,而 p_strdst 每次加 2,这也是为了跳过字符的颜色信息的空间

Hello OS 的文件数量会爆炸式增长,一个成熟的商业操作系统更是多达几万个代码模块文件,几千万行的代码量,是这世间最复杂的软件工程之一。所以需要一个牛逼的工具来控制这个巨大的编译过程

ake 是一个工具程序,它读取一个叫”makefile”的文件,也是一种文本文件,这个文件中写好了构建软件的规则,它能根据这些规则自动化构建软件。

makefile 文件中规则是这样的:首先有一个或者多个构建目标称为”target”;目标后面紧跟着用于构建该目标所需要的文件,目标下面是构建该目标所需要的命令及参数。

与此同时,它也检查文件的依赖关系,如果需要的话,它会调用一些外部软件来完成任务。

第一次构建目标后,下一次执行 make 时,它会根据该目标所依赖的文件是否更新决定是否编译该目标,如果所依赖的文件没有更新且该目标又存在,那么它便不会构建该目标。这种特性非常有利于编译程序源代码。

一个有关 makefile 的例子


CC = gcc #定义一个宏CC 等于gcc
CFLAGS = -c #定义一个宏 CFLAGS 等于-c
OBJS_FILE = file.o file1.o file2.o file3.o file4.o #定义一个宏
.PHONY : all everything #定义两个伪目标all、everything
all:everything #伪目标all依赖于伪目标everything
everything :$(OBJS_FILE) #伪目标everything依赖于OBJS_FILE,而OBJS_FILE是宏会被
#替换成file.o file1.o file2.o file3.o file4.o
%.o : %.c
   $(CC) $(CFLAGS) -o $@ $<

例如:file.c、file1.c、file2.c、file3.c、file4.c,通过这个通用规则会自动转换为依赖关系:file.o: file.c、file1.o: file1.c、file2.o: file2.c、file3.o: file3.c、file4.o: file4.c。

然后,针对这些依赖关系,分别会执行:$(CC) $(CFLAGS) -o $@ (< 命令,当然最终会转换为:gcc –c –o xxxx.o xxxx.c,这里的”xxxx”表示一个具体的文件名。)@ 目标文件 $< 依赖文件

下面我们用一张图来描述我们 Hello OS 的编译过程

经过上述流程,我们就会得到 Hello OS.bin 文件,但是我们还要让 GRUB 能够找到它,才能在计算机启动时加载它。

GRUB 在启动时会加载一个 grub.cfg 的文本文件,根据其中的内容执行相应的操作,其中一部分内容就是启动项。

GRUB 首先会显示启动项到屏幕,然后让我们选择启动项,最后 GRUB 根据启动项对应的信息,加载 OS 文件到内存。

输入命令:df /boot/,获取boot目录的挂载分区

Filesystem     1K-blocks  Used Available Use% Mounted on
/dev/sda2        1515376 76332   1344020   6% /boot

Hello OS 的启动项,Ubuntu20.04下在/boot/grub/grub.cfg

menuentry 'HelloOS' {
    insmod part_msdos   #GRUB&#x52A0;&#x8F7D;&#x5206;&#x533A;&#x6A21;&#x5757;&#x8BC6;&#x522B;&#x5206;&#x533A;
    insmod ext2        #GRUB&#x52A0;&#x8F7D;ext&#x6587;&#x4EF6;&#x7CFB;&#x7EDF;&#x6A21;&#x5757;&#x8BC6;&#x522B;ext&#x6587;&#x4EF6;&#x7CFB;&#x7EDF;
    set root='hd0,gpt2' #&#x6CE8;&#x610F;boot&#x76EE;&#x5F55;&#x6302;&#x8F7D;&#x7684;&#x5206;&#x533A;
    multiboot2 /HelloOS.bin #GRUB&#x4EE5;multiboot2&#x534F;&#x8BAE;&#x52A0;&#x8F7D;HelloOS.bin
    boot                  #GRUB&#x542F;&#x52A8;HelloOS.bin
}

添加完成后的实际效果图如下:

强制保存后,重启。

重启时,VMware Workstaion Pro下需要长按 shift键进入grub界面

如图:

Original: https://www.cnblogs.com/xyjk1002-rejuvenation/p/16632233.html
Author: miyan
Title: 操作系统实战45讲- 02 几行汇编几行C:实现一个最简单的内核

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/581749/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Python之NMAP详解

    NMap,也就是Network Mapper,最早是Linux下的网络扫描和嗅探工具包。 nmap是一个网络连接端扫描软件,用来扫描网上电脑开放的网络连接端。确定哪些服务运行在哪些…

    Linux 2023年6月14日
    0105
  • Python 批处理sql插入 %s 占位符报错

    语法错误 在查询表达式 ‘%s’ 中。 (-3100) (SQLPrepare)”) 语法错误 在查询表达式 ‘%s’ …

    Linux 2023年6月7日
    0106
  • Linux 压缩、解压缩命令

    Linux 压缩、解压缩命令 tar 语法命令 tar [options…] [files] options:选择描述-A 追加tar文件至归档-c 创建一个新文档-d…

    Linux 2023年6月6日
    087
  • DDoS攻击–TCP攻击概述

    https://blog.csdn.net/qq_34777600/article/details/81945594 posted @2020-12-10 18:07 珠峰之梦 阅…

    Linux 2023年6月7日
    090
  • 【pycharm】Cannot find reference ‘XXX‘ in ‘__init__.py‘ 解决办法

    Cannot find reference ‘XXX’ in ‘init.py’ 解决办法 File -> Editor -&…

    Linux 2023年6月8日
    099
  • Shell第四章《正则表达式》

    1.1、名词解释 正则表达式(regular expression, RE)是一种字符模式,用于在查找过程中匹配指定的字符。在大多数程序里,正则表达式都被置于两个正斜杠之间;例如/…

    Linux 2023年6月6日
    094
  • 记录XorDDos木马清理步骤

    1.检查 查看定时任务文件发现有两个异常定时任务 [root@manage ~]# cat /etc/crontab user-name command to be execute…

    Linux 2023年6月7日
    084
  • 虚拟机Ubuntu22.04 chrome页面显示异常

    虚拟机上ubuntu安装chrome出现页面显示异常的解决办法 将chrome上的硬件加速关掉就能恢复正常 具体原因是啥,有没有大佬能解答以下啊 引用:https://blog.c…

    Linux 2023年6月13日
    076
  • 国产化之虚拟ARM64-CPU安装银河麒麟操作系统

    背景 某个项目需要实现基础软件全部国产化,其中操作系统指定银河麒麟v4,CPU使用飞腾处理器。我本地没有这个国产的处理器,但飞腾是基于 _ARMv8_架构的64位处理器,所以理论上…

    Linux 2023年5月27日
    0305
  • [20211213]提示precompute_subquery.txt

    [20211213]提示precompute_subquery.txt –//学习了提示precompute_subquery,提示很明显就是先计算子查询的结果集,直接…

    Linux 2023年6月13日
    081
  • conda 和 pip 的具体区别

    pip install 安装包时不会自动安装所需的其他依赖包,只是在缺少其他依赖包时作错误提示,这时需要手动安装其他依赖包 pip 不会将python看成包,不能对环境中的pyth…

    Linux 2023年6月7日
    077
  • 微信小程序全局变量的设置、使用、修改过程解析

    微信小程序全局变量的设置、使用、修改过程解析 全局变量的设置 在miniprogram > app.js 文件中设置,globalData对象就是存储全局变量的。 php;g…

    Linux 2023年6月7日
    085
  • VR一体机如何退出FFBM

    Fast Factory Boot Mode(FFBM)是一种半开机的模式,它的主要目的是方便工厂测试,提高生产效率。正常情况下终端用户是不会碰到的。但售后的同学最近连续收到几台客…

    Linux 2023年6月7日
    0223
  • Grafana+Prometheus 搭建 JuiceFS 可视化监控系统

    作为承载海量数据存储的分布式文件系统,用户通常需要直观地了解整个系统的容量、文件数量、CPU 负载、磁盘 IO、缓存等指标的变化。 JuiceFS 没有重复造轮子,而是通过 Pro…

    Linux 2023年6月14日
    078
  • 插入排序算法C语言实现

    插入排序算法C语言实现 我写出来的排序算法用printf一步步解读,与google algorithm APP上模拟的单步执行不一致。 于是参考了https://www.cnblo…

    Linux 2023年6月14日
    098
  • 思科CISCO ASA 5521 防火墙 Ipsec 配置详解

    版本信息: Cisco Adaptive Security Appliance Software Version 9.9(2) Firepower Extensible Opera…

    Linux 2023年6月6日
    080
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球