• Linux是如何启动的?


    参考资料:

    An introduction to the Linux boot and startup processes

    这篇随笔,可以理解为是对这篇英文文章的翻译与个人理解、笔记的整合。

    扩展阅读:

    GNU GRUB - Wikipedia

    systemd - Wikipedia

    BIOS interrupt call - Wikipedia

    Multiboot specification - Wikipedia

    Chain loading - Wikipedia

    Master boot record - Wikipedia

    Best Couple of 2016: Display manager and window manager

    浅析 Linux 初始化 init 系统,第 1 部分:SysV init

    浅析 Linux 初始化 init 系统,第 2 部分:Upstart

    浅析 Linux 初始化 init 系统,第 3 部分:Systemd

    前言

    理解Linux是如何启动的对于配置和针对Linux启动失败的排错是至关重要的。

    本篇文章大体上把Linux启动过程分成了两部分:引导(boot)和启动(startup)。

    引导:从计算机开机至内核初始化完毕启动systemd程序的这个阶段。

    启动:从systemd程序启动至系统完全启动完毕的这个阶段。

    引导阶段主要涉及了引导装载程序(boot loader),对于我所学习的CentOS系列的系统来说,主要涉及的均是GRUB这个引导装载程序。

    • 0.x系列的版本,是老的版本,也叫做GRUB 1/Legacy,主要用于以前的Linux发行版,例如CentOS 5/6。
    • 2.x系列的版本,是新的版本,也叫做GRUB 2,现在主流的例如CentOS 7上会使用它。虽然是新版的GRUB,版本号差别也不是很大,但是GRUB 2几乎是完全重写的GRUB!

    启动阶段主要涉及了系统初始化进程的方式(init 进程/系统)。

    • CentOS 5:System V init,可简称System V或者SysV。
    • CentOS 6:Upstart。
    • CentOS 7:Systemd。

    这3种进程初始化方式,配置文件的写法有较大的不同。

    本篇随笔,所涉及的引导和启动的版本是当前的主流版本,即GRUB 2和Systemd。下文如果没特别说明或者GRUB单独出现的话,那么GRUB就表示GRUB 2了。

    将引导和启动的过程,更细致的划分的话,如下所示。

    1. Boot
      1. BIOS POST
      2. Boot loader(GRUB 2)
        1. Stage 1
        2. Stage 1.5
        3. Stage 2
      3. Kernel initialization
    2. Startup
      1. Systemd

    引导过程(boot)

    想要启动引导过程的话,主要有两种方式。一种是计算机处于关机状态,用户物理性开机;另一种是计算机处于开机状态,用户通过GUI或者CLI程序性重启(当然如果有物理重启按钮,也可以物理性重启)。

    译者注:我也不晓得为何作者要说这句简单的话。

    BIOS POST

    引导的第一步和Linux系统是无关的,所有的OS都会有这个步骤。这步是BIOS中提供的POST(Power On Self Test,开机自检)功能,主要用于检测硬件是否可正常工作。

    如果POST检测失败的话,则引导终止,后续的步骤也不会再有了,系统启动失败。

    POST检测成功,确保硬件可正常工作后,BIOS会释出BIOS中断(BIOS interrupt,详见扩展阅读)INT 13H,它用于在所有已连接的可引导设备上定位引导扇区(boot sector)。第一个找到的包含有效引导记录(boot record)引导扇区会被加载入内存当中,并且将控制权传递给从引导扇区中加载的代码。

    引导扇区是引导装载程序的第一个阶段(stage)。现代大多数的Linux发行版中采用三种引导装载程序,分别是LILO、GRUB 1和GRUB 2,GRUB 2是当前阶段最新也是最常用的引导装载程序。

    GRUB 2

    GRUB 2的全称是“GRand Unified Bootloader, version 2”,它使得计算机可以找到OS的内核文件并将其载入内存中。

    GRUB被设计用于兼容多引导规范(multiboot specification,详见扩展阅读),这个规范使得它可以引导许多的Linux和自由OS;它还可以链式加载(chain load,详见扩展阅读)专有(proprietary)OS的引导记录。

    GRUB还可以允许用户从某个Linux发行版中选择不同的内核来引导。这样在某个内核更新发生了错误,或者更新使得某些重要的软件使用出现异常的时候,就可以引导之前版本的内核来正常工作。

    GRUB 1的配置文件是/boot/grub/grub.conf,GRUB 2的配置文件是/boot/grub2/grub.cfg。红帽系的Linux,从Fedora 15和CentOS/RHEL 7开始将GRUB升级到了GRUB 2版本。GRUB 2和GRUB 1在功能上是相同的,但是经过了几乎完全的重写,所以是要优于GRUB 1的。

    GRUB 1和2都是有三个阶段(stage),本文会大致阐述这三个阶段。不过,关于GRUB具体是如何配置的,不在本文的范围中。

    GRUB 2在官方中并不是使用这3个阶段,即stage 1/1.5/2,这个应该是GRUB 1所使用的,不过使用这3个阶段来阐述GRUB 2,也是可以的。

    译者注:在扩展阅读中,GRUB 2应该是4个阶段。

    Stage 1

    当BIOS POST的自检阶段通过后,BIOS从已连接的设备上寻找可用的引导记录,引导记录一般位于磁盘的MBR上。stage 1的引导记录叫做boot.img。

    MBR位于磁盘的第一个扇区sector 0,大小为512B,扣除64B的分区信息和2个字节的boot signature,仅剩下446B的空间。这个空间非常小,所以boot.img的代码量也必须很小,它不会包含文件系统的驱动(即没有识别文件系统相关的代码),boot.img的唯一作用就是找到并加载stage 1.5。为了完成stage 1的任务,stage 1.5的位置必须位于stage 1自身和第一个分区之间。如图所示。

    By Shmuel Csaba Otto Traian, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=28427221

    将stage 1.5加载入内存后,stage 1就将控制权转交给了stage 1.5了。

    译者注:在我的CentOS 7系统上,该文件位于/boot/grub2/i386-pc/boot.img,大小为512B,理论上是应该小于446B才对。

    Stage 1.5

    如上所述,stage 1.5位于stage 1和第一个分区之间,即sector 1~62,总容量为512*62=31,744。

    译者注:上面的图片stage 1.5的容量为32,256B,比31,744多了一个512B,不懂为什么。

    这个阶段的文件是core.img,作者的该文件大小是25,389B,我的是26,664(/boot/grub2/i386-pc/core.img)。可见该阶段还可以有许多的剩余容量。

    这个阶段主要是包含了各种各样的文件系统驱动程序,例如EXT家族、XFS、NTFS等。只有具备了文件系统驱动,才可以基于文件的路径和名称(例如/boot/vmlinuz-3.10.0-862.el7.x86_64)来查找/加载某个文件。

    剩余的容量,应该是让开发人员自己扩展、增加想要加载的文件系统驱动程序的。

    这个阶段所加载的文件系统驱动,就是用于识别stage 2的文件所在的文件系统的。

    GRUB 2的stage 1.5中的core.img要比GRUB 1版本中的更加复杂和强大,因此GRUB 2中的stage 2可以位于标准的EXT系列文件系统,但不能是在LVM分区上。

    标准的stage 2的文件的位置是在/boot文件系统上,准确地说,是/boot/grub2。

    Stage 2

    该阶段的文件位于/boot/grub2目录中。该阶段不算前2个阶段有镜像文件(image file:boot.img和core.img),它主要由许多运行时按需加载的内核模块文件构成(位于/boot/grub2/i386-pc目录)。

    该阶段的主要功能是定位并加载内核文件,而后将控制权转交给内核。内核文件的名称均以vmlinuz开头,可在/boot目录下找到当前系统已安装的内核。

    [root@C7 ~]# ls -l /boot/vmlinuz-*
    -rwxr-xr-x. 1 root root 6224704 Sep 27  2018 /boot/vmlinuz-0-rescue-341d78e441db4d8b985b51fc31f40be9
    -rwxr-xr-x. 1 root root 6224704 Apr 21  2018 /boot/vmlinuz-3.10.0-862.el7.x86_64
    [root@C7 ~]# file /boot/vmlinuz-*
    /boot/vmlinuz-0-rescue-341d78e441db4d8b985b51fc31f40be9: Linux kernel x86 boot executable bzImage, version 3.10.0-862.el7.x86_64 (builder@kbuilder.dev.centos.org) #1 SMP , RO-rootFS, swap_dev 0x5, Normal VGA
    /boot/vmlinuz-3.10.0-862.el7.x86_64:                     Linux kernel x86 boot executable bzImage, version 3.10.0-862.el7.x86_64 (builder@kbuilder.dev.centos.org) #1 SMP , RO-rootFS, swap_dev 0x5, Normal VGA

    GRUB有一个预引导菜单,可以让用户选择想要引导的内核,包含了救援(rescue)模式,配置得当的话还包含恢复(recovery)模式。

    Kernel

    内核是一种可自我展开的压缩格式的文件,它们和RAM disk镜像文件、硬盘的设备映射都位于/boot目录下。

    /boot/initramfs-0-rescue-341d78e441db4d8b985b51fc31f40be9.img
    /boot/initramfs-3.10.0-862.el7.x86_64.img
    /boot/System.map-3.10.0-862.el7.x86_64

    当内核被载入内存执行,自我展开完毕后,它会启动systemd进程。此时引导过程就结束了,正式进入启动过程。

    注:引导过程的结束时,Linux仍然无法执行任何生产任务。因为生产任务是需要具体的进程来完成的,而systemd进程只是所有生产任务进程的最上级父进程(系统的第一个进程)。

    启动过程(startup)

    Systemd

    systemd是Linux系统中的第一个进程,即最顶级的父进程。它的任务是启动系统中的其他进程使得Linux可以进入生产环境得状态。包含挂载文件系统、启动和管理服务。和启动顺序无关的systemd任务不在本文的讨论范围之内。

    首先,systemd根据/etc/fstab挂载文件系统,包含swap文件和分区。此时systemd就可以访问位于/etc目录下的配置文件了,包含自己的配置文件。它使用自己的配置文件(/etc/systemd/system/default.target)来决定要将系统启动为哪种状态(state)或者target。default.target仅仅是一个到真实target文件的字符链接文件。对于桌面工作站来说,是链接到graphical.target(相当于System V init中的运行级别5)。对于服务器来说,一般是链接到multi-user.target(相当于System V init中的运行级别3)。emergency.target则相当于单用户模式。

    注意:target和服务是systemd的单元(unit)。

    Table 1是systemd的target和System V init的运行级别的对照表格。systemd提供了target别名(alias)用于向后兼容。target别名允许脚本和管理员使用SysV的命令(例如init 3)来切换运行级别,当然,这些命令会传递给systemd解析与执行。

    Table 1: Comparison of SystemV runlevels with systemd targets and some target aliases.

    SystemV Runlevel

    systemd target

    systemd target aliases

    Description

      halt.target  

    Halts the system without powering it down.

    0 poweroff.target runlevel0.target

    Halts the system and turns the power off.

    S emergency.target  

    Single user mode. No services are running; filesystems are not mounted. This is the most basic level of operation with only an emergency shell running on the main console for the user to interact with the system.

    1 rescue.target runlevel1.target

    A base system including mounting the filesystems with only the most basic services running and a rescue shell on the main console.

    2   runlevel2.target

    Multiuser, without NFS but all other non-GUI services running.

    3 multi-user.target runlevel3.target

    All services running but command line interface (CLI) only.

    4   runlevel4.target

    Unused.

    5 graphical.target runlevel5.target

    multi-user with a GUI.

    6 reboot.target runlevel6.target

    Reboot.

      default.target  

    This target is always aliased with a symbolic link to either multi-user.target or graphical.target. systemd always uses the default.target to start the system. The default.target should never be aliased to halt.target, poweroff.target, or reboot.target.

    每个target在其配置文件中会说明依赖关系,有依赖就有启动的先后顺序之分,被依赖方启动失败,那么依赖方也会启动失败(依赖方依赖于被依赖方)。这些依赖一般是系统要运行于某个功能级别下(例如web服务器、DB服务器、缓存服务器等)所需要的服务。当target配置文件中所有的依赖都正常启动完毕后,系统会运行于那个target级别下。

    Systemd也会去查找SysV配置目录下是否含有启动脚本,如果有的话,也会加载的。基本上在CentOS 7上,服务已经都使用systemd风格的配置文件来管理了,不过在SysV配置目录下还有一个网络相关的配置文件,可能只是用作一个学习案例吧,或者网络服务在CentOS 7上依然使用SysV管理(概率较低)。

    [root@C7 ~]# ls -l /etc/rc.d/init.d/
    total 40
    -rw-r--r--. 1 root root 18104 Jan  3  2018 functions
    -rwxr-xr-x. 1 root root  4334 Jan  3  2018 netconsole
    -rwxr-xr-x. 1 root root  7293 Jan  3  2018 network
    -rw-r--r--. 1 root root  1160 Apr 11  2018 README

    接下来我们来看一张文本图,Figure 1。这张图来源于bootup(7)。展示了systemd的启动流程。

               local-fs-pre.target
                        |
                        v
               (various mounts and   (various swap   (various cryptsetup
                fsck services...)     devices...)        devices...)       (various low-level   (various low-level
                        |                  |                  |             services: udevd,     API VFS mounts:
                        v                  v                  v             tmpfiles, random     mqueue, configfs,
                 local-fs.target      swap.target     cryptsetup.target    seed, sysctl, ...)      debugfs, ...)
                        |                  |                  |                    |                    |
                        \__________________|_________________ | ___________________|____________________/
                                                             |/
                                                              v
                                                       sysinit.target
                                                              |
                         ____________________________________/|\________________________________________
                        /                  |                  |                    |                    
                        |                  |                  |                    |                    |
                        v                  v                  |                    v                    v
                    (various           (various               |                (various          rescue.service
                   timers...)          paths...)              |               sockets...)               |
                        |                  |                  |                    |                    v
                        v                  v                  |                    v              rescue.target
                  timers.target      paths.target             |             sockets.target
                        |                  |                  |                    |
                        v                  \_________________ | ___________________/
                                                             |/
                                                              v
                                                        basic.target
                                                              |
                         ____________________________________/|                                 emergency.service
                        /                  |                  |                                         |
                        |                  |                  |                                         v
                        v                  v                  v                                 emergency.target
                    display-        (various system    (various system
                manager.service         services           services)
                        |             required for            |
                        |            graphical UIs)           v
                        |                  |           multi-user.target
    |                  |                  |
                        \_________________ | _________________/
                                          |/
                                           v
                                 graphical.target

    sysinit.target和basic.target可以看作是一个检测点(checkpoint)。尽管systemd的设计目标之一是并行启动系统服务,但是依然存在某些特定的服务和target是需要在其他服务和target启动之前启动的。直到所有被该检测点依赖的服务和target被满足后,那么该检测点才可以通过。

    因此直到所有被依赖的单元完成后,才可以到达sysinit.target。所有的那些单元,挂载文件系统、配置swap文件、启动udev、建立随机生成器种子(random genorator seed)、初始化低级设备、如果有文件系统需要加密的话则配置加密服务。不过在sysinit.target内部,上述的这些单元是可以并行执行的。也就是说systemd支持单元在某个target内部的并行执行。

    sysinit.target完成了一些底层的功能,即较接近硬件层,慢慢地会往高层发展,接近用户层,即basic.target。这个阶段涉及的unit,如图所示。

    最后就可以启动multi-user.target和graphical.target这两个我们熟悉的用户级别的target了。注意:multi-user.target必须启动成功,才可以启动graphical.target。

    Figure 1中,加粗带下划线的target,是常用的启动target,到达这些target,就表示系统已经启动完毕了。multi-user.target启动完毕后展示了文本模式的登录界面,而graphical.target则展示了图形化的登陆界面,想了解关于图形化登陆界面的话,可查阅扩展阅读中的Best Couple of 2016: Display manager and window manager。

  • 相关阅读:
    (转载)openwrt nginx
    *** 竞赛中的各种低级错误,及编程常见错误小结 ***
    信息学奥赛辅导经验谈 & 问题教学法中的学生思维能力培养
    数学&数论的一些题
    信息学竞赛中的一些经典思维 (题)
    从权值线段树到主席树
    浅谈莫队算法
    CSP-S 2019提高组训练 服务器需求
    NOIP2019 PJ 对称二叉树
    NOIP2017 PJ 跳房子 —— 单调队列优化DP
  • 原文地址:https://www.cnblogs.com/alongdidi/p/how_linux_start.html
Copyright © 2020-2023  润新知