01.聊聊x86计算机启动发生的事?v3
作者:小牛呼噜噜 ,首发于公众号「小牛呼噜噜」
大家好,我是呼噜噜,最近在看linux早期内核0.12
的源码,突然想到一个困扰自己好久的问题:当我们按下电源键,计算机发生了什么?神秘地址0x7C00
究竟是什么?操作系统又是如何被加载到硬件中的?带着这些问题,继续往下阅读本文。
x86计算机启动过程,主要分为这几个阶段:BIOS自检,引导设备的选择,主引导记录,加载操作系统
BIOS自检
当我们按下电源开关后,主板会首先通电,在每台计算机上都有一块,主板也称为母板、双亲板,是计算机最基本也是最重要的部件之一,主板上安装了组成计算机的主要电路系统,一般有BIOS芯片、I/O控制芯片、键盘、面板控制开关接口、指示灯查接件、扩充插槽
等元件
当主板通电后,开始读取主板上ROM里面的BIOS程序,进行BIOS自检
BIOS(Basic Input Output System,基本输入输出系统),它负责管理和控制计算机硬件设备,本质上是一组"程序代码",作为操作系统和底层硬件的桥梁!如今UEFI
基本已经取代BIOS
成为64位计算机的标准,因为它与BIOS相比,功能更完善,使用更舒适。UEFI其实就是支持UEFI规范的BIOS,所以本文还是以BIOS
为例
BIOS
作为计算机开机之后,CPU
要进行处理的第一个“可执行程序”,也就是第一个“开机启动项”。其程序代码事先被刷入集成在主板的ROM芯片中,主要保存着系统设置程序、基本输入输出程序、开机上电自检程序和系统启动自举程序等
- ROM: 只读存储器,不需要供电也可保持数据不丢失。这点特性和内存有着鲜明的不同
- 现在一般用Flash闪存来代替ROM,由于ROM写入后就不能修改,改用Flash闪存后,既方便又能用专用程序即可修改其中代码
当BIOS启动后,会开始BIOS自检,会依次执行以下操作:
- 主要是对计算机的硬件设备进行检测,然后初始化,包括处理器、内存、硬盘、显卡、声卡等
- 对计算机内存进行检测,检查硬盘和其他存储设备是否正常
- BIOS还会检查计算机的其他设备,包括键盘、鼠标、显示器、声卡等
- 显示系统信息:BIOS会在屏幕上显示系统信息,包括计算机型号、处理器型号、内存大小、硬盘容量等
期间如果检测到设备或者硬件运行不正常,这个也叫做硬件自检
,主板会发出不同的蜂鸣声(具体查看bios手册区分)来作为警告,同时启动会中止。同时我们不用担心检测时间过长,往往我们还没感觉的时候,计算机的BIOS自检就已经完成了。
BIOS设置完计算机硬件参数后的数据被保存到CMOS芯片上,CMOS
是主板上的一块可读写的并行或串行Flash
芯片(RAM芯片)。CMOS
是RAM
芯片,可擦写,这与ROM
不同。CMOS
本身只是一块存储器,只有数据保存功能,这个芯片仅仅是用来存放数据的。CMOS
是靠主板上的纽扣电池供电的,就算主机断电也能保存数据
另外BIOS
是软件程序,它在硬件上其实是依赖于EC,嵌入式控制器Embedded Controller
EC
是一个16位单片机,作为传统的KBC键盘控制器的延伸,相对于KBC
,EC
更智能化,功能更多它内部本身也有一定容量的Flash
来存储EC
的代码。在笔记本上的BIOS
绝大多数还有一个功能就是通过控制EC
来控制上电
无论你是在开机或者是关机状态,除非你把电池和Adapter
完全卸除。在关机状态下,EC一直保持运行,关机时的工作,包括自身的供电、时钟、复位、GPIO定义等。而在开机后,EC更作为键盘,充电指示灯以及风扇和其他各种指示灯等设备的控制,它甚至控制着系统的待机、休眠等状态
引导设备选择
当BIOS完成硬件自检后,需要进行引导设备的选择,主要是确定计算机从哪个设备启动,通常是硬盘或可移动设备。这一步也是我们常说的BIOS下的启动顺序,计算机需要知道下一个阶段要启动的程序具体放在了哪一个设备上。
用户可以自行去选择从哪个设备启动计算机,比如光盘或USB驱动器,进而调节启动设备的优先级。
BIOS操作界面,有一项就是"设定启动顺序",我们一般使用U盘装系统就得在这一步设置为U盘启动。
主引导记录
当BIOS按照我们上一步设定好启动顺序,BIOS则根据这个顺序将计算机的控制权交给排在第一位的存储设备
,主要功能就是将硬盘中操作系统的核心代码加载到计算机的内存中并执行它
这时计算机会读取当前设备
的第一个扇区,也就是读取最前面的512个字节
,被称为主引导记录MBR
MBR是什么?
MBR是存储设备中的第一个扇区,也就是磁盘最前面的512字节(Byte),称为“主引导记录”(Master boot record,简称为MBR)
我们这就不得不提机械硬盘的构造了,常见的机械硬盘的组成部分:
我们就不一一介绍了,我们直接讲其存储数据的原理。机械硬盘存储数据的时候,是将数据存储在其内部的盘面上。一块硬盘中一般会有多个盘片。
盘片的表面涂有磁性物质,这些磁性物质用来记录二进制数据。因为正反两面都可涂上磁性物质,故一个盘片可能会有两个盘面。
每个盘面都会有对应的磁头,所有磁头"共进共退",因为会有一个磁臂固定它们。
每个盘面划分成了一圈一圈的磁道,最外圈是0磁盘。然后每个磁盘又划分为了一个个小块,小块叫做扇区。扇区大小固定,是512个字节。
扇区大小为啥固定512字节?这是1956年由industry trade organization, International Disk Drive Equipment和Materials Association三家机构确定的行业标准, 大家都默认会遵守的标准,久而久之,如果改变的话,兼容各种情况的代价非常大。
我们现在更常用的固态硬盘的原理是和机械硬盘是截然不同的,大家感兴趣地可以自行去了解。上面科普了许多磁盘的知识,下面让我们回到MBR上。
上古时期的计算机,由于BIOS很小,功能有限,为了完成加载操作系统的功能,就诞生了MBR。(现代操作系统已经很少用MBR,现在主要是GUID,通过UEFI安装启动)
MBR在0盘0道0扇区上(最外层磁盘的最外围磁道的第一个扇区),也就是该储存设备的第一个扇区(大小512个字节)。它存放了用于启动操作系统的引导程序代码,其实这串代码就是告诉计算机去哪一个地址去找操作系统。
MBR组成部分
另外主引导记录由三个部分组成:
- 占446个字节: 主引导程序(也叫Boot Loader),如果启动管理器grub是直接写进mbr硬盘的主引导记录中的,计算机BIOS在启动时,按照预定的方式,将MBR内的代码加载至内存指定位置, 然后跳转至那里,mbr的代码就开始运行了。通俗点讲,主引导程序它个头比较小,操作系统个头大,它的任务就是去加载一个个的操作系统核心程序
- 占64个字节:记录分区表,由于硬盘可以分区,每个区可以安装不同的操作系统,所以主引导记录必须知道将控制权转交给哪个区(也就是要启动的
操作系统所在的分区
) - 占2个字节:主引导记录的签名(0x55和0xAA),如果这512字节的最后两个字节是
0x55和0xAA
,表明这个设备可以用于启动;如果不是,表明设备不能用于启动,控制权于是被转交给"启动顺序"中的下一个设备。如果到最后还是没找到符合条件的,直接报出一个无启动区的error
额外补充一下,分区表的概念:分区表的长度只有64个字节,里面又分成四项,每项16个字节。所以,一个硬盘最多只能分四个一级分区,又叫做"主分区"。
每个主分区的16个字节,由6个部分组成:
- 第1个字节:如果为
0x80
,就表示该主分区是激活分区,控制权要转交给这个分区。四个主分区里面只能有一个是激活的。 - 第2-4个字节:主分区第一个扇区的物理位置(柱面、磁头、扇区号等等)。
- 第5个字节:主分区类型。
- 第6-8个字节:主分区最后一个扇区的物理位置。
- 第9-12字节:该主分区第一个扇区的逻辑地址。
- 第13-16字节:主分区的扇区总数,决定了这个主分区的长度,一个主分区的扇区总数最多不超过2的32次方。。
我们这里简要概括一下,当计算机按BIOS下设置的启动顺序,将控制权移交给排在第一位的存储设备时,计算机会读取
当前设备的第一个扇区(512个字节),即主引导记录MBR
这个时候,计算机会先识别512个字节中最后2个字节,如果最后两个字节是0x55和0xAA
,表明这个设备可以用于启动;如果不是,表明设备不能用于启动,控制权于是被转交给"启动顺序"中的下一个设备
当前设备可以启动的话,将512个字节的MBR,原封不动地搬运到内存0x7c00处,后续MBR
中主引导程序Boot Loader会告诉计算机去哪一个地址去找到操作系统核心代码,这里由用户选择启动哪一个操作系统,初始化硬件设备,并将其按照自定义方式加载到内存中执行
那看到这里大家一定有一个疑惑?计算机为啥要把操作系统代码加载到内存地址0x7c00处,其他地址不行吗?
0x7c00是什么神秘的地址?
0x7C00
这个地址,它不属于Intel x86
平台规范的,你翻遍Intel x86
的手册,也找不到它的定义。它其实是历史遗留原因,第一次出现于IBM PC 5150
电脑,IBM PC 5150
是x86(32位)IBM PC/AT
系列的老祖宗,其使用了intel 8088
芯片,后人一直沿用这个地址以保持兼容。
那这个地址是怎么得出来的呢?IBM PC 5150
电脑的操作系统是86-DOS,由于那个时候内存是非常宝贵的,它只需要32KB
的内存就能运行,优化到极致,这在如今看来非常恐怖,实在是短小精悍!
32KB=32 * 1024 B = 32768 B = 0x8000 B
, 由于内存地址是从0x0000
开始的,32位末地址是0x8000 -1=0x7FFF
所以32KB
的内存地址是0x0000~0x7FFF
现在又知主引导记录需要512
字节,其本身引导程序的堆栈/数据区域也至少需要512
字节
0x7FFF -512 -512 + 1=0x7C00
,这样就得出0x7C00
这个地址了。
计算机启动会后,内存布局如下:
+——————— 0×0
| Interrupts vectors(中断向量表)
+——————— 0×400
| BIOS data area(BIOS的数据区域)
+——————— 0×5??
| OS load area(操作系统加载区域)
+——————— 0x7C00
| Boot sector(引导区域)
+——————— 0x7E00
| Boot data/stack(引导数据/堆栈)
+——————— 0x7FFF
| (not used)
+——————— (…)
当操作系统启动后,主引导记录也就完成使命了,其所在的内存地址0x7C00
之后的所有内存,皆可被操作系统重新利用,突出一个节约内存的理念。
加载操作系统
操作系统的加载是计算机启动过程中的最后一步,控制权将被转交给操作系统,主要工作是操作系统的所有模块加载到内存中,完成操作系统的初始化,最终实现操作系统全面接管计算机
我们这里以Linux为例,首先会去加载boot目录下的内核启动文件,成功加载内核后,然后去启动init进程(pid进程号为1),最后去加载操作系统的各个模块,比如网络、IO设备、窗口等,使得操作系统能够正常运行。
这块就不细讲了,如果去深扒linux的源代码,远远不是一篇文章能讲完的。后面笔者会尝试去更新linux0.12的相关文章,敬请期待
直到计算机中出现我们所熟悉,输入用户名密码登录的界面
参考资料:
https://www.minitool.com/lib/power-on-self-test.html
https://www.glamenv-septzen.net/en/view/6
https://www.ruanyifeng.com/blog/2015/09/0x7c00.html
https://blog.csdn.net/u011397314/article/details/111170978
《Linux内核完全注释5.0》
本文首发于公众号「小牛呼噜噜」,扫码关注,即可品读更多精彩文章