大家好,我是呼噜噜,最近在看linux早期内核0.12
的源码,突然想到一个困扰自己好久的问题:当我们按下电源键,计算机发生了什么?神秘地址0x7C00究竟是什么?操作系统又是如何被加载到硬件中的?带着这些问题,继续往下阅读本文。
x86计算机启动过程,主要分为这几个阶段:BIOS自检,引导设备的选择,主引导记录,加载操作系统
当电源自检通过后,主板会通电,开始读取ROM里面的BIOS程序,进行BIOS自检。BIOS(Basic Input Output System,基本输入输出系统),它负责管理和控制计算机硬件设备,本质上是一组"程序代码"。
BIOS作为计算机开机之后,CPU要进行处理的第一个“可执行程序”,也就是第一个“开机启动项”。其程序代码事先被刷入集成在主板的ROM芯片中,主要保存着系统设置程序、基本输入输出程序、开机上电自检程序和系统启动自举程序等
ROM: 只读存储器,不需要供电也可保持数据不丢失。这点特性和内存有着鲜明的对比
现在一般用Flash闪存来代替ROM,由于ROM写入后就不能修改,改用Flash闪存后,既方便又能用专用程序即可修改其中代码
当BIOS启动后,会开始BIOS自检,会依次执行以下操作:
作者:小牛呼噜噜 ,首发于公众号「小牛呼噜噜」
期间如果检测到设备或者硬件运行不正常,主板会发出不同的蜂鸣声(具体查看bios手册区分)来作为警告,同时启动会中止。同时我们不用担心检测时间过长,往往我们还没感觉的时候,计算机的BIOS自检就已经完成了。
当BIOS完成硬件自检后,需要进行引导设备的选择,主要是确定计算机从哪个设备启动,通常是硬盘或可移动设备。这一步也是我们常说的BIOS下的启动顺序,计算机需要知道下一个阶段要启动的程序具体放在了哪一个设备上。
用户可以自行去选择从哪个设备启动计算机,比如光盘或USB驱动器,进而调节启动设备的优先级。
BIOS操作界面,有一项就是"设定启动顺序",我们一般使用U盘装系统就得在这一步设置为U盘启动。
当BIOS按照我们设定好的启动顺序,BIOS则根据这个顺序将计算机的控制权交给排在第一位的存储设备。主要目的是将硬盘中操作系统的核心代码加载到计算机的内存中并执行它。通俗点讲,主引导程序它个头比较小,操作系统个头大,它的任务就是去加载一个个头大的程序,也就是操作系统。
那怎样将操作系统的核心代码加载到计算机的内存中并执行?我们只需将从第一位设备中读取设备的MBR,并且将程序放在0x7c000的内存地址位中即可
MBR是存储设备中的第一个扇区,也就是磁盘最前面的512字节(Byte),称为“主引导记录”(Master boot record,简称为MBR)
我们这就不得不提机械硬盘的构造了,常见的机械硬盘的组成部分:
我们就不一一介绍了,我们直接讲其存储数据的原理。机械硬盘存储数据的时候,是将数据存储在其内部的盘面上。一块硬盘中一般会有多个盘片。
盘片的表面涂有磁性物质,这些磁性物质用来记录二进制数据。因为正反两面都可涂上磁性物质,故一个盘片可能会有两个盘面。
每个盘面都会有对应的磁头,所有磁头"共进共退",因为会有一个磁臂固定它们。
每个盘面划分成了一圈一圈的磁道,最外圈是0磁盘。然后每个磁盘又划分为了一个个小块,小块叫做扇区。扇区大小固定,是512个字节。
扇区大小为啥固定512字节?这是1956年由industry trade organization, International Disk Drive Equipment和Materials Association三家机构确定的行业标准, 大家都默认会遵守的标准,久而久之,如果改变的话,兼容各种情况的代价非常大。
我们现在更常用的固态硬盘的原理是和机械硬盘是截然不同的,大家感兴趣地可以自行去了解。上面科普了许多磁盘的知识,下面让我们回到MBR上。
由于BIOS很小,功能有限,为了完成加载操作系统的功能,就诞生了MBR
MBR在** 0 盘 0 道0扇区上(最外层磁盘的最外围磁道的第一个扇区),也就是该储存设备的第一个扇区(大小512个字节)。它存放了用于启动操作系统的引导程序代码,其实这串代码就是告诉计算机去哪一个地址去找操作系统**。
主引导记录由三个部分组成:
额外补充一下,分区表的概念:分区表的长度只有64个字节,里面又分成四项,每项16个字节。所以,一个硬盘最多只能分四个一级分区,又叫做"主分区"。
每个主分区的16个字节,由6个部分组成:
当主引导程序将硬盘的第一个扇区中读取到的 操作系统引导程序代码(512 个字节的内容),加载(原封不动地复制)到计算机内存0x7c00这个位置。这个过程需要依靠硬盘控制器和指令集来完成。
那看到这里大家一定有一个疑惑?计算机为啥要把操作系统代码加载到内存地址0x7c00处,其他地址不行吗?
0x7C00这个地址,它不属于Intel x86平台规范的,你翻遍Intel x86的手册,也找不到它的定义。它其实是历史遗留原因,第一次出现于IBM PC 5150电脑,IBM PC 5150是x86(32位)IBM PC/AT系列的老祖宗,其使用了intel 8088芯片,后人一直沿用这个地址以保持兼容。
那这个地址是怎么得出来的呢?IBM PC 5150电脑的操作系统是86-DOS,它最少需要32KB的内存,要知道那个时候内存是非常宝贵的,能省就省,勤俭持家嘛。
32KB=32 * 1024 B = 32768 B = 0x8000 B
, 由于内存地址是从0x0000开始的,32位末地址是0x8000 -1=0x7FFF
所以32KB的内存地址是0x0000~0x7FFF
现在又知主引导记录需要512字节,其本身引导程序的堆栈/数据区域也至少需要512 字节
0x7FFF -512 -512 + 1=0x7C00
,这样就得出0x7C00
这个地址了。
计算机启动会后,内存布局如下:
+——————— 0×0 | Interrupts vectors(中断向量表) +——————— 0×400 | BIOS data area(BIOS的数据区域) +——————— 0×5?? | OS load area(操作系统加载区域) +——————— 0x7C00 | Boot sector(引导区域) +——————— 0x7E00 | Boot data/stack(引导数据/堆栈) +——————— 0x7FFF | (not used) +——————— (…)
当操作系统启动后,主引导记录也就完成使命了,其所在的内存地址0x7C00
之后的所有内存,皆可被操作系统重新利用,突出一个节约内存的理念。
操作系统的加载是计算机启动过程中的最后一步,控制权将被转交给操作系统,主要工作是操作系统的所有模块加载到内存中,完成操作系统的初始化,最终实现**
我们这里以Linux为例,首先会去加载boot目录下的内核启动文件,成功加载内核后,然后去启动init进程(pid进程号为1),最后去加载操作系统的各个模块,比如网络、IO设备、窗口等,使得操作系统能够正常运行。
这块就不细讲了,如果去深扒linux的源代码,远远不是一篇文章能讲完的。后面笔者会尝试去更新linux0.12的相关文章,敬请期待
直到计算机中出现我们所熟悉,输入用户名密码登录的界面
参考资料:
《Linux内核完全注释5.0》
https://www.minitool.com/lib/power-on-self-test.html
https://www.ruanyifeng.com/blog/2015/09/0x7c00.html
https://www.glamenv-septzen.net/en/view/6
作者:小牛呼噜噜 ,首发于公众号「小牛呼噜噜」
感谢阅读,原创不易,如果有收获的话,就点个免费的[赞]or[转发],你的支持会激励我输出更高质量的文章,感谢!