在回答这个问题之前,你可能会首先想:为什么操作系统需要保护自己呢?
操作系统其实就是一个大管家,负责给应用程序搭建舞台,好让程序们过好自己的一生,但偏偏有不听话的程序可能想抢操作系统的戏,显然这会影响所有其它正在程序,因此操作系统必须要有能力保护自己。
我们从历史的角度了解了x86最开始是没有任何保护机制的,应用程序竟然可以与操作系统平起平坐,操作系统能读写的内存区域应用程序也一样可以读写,操作系统可以控制的硬件应用程序一样不在话下。
应用程序和操作系统这么平等还何谈保护?其实从某种程度讲,保护自己就是限制别人,那么操作系统该怎样限制应用程序呢?
程序也是分三六九等的
核心就在一点:权限。这一点相信对于打工人都深有体会,在公司里有的文档你无权查看,有的数据库你无权读取,有的门禁你的卡刷不开等等。这里也是一样的道理,但是操作系统和普通的应用程序都是软件,从本质上讲没有任何区别,在CPU眼里都是机器指令,显然从软件这一层面上看操作系统没有很好的办法能控制应用程序,这就不得不借助硬件的帮忙了,借助谁的帮忙呢?显然是CPU。我们刚才提到过,不管是操作系统还是应用程序在CPU眼里都是机器指令,CPU闭着眼执行就完事儿,从时间角度上看CPU就是一条又一条的在执行指令:然而,CPU也不能对此一点都不关心,CPU必须能区分出哪些指令属于操作系统,哪些指令属于普通的应用程序!该怎么区分呢?很简单,其中一种方法是这样的,我们添加一些特殊的机器指令,假设是指令A和B,CPU执行到该指令A时就知道接下来要执行的指令属于操作系统,当执行完指令B时就知道接下来要执行的属于普通应用程序,这两条指令在x86(32位)中就是int与iret指令,这两个指令对应的背后就是所谓的系统调用。有了这样的指令,CPU可以清楚的执行什么时候在执行普通程序,什么是在运行操作系统(程序),CPU能区分清楚那么就能给它们赋予不同的权限,这就是所谓用户态与内核态的由来,用户态对应的是普通程序,内核态对应的是操作系统,它们的权限是不一样的。x86 CPU支持四种权限等级,0,1,2,3,一般的操作系统都使用两种特权0和3,0是最高权限,显然这是操作系统也就是内核态所拥有的权限,而3是普通程序运行的权限,相对较低。同时,一些指令只有在内核态下才可以执行,这些就是所谓特权指令,当CPU在用户态(普通程序)时是没有办法执行特权指令的,这样就从机器指令这个层面确保了普通程序不能执行某些特权操作。我们知道程序除了机器指令外还有指令依赖的数据,而数据又是保存在内存中,那么接下来的问题是操作系统该怎样保护自己的内存不会普通程序读写呢?访问内存也需要权限
答案和我们刚才讲解的机器指令的特权划分是一样的。我们规定操作系统所在的内存区域只有CPU处于内核态时才可以访问,如果位于用户态的程序试图访问内核所在的地址空间那么将立刻被操作系统kill掉。那么接下来的问题就是我们该怎样给一段内存添加上权限信息呢?显然我们需要一张“表”,这张表中记录一段内存区域并且记录下访问这块内存所需要的权限信息,类似这样:
从实模式到保护模式
我们在之前的文章中说过,x86是一个有着顽强生命力的物种,其它大部分类型的CPU在计算机不长的历史中逐渐消失了,而x86则历久弥新,也因此x86历史包袱十分沉重,即使是最新款的intel x86处理器也可以运行上世纪编写的古老程序,为做到向后兼容,intel x86程序必须既能运行在实模式下也能运行在保护模式下。因此x86处理器在加电会首先进入实模式然后切换到保护模式,现代操作系统都运行在保护模式下,正是利用了处理器的一系列特性操作系统才得以保护自己。我们看到的x86内存管理都是基于段式机制,Segmentation来管理内存的,实际上x86处理器在引入保护模式的同时也开始支持页式内存管理(paging),因此现代x86处理器即支持段式内存管理也支持页式内存管理,只不过对于现代操作系统像Linux等实际上几乎不再使用处理器提供的段式内存管理机制而是基于页式内存管理机制。从这里我们也能看出来,内存管理机制其实是处理器这种硬件提供的,操作系统(软件)只不过这种机制的使用者而已。