为了方便管理,我们可以将硬盘这样的物理块设备,分割成多个逻辑块设备。或者,我们也可以将多个物理块设备,组合成一个容量更大的逻辑块设备。
底层的相关技术和工具,包括RAID(大家可能比较熟悉)、JBOD、卷管理系统(Volume Manager)。
Windows的卷管理系统,就是它自带的磁盘管理工具。而Linux的,是大名鼎鼎的LVM(Logical Volume Manager,逻辑卷管理)。
我们先说说Windows的。
在Windows中,磁盘分为基本磁盘和动态磁盘。默认情况下,用户用的都是基本磁盘。
一个基本磁盘可以划分为多个分区,分区类别包括主分区、扩展分区和逻辑分区。
硬盘分区
主分区是硬盘的启动分区,我们常说的“C盘”就是硬盘上的主分区。MBR分区表可以划分出4个主分区。如果使用GPT分区,可以管理128个主分区。
除去主分区以外,硬盘剩下的容量就被认定为扩展分区。扩展分区不能直接使用。扩展分区可以分成一个或若干个逻辑分区,也就是我们的“D盘”、“E盘”等。
动态磁盘是基本磁盘的升级模式。在动态磁盘中,分区叫做卷。卷的出现,就是为了便于对多硬盘进行管理。
简单来说,动态磁盘可以将不同硬盘分到一个卷。假如你手中有160G和250G硬盘各一块,如果想划分90G和320G的分区,就可以借助动态磁盘来完成。
动态磁盘里面的卷,又分为简单卷、跨区卷、带区卷、镜像卷、RAID-5卷。限于篇幅,就不做具体介绍了。基本磁盘里的分区,现在也被微软改叫为卷。
再来看看Linux的LVM工具。
其实LVM和动态磁盘的思路差不多的,也是把物理空间变成逻辑空间。
首先,物理存储介质进行初始化,变成物理卷(PV,physical volume)。
然后,一个或多个物理卷组成一个卷组(VG,Volume Group)。
创建卷组之后,再创建逻辑卷(LV,logical volume)。
整个过程,如下图所示:
LVM主要元素的构成
好了,不管是Windows还是Linux,逻辑卷都有了,是不是可以直接使用它们啦?
不行,还差一步。那就是文件系统(File System)。
文件系统就像仓库管理员。作为用户,你不需要知道仓库里面到底是什么样子,只需要把货物交给他,他会以一个树形结构目录,登记这些货物。你来取的时候,只需要告诉他路径,他就会把货物交给你。
文件夹结构
文件系统有很多种类型,常见的有Windows的FAT/FAT32/NTFS(大家应该很熟悉),还有就是Linux的EXT2/EXT3/EXT4/XFS/BtrFS等。
Windows系统下,通过对分区(卷)进行文件系统格式化,再分配一个盘符,我们就可以在“我的电脑”里看到可用的磁盘。Linux系统下,我们需要对逻辑卷进行文件系统格式化,然后执行挂载操作,也就能对存储空间进行使用了。
▉ 什么是DAS/NAS/SAN
除了内置存储之外,随着存储容量需求的不断增加,加上维护便利性的需要,计算机系统开始引入了外挂存储。也就是说,硬盘从计算机的内部,跑到了计算机的外部。
外挂存储分为两种,一种是直连式存储(DAS,Direct Attached Storage),还有一种是网络存储(FAS,Fabric Attached Storage)。
DAS直连式存储,一般是使用专用线缆(例如SCSI),与存储设备(例如磁盘阵列)进行直连。
虽然数据存储设备看似在外部,但直接挂接在服务器内部总线上,是整个服务器结构的一部分。
DAS的缺点是存储设备只能连接到一台主机使用,无法共享,成本较高,且安全性可靠性较低。
FAS网络存储,是一种多点连接式的存储。它又分为NAS(Network-attached Storage,网络接入存储)和SAN(Storage Area Network,存储区域网络)。
这些概念的名字非常像,大家千万别晕。画个图看得明白一些:
NAS与DAS相比,最大的特点是非直连。它可以通过IP网络,实现多台主机与存储设备之间的连接。
NAS大大提高了存储的安全性、共享性和成本。但是I/O(输入输出)渐渐成为性能瓶颈。随着应用服务器的不断增加,网络系统效率会急剧下降。为了解决这个问题,出现了SAN存储方案。
SAN是在NAS基础上做的演进。它通过专用光纤通道交换机访问数据,采用ISCSI、FC协议。
SAN和NAS的关键区别,就在于文件系统的位置。画个图就明白了:
可以看出,如果说SAN是一块网络硬盘的话,NAS基本上已经像一台独立的服务器了。NAS拥有文件系统,用户可以通过TCP/IP协议直接访问上面的数据。
现在很多家庭都开始使用小型NAS设备,相当于一个小型服务器。
在NAS的模式下,不同的客户端可以使用网络文件系统(Network File System)访问NAS上的文件。常见的网络文件系统有Windows网络的CIFS(也叫SMB)、类Unix系统网络的NFS等。
FTP、HTTP其实也算是文件存储的某种特殊实现,它们通过某个URL地址来访问一个文件。