• ext2文件系统


    我们知道,一个磁盘可以划分成多个分区,每个分区必须先用格式化工具(例如某种
    mkfs命令)格式化成某种格式的文件系统,然后才能存储文件,格式化的过程会在磁盘上写
    一些管理存储布局的信息。下图是一个磁盘分区格式化成ext2文件系统后的存储布局。
    文件系统中存储的最小单位是块(Block),一个块究竟多大是在格式化时确定的,
    例如mke2fs的-b选项可以设定块大小为1024、2048或4096字节。而上图中启动块(Boot
    Block)的大小是确定的,就是1KB,启动块是由PC标准规定的,用来存储磁盘分区信息和启
    动信息,任何文件系统都不能使用启动块。启动块之后才是ext2文件系统的开始,ext2文
    件系统将整个分区划成若干个同样大小的块组(Block Group),每个块组都由以下部分组
    成。
    超级块(Super Block) 描述整个分区的文件系统信息,例如块大小、文件系统版本
    号、上次mount的时间等等。超级块在每个块组的开头都有一份拷贝。
    块组描述符表(GDT,Group Descriptor Table) 由很多块组描述符组成,整个分区分
    成多少个块组就对应有多少个块组描述符。每个块组描述符(Group Descriptor)存储一个
    块组的描述信息,例如在这个块组中从哪里开始是inode表,从哪里开始是数据块,空闲的
    inode和数据块还有多少个等等。和超级块类似,块组描述符表在每个块组的开头也都有一
    份拷贝,这些信息是非常重要的,一旦超级块意外损坏就会丢失整个分区的数据,一旦块组
    描述符意外损坏就会丢失整个块组的数据,因此它们都有多份拷贝。通常内核只用到第0个
    块组中的拷贝,当执行e2fsck检查文件系统一致性时,第0个块组中的超级块和块组描述符
    表就会拷贝到其它块组,这样当第0个块组的开头意外损坏时就可以用其它拷贝来恢复,从
    而减少损失。
    块位图(Block Bitmap) 一个块组中的块是这样利用的:数据块存储所有文件的数
    据,比如某个分区的块大小是1024字节,某个文件是2049字节,那么就需要三个数据块来
    存,即使第三个块只存了一个字节也需要占用一个整块;超级块、块组描述符表、块位
    图、inode位图、inode表这几部分存储该块组的描述信息。那么如何知道哪些块已经用来存
    储文件数据或其它描述信息,哪些块仍然空闲可用呢?块位图就是用来描述整个块组中哪些
    块已用哪些块空闲的,它本身占一个块,其中的每个bit代表本块组中的一个块,这个bit为
    1表示该块已用,这个bit为0表示该块空闲可用。
    为什么用df命令统计整个磁盘的已用空间非常快呢?因为只需要查看每个块组的块位图
    即可,而不需要搜遍整个分区。相反,用du命令查看一个较大目录的已用空间就非常慢,因
    为不可避免地要搜遍整个目录的所有文件。
    与此相联系的另一个问题是:在格式化一个分区时究竟会划出多少个块组呢?主要的限
    制在于块位图本身必须只占一个块。用mke2fs格式化时默认块大小是1024字节,可以用-b参
    数指定块大小,现在设块大小指定为b字节,那么一个块可以有8b个bit,这样大小的一个块
    位图就可以表示8b个块的占用情况,因此一个块组最多可以有8b个块,如果整个分区有s个
    块,那么就可以有s/(8b)个块组。格式化时可以用-g参数指定一个块组有多少个块,但是通
    常不需要手动指定,mke2fs工具会计算出最优的数值。
    inode位图(inode Bitmap) 和块位图类似,本身占一个块,其中每个bit表示一个
    inode是否空闲可用。
    inode表(inode Table) 我们知道,一个文件除了数据需要存储之外,一些描述信息
    也需要存储,例如文件类型(常规、目录、符号链接等),权限,文件大小,创建/修改/访
    问时间等,也就是ls -l命令看到的那些信息,这些信息存在inode中而不是数据块中。每个
    文件都有一个inode,一个块组中的所有inode组成了inode表。
    inode表占多少个块在格式化时就要决定并写入块组描述符中,mke2fs格式化工具的默
    认策略是一个块组有多少个8KB就分配多少个inode。由于数据块占了整个块组的绝大部分,
    也可以近似认为数据块有多少个8KB就分配多少个inode,换句话说,如果平均每个文件的大
    小是8KB,当分区存满的时候inode表会得到比较充分的利用,数据块也不浪费。如果这个分
    区存的都是很大的文件(比如电影),则数据块用完的时候inode会有一些浪费,如果这个
    分区存的都是很小的文件(比如源代码),则有可能数据块还没用完inode就已经用完了,
    数据块可能有很大的浪费。如果用户在格式化时能够对这个分区以后要存储的文件大小做一
    个预测,也可以用mke2fs的-i参数手动指定每多少个字节分配一个inode。
    数据块(Data Block) 根据不同的文件类型有以下几种情况
    对于常规文件,文件的数据存储在数据块中。
    对于目录,该目录下的所有文件名和目录名存储在数据块中,注意文件名保存在它所在
    目录的数据块中,除文件名之外,ls -l命令看到的其它信息都保存在该文件的inode中。注
    意这个概念:目录也是一种文件,是一种特殊类型的文件。
    对于符号链接,如果目标路径名较短则直接保存在inode中以便更快地查找,如果目标
    路径名较长则分配一个数据块来保存。
    设备文件、FIFO和socket等特殊文件没有数据块,设备文件的主设备号和次设备号保存
    在inode中 。

    目录中记录项文件类型

    从上图可以看出,索引项Blocks[13]指向两级的间接寻址块,最多可表示(b/4)2+b/
    4+12个数据块,对于1K的块大小最大可表示64.26MB的文件。索引项Blocks[14]指向三级
    的间接寻址块,最多可表示(b/4)3+(b/4)2+b/4+12个数据块,对于1K的块大小最大可表示
    16.06GB的文件。
    可见,这种寻址方式对于访问不超过12个数据块的小文件是非常快的,访问文件中的任
    意数据只需要两次读盘操作,一次读inode(也就是读索引项)一次读数据块。而访问大文
    件中的数据则需要最多五次读盘操作:inode、一级间接寻址块、二级间接寻址块、三级间
    接寻址块、数据块。实际上,磁盘中的inode和数据块往往已经被内核缓存了,读大文件的
    效率也不会太低。

  • 相关阅读:
    BZOJ4912 [Sdoi2017]天才黑客 【虚树 + 最短路】
    BZOJ2738 矩阵乘法 【整体二分 + BIT】
    BZOJ1185 [HNOI2007]最小矩形覆盖 【旋转卡壳】
    BZOJ4830 [Hnoi2017]抛硬币 【扩展Lucas】
    BZOJ3738 [Ontak2013]Kapitał 【扩展Lucas】
    云计算,大数据,人工智能
    conda基本操作
    nlp基础(一)基本应用
    ml交叉验证
    Python魔术方法
  • 原文地址:https://www.cnblogs.com/yangguang-it/p/7115118.html
Copyright © 2020-2023  润新知