文件系统的概念
文件系统是操作系统中管理持久性数据的子系统,提供数据存储和访问功能
文件是具有符号名,由字节序列构成的数据项集合
文件系统的功能
- 分配文件磁盘空间
- 管理文件块(位置和顺序)
- 管理空闲空间
- 分配算法
- 管理文件集合
- 定位:文件及其内容
- 命名:通过名字找到文件
- 文件系统结构:文件组织方式
- 数据可靠和安全
- 安全:多层次保护数据安全
- 可靠:持久保存文件,避免系统崩溃、媒体错误、攻击等
文件属性:名称、类型、位置、大小、保护、创建者、创建时间、最近修改时间
文件头:文件系统元数据中的文件信息
- 文件属性
- 文件存储位置和顺序
文件描述符
- 文件访问模式
进程访问文件数据前必须先“打开”文件
- 内核跟踪进程打开的所有文件
操作系统为每个进程维护一个打开文件表,文件描述符是打开文件的标识
操作系统在打开文件表中维护的打开文件状态和信息
- 文件指针
最近一次读写位置,每个进程分别维护自己打开的文件指针
- 文件打开计数
当前打开文件的次数,最后一个进程关闭文件时,将其从打开文件表中移除
- 文件的磁盘位置
缓存数据访问信息
- 访问权限
每个进程的文件访问模式信息
文件的用户视图和系统视图
- 文件的用户视图
持久的数据结构
- 系统访问接口
字节序列的集合,系统不关心存储在磁盘上的数据结构
- 操作系统的文件视图
数据块的集合,数据块是逻辑存储单元,而扇区是物理存储单元
用户视图到系统视图的转换
- 进程读文件
获取字节所在的数据块,返回数据块内对应内容
- 进程写文件
获取数据块,修改数据块的对应部分,写回数据块
访问模式:
- 顺序访问: 按字节依次读取
- 随机访问: 从中间读写
- 索引访问: 依据数据特征索引
文件内部结构
- 无结构
单词和字节的序列
- 简单记录结构
分列、固定长度和可变长度
- 复杂结构
格式化文档、可执行文件等
文件系统种类
分层文件系统
文件以目录的方式组织起来
目录是一类特殊的文件,目录的内容是文件索引表<文件名, 指向文件的指针>
目录实现
-
文件名的线性列表,包涵了指向数据块的指针
-
哈希表 – 哈希数据结构的线性表
文件别名
- 硬链接: 多个文件项指向一个文件
- 软链接: 以“快捷方式”指向其他文件
种类
- 磁盘文件系统
- 数据库文件系统
- 日志文件系统
- 网络/分布式文件系统
- 特殊/虚拟文件系统
文件系统的实现
分层结构
- 虚拟(逻辑)文件系统(VFS, Virtual File System)
对所有不同文件系统的抽象,提供相同的文件系统接口,管理所有文件和文件系统关联的数据结构,与特定的文件模块进行交互
文件系统基本数据结构
文件卷控制块 (Unix: “superblock”)
- 每个文件系统一个
- 文件系统详细信息
- 块、块大小、空余块、计数/指针等
文件控制块(Unix: “vnode” or “inode”)
- 每个文件一个
- 文件详细信息
- 访问权限、拥有者、大小、数据块位置等
目录项 (Linux: “dentry”)
- 每个目录项一个(目录和文件)
- 将目录项数据结构及树型布局编码成树型数据结构
- 指向文件控制块、父目录、子目录等
文件系统的存储结构
文件系统数据结构
- 卷控制块 (每个文件系统一个)
- 文件控制块 (每个文件一个)
- 目录节点(每个目录项一个)
持久存储在外存中
- 存储设备的数据块中
当需要时加载进内存
- 卷控制模块 : 当文件系统挂载时进入内存
- 文件控制块: 当文件被访问时进入每次
- 目录节点: 在遍历一个文件路径时进入内存
数据块缓存
- 数据块按需读入内存
提供read()操作
预读: 预先读取后面的数据块
- 数据块使用后被缓存
假设数据将会再次用到
写操作可能被缓存和延迟写入
- 两种数据块缓存方式
数据块缓存
页缓存: 统一缓存数据块和内存页
页缓存
- 虚拟页式存储
在虚拟地址空间中虚拟页面可映射到本地外存文件中
- 文件数据块的页缓存
在虚拟内存中文件数据块被映射成页,文件的读/写操作被转换成对内存的访问,可能导致缺页和/或设置为脏页
文件分配
连续分配
文件头指定起始块和长度
分配策略:最先匹配, 最佳匹配
文件读取表现好,高效的顺序和随机访问
链式分配
文件以数据块链表方式存储
文件头包含了到第一块和最后一块的指针
创建、增大、缩小很容易,没有碎片
索引分配
为每个文件创建一个索引数据块,指向文件数据块的指针列表,文件头包含了索引数据块指针
创建、增大、缩小很容易,没有碎片,支持直接访问
(续