初识文件管理
文件的属性
-
文件名:由创建文件的用户决定文件名,主要是为了方便用户找到文件,同一目录下不允许有重名文件
-
标识符:一个系统内的各文件标识符唯一,对用户来说毫无可读性, 因此标识符只是操作系统用于区分各个文件的一种内部名称
-
类型:指明文件的类型
-
位置:文件存放的路径(让用户使用)、在外存中的地址(操作系统使用,对用户不可见)
-
大小:指明文件大小
-
创建时间、上次修改时间
-
文件所有者信息
-
保护信息:对文件进行保护的访问
-
控制信息
文件的逻辑结构
- 文件的逻辑结构:在用户看来,文件内部的数据应该怎样组织起来
- 无结构文件:由一些二进制或字符流组成,又称“流式文件”,如文本文件
- 有结构文件:由一组相似的记录组成,又称“记录式文件”,如数据库表
- 记录是一组相关数据项的集合,比如数据库表中的一行
- 数据项是文件系统中最基本的数据单位,比如数据库表中的一条记录中的一个列值
目录结构
- 目录结构就是:文件之间应该怎样组织起来
- 目录其实也是一种特殊的有结构文件(由记录组成)
- 所谓的“目录” 其实就是我们熟悉的“文件夹”
操作系统向上提供的功能
- 操作系统向上提供方便用户、应用程序使用文件的功能
- 双击记事本后,应用程序通过操作系提供的“读文件”功能,即read 系统调用,将文件数据从外存读入内存,并显示在屏幕上
- 在“记事本”应用程序中编辑文件内容,点击“保存”后, “记事本”应用程序通过操作系统提供的“写文件”功能,即write系统调用, 将文件数据从内存写回外存
- 点了“删除”之后, 通过操作系统提供的 “删除文件”功能,即delete系统调用, 将文件数据从外存中删除
文件的物理结构
- 文件的物理结构就是:在操作系统看来,文件应该如何存放在外存中
- 操作系统以“块”为单位为文件分配存储空间
- 外存会分为一个个“块/磁盘块/物理块”,每个磁盘块的大小是相等的
- 文件的逻辑地址也可以分为(逻辑块号,块内地址)
- 操作系统同样需要将逻辑地址转换为外存的物理地址(物理块号,块内地址)的形式
- 块内地址的位数取决于磁盘块的大小
文件的逻辑结构
- 文件的逻辑结构:在用户看来,文件内部的数据应该怎样组织起来
无结构文件
- 按文件是否有结构分类,可以分为无结构文件、有结构文件两种
- 无结构文件:文件内部的数据就是一系列二进制流或字符流组成。又称“流式文件”
- 如: Windows 操作系统中的 .txt 文件
- 流式文件内部的数据是一系列字符流,没有明显的结构特性,因此也不用探讨无结构文件的“逻辑结构”问题
有结构文件
- 有结构文件:由一组相似的记录组成,又称“记录式文件”。每条记录又若干个数据项组成
- 如: 数据库表文件,一般来说,每条记录有一个数据项可作为关键字(作为识别不同记录的ID)
- 根据各条记录的长度(占用的存储空间)是否相等,又可分为定长记录和可变长记录两种
- 根据有结构文件中的各条记录在逻辑上如何组织,可以分为三类:顺序文件、索引文件、索引顺序文件
顺序文件
- 顺序文件:文件中的记录在逻辑上一个接一个的顺序排列,记录可以是定长的或可变长的。各个记录在物理上可以顺序存储或链式存储:
- 顺序文件按照记录之间的顺序与关键字是否有关可分为:
- 小结:
- 随机存取:快速找到第 i 个记录对应的地址
索引文件
- 建立一张索引表以加快文件检索速度
- 一条记录对应一个索引项
索引顺序文件
- 建立一张索引表以加快文件检索速度
- 一组记录对应一个索引项
小结
文件的物理结构🌟
- 文件的物理结构:文件数据应该如何存放在外存中
连续分配
- 连续分配方式要求每个文件在磁盘上占有一组连续的块
- 优点:支持顺序访问和直接访问(即随机访问);连续分配的文件在顺序访问时速度最快
- 缺点:不方便文件拓展;存储空间利用率低,会产生磁盘碎片
非连续分配
链接分配
- 链接分配采取离散分配的方式,可以为文件分配离散的磁盘块。分为隐式链接和显式链接两种
隐式链接
- 隐式链接:除文件的最后一个盘块之外,每个盘块中都存有指向下一个盘块的指针。文件目录包括文件第一块的指针和最后一块的指针
- 优点:很方便文件拓展,不会有碎片问题,外存利用率高
- 缺点:只支持顺序访问,不支持随机访问,查找效率低,指向下一个盘块的指针也需要耗费少量的存储空间
注:考试题目中遇到未指明隐式/显式的“链接分配”,默认指的是隐式链接的链接分配
显式链接
- 显式链接——把用于链接文件各物理块的指针显式地存放在一张表中,即 文件分配表(FAT,File Allocation Table)。一个磁盘只会建立一张文件分配表。开机时文件分配表放入内存,并常驻内存
- 优点:很方便文件拓展,不会有碎片问题,外存利用率高,并且支持随机访问。相比于隐式链接来说,地址转换时不需要访问磁盘,因此文件的访问效率更高
- 缺点:文件分配表的需要占用一定的存储空间
索引分配
- 如果索引表太大,一个索引块装不下,那么有三种解决方案:链接方案、多层索引、混合索引
链接方案
多层索引
- 若采用三层索引,则文件的最大长度为 256 * 256 * 256 * 1KB = 16GB
- 类似的,访问目标数据块,需要4次磁盘I/O
混合索引
小结
文件目录
文件控制块(FCB)🌟
目录结构
单级目录结构
两级目录结构
多级目录结构
- 多级目录结构又称树形目录结构
- 树形目录结构可以很方便地对文件进行分类,层次结构清晰,也能够更有效地进行文件的管理和保护。但是,树形结构不便于实现文件的共享。为此,提出了“无环图目录结构”。
无环图目录结构
索引节点
小结
文件存储空间管理🌟
- 文件存储空间管理:对空闲磁盘块的管理
存储空间的划分与初始化
空闲表法
空闲链表法
位示图法
小结
文件操作
- 操作系统在处理 Create 系统调用时,主要做了两件事:
- 在外存中找到文件所需的空间(结合上小节学习的空闲链表法、位示图、成组链接法等管理策略,找到空闲空间)
- 根据文件存放路径的信息找到该目录对应的目录文件(此处就是 D:/Demo 目录),在目录中创建该文件对应的目录项。目录项中包含了文件名、文件在外存中的存放位置等信息
- 操作系统在处理 Delete 系统调用时,主要做了几件事:
- 根据文件存放路径找到相应的目录文件,从目录中找到文件名对应的目录项
- 根据该目录项记录的文件在外存的存放位置、文件大小等信息,回收文件占用的磁盘块 (回收磁盘块时,根据空闲表法、空闲链表法、 位图法等管理策略的不同,需要做不同的处理)
- 从目录表中删除文件对应的目录项
- 操作系统在处理 open 系统调用时,主要做了几件事:
- 根据文件存放路径找到相应的目录文件,从目录中找到文件名对应的的目录项,并检查该用户是否有指定的操作权限。
- 将目录项复制到内存中的“打开文件表”中。并将对应表目的编号返回给用户。之后用户使用打开文件表的编号来指明要操作的文件
- 操作系统在处理 Close 系统调用时,主要做了几件事:
- 将进程的打开文件表相应表项删除
- 回收分配给该文件的内存空间等资源
- 系统打开文件表的打开计数器count 减1,若 count = 0,则删除对应表项
- 进程使用 read系统调用完成写操作
- 需要指明是哪个文件(在支持“打开文件”操作的系统中,只需要提供文件在打开文件表中的索引号即可),
- 还需要指明要读入多少数据(如:读入 1KB)、指明读入的数据要放在内存中的什么位置
- 操作系统在处理 read 系统调用时,会从读指针指向的外存中,将用户指定大小的数据读入用户指定的内存区域中
- 进程使用 write 系统调用完成写操作
- 需要指明是哪个文件(在支持“打开文件”操作的系统中,只需要提供文件在打开文件表中的索引号即可)
- 还需要指明要写出多少数据(如:写出 1KB)、写回外存的数据放在内存中的什么位置
- 操作系统在处理 write 系统调用时,会从用户指定的内存区域中,将指定大小的数据写回写指针指向的外存
文件共享
- 操作系统为用户提供文件共享功能,可以让多个用户共享地使用同一个文件
- “快捷方式"就是软链接
文件保护
- 文件保护:保护文件数据的安全
文件系统的层次结构
- 第一层:文件操作
- 第二层:文件目录
- 第三层:文件保护
- 第四层:文件的逻辑结构
- 第五层:文件的物理结构
- 第六层:文件的存储空间管理和上一章的磁盘管理