返回

操作系统笔记06-文件管理

初识文件管理

文件的属性

  • 文件名:由创建文件的用户决定文件名,主要是为了方便用户找到文件,同一目录下不允许有重名文件

  • 标识符:一个系统内的各文件标识符唯一,对用户来说毫无可读性, 因此标识符只是操作系统用于区分各个文件的一种内部名称

  • 类型:指明文件的类型

  • 位置:文件存放的路径(让用户使用)、在外存中的地址(操作系统使用,对用户不可见)

  • 大小:指明文件大小

  • 创建时间、上次修改时间

  • 文件所有者信息

  • 保护信息:对文件进行保护的访问

  • 控制信息

文件的逻辑结构

  • 文件的逻辑结构:在用户看来,文件内部的数据应该怎样组织起来
  • 无结构文件:由一些二进制字符流组成,又称“流式文件”,如文本文件
  • 有结构文件:由一组相似的记录组成,又称“记录式文件”,如数据库表
    • 记录是一组相关数据项的集合,比如数据库表中的一行
    • 数据项是文件系统中最基本的数据单位,比如数据库表中的一条记录中的一个列值

目录结构

  • 目录结构就是:文件之间应该怎样组织起来
  • 目录其实也是一种特殊的有结构文件(由记录组成)
  • 所谓的“目录” 其实就是我们熟悉的“文件夹”

操作系统向上提供的功能

  • 操作系统向上提供方便用户、应用程序使用文件的功能
  • 双击记事本后,应用程序通过操作系提供的“读文件”功能,即read 系统调用,将文件数据从外存读入内存,并显示在屏幕上
  • 在“记事本”应用程序中编辑文件内容,点击“保存”后, “记事本”应用程序通过操作系统提供的“写文件”功能,即write系统调用, 将文件数据从内存写回外存
  • 点了“删除”之后, 通过操作系统提供的 “删除文件”功能,即delete系统调用, 将文件数据从外存中删除

文件的物理结构

  • 文件的物理结构就是:在操作系统看来,文件应该如何存放在外存中
  • 操作系统以“”为单位为文件分配存储空间
  • 外存会分为一个个“块/磁盘块/物理块”,每个磁盘块的大小是相等的
  • 文件的逻辑地址也可以分为(逻辑块号,块内地址)
  • 操作系统同样需要将逻辑地址转换为外存的物理地址(物理块号,块内地址)的形式
  • 块内地址的位数取决于磁盘的大小

文件的逻辑结构

  • 文件的逻辑结构:在用户看来,文件内部的数据应该怎样组织起来

无结构文件

  • 按文件是否有结构分类,可以分为无结构文件、有结构文件两种
  • 无结构文件:文件内部的数据就是一系列二进制流字符流组成。又称“流式文件
    • 如: Windows 操作系统中的 .txt 文件
  • 流式文件内部的数据是一系列字符流,没有明显的结构特性,因此也不用探讨无结构文件的“逻辑结构”问题

有结构文件

  • 有结构文件:由一组相似的记录组成,又称“记录式文件”。每条记录又若干个数据项组成
    • 如: 数据库表文件,一般来说,每条记录有一个数据项可作为关键字(作为识别不同记录的ID)
  • 根据各条记录的长度(占用的存储空间)是否相等,又可分为定长记录可变长记录两种
  • 根据有结构文件中的各条记录在逻辑上如何组织,可以分为三类:顺序文件、索引文件、索引顺序文件

顺序文件

  • 顺序文件:文件中的记录在逻辑上一个接一个的顺序排列,记录可以是定长的或可变长的。各个记录在物理上可以顺序存储链式存储
  • 顺序文件按照记录之间的顺序关键字是否有关可分为:
  • 小结:
  • 随机存取:快速找到第 i 个记录对应的地址

索引文件

  • 建立一张索引表以加快文件检索速度
  • 一条记录对应一个索引项

索引顺序文件

  • 建立一张索引表以加快文件检索速度
  • 一组记录对应一个索引项

小结

文件的物理结构🌟

  • 文件的物理结构:文件数据应该如何存放在外存中

连续分配

  • 连续分配方式要求每个文件在磁盘上占有一组连续的块
  • 优点:支持顺序访问和直接访问(即随机访问);连续分配的文件在顺序访问时速度最快
  • 缺点:不方便文件拓展;存储空间利用率低,会产生磁盘碎片

非连续分配

链接分配

  • 链接分配采取离散分配的方式,可以为文件分配离散的磁盘块。分为隐式链接显式链接两种
隐式链接
  • 隐式链接:除文件的最后一个盘块之外,每个盘块中都存有指向下一个盘块的指针。文件目录包括文件第一块的指针和最后一块的指针
  • 优点:很方便文件拓展,不会有碎片问题,外存利用率高
  • 缺点:只支持顺序访问,不支持随机访问,查找效率低,指向下一个盘块的指针也需要耗费少量的存储空间

注:考试题目中遇到未指明隐式/显式的“链接分配”,默认指的是隐式链接的链接分配

显式链接
  • 显式链接——把用于链接文件各物理块的指针显式地存放在一张表中,即 文件分配表(FAT,File Allocation Table)。一个磁盘只会建立一张文件分配表。开机时文件分配表放入内存,并常驻内存
  • 优点:很方便文件拓展,不会有碎片问题,外存利用率高,并且支持随机访问。相比于隐式链接来说,地址转换时不需要访问磁盘,因此文件的访问效率更高
  • 缺点:文件分配表的需要占用一定的存储空间

索引分配

  • 如果索引表太大,一个索引块装不下,那么有三种解决方案:链接方案、多层索引、混合索引
链接方案
多层索引
  • 若采用三层索引,则文件的最大长度为 256 * 256 * 256 * 1KB = 16GB
  • 类似的,访问目标数据块,需要4次磁盘I/O
混合索引

小结

文件目录

文件控制块(FCB)🌟

目录结构

单级目录结构

两级目录结构

多级目录结构

  • 多级目录结构又称树形目录结构
  • 树形目录结构可以很方便地对文件进行分类,层次结构清晰,也能够更有效地进行文件的管理和保护。但是,树形结构不便于实现文件的共享。为此,提出了“无环图目录结构”。

无环图目录结构

索引节点

小结

文件存储空间管理🌟

  • 文件存储空间管理:对空闲磁盘块的管理

存储空间的划分与初始化

空闲表法

空闲链表法

位示图法

小结

文件操作

  • 操作系统在处理 Create 系统调用时,主要做了两件事:
    • 在外存中找到文件所需的空间(结合上小节学习的空闲链表法、位示图、成组链接法等管理策略,找到空闲空间)
    • 根据文件存放路径的信息找到该目录对应的目录文件(此处就是 D:/Demo 目录),在目录中创建该文件对应的目录项。目录项中包含了文件名、文件在外存中的存放位置等信息
  • 操作系统在处理 Delete 系统调用时,主要做了几件事:
    • 根据文件存放路径找到相应的目录文件,从目录中找到文件名对应的目录项
    • 根据该目录项记录的文件在外存的存放位置、文件大小等信息,回收文件占用的磁盘块 (回收磁盘块时,根据空闲表法、空闲链表法、 位图法等管理策略的不同,需要做不同的处理)
    • 从目录表中删除文件对应的目录项
  • 操作系统在处理 open 系统调用时,主要做了几件事:
    • 根据文件存放路径找到相应的目录文件,从目录中找到文件名对应的的目录项,并检查该用户是否有指定的操作权限。
    • 将目录项复制到内存中的“打开文件表”中。并将对应表目的编号返回给用户。之后用户使用打开文件表的编号来指明要操作的文件
  • 操作系统在处理 Close 系统调用时,主要做了几件事:
    • 将进程的打开文件表相应表项删除
    • 回收分配给该文件的内存空间等资源
    • 系统打开文件表的打开计数器count 减1,若 count = 0,则删除对应表项
  • 进程使用 read系统调用完成写操作
    • 需要指明是哪个文件(在支持“打开文件”操作的系统中,只需要提供文件在打开文件表中的索引号即可),
    • 还需要指明要读入多少数据(如:读入 1KB)、指明读入的数据要放在内存中的什么位置
    • 操作系统在处理 read 系统调用时,会从读指针指向的外存中,将用户指定大小的数据读入用户指定的内存区域中
  • 进程使用 write 系统调用完成写操作
    • 需要指明是哪个文件(在支持“打开文件”操作的系统中,只需要提供文件在打开文件表中的索引号即可)
    • 还需要指明要写出多少数据(如:写出 1KB)、写回外存的数据放在内存中的什么位置
    • 操作系统在处理 write 系统调用时,会从用户指定的内存区域中,将指定大小的数据写回写指针指向的外存

文件共享

  • 操作系统为用户提供文件共享功能,可以让多个用户共享地使用同一个文件
  • “快捷方式"就是软链接

文件保护

  • 文件保护:保护文件数据的安全

文件系统的层次结构

  • 第一层:文件操作
  • 第二层:文件目录
  • 第三层:文件保护
  • 第四层:文件的逻辑结构
  • 第五层:文件的物理结构
  • 第六层:文件的存储空间管理和上一章的磁盘管理
最后更新于 Jun 03, 2022 23:07 UTC
Built with Hugo
Theme Stack designed by Jimmy