• 文件的物理结构(连续分配,链接分配,索引分配)


    1.文件块,磁盘块

    类似于内存分页,磁盘中的存储单元也会被分为一个个“块/磁盘块/物理块”。
    很多操作系统中,磁盘块的大小与内存块、页面的大小相同

    内存与磁盘之间的数据交换(即读/写操作、磁盘I/O)都是以“块”为单位进行的。
    即每次读入一块,或每次写出一块。
    在这里插入图片描述

    • 在内存管理中,进程的逻辑地址空间被分为一个一个页面。
    • 在外存管理中,为了方便对文件数据的管理,文件的逻辑地址空间也被分为了一个一个的文件“块”
    • 文件的逻辑地址也可以表示为(逻辑块号,块内地址)的形式。
    • 操作系统为文件分配存储空间都是以块为单位的。
    • 用户通过逻辑地址来操作自己的文件,操作系统要负责实现从逻辑地址到物理地址的映射。

    2.连接分配

    连续分配方式要求每个文件在磁盘上占有一组连续的块

    在这里插入图片描述

    1.地址转换

    1. 用户给出要访问的逻辑块号,操作系统找到该文件对应的目录项(FCB)
    2. 物理块号=起始块号+逻辑块号
    3. 当然,还需要检查用户提供的逻辑块号是否合法(逻辑块号≥长度就不合法)

    在这里插入图片描述

    2.优点

    • 可以直接算出逻辑块号对应的物理块号,因此连续分配支持顺序访问和直接访间(即随机访问)
    • 连续分配的文件在顺序读/写时速度最快(读取某个磁盘块时,需要移动磁头。访问的两个磁盘块相隔越远,移动磁头所需时间就越长。)

    3.缺点

    1.不便于拓展

    在这里插入图片描述

    1. 若此时文件A要拓展,需要再增加一个磁盘块(总共需要连续的4个磁盘块)。
    2. 由于采用连续结构,因此文件A占用的磁盘块必须是连续的。
    3. 因此只能将文件A全部“迁移”到绿色区域。

    结论:物理上采用连续分配的文件不方便拓展

    2.产生磁盘碎片

    在这里插入图片描述
    结论:物理上采用连续分配,存储空间利用率低,会产生难以利用的磁盘碎片

    可以用紧凑来处理碎片,但是需要耗费很大的时间代价。

    3.链接分配

    链接分配采取离散分配的方式,可以为文件分配离散的磁盘块。分为隐式链接和显式链接两种。

    1.隐式链接

    1. 用户给出要访问的逻辑块号i,操作系统找到该文件对应的目录项(FCB)
    2. 从目录项中找到起始块号(即0号块),
    3. 将号逻辑块读入内存,由此知道1号逻辑块存放的物理块号,
    4. 于是读入1号逻辑块,再找到2号逻辑块的存放位置…以此类推。
    5. 因此,读入i号逻辑块,总共需要i+1次磁盘I/O。

    在这里插入图片描述

    结论(缺点):采用链式分配(隐式链接)方式的文件,只支持顺序访问,不支持随机访问,查找效率低。
    另外,指向下一个盘块的指针也需要耗费少量的存储空间。

    1.文件的拓展

    若此时要拓展文件,则可以随便找一个空闲磁盘块,挂到文件的磁盘块链尾,并修改文件的FCB。

    结论(优点):采用隐式链接的链接分配方式,很方便文件拓展
    另外,所有的空闲磁盘块都可以被利用,不会有碎片问题,外存利用率高

    2.显示链接

    把用于链接文件各物理块的指针显式地存放在一张表中。
    即文件分配表(FAT,File Allocation Table)

    1.例题

    假设某个新创建的文件“aaa”依次存放在磁盘块2→5→0→1,
    假设某个新创建的文件“bbb”依次存放在磁盘块4→23→3

    在这里插入图片描述
    注意:一个磁盘仅设置一张FAT
    开机时,将FAT读入内存,并常驻内存
    FAT的各个表项在物理上连续存储,且每一个表项长度相同,因此“物理块号”字段可以是隐含的。

    2.地址转换
    1. 用户给出要访问的逻辑块号i,操作系统找到该文件对应的目录项(FCB)
    2. 从目录项中找到起始块号,若i>0,则查询内存中的文件分配表FAT
    3. 往后找到i号逻辑块对应的物理块号。
    4. 逻辑块号转换成物理块号的过程不需要读磁盘操作

    结论(优点):采用链式分配(显式链接)方式的文件,支持顺序访问,也支持随机访问(想访问i号逻辑块时,并不需要依次访问之前的0~ i-1号逻辑块),
    由于块号转换的过程不需要访问磁盘,因此相比于隐式链接来说,访问速度快很多。

    显然,显式链接也不会产生外部碎片,也可以很方便地对文件进行拓展

    3.缺点

    文件分配表的需要占用一定的存储空间。

    注意:考试题目中遇到未指明隐式/显式的“链接分配”,默认指的是隐式链接的链接分配。

    4.索引分配

    索引分配允许文件离散地分配在各个磁盘块中,系统会为每个文件建立一张索引表
    索引表中记录了文件的各个逻辑块对应的物理块(索引表的功能类似于内存管理中的页表――建立逻辑页面到物理页之间的映射关系)。

    索引表存放的磁盘块称为索引块
    文件数据存放的磁盘块称为数据块

    1.例题

    假设某个新创建的文件“aaa”的数据依次存放在磁盘块2→5 →13→>9 。
    7号磁盘块作为“aaa”的索引块,索引块中保存了索引表的内容。

    在这里插入图片描述

    注:在显式链接的链式分配方式中,文件分配表FAT是一个磁盘对应一张。
    而索引分配方式中,索引表是一个文件对应一张。

    索引表中的“逻辑块号”是可以隐含的。

    2.地址转换

    1. 用户给出要访问的逻辑块号i,操作系统找到该文件对应的目录项(FCB)
    2. 从目录项中可知索引表存放位置,将索引表从外存读入内存,并查找索引表即可只i号逻辑块在外存中的存放位置。

    3.优缺点

    • 优点:索引分配方式可以支持随机访问文件拓展也很容易实现(只需要给文件分配一个空闲块,并增加一个索引表项即可)
    • 缺点:索引表需要占用一定的存储空间

    4.大文件存储问题

    若文件太大,索引表项太多,可以采取以下三种方法解决:

    1.链接方案

    如果索引表太大,一个索引块装不下,那么可以将多个索引块链接起来存放。

    在这里插入图片描述

    1. 假设磁盘块大小为1KB,一个索引表项占4B,则一个磁盘块只能存放256个索引项。
    2. 若一个文件大小为256*256KB =65,536 KB= 64MB
    3. 该文件共有256256个块,也就对应256256个索引项,也就需要256个索引块来存储,这些索引块用链接方案连起来。
    4. 若想要访问文件的最后一个逻辑块,就必须找到最后一个索引块(第256个索引块),而各个索引块之间是用指针链接起来的,因此必须先顺序地读入前255个索引块

    缺点:若文件很大,索引表很长,就需要将很多个索引块链接起来。想要找到i号索引块,必须先依次读入0~i-1号索引块,这就导致磁盘I/O次数过多,查找效率低下

    2.多层索引

    建立多层索引(原理类似于多级页表)。
    使第一层索引块指向第二层的索引块。
    还可根据文件大小的要求再建立第三层、第四层索引块。

    在这里插入图片描述

    1. 假设磁盘块大小为1KB,一个索引表项占4B,则一个磁盘块只能存放256个索引项。
    2. 若某文件采用两层索引,则该文件的最大长度可以到2562561KB= 65,536 KB = 64MB
    3. 可根据逻辑块号算出应该查找索引表中的哪个表项。
    4. 如:要访问1026号逻辑块,则1026/256 = 4,1026%256=2
    5. 因此可以先将一级索引表调入内存,查询4号表项,
    6. 将其对应的二级索引表调入内存,再查询二级索引表的2号表项即可知道1026号逻辑块存放的磁盘块号了。
    7. 访问目标数据块,需要3次磁盘I/O

    若采用三层索引,则文件的最大长度为256256256*1KB=16GB
    类似的,访问目标数据块,需要4次磁盘I/O

    总结:采用K层索引结构,且顶级索引表未调入内存,则访问一个数据块只需要K+1次读磁盘操作。

    缺点:即使是小文件,访问一个数据块依然需要K+1次读磁盘。

    3.混合索引

    多种索引分配方式的结合。
    例如,一个文件的顶级索引表中,既包含直接地址索引(直接指向数据块),又包含一级间接索引(指向单层索引表)、还包含两级间接索引(指向两层索引表)。

    在这里插入图片描述
    对于小文件,只需较少的读磁盘次数就可以访问目标数据块。(一般计算机中小文件更多)

    优点:对于小文件来说,访问一个数据块所需的读磁盘次数更少。

    在这里插入图片描述

  • 相关阅读:
    ISBN号码(蓝桥杯)
    暑假加餐|有钱人和你想的不一样(第12天)+配电网与微电网中虑需求响应的研究【基于价格型需求响应】(Python代码实现)
    Lazada跨境电商API接口,Onebound数据
    java计算机毕业设计同学录管理系统源码+系统+数据库+lw文档+mybatis+运行部署
    java用位运算实现加减乘除
    线上价格监测,如何才算到手价
    Nacos的动态配置源码解析
    软件测试/测试开发丨venv 环境管理 学习笔记
    代码随想录训练营day52
    mysql连接池DataSource,DruidDataSource的理解及其使用
  • 原文地址:https://blog.csdn.net/qq_61888137/article/details/133965234