• 文件缓存的读写


    文件系统的读写,其实就是调用系统函数 read 和 write。下面的代码就是 read 和 write 的系统调用,在内核里面的定义。

    1. SYSCALL_DEFINE3(read, unsigned int, fd, char __user *, buf, size_t, count)
    2. {
    3. struct fd f = fdget_pos(fd);
    4. ......
    5. loff_t pos = file_pos_read(f.file);
    6. ret = vfs_read(f.file, buf, count, &pos);
    7. ......
    8. }
    9. SYSCALL_DEFINE3(write, unsigned int, fd, const char __user *, buf,
    10. size_t, count)
    11. {
    12. struct fd f = fdget_pos(fd);
    13. ......
    14. loff_t pos = file_pos_read(f.file);
    15. ret = vfs_write(f.file, buf, count, &pos);
    16. ......
    17. }

    对于 read 来讲,里面调用 vfs_read->__vfs_read。对于 write 来讲,里面调用 vfs_write->__vfs_write。下面是 __vfs_read 和 __vfs_write 的代码。

    1. ssize_t __vfs_read(struct file *file, char __user *buf, size_t count,
    2. loff_t *pos)
    3. {
    4. if (file->f_op->read)
    5. return file->f_op->read(file, buf, count, pos);
    6. else if (file->f_op->read_iter)
    7. return new_sync_read(file, buf, count, pos);
    8. else
    9. return -EINVAL;
    10. }
    11. ssize_t __vfs_write(struct file *file, const char __user *p, size_t count,
    12. loff_t *pos)
    13. {
    14. if (file->f_op->write)
    15. return file->f_op->write(file, p, count, pos);
    16. else if (file->f_op->write_iter)
    17. return new_sync_write(file, p, count, pos);
    18. else
    19. return -EINVAL;
    20. }

    缓存其实就是内存中的一块空间。因为内存比硬盘快得多,Linux 为了改进性能,有时候会选择不直接操作硬盘,而是读写都在内存中,然后批量读取或者写入硬盘。一旦能够命中内存,读写效率就会大幅度提高。

    根据是否使用内存做缓存,我们可以把文件的 I/O 操作分为两种类型。

    第一种类型是缓存 I/O。大多数文件系统的默认 I/O 操作都是缓存 I/O。对于读操作来讲,操作系统会先检查,内核的缓冲区有没有需要的数据。如果已经缓存了,那就直接从缓存中返回;否则从磁盘中读取,然后缓存在操作系统的缓存中。对于写操作来讲,操作系统会先将数据从用户空间复制到内核空间的缓存中。

    第二种类型是直接 IO,就是应用程序直接访问磁盘数据,而不经过内核缓冲区,从而减少了在内核缓存和用户程序之间数据复制。

    ext4 是一种日志文件系统,是为了防止突然断电的时候的数据丢失,引入了日志**(Journal)**模式。日志文件系统比非日志文件系统多了一个 Journal 区域。文件在 ext4 中分两部分存储,一部分是文件的元数据,另一部分是数据。元数据和数据的操作日志 Journal 也是分开管理的。你可以在挂载 ext4 的时候,选择 Journal 模式。这种模式在将数据写入文件系统前,必须等待元数据和数据的日志已经落盘才能发挥作用。这样性能比较差,但是最安全。

    另一种模式是 order 模式。这个模式不记录数据的日志,只记录元数据的日志,但是在写元数据的日志前,必须先确保数据已经落盘。这个折中,是默认模式。

    还有一种模式是 writeback,不记录数据的日志,仅记录元数据的日志,并且不保证数据比元数据先落盘。这个性能最好,但是最不安全。

    每一个打开的文件都有一个 struct file 结构,每个 struct file 结构都有一个 struct address_space 用于关联文件和内存,就是在这个结构里面,有一棵树,用于保存所有与这个文件相关的的缓存页。

    直接 I/O 读写的流程是一样的,调用 ext4_direct_IO,再往下就调用块设备层了。缓存 I/O 读写的流程不一样。对于读,从块设备读取到缓存中,然后从缓存中拷贝到用户态。对于写,从用户态拷贝到缓存,设置缓存页为脏,然后启动一个线程写入块设备。

    此文章为11月Day10学习笔记,内容来源于极客时间《趣谈Linux操作系统》,推荐该课程。

  • 相关阅读:
    我的大二web课程设计 使用HTML做一个简单漂亮的页面(纯html代码)
    自定义事件的监听及触发
    组件之间的传值——provide和inject
    Docker 存储驱动解析:选择最适合你的存储方案
    Sui主网升级至V1.12.2版本
    22/6/26
    Pyinstaller打包EXE时添加版本信息、作者信息并在运行时读取外部配置文件
    样式的双向绑定的2种方式,实现样式交互效果
    山海鲸报表系统:数据洞察的利器
    goland的Markdown拖动插入链接编码有问题
  • 原文地址:https://blog.csdn.net/key_3_feng/article/details/134342204