fuse是用户态文件系统。在介绍fuse之前,先笼统地介绍一下文件系统。
文件系统是操作系统用于明确存储设备或者分区上的文件的方法和数据结构。用户态文件系统是操作系统提供了一层文件存储的接口,方便用户对文件操作的接口。文件系统的主要功能,一是对文件的操作(打开、关闭、增删改查),二是文件数据的存储。
文件系统分为分布式文件系统和基于操作系统本身的文件系统。分布式文件系统由两部分组成:一是对文件本身做索引,二是包含一个网络服务器,对外提供服务。例子有fastdfs、ceph等。基于操作系统本身的文件系统,不是对文件做索引,而是对磁盘做索引,把一个文件分为多个块进行存储,例如fat32、ntfs、ext3/4等。分布式文件系统是需要基于操作系统本身的文件系统来做的。
linux中实现了vfs,针对不同的文件系统统一实现了文件系统的一系列操作接口,对外屏蔽了不同文件系统内部的区别。
fuse是内核的一个模块,里面有两个文件,file.c用来存储文件的属性如权限、大小等,inode.c用来存储文件具体数据。
可以通过命令ls /dev/fuse
查看内核是否支持fuse,如果有就支持。可以在make menuconfig
编译内核时选择是否支持fuse。
fuse包含一个内核模块和一个用户空间守护进程(下文称fuse daemon)。内核模块加载时被注册成 linux 虚拟文件系统的一个 fuse 文件系统驱动。此外,还注册了一个/dev/fuse的块设备。该块设备作为fuse daemon与内核通信的桥梁,fuse daemon通过/dev/fuse读取fuse request,处理后将reply写入/dev/fuse。
这里介绍一下三个模块:
这三者的联系,与mysql实现做个类比,fs/file相当于mysql源码;libfuse相当于mysql的driver,去操作mysql;/dev/fuse相当于mysql应用程序。
上图详细展示了fuse的构架。当application挂在fuse文件系统上,并且执行一些系统调用时,VFS会将这些操作路由至fuse driver,fuse driver创建了一个fuse request结构体,并把request保存在请求队列中。此时,执行操作的进程会被阻塞,同时fuse daemon通过读取/dev/fuse将request从内核队列中取出,并且提交操作到底层文件系统中(例如 EXT4 或 F2FS)。当处理完请求后,fuse daemon会将reply写回/dev/fuse,fuse driver此时把requset标记为completed,最终唤醒用户进程。
这里我们关注两点:
fuse在内核中维护了五个队列,分别为:Backgroud、Pending、Processing、Interrupts、Forgets。一个请求在任何时候只会存在于一个队列中。
当pending 、interrups、forgets队列都没有请求时,读进程进入休眠。一旦有请求到达,这个等待队列上的进程将被唤醒。Interrups 和 forgets的请求优先级高于pending队列。当请求的数据内容被拷贝至用户空间后,该请求会被移至processing队列。
当fuse daemon处理完请求后,会将结果写回到/dev/fuse。写数据保存在struct fuse_copy_state中,并且会根据unique id在fc(fuse_conn)中找到对应的req,并将写回的参数从fuse_copy_state拷贝至req->out。
再来总体看一下执行流程。
当fuse daemon处理完请求后,会将结果写回到/dev/fuse。写数据保存在struct fuse_copy_state中,并且会根据unique id在fc(fuse_conn)中找到对应的req,并将写回的参数从fuse_copy_state拷贝至req->out。