在正式讲解Linux中是如何对文件进行IO前,我们先简单回顾以下C语言中,是如何进行文件的IO的。
对于C语言部分接口,本博客不做详解,只回顾些重要概念。想了解接口可见博客[C语言:文件操作]。
fopen
用于打开文件,包含在头文件
中,函数原型如下:
FILE* fopen(const char *pathname, const char *mode);
pathname
:打开文件路径,可以是绝对路径或相对路径mode
:打开文件的模式打开文件的最常用模式为:
"r"
:只读,若文件不存在则报错
"w"
:只写,若文件不存在则创建,打开时清空文件原有内容
"a"
:只写,若文件不存在则创建,打开时从文件末尾追加
该函数会返回一个FILE*
的指针,C语言中,通过操作这个FILE*
来控制文件的IO。
当我们打开文件时,每个被使⽤的⽂件都在内存中开辟了⼀个相应的⽂件信息区,⽤来存放⽂件的相关信息。
这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的,取名FILE
。我们可以通过操纵这个FILE
类型的结构体,来操控文件。
大部分情况下,我们可以得到一个指向该结构体的指针FILE*
,即文件指针,后续通过文件指针来操控文件。
上图中,三个指针pf1
,pf2
,pf3
,它们都指向了一个FILE
类型的文件信息区。而每个文件信息区都存储着一个文件的信息,后续就通过这三个指针来操控这三个文件。
C语⾔程序在启动的时候,默认打开了3个流:
stdin
- 标准输⼊流,在⼤多数的环境中从键盘输⼊。
stdout
- 标准输出流,⼤多数的环境中输出⾄显⽰器界⾯。
stderr
- 标准错误流,⼤多数环境中输出到显⽰器界⾯。
这三个流也是通过文件指针来操作的。
以上是从C语言的视角来看文件,接下来从操作系统的角度来看文件。
在C语言中,所有文件都通过文件指针FILE*
来操控,而在Linux中,所有IO操作都围绕文件描述符fd
。
open
用于打开文件,需要头文件
、
、
,函数原型如下:
int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);
open
会返回一个int
类型的值,这个值就是文件描述符fd
,后续通过fd
操控对应文件。
该接口有两个版本,先说只有两个参数的接口:
pathname
:打开文件的路径flags
:打开文件的模式这个模式和fopen
的相似,比如控制读、写、追加等,以下选项:
选项 | 功能 |
---|---|
O_RDONLY | 以只读方式打开 |
O_WRONLY | 以只写方式打开 |
O_RDWR | 以读写方式打开 |
O_CREAT | 若打开时不存在,则创建文件 |
假设用以下代码打开一个不存在的文件:
int fd = open("log.txt", O_WRONLY);
如果使用C语言的fopen
,以w
形式打开,遇到一个不存在的文件log.txt
,则会默认创建该文件。但是对于open
接口,以O_RDONLY
形式打开一个文件,如果文件不存在,就什么也不干。
如果想要打开文件同时创建文件,则需要加上O_CREAT
,open
接口是以位图的形式传参的,把所需的选项进行按位或即可。
在test.exe
中执行以下代码:
#include
#include
#include
#include
#include
int main()
{
int fd = open("log.txt", O_WRONLY | O_CREAT);
return 0;
}
其中O_WRONLY | O_CREAT
的意思就是:以只读方式打开文件,如果文件不存在就创建。
运行,/test.exe
后,当前目录就出现了文件log.txt
了,但是它的权限值是乱码-rws--s--T
,如果你删掉该文件后再次运行代码,你会发现下一次的权限值和上次还不一样。
当
open
没有传入第三个参数时,生成文件的权限值是随机的
此时就需要三个参数的open
接口:
int open(const char *pathname, int flags, mode_t mode);
其中mode
用于控制文件的初始权限,最终权限还要经过umask
过滤
在test.exe
中执行以下代码:
#include
#include
#include
#include
#include
int main()
{
umask(0000);
int fd = open("log.txt", O_WRONLY | O_CREAT, 0666);
return 0;
}
先通过umask(0000)
将当前的umask
变成0000
,随后open
的第三个参数传入0666
,也就是log.txt
的初始权限。由于umask
变成0000
,不会影响初始权限,最终log.txt
的权限就是0666
,也就是rw-rw-rw-
。
最终log.txt
的权限为rw-rw-rw-
,因此open
的第三个参数,是用于控制文件的初始权限的。
close
用于关闭文件,需要头文件
,函数原型如下:
int close(int fd);
直接传入对应文件的fd
即可。
write
用于向文件写入,需要头文件
,函数原型如下:
ssize_t write(int fd, const void *buf, size_t count);
fd
:被写入文件的fd
buf
:指向被写入的字符串count
:写入字符的个数示例:
在test.exe
中执行以下代码:
#include
#include
#include
#include
#include
int main()
{
int fd = open("log.txt", O_WRONLY | O_CREAT, 0666);
const char* str = "Hello\n World!\n";
write(fd, str, 6);
close(fd);
return 0;
}
以上代码中,向log.txt
写入了一个字符串str
,write
的第三个参数为6
,只写入了六个字符Hello\n
,输出结果:
可以看到,log.txt
的内容确实是Hello
。
在保留原先的Hello
的情况下,我们再写入以下内容:
const char* str = "123";
write(fd, str, 3);
这次只写入三个字符,看看输出结果:
最终log.txt
的内容变成了123lo
,这是为什么?
以
O_WRONLY
模式对文件进行写入时,不会先把文件内容清空,而是直接从头开始覆盖
因此新写入的123
把原先hello
的头三个字符覆盖掉了,但是后面的字符没有被覆盖也没有被清空。
对于一个文件重复写入,有两种解决方案,对应两个open
的选项:
选项 | 功能 |
---|---|
O_TRUNC | 打开时清空文件内容 |
O_APPEND | 以追加的形式写入 |
同样以位图的形式传入,直接按位或到第三个参数中即可,这样就可以得到两种常用组合:
O_WRONLY | O_CREAT | O_TRUNC
:以只读形式打开,如果文件不存在就创建,打开时清空文件所有内容O_WRONLY | O_CREAT | O_APPEND
:以只读形式打开,如果文件不存在就创建,打开时从文件的结尾开始追加不知道你看到这个描述,有没有一点点熟悉?
没错,O_WRONLY | O_CREAT | O_TRUNC
模式打开,就是fopen
的以"w"
形式打开;O_WRONLY | O_CREAT | O_APPEND
就是fopen
的以"a"
形式打开。由于fopen
是用户操作接口,而open
是系统调用接口,其实fopen
就是对open
的封装。
read
用于读取文件,需要头文件
,函数原型如下:
ssize_t read(int fd, void* buf, size_t count);
fd
:目标文件的文件描述符fd
buf
:将文件内容读取到buf
指向的空间中count
:最多读取count
个字节的内容返回值:
< 0
:读取发送错误
= 0
:读取到文件末尾
> 0
:读取成功,返回读取到的字符个数
示例:
在test.exe
中执行以下代码:
#include
#include
#include
#include
#include
#include
int main()
{
int fd = open("log.txt", O_RDONLY);
char buffer[1024];
ssize_t ret1 = read(fd, buffer, 1024);
printf("ret1 = %ld\n", ret1);
printf("%s", buffer);
ssize_t ret2 = read(fd, buffer, 1024);
printf("ret2 = %ld\n", ret2);
close(fd);
return 0;
}
log.txt
的内容为字符串Hello Linux\n
,一开始通过open
以只读形式打开文件后,先通过read(fd, buffer, 1024)
把内容存储到数组buffer
中,并把返回值交给ret1
。随后输出ret1
和buffer
。
读取完log.txt
后,再读取了一次read(fd, buffer, 1024)
,这次读取的结果交给ret2
,并输出ret2
。
输出结果:
第一次read
返回值为13
,也就是字符串Hello Linux\n
中有13
个字符,随后buffer
中也正常输出了Hello Linux\n
。而第二次read
,由于上一次读取时已经遇到文件末尾了,所以本次读取返回0
。
想要打开一个文件,文件是要从磁盘中提取的,要访问硬件设备,而访问硬件设备是操作系统才有的权力,因此访问文件毫无疑问是要经过操作系统的。在操作系统中,会使用一个叫做file
的结构体来描述一个被打开的文件,并把这个文件的数据从磁盘加载到内存中。
当一个文件被打开加载到内存中,就可以称这个文件是一个内存文件
,本博客现在讨论的就是被打开的文件,或者说内存文件
是如何进行管理的。
在Linux 2.6.10
内核中,struct file
如下:
struct file {
struct list_head f_list;
struct dentry *f_dentry;
struct vfsmount *f_vfsmnt;
struct file_operations *f_op;
atomic_t f_count;
unsigned int f_flags;
mode_t f_mode;
int f_error;
loff_t f_pos;
struct fown_struct f_owner;
unsigned int f_uid, f_gid;
struct file_ra_state f_ra;
unsigned long f_version;
void *f_security;
/* needed for tty driver, and maybe others */
void *private_data;
#ifdef CONFIG_EPOLL
/* Used by fs/eventpoll.c to link all the hooks to this file */
struct list_head f_ep_links;
spinlock_t f_ep_lock;
#endif /* #ifdef CONFIG_EPOLL */
struct address_space *f_mapping;
};
struct file
是一个非常重要的数据结构,它表示一个打开的文件,并且提供了访问和操作文件的接口。
我提取出几个重要的成员,做一个简化模型:
其中这些重要成员的功能如下:
loff_t f_pos
这个成员保存了文件当前的读写位置。许多文件操作函数都会根据这个位置来读写数据。
unsigned int f_flags
:
这个成员保存了打开文件时设置的标志,如 O_RDONLY
, O_WRONLY
, O_APPEND
等。这些标志决定了对文件的访问权限和行为。
struct fown_struct f_owner
这个成员保存了文件所有者的信息,包括进程 ID 和用户 ID。它用于实现文件的所有权和权限检查。
struct file_operations *f_op
这个成员指向一个 struct file_operations
类型的结构体,它定义了各种文件操作函数,如 read()
, write()
, open()
, release()
等。这些函数由文件系统或驱动程序实现,用于处理对文件的各种操作。
在Linux
中,一切皆文件,不论是显示器,键盘,磁盘,内存,一切软硬件都是通过文件来控制的,因此每个文件的写入与读取方式很有可能不同,但是我们又要用read
,write
这样的接口来对文件统一的读写。于是在struct file
中,用一个f_op
成员指向一个结构体struct file_operations
,在对应结构体内部,存放着指向各种函数指针。
在Linux 2.6.10
内核中,struct file_operations
如下:
struct file_operations {
struct module *owner;
loff_t (*llseek) (struct file *, loff_t, int);
ssize_t (*read) (struct file *, char __user *, size_t, loff_t *);
ssize_t (*aio_read) (struct kiocb *, char __user *, size_t, loff_t);
ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *);
ssize_t (*aio_write) (struct kiocb *, const char __user *, size_t, loff_t);
int (*readdir) (struct file *, void *, filldir_t);
unsigned int (*poll) (struct file *, struct poll_table_struct *);
int (*ioctl) (struct inode *, struct file *, unsigned int, unsigned long);
int (*mmap) (struct file *, struct vm_area_struct *);
int (*open) (struct inode *, struct file *);
int (*flush) (struct file *);
int (*release) (struct inode *, struct file *);
int (*fsync) (struct file *, struct dentry *, int datasync);
int (*aio_fsync) (struct kiocb *, int datasync);
int (*fasync) (int, struct file *, int);
int (*lock) (struct file *, int, struct file_lock *);
ssize_t (*readv) (struct file *, const struct iovec *, unsigned long, loff_t *);
ssize_t (*writev) (struct file *, const struct iovec *, unsigned long, loff_t *);
ssize_t (*sendfile) (struct file *, loff_t *, size_t, read_actor_t, void *);
ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int);
unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);
int (*check_flags)(int);
int (*dir_notify)(struct file *filp, unsigned long arg);
int (*flock) (struct file *, int, struct file_lock *);
};
在以上结构体的成员中,可以找到几个熟悉的身影:read
,write
,open
,它们都是函数指针。我们在对文件进行IO操作的时候,其实都是到了struct file
中,找到这里的函数指针,通过函数的地址来调用各自实现的函数。这样每个硬件厂商实现自己的读写接口,上层只需要以统一的形式调用即可。
刚刚的结构体struct file
是用于描述具体的被打开的文件的,而操作系统想要对所有被打开的文件进行统一的管理,就需要再把所有的struct file
组织起来,这个组织struct file
的结构体,就是struct files_struct
。
在Linux 2.6.10
内核中,struct files_struct
如下:
struct files_struct {
atomic_t count;
spinlock_t file_lock; /* Protects all the below members. Nests inside tsk->alloc_lock */
int max_fds;
int max_fdset;
int next_fd;
struct file ** fd; /* current fd array */
fd_set *close_on_exec;
fd_set *open_fds;
fd_set close_on_exec_init;
fd_set open_fds_init;
struct file * fd_array[NR_OPEN_DEFAULT];
};
其中最重要的成员,就是最后一个成员fd_array
,该成员是一个数组,指向的成员类型为struct file*
,也就是指向struct file
的指针。
视图如下:
fd_array
就是灰色的数组,每个数组的元素都是一个指向struct file
的指针,struct file
对应一个打开的文件。操作系统有一个全局的struct files_struct
,用于统一管理所有进程打开的文件。
每个进程也要打开多个文件,那么每个进程又要如何管理自己打开的文件呢?
每个进程也要通过
struct files_struct
来管理多个struct file
在进程PCB
即task_struct
中,有这样一个成员:
/* open file information */
struct files_struct *files;
也就是说,每个进程也要维护一个struct files_struct
,来控制自己打开的文件。
当一个文件被打开,大致视图如下:
左侧是被操作系统全局管理的struct files_struct
,整个系统中所有被打开的文件都要被这个结构体管理。而右侧是每个进程自己打开维护的struct files_struct
,分别管理自己打开的文件。
我在图片中也标识了,当多个进程打开同一个文件,那么它们的fd_array
里面的元素,会指向同一个struct file
。
那么我在此先抛出结论:
文件描述符
fd
,就是fd_array
的数组下标
现在我们创建一大批文件,然后看看它们的fd
的值。
在test.exe
中执行以下代码:
#include
#include
#include
#include
#include
int main()
{
int fd1 = open("log1.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
int fd2 = open("log2.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
int fd3 = open("log3.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
int fd4 = open("log4.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
int fd5 = open("log5.txt", O_WRONLY | O_CREAT | O_TRUNC, 0666);
printf("fd1 = %d\n", fd1);
printf("fd2 = %d\n", fd2);
printf("fd3 = %d\n", fd3);
printf("fd4 = %d\n", fd4);
printf("fd5 = %d\n", fd5);
return 0;
}
输出结果:
执行./test.exe
后,确实多出了五个文件,但是其fd
是3 4 5 6 7
这样从3
开始依次排列的,为什么要这样干?数组下标从0
开始,那么编号0 1 2
的fd
去哪里了?
还记得在C语言中,会为我们默认打开三个流stdin
,stdout
,stderr
吗?这三个流也是向文件输入输出,默认打开三个流stdin
,stdout
,stderr
的时候,0 1 2
为编号的fd
就已经被占用了!
C语言中,文件流是以FILE
的形式被管理的,毫无疑问FILE
是对Linux
文件系统的封装,FILE
内部一定存储了fd
,否则无法通过fd
来访问特定的文件。其中FILE
的_fileno
成员,就是fd
。
来看看stdin
,stdout
,stderr
的_fileno
:
#include
int main()
{
int fd1 = stdin->_fileno;
int fd2 = stdout->_fileno;
int fd3 = stderr->_fileno;
printf("stdin->_fileno = %d\n", fd1);
printf("stdout->_fileno = %d\n", fd2);
printf("stderr->_fileno = %d\n", fd3);
return 0;
}
输出结果:
这就很好的证明了stdin
,stdout
,stderr
占用了0 1 2
为编号的fd
。
也许你听说过很多次缓冲区,但是对它依然感到陌生,其实缓冲区的概念很好理解:
缓冲区本质上就是一块内存区域
fwrite
等C语言的文件IO接口,都在底层封装了系统调用接口write
等,如果用户高频调用fwrite
,那么也就会相应地调用write
等系统调用接口。
于是C语言的设计者认为,反正最后数据都要被到内存中,这个过程需要通过write
等系统调用接口,我们能不能把调用fwrite
写入的数据先保留下来,等到一定的量之后,再通过一次write
,把之前所有的数据一次性写入?
于是缓冲区应运而生,这个缓冲区叫做用户级缓冲区
,用户调用的所有C语言文件IO接口,都会先写到缓冲区中,然后等到一定条件,在通过一次系统调用,把之前所有缓冲区的数据写入到操作系统中,这个一次性写入过程叫做刷新缓冲区
。
要注意的是,操作系统也有自己的缓冲区,但是这个是操作系统自己管理的内核缓冲区
,其决定了wirte
等系统调用接口写入的数据,何时写入到内存中,但不是该博客讨论的范围,后续讨论的缓冲区都是用户级缓冲区
。
用户级缓冲区的刷新策略有以下三种:
- 无缓冲:不进行缓冲,直接输出
- 行缓冲:向显示器写入时,
'\n'
会强制刷新缓冲区,也就是一行一行刷新缓冲区- 全缓冲:向普通文件写入时,一般缓冲区被写满才会刷新
当然,程序结束,或者用户调用flush
函数,也会强制刷新缓冲区。
那么缓冲区在哪里呢?
缓冲区被结构体
FILE
管理
由于每个文件的FILE
是独立的,因此每个文件的缓冲区也是独立的!
我用一段申请的代码来证明缓冲区的存在:
先在test.exe
中运行以下代码:
#include
#include
#include
#include
#include
#include
int main()
{
const char* s1 = "hello write!\n";
write(stdout->_fileno, s1, strlen(s1));
const char* s2 = "hello printf!";
printf("%s", s2);
printf("\n");
return 0;
}
这串代码分别通过系统调用接口write
和用户操作接口printf
向stdout
写入数据,也就是向显示器写入数据。
输出结果:
write
和printf
都输出了一条语句,这符合预期,接下来我修改一下代码:
#include
#include
#include
#include
#include
#include
int main()
{
const char* s1 = "hello write!\n";
write(stdout->_fileno, s1, strlen(s1));
const char* s2 = "hello printf!";
printf("%s", s2);
fork();
printf("\n");
return 0;
}
在write
和printf
输出完后,在printf("\n");
之前,使用fork
创建了一个子进程,现在输出结果如下:
奇怪的现象出现了,printf("%s", s2);
明明在fork
之前就已经完成了,为什么会输出两次?
在printf("%s", s2);
中,我特地没有换行,因为向显示器输出时,换行会刷新缓冲区,而当前缓冲区还没有被刷新。于是hello printf!
被保留在了缓冲区。
当子进程被创建时,会继承父进程的数据和代码,stdin
的FILE
指向的缓冲区,也会被继承。当父子进程分别指向printf("\n");
时,刷新各自的缓冲区,于是分别输出了一句hello printf!
。
可以得出的是,在C语言层面确实存在一个用户级缓冲区,这个缓冲区可以被继承。