文件操作详解


#include 
int main()
{
 int a = 10000;
 
 FILE* pf = fopen("test.txt", "wb");
 fwrite(&a, 4, 1, pf);//⼆进制的形式写到⽂件中
 fclose(pf);
 pf = NULL;
 return 0;
}

在VS上打开二进制文件：

4. 文件的打开和关闭

4.1 流和标准流

4.1.1 流

我们程序的数据需要输出到各种外部设备，也需要从外部设备获取数据，不同的外部设备的输入输出操作各不相同，为了方便程序员对各种设备进行方便的操作，我们抽象出了流的概念，我们可以把流想象成流淌着字符的河。

C程序针对文件、画面、键盘等的数据输入输出操作都是同流操作的。

一般情况下，我们要想向流里写数据，或者从流中读取数据，都是要打开流，然后操作。

流是一个高度抽象的概念：

程序直接传输到外部设备比较繁琐，所以写入流，让流操作

4.1.2 标准流

那为什么我们从键盘输入数据，向屏幕上输出数据，并没有打开流呢？

那是因为C语言程序在启动的时候，默认打开了3个流：

• stdin - 标准输入流，在大多数的环境中从键盘输入。

• stdout - 标准输出流，大多数的环境中输出至显示器界面。

• stderr - 标准错误流，大多数环境中输出到显示器界面。

这是默认打开了这三个流，我们使用scanf、printf等函数就可以直接进行输入输出操作的。

stdin、stdout、stderr三个流的类型是： FILE* ，通常称为文件指针。

C语言中，就是通过 FILE* 的文件指针来维护流的各种操作的。

4.2 文件指针

缓冲文件系统中，关键的概念是“文件类型指针”，简称“文件指针”。

每个被使用的文件都在内存中开辟了一个相应的文件信息区，用来存放文件的相关信息（如文件的名字，文件状态及文件当前的位置等）。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的，取名FILE.

例如，VS2013编译环境提供的 stdio.h 头文件中有以下的文件类型申明：


struct _iobuf {
 char *_ptr;
 int _cnt;
 char *_base;
 int _flag;
 int _file;
 int _charbuf;
 int _bufsiz;
 char *_tmpfname;
 };
typedef struct _iobuf FILE;

不同的C编译器的FILE类型包含的内容不完全相同，但是大同小异。

每当打开一个文件的时候，系统会根据文件的情况自动创建一个FILE结构的变量，并填充其中的信息，使用者不必关心细节。

一般都是通过一个FILE的指针来维护这个FILE结构的变量，这样使用起来更加方便。

下面我们可以创建一个FILE*的指针变量:

FILE* pf;//⽂件指针变量

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区（是一个结构体变量）。通过该文件信息区中的信息就能够访问该文件。也就是说，通过文件指针变量能够间接找到与它关联的文件。

比如：

4.3 文件的打开和关闭

文件在读写之前应该先打开文件，在使用结束之后应该关闭文件。

在编写程序的时候，在打开文件的同时，都会返回一个FILE*的指针变量指向该文件，也相当于建里了指针和文件的关系。

ANSIC 规定使用 fopen 函数来打开文件， fclose 来关闭文件。


//打开⽂件
FILE * fopen ( const char * filename, const char * mode );
//第一个参数：文件名  第二个参数：打开文件的模式
//关闭⽂件
int fclose ( FILE * stream );

mode表示文件的打开模式，下面都是文件的打开模式：

文件使用方式	含义	如果指定文件不存在
" r " (只读)	为了输入数据，打开一个已经存在的文本文件	出错
" w " (只写)	为了输出数据，打开一个文本文件	建立一个新的文件
" a " (追加)	向文本文件尾部添加数据	建立一个新的文件
" rb " (只读)	为了输入数据，打开一个二进制文件	出错
" wb " (只写)	为了输出数据，打开一个二进制文件	建立一个新的文件
" ab " (追加)	向一个二进制文件尾部添加数据	出错
" r+ "(读写)	为了读写，打开一个文本文件	出错
" w+ "(读写)	为了读写，建立一个新的文本文件	建立一个新的文件
" a+ " (读写)	打开一个文件，在文件尾部进行读写	建立一个新的文件
"rb+ "(读写)	打开一个二进制文件（读写）	出错
" wb+ "(读写)	建立一个新的二进制文件（读写）	建立一个新的文件
" ab+ " (读写)	打开一个二进制文件，在文件尾部进行读和写	建立一个新的文件

“r“：文件必须存在，如果文件不存在，则打开失败，fopen函数打开失败的话，会返回NULL，如果打开成功的话，会返回文件信息区的地址FILE*
”w“：写文件，如果文件存在，会清空原来文件的内容，相当于变成空文件，如果文件不存在，会新建一个空文件

代码演示：

在桌面打开文件：

5. 文件的顺序读写

5.1 顺序读写函数介绍

1.fgetc（从流中获取字符）

参数是标准输入流,读一次向后移动 1 ，类似于指针的 ++ ，当读取超出文件长度出EOF(-1)

int ret =  fgetc(pf);

2，fputc(从流中获取字符)

第一个参数是字符，第二个参数是标准输出流（stdout,stderr）

fputc('字符',输出流);

文件的拷贝:

3.fgets(从流中获取字符串写入目标数组）

第一个参数是目标数组的指针；

第二个复制到数组的最大个数（n-1个，最后一个放'\0'）；

第三个参数是标准输入流。

代码演示：

4.fputs(将字符串写入流)

第一个参数是要写入流的地址指针；

第二个参数是标准输出流。

5.fprintf(将格式化数据写入流)

第一个参数是标准输出流

第二个参数是格式化字符串等一系列的东西

代码演示：

6.fscanf（从流中读取格式化数据）

第一个参数是标准输入流

第二个参数是格式化字符串等一系列的东西

将文件中的数据读取到程序中，再打印。

7.fwrite（以二进制的方式写文件）

第一个参数是写入元素数组的指针

第二个参数是要写入的每个元素的大小（单位字节）

第三个参数是要写入的元素个数

第四个参数是要被写入的地址

代码演示：

8.fread（以二进制的方式读文件）

第一个参数是接收读取文件内容的地址

第二个参数是要读取文件的大小

第三个参数是要读取文件的个数

第四个参数是被读取文件的地址

代码演示：

这里的读写是面向内存的，也就是说对于用户来说的输入，对于内存来说是读，就是读取用户的输入信息，或者是别的位置的数据；对用户来说的输出，对于内存来说是写，就是写出信息让用户可以看到。

5.2 对比以组函数：

scanf/fscanf/sscanf

printf/fprintf/sprintf

scanf() - 针对标准输入流（stdin）的格式化输入函数
printf() - 针对标准输出流（stdout）的格式化输出函数

fscanf() - 针对所有输入流的格式化输入函数
fprintf() - 针对所有输出流的格式化输出函数

sscanf() - 从字符中读取格式化的数据
sprintf() - 把格式化的数据转化成字符串

代码演示：

6. 文件的随机读写

6.1 fseek

根据文件指针的位置和偏移量来定位文件指针。

int fseek ( FILE * stream, long int offset, int origin );

第一个参数流

第二个参数偏移量

第三个参数起始位置

起始位置选项： SEEK_CUR ：文件当前位置开始

SEEK_END ：文件末尾位置开始

SEEK_SET ：文件起始位置开始

6.2 ftell

返回文件指针相对于起始位置的偏移量

long int ftell ( FILE * stream );

参数是流

6.3 rewind

让文件指针的位置回到文件的起始位置

void rewind ( FILE * stream );

参数是流

代码演示：

7. 文件读取结束的判定

7.1 被错误使用的 feof

牢记：在文件读取过程中，不能用feof函数的返回值直接来判断文件的是否结束。

feof 的作用是：当文件读取结束的时候，判断是读取结束的原因是否是：遇到文件尾结束。

1. 文本文件读取是否结束，判断返回值是否为 EOF （ fgetc ），或者 NULL （ fgets ）例如：

• fgetc 判断是否为 EOF .

• fgets 判断返回值是否为 NULL .

2. 二进制文件的读取结束判断，判断返回值是否小于实际要读的个数。例如：

• fread判断返回值是否小于实际要读的个数。

文本文件的例子：


#include 
#include 
int main(void)
{
 int c; // 注意：int，⾮char，要求处理EOF
 FILE* fp = fopen("test.txt", "r");
 if(!fp) {
 perror("File opening failed");
 return EXIT_FAILURE;
 }
 //fgetc 当读取失败的时候或者遇到⽂件结束的时候，都会返回EOF
 while ((c = fgetc(fp)) != EOF) // 标准C I/O读取⽂件循环
 { 
 putchar(c);
 }
 //判断是什么原因结束的
 if (ferror(fp))
 puts("I/O error when reading");
 else if (feof(fp))
 puts("End of file reached successfully");
 fclose(fp);
}

二进制文件的例子：


#include 
enum { SIZE = 5 };
int main(void)
{
 double a[SIZE] = {1.,2.,3.,4.,5.};
 FILE *fp = fopen("test.bin", "wb"); // 必须⽤⼆进制模式
 fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组
 fclose(fp);
 double b[SIZE];
 fp = fopen("test.bin","rb");
 
 size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组
 if(ret_code == SIZE) {
 puts("Array read successfully, contents: ");
 for(int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
 putchar('\n');
 } else { // error handling
 if (feof(fp))
 printf("Error reading test.bin: unexpected end of file\n");
 else if (ferror(fp)) {
 perror("Error reading test.bin");
 }
 }
 fclose(fp);
}

8. 文件缓冲区

ANSIC 标准采用“缓冲文件系统”处理的数据文件的，所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区，装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据，则从磁盘文件中读取数据输入到内存缓冲区（充满缓冲区），然后再从缓冲区逐个地将数据送到程序数据区（程序变量等）。缓冲区的大小根据C编译系统决定的。


#include 
#include 
//VS2019 WIN11环境测试
int main()
{
 FILE*pf = fopen("test.txt", "w");
 fputs("abcdef", pf);//先将代码放在输出缓冲区
 printf("睡眠10秒-已经写数据了，打开test.txt⽂件，发现⽂件没有内容\n");
 Sleep(10000);
 printf("刷新缓冲区\n");
 fflush(pf);//刷新缓冲区时，才将输出缓冲区的数据写到⽂件（磁盘）
 //注：fflush 在⾼版本的VS上不能使⽤了
 printf("再睡眠10秒-此时，再次打开test.txt⽂件，⽂件有内容了\n");
 Sleep(10000);
 fclose(pf);
 //注：fclose在关闭⽂件的时候，也会刷新缓冲区
 pf = NULL;
 return 0;
}

这里可以得出一个结论：

因为有缓冲区的存在，C语言在操作文件的时候，需要做刷新缓冲区或者在文件操作结束的时候关闭文件。

如果不做，可能导致读写文件的问题。

总结

好了，本篇博客到这里就结束了，如果有更好的观点，请及时留言，我会认真观看并学习。
不积硅步，无以至千里；不积小流，无以成江海。

相关阅读:
排错-关于clion not found visual studio 的问题
 信号处理之巴特沃斯滤波器的理解----2022/11/30
修饰蛋白质磷脂-聚乙二醇-酰肼|DSPE-PEG-Hydrazide|DSPE-PEG-HZ
基于微服务+Java+Spring Cloud +UniApp +MySql开发的智慧工地源码（物联网、人工智能、AI识别、危大工程）
博士也会毕业吗？
机器学习笔记 YOLOv9模型相关论文简读
 关于最近项目数字前端FLOW的一些总结
 Linux 命令（204）—— ss 命令
 小学生加减乘除闯关运算练习流量主微信小程序开发
 面试：注解类型有哪些，如何自定义注解
原文地址：https://blog.csdn.net/2301_79585944/article/details/134409494