• [Linux打怪升级之路]-缓冲区


    前言

    作者小蜗牛向前冲

    名言我可以接受失败,但我不能接受放弃

      如果觉的博主的文章还不错的话,还请点赞,收藏,关注👀支持博主。如果发现有问题的地方欢迎❀大家在评论区指正

     本期学习目标:认识什么是缓冲区,缓冲区在哪里,模拟实现一个简单的缓冲区。

    目录

    一、缓冲区

    1、见一个现象

    2、缓冲区的相关知识

    3、解释现象 

    二、模拟实现缓冲区 

    1、makefile 

    2、myStdio.h 

     3、myStdio.c

    4、test.c 


    一、缓冲区

    我们在重定向博客中曾经发现了一个现象,在做重定向实验时,我们将文件描述符fd = 1关闭掉,并通过open函数打开(创建)add.txt的文件,由于fd = 1 被关闭了,根据文件描述符fd的分配规则:是从小到大 ,遵循寻找最小而且没有被占用的的fd分配这时候fd = 1中file*的指针会指向add.txt文件中,就不在向显示器打印了,而要将open fd的内容写到add.txt中,但是我们通过cat命令查看add.txt中的内容却什么也没有,这是为什么呢?

    这就不得不提缓冲区的概念,其实缓存区就是一段内存,但是这段内存是谁申请的?属于谁的?为什么要有缓冲区呢?

    下面我们来看一个现象:

    1、见一个现象

    首先我们分别调用C接口和系统接口进行打印测试。

    我们将mytest中的文件内容输出重定向到log.txt中,我们也在log.txt中查找到了输出的内容.

    下面我们继续进行在代码测试,在代码最后用fork建立一个子进程

    运行程序:

     我们发现 printf 和 fprintf及fputs(库函数)都输出了2次,而 write 只输出了一次(系统调用)。为什么呢?我们只是在多加了应该子进程而已,这说明出现这种现象肯定是和fork函数有关。

    2、缓冲区的相关知识

    为什么库函数会打印二次,而系统调用的函数只会被打印一次呢?毋庸置疑这肯定和缓冲区有关。

    上面我们提到缓存冲区是一段内存,那么既然是一段内存肯定要被管理起来,而管理缓冲区的结构体我们称之为FILE,而且我们可以知道是缓冲区肯定不在内核中。

    我们也可以在系统中见一见他

    1. //输入命令
    2. vim /usr/include/libio.h

     打开文件在246行这样就能看到_IO_FILE的结构体,不对啊吖,不是说FILE才是管理缓冲区的吗?

    怎么变成了_IO_FILE的结构体,其实在其实是在:

    typedef struct _IO_FILE FILE; 在/usr/include/stdio.h

    中进行了重命名的,第48行就对_IO_FILE的结构体进行了typedef。

    这里我们需要注意的是FILE结构体中也封装了fd,这就会在合适的时候,就会将在缓冲区中内容刷新到外设中。

    缓冲区的刷新几种形式: 

    立刻刷新       -----无缓冲

    行刷新           ------显示器

    缓冲区满刷新     -------磁盘文件

     那我们怎么理解上面的几种刷新方式呢?

    立刻刷新是只直接在内存中的信息,刷新到外设,这种场景是非常少见的,因为这样非常消耗资源。

    行刷新,就是缓冲区满了一行就刷新,也就是说我们在调用函数时有"\n"时就会进行刷新。

    缓冲区满刷新,就是指缓冲区的内存满了,才会把缓冲区里面的内容刷新到外设中。

    缓冲区的自动刷新规则:

    • 用户强制刷新
    • 进程退出

    3、解释现象 

    上面我们了解有关缓冲区的相关知识,那么为什么会出现我们上面的现象呢?

    在代码结束前我们进行了子进程的创建:

    代码结束之前,进行创建子进程
       1. 如果我们没有进行>,看到了4条消息
    stdout 默认使用的是行刷新,在进程fork之前,三条C函数已经将数据进行打印输出到显示器上(外设),你的FILE内部,进程内部不存在对应的数据啦。
        2. 如果我们进行了>, 写入文件不再是显示器,而是普通文件,采用的刷新策略是全缓冲,之前的3条c显示函数,虽然带了\n,但是不足以stdout缓冲区写满!数据并没有被刷新!!!
        执行fork的时候,stdout属于父进程,创建子进程时, 紧接着就是进程退出!谁先退出,一定要进行缓冲区刷新(就是修改)
        由于写时拷贝!!数据最终会显示两份,所以在父子进程退出后,会立刻被缓冲区刷新,从而导致三条C函数分别进行了二次打印。
    3. write为什么没有呢?

    上面的过程都和wirte无关,wirte没有FILE,而用的是fd,就没有C提供的缓冲区

     这里我们就可以回答:

    缓冲区在哪里

    在FILE*指向的FILE结构体中(这也就是为什么,我们自己要强制刷新的时候要传文件指针,fflush(文件指针),fclose(文件指针))。

    重定向实验的现象:

    因为我们虽然将open fd的内容要写入到add.txt中,但是由于add.txt是普通文件,他采取的方式是全缓存,就不足以以让缓冲区刷新到显示器(stdout)中,所以通过cat 命令查看会什么也查不出来。

    二、模拟实现缓冲区 

    这里我们分模块化实现:

    1、makefile 

    这里我们用makefile来完成对程序的自动化编译和构建程序

    1. test:test.c myStdio.c //依赖关系
    2. gcc -o $@ $^ -std=c99//依赖方法
    3. .PHONY:clean//声明伪目标clean
    4. clean:
    5. rm -f test

    2、myStdio.h 

    myStdio.h中对 缓冲区结构进行定义并且进行相关的函数声明:

    1. #pragma once
    2. #include
    3. #include
    4. #include
    5. #include
    6. #include
    7. #include
    8. #include
    9. #include
    10. #define SIZE 1024
    11. #define SYNC_NOW 1//sync能够马上刷新缓冲区(马上刷新)
    12. #define SYNC_LINE 2//行刷新
    13. #define SYNC_FULL 4//全缓冲刷新
    14. typedef struct _FILE{
    15. int flags; //刷新方式
    16. int fileno;
    17. int cap; //buffer的总容量
    18. int size; //buffer当前的使用量
    19. char buffer[SIZE];
    20. }FILE_;
    21. FILE_ *fopen_(const char *path_name, const char *mode);
    22. void fwrite_(const void *ptr, int num, FILE_ *fp);
    23. void fclose_(FILE_ * fp);
    24. void fflush_(FILE_ *fp)

     3、myStdio.c

     在myStdio.c中对 缓冲区功能函数进行实现:

    这里我们主要实现:

    fopen_打开文件。fwrite_x向文件中写入,fflush_刷新缓冲区,fclose_关闭文件

    1. #include "myStdio.h"
    2. FILE_ *fopen_(const char *path_name, const char *mode)
    3. {
    4. int flags = 0;
    5. int defaultMode=0666;
    6. if(strcmp(mode, "r") == 0)
    7. {
    8. flags |= O_RDONLY;
    9. }
    10. else if(strcmp(mode, "w") == 0)
    11. {
    12. flags |= (O_WRONLY | O_CREAT |O_TRUNC);
    13. }
    14. else if(strcmp(mode, "a") == 0)
    15. {
    16. flags |= (O_WRONLY | O_CREAT |O_APPEND);
    17. }
    18. else
    19. {
    20. //TODO
    21. }
    22. int fd = 0;
    23. if(flags & O_RDONLY) fd = open(path_name, flags);
    24. else fd = open(path_name, flags, defaultMode);
    25. if(fd < 0)
    26. {
    27. const char *err = strerror(errno);
    28. write(2, err, strlen(err));
    29. return NULL; // 为什么打开文件失败会返回NULL
    30. }
    31. FILE_ *fp = (FILE_*)malloc(sizeof(FILE_));
    32. assert(fp);
    33. fp->flags = SYNC_LINE; //默认设置成为行刷新
    34. fp->fileno = fd;
    35. fp->cap = SIZE;
    36. fp->size = 0;
    37. memset(fp->buffer, 0 , SIZE);
    38. return fp; // 为什么你们打开一个文件,就会返回一个FILE *指针
    39. }
    40. void fwrite_(const void *ptr, int num, FILE_ *fp)
    41. {
    42. // 1. 写入到缓冲区中
    43. memcpy(fp->buffer+fp->size, ptr, num); //这里我们不考虑缓冲区溢出的问题
    44. fp->size += num;
    45. // 2. 判断是否刷新
    46. if(fp->flags & SYNC_NOW)
    47. {
    48. write(fp->fileno, fp->buffer, fp->size);
    49. fp->size = 0; //清空缓冲区
    50. }
    51. else if(fp->flags & SYNC_FULL)
    52. {
    53. if(fp->size == fp->cap)
    54. {
    55. write(fp->fileno, fp->buffer, fp->size);
    56. fp->size = 0;
    57. }
    58. }
    59. else if(fp->flags & SYNC_LINE)
    60. {
    61. if (strcmp(&(fp->buffer[fp->size - 1]), "\n") == 0)
    62. {
    63. write(fp->fileno, fp->buffer, fp->size);
    64. fp->size = 0;
    65. }
    66. }
    67. else{
    68. }
    69. }
    70. void fflush_(FILE_ *fp)
    71. {
    72. if( fp->size > 0) write(fp->fileno, fp->buffer, fp->size);
    73. fsync(fp->fileno); //将数据,强制要求OS进行外设刷新!
    74. fp->size = 0;
    75. }
    76. void fclose_(FILE_ * fp)
    77. {
    78. fflush_(fp);
    79. close(fp->fileno);
    80. }

    4、test.c 

    1. #include "myStdio.h"
    2. #include
    3. int main()
    4. {
    5. FILE_ *fp = fopen_("./hello.txt", "w");
    6. if(fp == NULL)
    7. {
    8. return 1;
    9. }
    10. int cnt = 10;
    11. const char *msg = "hello pjb ";
    12. while(1)
    13. {
    14. fwrite_(msg, strlen(msg), fp);
    15. sleep(1);
    16. printf("count: %d\n", cnt);
    17. cnt--;
    18. if(cnt == 0) break;
    19. }
    20. fclose_(fp);
    21. return 0;
    22. }

     下面写一个简单的bush脚本:

     while :; do cat hello.txt;sleep 1;echo "###############";done
    

    这是一个简单的 Bash 脚本,它的功能是循环读取并打印文件 "hello.txt" 的内容,并每隔 1 秒打印一条分隔线。

    解释一下脚本的含义:

    • while :; do 表示开始一个无限循环。
    • cat hello.txt 使用 cat 命令读取并打印 "hello.txt" 文件的内容。
    • sleep 1 表示暂停执行 1 秒,即等待一秒钟。
    • echo "###############" 打印一条分隔线,由多个 "#" 字符组成。
    • done 表示循环结束。

    因此,执行这段脚本时,会不断循环读取并打印 "hello.txt" 文件的内容,每次打印之间会有一秒的暂停,并且在每次打印后会输出一条分隔线。

    请确保当前目录下存在名为 "hello.txt" 的文件,并且具有可读权限。

    测试:

     1、当写入文件的msg字符串不带换行符时。

        const char *msg = "hello pjb ";

     

     这里我们观察到当程序结束时,才将缓冲区中的内容刷新到hello.txt文件中。

    2、当写入文件的msg字符串带换行符

        const char *msg = "hello pjb\n";

    这里名为可以验证到带\n普通文件是逐行进行刷新的。

    缓冲区总结 :

    看到这些现象我们不由的想缓存区的刷新策略:有全缓存,行缓冲,立即刷新

    上面是我们自己进行的封装,但是这和os(操作系统)有什么关系呢?下面来看一幅图

     

    这幅图大致说明了字符串,要写入到文件中,需要经过层层拷贝在 最终由操作系统(OS)决定刷新到磁盘文件中。

    这里我们要注意的是,在有用户刷新到C语言的缓冲区(FILE)中才会遵循全缓冲,行缓冲。对于操作系统来说他会自己调配资源进行刷新。

    特别注意:

    我们也可以强制OS刷新,调用fflush()就可以了。

    ffush()的底层:

    1. void fflush_(FILE_ *fp)
    2. {
    3. if( fp->size > 0) write(fp->fileno, fp->buffer, fp->size);
    4. fsync(fp->fileno); //将数据,强制要求OS进行外设刷新!
    5. fp->size = 0;
    6. }

    其实是调用来fsync的接口进行强制刷新。

  • 相关阅读:
    第4章 SpringBoot与Web应用
    【算法】贪心
    postgresql11 主从配置详解
    Spring Cloud Alibaba+saas企业架构技术选型+架构全景业务图 + 架构典型部署方案
    Mysql tinyint(1)与tinyint(4)的区别
    制作翻页电子画册,手机观看更快捷
    纯自动化的消息发送工具实现!
    高质量ChatGPT Prompt 精选
    torch.mm函数介绍
    Automatic differentiation package - torch.autograd
  • 原文地址:https://blog.csdn.net/qq_61552595/article/details/132918905