• BIT-7文件操作和程序环境(16000字详解)


    一:文件

    1.1 文件指针

    每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE.

    例如,VS2013编译环境提供的 stdio.h 头文件中有以下的文件类型申明:

    struct _iobuf {//文件信息区
        char *_ptr;
        int  _cnt;
        char *_base;
        int  _flag;
        int  _file;
        int  _charbuf;
        int  _bufsiz;
        char *_tmpfname;
       };
    typedef struct _iobuf FILE;
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    一般来说,我们是通过文件指针来维护这个文件信息区的

    下面我们可以创建一个FILE*的指针变量:

    FILE* pf;//文件指针变量
    
    • 1

    定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。

    如图所示:
    在这里插入图片描述

    1.2文件的打开和关闭

    文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。

    在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。

    当在C语言中操作文件时,我们通常使用fopen函数来打开文件,并使用fclose函数来关闭文件。

    fopen函数用于打开一个文件,并返回一个指向文件的指针。它的原型如下:

    FILE *fopen(const char *filename, const char *mode);
    
    • 1
    • filename参数是一个字符串,表示要打开的文件名称。
    • mode参数是一个字符串,用于指定文件的打开模式。

    下面是一些常见的打开模式:

    文件使用方式含义如果指定文件不存在
    “r”为了输入数据,打开一个已经存在的文本文件出错
    “w”为了输出数据,打开一个文本文件建立一个新的文件
    “a”向文本文件尾添加数据建立一个新的文件
    “rb”为了输入数据,打开一个二进制文件出错
    “wb”为了输出数据,打开一个二进制文件建立一个新的文件
    “ab”向一个二进制文件尾添加数据建立一个新的文件
    “r+”为了读和写,打开一个文本文件出错
    “w+”为了读和写,建议一个新的文件建立一个新的文件
    “a+”打开一个文件,在文件尾进行读写建立一个新的文件
    “rb+”为了读和写打开一个二进制文件出错
    “wb+”为了读和写,新建一个新的二进制文件建立一个新的文件
    “ab+”打开一个二进制文件,在文件尾进行读和写建立一个新的文件

    示例代码:

    #include 
    
    int main() {
        FILE *file;
        char *filename = "example.txt";
        char *mode = "r";
    
        file = fopen(filename, mode);
        if (file == NULL) {
            printf("无法打开文件!\n");
            return 1;
        }
    
        // 做一些文件操作...
    
        fclose(file);
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    在上面的示例中,我们声明了一个指向FILE类型的指针file,然后指定了要打开的文件的路径和名称,以及打开模式。然后,我们使用fopen函数打开该文件,并将返回的文件指针赋值给file

    fopen函数的返回值是一个指向FILE类型的指针,如果打开文件失败(比如文件不存在),则返回NULL

    在完成文件操作后,我们使用fclose函数来关闭文件。这个函数负责将文件指针指向的文件关闭,并释放与该文件相关的资源。关闭文件后,我们就不能再对其进行读写操作了。

    注意:开文件后,我们必须在不再需要使用文件时及时关闭它,以便释放系统资源。

    1.3 scanf printf fscanf fprintf sscanf sprintf

    1. scanf:

    scanf是一个标准输入函数,用于从标准输入设备(键盘)中读取格式化输入并将其存储在指定的变量中。它允许以指定的格式读取不同类型的数据,如整数、浮点数、字符等。

    1. printf:

    printf是一个标准输出函数,用于将格式化的数据输出到标准输出设备(屏幕)。它允许以指定的格式输出不同类型的数据,如整数、浮点数、字符等。

    1. fscanf:
    int fscanf(FILE *file, const char *format, argument_list)
    
    • 1
    • file:要读取的文件指针。
    • forma`:格式字符串,指定了输入的预期格式。
    • argument_list:读取值的变量列表。

    fscanf函数从给定的文件中按照指定的格式读取数据,并将读取的值存储到指定的变量中。它会根据格式字符串中的格式说明符逐个读取输入,并将读取的值与相应的变量进行匹配。

    fscanf是一个文件输入函数,用于从文件中读取格式化输入并将其存储在指定的变量中。与scanf函数类似,但fscanf从指定的文件中读取数据而不是从键盘。

    1. fprintf:
      int fprintf(FILE *file, const char *format, argument_list)
    
    • 1
    • file:要写入的文件指针。
    • format:格式字符串,指定了输出的格式。
    • argument_list:要写入的变量列表。

    fprintf函数将指定的变量根据格式字符串的要求进行格式化,并将格式化后的内容写入到给定的文件中。

    fprintf是一个文件输出函数,用于将格式化的数据输出到指定的文件中。与printf函数类似,但fprintf将数据写入指定的文件而不是输出到屏幕。

    1. sscanf:

    sscanf函数用于从一个字符串中读取数据并按照指定的格式转换。它的函数原型如下:

       int sscanf(const char *str, const char *format, ...)
    
    • 1
    • str是要读取的字符串。
    • format是格式字符串,定义了读取数据的规则。
    • …是可变参数列表,用于接收读取的数据。

    sscanf是一个字符串输入函数,用于从一个字符串中读取格式化输入并将其存储在指定的变量中。与scanf类似,但sscanf从一个字符串中读取数据而不是从标准输入设备或文件中。

    1. sprintf:

    sprintf函数用于将格式化的数据写入一个字符串中。它的函数原型如下:

       int sprintf(char *str, const char *format, ...)
    
    • 1
    • str是目标字符串的指针,用于存储格式化的数据。
    • format是格式字符串,定义了写入数据的规则。
    • …是可变参数列表,用于提供需要格式化的数据。

    sprintf是一个字符串输出函数,用于将格式化的数据输出到一个字符串中。与printf类似,但sprintf将数据写入一个字符串而不是输出到屏幕或文件中。

    这些函数的区别在于输入/输出的来源或目标不同。scanf和printf用于标准输入输出,fscanf和fprintf用于文件输入输出,sscanf和sprintf用于字符串输入输出。

    下面是一些示例代码:

    #include 
    
    int main() {
       int num;
       char str[100];
    
       // 从键盘输入一个整数
       printf("请输入一个整数:");
       scanf("%d", &num);
    
       // 将该整数写入文件
       FILE *file = fopen("data.txt", "w");
       fprintf(file, "%d", num);//将一个整数num格式化为字符串,并将其写入到指定的文件file中。
       fclose(file);
    
       // 从文件中读取整数
       file = fopen("data.txt", "r");
       fscanf(file, "%d", &num);//从打开的文件file中读取一个整数,并将其存储在num变量中。
       fclose(file);
    
       // 将整数转换为字符串
       sprintf(str, "%d", num);//将一个整数num转换为字符串,并将结果存储在字符数组str中。
       
       // 从字符串中读取整数
       sscanf(str, "%d", &num);//从一个字符串str中读取一个整数,并将其存储在num变量中
    
       // 输出整数和字符串
       printf("整数:%d\n字符串:%s\n", num, str);
    
       return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31

    1.4 文件的顺序读写

    fgetc fputc fgets fputs fread fwrite 是c语言中常用的顺序读写函数(fscanf和fprintf也是),下面我们一 一介绍

    1. fgetc函数:

    int fgetc(FILE *stream)函数用于从指定的文件流中读取一个字符,并返回该字符的ASCII码值。它的参数是一个指向FILE类型的指针,指向要读取的文件流。函数执行成功时将返回读取的字符,若已到达文件末尾或读取失败,则返回EOF(-1)。

    下面是一个使用fgetc函数读取文件的示例代码:

    #include 
    
    int main() {
       FILE *file = fopen("input.txt", "r");
       
       int character;
       while ((character = fgetc(file)) != EOF) {
          printf("%c", character);
       }
       
       fclose(file);
       
       return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    1. fputc函数:

    int fputc(int character, FILE *stream)函数用于将指定的字符写入到文件中,并返回写入成功的字符。它的第一个参数是要写入的字符,第二个参数是指向FILE类型的指针,指向要写入的文件流。函数执行成功时将返回写入的字符,若写入失败,则返回EOF(-1)。

    下面是一个使用fputc函数写入文件的示例代码:

    #include 
    
    int main() {
       FILE *file = fopen("output.txt", "w");
       
       char character = 'A';
       fputc(character, file);
       
       fclose(file);
       
       return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    注意:fgetc函数在读取到文件末尾或读取失败时返回EOF(-1),而fputc函数在写入失败时返回EOF(-1)。

    1. fgets函数:

    fgets 函数用于从文件中读取一行文本。它的声明如下:

    char *fgets(char *str, int n, FILE *stream);
    
    • 1
    • str:指向用于存储读取数据的字符数组的指针;
    • n:要读取的字符的最大数量(包括空字符,所以实际数量要-1),通常使用数组的大小;
    • stream:指向要读取的文件的指针。

    fgets 会读取文件中的一行文本并存储在 str 中,直到达到以下情况之一:

    • 读取到了n-1个字符(读取的字符个数不是n,而是n-1)
    • 读取到换行符 ‘\n’;(读到\n会把\n保存进去)
    • 到达文件的末尾;
    • 发生错误。

    fgets 会自动在读取到的文本末尾添加空字符 ‘\0’,因此 str 数组必须足够大以容纳该字符串。

    示例代码:

    #include 
    
    int main() {
        // 打开文件以供读取
        FILE *file = fopen("file.txt", "r");
      
        if (file) {
            char str[100];
    
            // 从文件中读取一行文本
            while (fgets(str, sizeof(str), file)) {
                printf("%s", str);  // 打印读取的文本
            }
    
            fclose(file);  // 关闭文件
        }
      
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    1. fputs函数:

    fputs 函数用于将字符串写入文件。它的声明如下:

    int fputs(const char *str, FILE *stream);
    
    • 1
    • str:要写入文件的字符串;
    • stream:指向要写入的文件的指针。

    fputs 会将 str 中的内容写入 stream 所指向的文件,直到遇到空字符 ‘\0’。写入成功时,它会返回一个非负值;否则,返回 EOF。

    示例代码:

    #include 
    
    int main() {
        // 打开文件以供写入
        FILE *file = fopen("file.txt", "w");
      
        if (file) {
            char str[] = "Hello, World!";
    
            // 将字符串写入文件
            fputs(str, file);
    
            fclose(file);  // 关闭文件
        }
      
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    注意: fgets 返回的是读取到的字符串的指针,fputs 的返回值是一个非负整数(表示写入的字符数)或 EOF(表示写入失败)。

    1. fread 函数:
      fread 函数用于从文件中读取数据。其声明如下:
    size_t fread(void *ptr, size_t size, size_t count, FILE *stream);
    
    • 1
    • ptr:指向接收数据的缓冲区的指针。(读到哪去的地址)
    • size:要读取的每个元素的大小(以字节为单位)。
    • count:要读取的元素的个数。
    • stream:指向要读取的文件的指针。

    fread 函数的返回值表示成功读取的元素数。

    示例代码:

    #include 
    
    int main() {
        FILE *file = fopen("data.txt", "rb");
        if (file == NULL) {
            printf("Unable to open the file.\n");
            return 1;
        }
    
        int numbers[5];
        size_t elements_read = fread(numbers, sizeof(int), 5, file);
        fclose(file);
    
        printf("Read %zu elements: ", elements_read);
        for (int i = 0; i < elements_read; i++) {
            printf("%d ", numbers[i]);
        }
        printf("\n");
    
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21

    在上面的示例中,我们打开一个名为 “data.txt” 的二进制文件,然后使用 fread 函数从文件中读取 5 个整数,并将它们存储在 numbers 数组中。最后,我们遍历数组并将读取的元素打印出来。

    1. fwrite 函数:
      fwrite 函数用于向文件中写入数据。其声明如下:
    size_t fwrite(const void *ptr, size_t size, size_t count, FILE *stream);
    
    • 1
    • ptr:指向要写入的数据的指针。
    • size:要写入的每个元素的大小(以字节为单位)。
    • count:要写入的元素的个数。
    • stream:指向要写入的文件的指针。

    fwrite 函数的返回值表示成功写入的元素数。

    示例代码:

    #include 
    
    int main() {
        FILE *file = fopen("data.txt", "wb");
        if (file == NULL) {
            printf("Unable to open the file.\n");
            return 1;
        }
    
        int numbers[] = {1, 2, 3, 4, 5};
        size_t elements_written = fwrite(numbers, sizeof(int), 5, file);
        fclose(file);
    
        printf("Written %zu elements to the file.\n", elements_written);
    
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    在上面的示例中,我们打开一个名为 “data.txt” 的二进制文件,然后使用 fwrite 函数将整数数组 numbers 的内容写入文件。最后,我们打印出成功写入的元素数。

    注意:fread 函数的返回值表示成功读取的元素数,而 fwrite 函数的返回值表示成功写入的元素数。

    对于c语言中输入输出都是相对于程序来说的,如图所示:
    在这里插入图片描述

    1.4.1 c 语言stdin流 stdout流 stderr流

    在c语言中,只要c语言程序运行起来,就会默认打开3个流

    • stdin流

    • stdout流

    • stderr流

    这三个流的指针都是FILE*

    所以对于fputc(‘a’,stdout);来说,就相当于把a打印在屏幕上

    对于int ch = fgetc(stdin);来说,就相当于从键盘上读一个字符

    1.5 文件的随机读写

    1.5.1 fseek

    fseek 是 C 语言标准库中的一个函数,用于在文件中移动文件指针的位置。它的原型如下:

    int fseek(FILE* stream, long int offset, int origin);
    
    • 1

    fseek 函数接受三个参数:

    • stream:指向 FILE 类型的指针,表示要移动文件指针的文件流。
    • offset:移动的偏移量,单位为字节。
    • origin:指示移动起点的位置,可以是以下三个常量之一:
      • SEEK_SET:从文件开头开始计算。
      • SEEK_CUR:从当前位置开始计算。
      • SEEK_END:从文件末尾开始计算。

    fseek 的返回值为 0 表示成功,非 0 值则表示出错。

    下面是一个示例代码,演示了 fseek 函数的用法:

    #include 
    
    int main() {
        FILE* file = fopen("example.txt", "r");
        if (file == NULL) {
            printf("无法打开文件。\n");
            return 1;
        }
    
        // 定位到文件结尾
        fseek(file, 0, SEEK_END);
    
        // 获取文件大小
        long int size = ftell(file);
        printf("文件大小为 %ld 字节。\n", size);
    
        // 重新定位到文件开头
        fseek(file, 0, SEEK_SET);
    
        // 读取文件内容
        char buffer[256];
        while (fgets(buffer, sizeof(buffer), file) != NULL) {
            printf("%s", buffer);
        }
    
        fclose(file);
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28

    在这个例子中,程序打开了一个名为 example.txt 的文本文件。首先,我们使用 fseek(file, 0, SEEK_END) 将文件指针移动到文件末尾,然后使用 ftell(file) 获取文件大小(以字节为单位)。接下来,我们使用 fseek(file, 0, SEEK_SET) 将文件指针重新定位到文件开头。最后,我们使用 fgets 函数从文件中逐行读取内容,并将其打印到控制台。

    1.5.2 ftell

    C 语言中的 ftell 函数用于获取文件指针的当前位置。它返回一个 long 类型的值,表示文件指针相对于文件起始位置的偏移量。下面是对 ftell 函数的详细解释以及一个代码示例。

    ftell 函数的原型如下:

    long ftell(FILE *stream);
    
    • 1
    • ftell 函数接受一个指向 FILE 结构体的指针作为参数,该指针指向要获取偏移量的文件。
    • ftell 函数返回一个 long 类型的值,表示文件指针的当前位置相对于文件开始位置的字节偏移量。如果发生错误,函数返回 EOF-1)。

    下面是一个示例代码,演示了如何使用 ftell 函数:

    #include 
    
    int main() {
       FILE *file;
       long filesize;
    
       // 打开文件
       file = fopen("example.txt", "r");
       
       if (file == NULL) {
          printf("无法打开文件。\n");
          return 1;
       }
    
       // 定位文件指针到文件尾部
       fseek(file, 0, SEEK_END);
    
       // 获取文件指针相对于文件开头的偏移量
       filesize = ftell(file);
    
       printf("文件大小为 %ld 字节。\n", filesize);
    
       // 关闭文件
       fclose(file);
    
       return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27

    在这个示例中,我们打开一个名为 example.txt 的文本文件,并将文件指针定位到文件末尾。然后,使用 ftell 函数获取文件指针相对于文件开头的偏移量,并将结果存储在 filesize 变量中。最后,打印文件大小。

    请注意,fseek 函数用于定位文件指针的位置,而 ftell 函数用于获取这个位置的偏移量。

    1.5.3 rewind

    rewind 是 C 语言标准库 中的一个函数,用于将文件指针重新定位到文件的起始位置。它可用于将文件指针移动到文件开头,以便再次读取文件内容或重新从起始位置写入数据。

    下面是 rewind 函数的原型:

    void rewind(FILE *stream);
    
    • 1

    该函数接受一个指向已打开文件的指针作为参数,并将文件指针重置到文件起始位置。函数不返回任何值。

    下面是一个使用 rewind 函数的示例代码:

    #include 
    
    int main() {
       FILE *file = fopen("example.txt", "r");  // 以只读模式打开文件
       if (file == NULL) {
          printf("无法打开文件!\n");
          return 1;
       }
    
       // 读取文件内容
       char ch;
       while ((ch = fgetc(file)) != EOF) {
          printf("%c", ch);
       }
    
       rewind(file);  // 将文件指针重置到文件起始位置
    
       printf("\n重新读取文件内容:\n");
       while ((ch = fgetc(file)) != EOF) {
          printf("%c", ch);
       }
    
       fclose(file);  // 关闭文件
       return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25

    上述代码打开了一个名为 example.txt 的文件,并使用 fgetc 函数逐个字符地读取文件内容并输出。然后,在文件指针被重置到起始位置后,再次读取文件内容并输出。

    1.6 文本文件和二进制文件

    根据数据的组织形式,数据文件被称为文本文件或者二进制文件。

    数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。

    如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。

    一个数据在内存中是怎么存储的呢?

    字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。

    如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节(VS2013测试)。

    在这里插入图片描述

    1.7 文件读取结束的判定

    下面是对文本文件和二进制文件文件结束的可靠判断:

    1. 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )

    fgetc 判断是否为 EOF .
    fgets 判断返回值是否为 NULL .

    1. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。

    fread判断返回值是否小于实际要读的个数。

    1.8 文件缓冲区

    文件缓冲区(File Buffer)是在C语言中用于文件输入和输出的一种机制。它主要用于提高文件的读写效率。当我们打开一个文件进行读取或写入操作时,操作系统会为该文件分配一个缓冲区,通过该缓冲区来进行数据的读取和写入。

    ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。

    从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。并且缓冲区的大小根据C编译系统决定的。

    如图所示:
    在这里插入图片描述
    注意:fclose在关闭文件的时候,也会刷新缓冲区,因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做,可能导致读写文件的问题。

    二:程序环境

    在ANSI C的任何一种实现中,存在两个不同的环境。

    1. 第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令
    2. 第2种是执行环境,它用于实际执行代码

    2.2 翻译环境

    翻译环境如图所示:
    在这里插入图片描述

    下面是一个简图:
    在这里插入图片描述

    在C语言中,编译器将源代码转换成可执行的机器码的过程分为预编译、编译、汇编和链接四个阶段。下面对这四个阶段进行详细解释:

    1. 预编译阶段:

      • 移除注释:移除源代码中的所有注释。
      • 处理预处理指令:处理以#开头的预处理指令,如宏定义、头文件包含等。
      • 展开宏定义:将源代码中的宏展开为相应的代码片段。(宏替换)
      • 处理条件编译:根据条件编译指令(如#if#ifdef#ifndef等)判断编译哪些部分的代码。
      • 生成修改后的源文件:将预处理后的代码保存为一个新的文件供下一阶段使用。
    2. 编译阶段:

      • 词法分析和语法分析:将源代码分析成词法单元,并根据语法规则构建语法树。
      • 语义分析:检查代码的语义正确性,如变量声明与使用是否匹配,函数调用参数是否正确等。
      • 中间代码生成:将语法树转换成中间代码(如三地址码、虚拟机指令等)。
      • 优化:对中间代码进行各种优化,如常量折叠、公共子表达式消除、循环展开等。
      • 目标代码生成:将优化后的中间代码翻译成目标机器代码。
    3. 汇编阶段:

      • 将目标代码转换成汇编语言表示,即将机器指令和操作数用助记符表示。
      • 汇编器通过符号表解析符号,并为每个符号分配相应的内存地址。
      • 生成可重定位的机器代码文件(目标文件)。
    4. 链接阶段:

      • 解析引用:将不完整的目标文件(包含对其他模块的引用)与其他模块的目标文件进行符号解析,找到引用的符号所在的地址。
      • 重定位:将目标文件的各个模块的绝对地址转换成最终的绝对地址。
      • 符号解析:将符号引用与符号定义进行匹配,并进行地址重定向。
      • 内存分配:将各个模块的目标代码和数据分配到内存的不同区域。
      • 生成可执行文件:将链接后的目标文件生成可执行文件,包含所有的符号引用和定义。

    2.1 运行环境:

    程序执行的过程:

    1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。

    2. 程序的执行便开始。接着便调用main函数。

    3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。

    4. 终止程序。正常终止main函数;也有可能是意外终止(断电,卡死,崩溃)

    三:预处理

    3.1预定义

    预定义符号:

    • FILE //进行编译的源文件
    • LINE //文件当前的行号
    • DATE //文件被编译的日期
    • TIME //文件被编译的时间
    • STDC //如果编译器遵循ANSI C,其值为1,否则未定义

    这些预定义符号都是语言内置的。

    举个栗子:

    printf("file:%s line:%d\n", __FILE__, __LINE__);//打印文件路径和行号
    
    • 1

    3.2 define定义标识符和宏

    在C语言中,#define 是一个预处理指令,用于定义常量和宏。

    • define定义标识符常量:#define MAX 1000

    • define定义宏: #define ADD(x, y) ((x)+(y))

    和标识符常量类似,宏也会被替换,比如

    • #define ADD(x, y) ((x)+(y)) :ADD(x,y)就会被替换为((x)+(y)),

    下面通过一个简单代码例子来说明宏的作用:

    #define ADD(x, y) (x)+(y)
    #include 
    
    int main()
    {
      int sum = ADD(2, 3);
      printf("sum = %d\n", sum);
     
      sum = 10*ADD(2, 3);
      printf("sum = %d\n", sum);
     
      return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    宏定义是使用#define关键字指定的,宏的名称是ADD,宏的替换体是(x)+(y)。这个宏定义表示在代码中使用ADD(x, y)时,会将其替换为(x)+(y)。

    在main函数中,有两个使用了宏的行。

    • 第一行int sum = ADD(2, 3);,

    表示将宏ADD中的x替换为2,y替换为3,得到的替换结果是(2)+(3),这个结果为5。然后将计算结果赋值给变量sum。

    • 第二行sum = 10*ADD(2, 3);,

    表示将宏ADD中的x替换为2,y替换为3,得到的替换结果是(2)+(3)。

    请注意! sum = 10*ADD(2, 3); 中的ADD(2,3)被替换后 式子变成了10 *(2)+(3)这个结果等于23,请不要误以为是2和3相加后再乘10,宏只是简单的进行替换,并不运算

    注意:对于字符串里的符号,宏是不会替换的

    3.3# 和 ##用法

    当我们在C语言中定义宏时,有时候我们需要把宏参数转化为对应的字符串。在C语言中,我们可以使用#运算符来实现这个目标。

    下面是一个示例代码,演示了如何使用#运算符将宏参数转化为字符串:

    #include 
    
    #define PRINT_STRING(x)  printf("String: %s\n", #x)
    
    int main() {
       char str[] = "Hello, world!";
       PRINT_STRING(str);
       return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    在这个示例中,我们定义了一个宏PRINT_STRING,它接受一个参数x。使用#运算符,我们可以在宏的定义中将参数x转化为对应的字符串。在main()函数中,我们传递一个字符串str给宏PRINT_STRING,它将打印出字符串"String: Hello, world!"

    另外,还有一个特殊的运算符##,称为连接运算符或者拼接运算符。它用于将两个宏参数组合成单个标识符,或者拼接成一个更大的标识符。

    下面是一个示例代码,演示了如何使用##运算符进行参数拼接:

    #include 
    
    #define CONCAT(a, b) a ## b
    
    int main() {
       int num1 = 10;
       int num2 = 20;
       int result = CONCAT(num, 1) + CONCAT(num, 2);
       printf("Result: %d\n", result);
       return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    在这个示例中,我们定义了一个宏CONCAT,它接受两个参数ab。使用##运算符,我们将参数ab拼接成一个新的标识符。在main()函数中,我们使用CONCAT宏将num1num2拼接成num1num2,然后将它们相加,得到结果30。最后,我们使用printf函数打印结果。

    通过使用###运算符,我们可以在C语言中更灵活地操作宏参数,并且能够实现一些特定的功能。

    3.4 宏和函数的对比

    宏通常被应用于执行简单的运算。比如在两个数中找出较大的一个。那为什么不用函数来完成这个任务?

    原因有二:

    1. 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏比函数在程序的规模和速度方面更胜一筹。
    2. 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于>来比较的类型。宏是类型无关的。

    当然和函数相比宏也有劣势的地方:

    1. 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。

    2. 宏是没法调试的。

    3. 宏由于类型无关,也就不够严谨。

    4. 宏可能会带来运算符优先级的问题,导致程容易出现错。

    宏和函数的一个对比:

    属性函数
    代码长度每次使用时插入只出现于一个地方
    执行速度更快相对慢一些
    操作符优先级需要多加括号更容易预测
    带有副作用的参数可能产生不可预测结果更容易控制结果
    参数类型与类型无关与类型有关
    调试不方便调试可以逐语句调试
    递归不能递归可以递归

    命名约定:

    一般来讲函数的宏的使用语法很相似。所以语言本身没法帮我们区分二者。那我们平时的一个习惯是:

    • 把宏名全部大写
    • 函数名不要全部大写

    3.5 #undef

    #undef 是 C 语言中的一个预处理指令,用于取消定义(或者称为取消宏定义)。当我们使用 #define 定义了一个宏之后,如果需要取消这个宏的定义,就可以使用 #undef 进行操作。

    #undef 的语法形式为:

    #undef 宏名
    
    • 1

    其中,宏名 是要取消定义的宏的名称。

    下面我们来通过一个代码示例来说明 #undef 的使用:

    #include 
    
    #define PI 3.14159
    
    int main() {
        printf("PI的值为:%f\n", PI);
        
        #undef PI
        
        printf("取消宏定义后,PI的值为:%f\n", PI); // 这里会报错,因为 PI 已经被取消定义了
        
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    #undef 可以在任何地方使用,不一定要紧跟在宏定义的后面。它的作用范围仅限于当前文件,不会影响其他文件。

    3.6 文件包含

    在C语言中,#include <>#include "" 是用于包含头文件的预处理指令,它们之间有一些区别。

    #include <> 是用于包含系统标准库的头文件。当使用#include <>时,编译器会在系统的标准库路径下搜索指定的头文件。示例代码如下:

    #include  // 标准输入输出头文件
    
    int main() {
        printf("Hello, World!");
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    #include "" 是用于包含自定义的头文件或者用户创建的头文件。当使用#include ""时,编译器首先在当前目录下搜索指定的头文件,如果找不到,则在编译器的包含路径中搜索。示例代码如下:

    #include "myheader.h" // 自定义头文件
    
    int main() {
        // 调用自定义函数
        myFunction();
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    需要注意的是,#include <>#include "" 的使用是有规范的,开发者应该根据具体的情况选择正确的包含方式。一般来说,系统提供的标准库使用#include <>,自定义的头文件使用#include ""。这样可以提高代码的可读性和维护性。

    对于库文件也可以使用 “” 的形式包含,但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。

    3.7 条件编译

    条件编译是C语言中的一种预处理指令,它允许在编译过程中根据指定的条件选择性地包含或排除一部分代码。条件编译经常用于根据不同的编译选项或目标平台来选择性地编译代码。

    条件编译使用以下指令:

    • #if:如果给定的条件为真,则编译下面的代码块。
    • #elif:如果前面的条件为假,并且给定的条件为真,则编译下面的代码块。
    • #else:如果前面的条件都为假,则编译下面的代码块。
    • #endif:表示条件编译的结束。

    下面是一个简单的示例,演示如何使用条件编译:

    #include 
    
    #define VERSION 2
    
    int main() {
        #if VERSION == 1
            printf("这是版本1\n");
        #elif VERSION == 2
            printf("这是版本2\n");
        #else
            printf("这是其他版本\n");
        #endif
        
        return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    在上面的示例中,根据定义的VERSION宏的值来选择性地编译不同的代码块。如果VERSION的值是1,则输出"这是版本1";如果VERSION的值是2,则输出"这是版本2";如果VERSION的值既不是1也不是2,则输出"这是其他版本"。

    通过改变VERSION的值,可以选择不同的代码路径进行编译。

    使用条件编译可以根据需要去掉或者包含一些代码,从而实现在不同条件下的灵活编译。这在处理不同平台的特定代码或者根据编译选项选择性地编译某些功能时非常有用。

    #if defined(symbol)//这两种写法是等效的
    #ifdef symbol
    
    • 1
    • 2
    #if !defined(symbol)//这两种写法是等效的
    #ifndef symbol
    
    • 1
    • 2

    3.7嵌套文件包含

    如果出现这样的场景:
    在这里插入图片描述

    • comm.h和comm.c是公共模块。
    • test1.h和test1.c使用了公共模块。
    • test2.h和test2.c使用了公共模块。
    • test.h和test.c使用了test1模块和test2模块。

    这样最终程序中就会出现两份comm.h的内容。这样就造成了文件内容的重复

    如何解决这个问题?答案是条件编译。

    每个头文件的开头写:

    #ifndef __TEST_H__
    #define __TEST_H__
    //头文件的内容
    #endif  //__TEST_H__
    
    • 1
    • 2
    • 3
    • 4

    或者

    #pragma once
    
    • 1

    就可以避免头文件的重复引入。

  • 相关阅读:
    TensorFlow搭建LSTM实现多变量多步长时间序列预测(五):seq2seq
    猫头虎博主第六期赠书活动:《手机摄影短视频和后期从小白到高手》
    SpringCloud 学习笔记总结 (二)
    Redis:2023年的必修课,不学就要被市场淘汰
    统计力学中的概率论基础(二)
    CSS中clip-path、white-space使用
    linux之perf(8)annotate标注
    K8S网络原理
    Geode滚动升级手册
    boot 创建 https
  • 原文地址:https://blog.csdn.net/weixin_73232539/article/details/133500509