• linux系统编程—系统调用/文件I/O


    系统调用——内核提供的函数
    在这里插入图片描述

    1、open函数

    函数原型:

    int open(const char *pathname, int flags);
    int open(const char *pathname, int flags, mode_t mode); 
    int close(int fd); 
    
    • 1
    • 2
    • 3
    open两个参数,路径+打开方式
    	int open(char *pathname, int flags)  这个函数需要包含这个头文件	#include <unistd.h>
    
    	参数:
    		pathname: 欲打开的文件路径名
    
    		flags:文件打开方式: 需要包含下面头文件	#include <fcntl.h>
    
    			O_RDONLY|O_WRONLY|O_RDWR	O_CREAT|O_APPEND|O_TRUNC|O_EXCL|O_NONBLOCK ....
    
    	返回值:
    		成功: 打开文件所得到对应的 文件描述符(整数)
    
    		失败: -1, 设置errno	
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    open两个参数,路径+创建+创建权限
    	int open(char *pathname, int flags, mode_t mode)		123  775	
    
    	参数:
    		pathname: 欲打开的文件路径名
    
    		flags:文件打开方式:	O_RDONLY|O_WRONLY|O_RDWR	O_CREAT|O_APPEND|O_TRUNC|O_EXCL|O_NONBLOCK ....
    
    		mode: 参数3使用的前提, 参2指定了 O_CREAT。	取值8进制数,用来描述文件的 访问权限。 rwx    0664
    
    			创建文件最终权限 = mode & ~umask
    
    
     
     
    
    	返回值:
    		成功: 打开文件所得到对应的 文件描述符(整数)
    
    		失败: -1, 设置errno
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20

    例如
    open(“./d.cp”,O_RDONLY | O_CREAT| O_TRUNC, 0644) 如果文件存在那么截断成0,如果文件不存在那么创造文件,并且把文件权限赋值为0644

    close函数
    int close(int fd);
    
    • 1

    2、错误处理函数

    #include
    printf("erron=%d",errno);
    
    • 1
    • 2

    通过逻辑条件语句和perror函数结合的错误处理函数

    if(fd==-1)
    { 
     perror("打开失败");
     exit(1);  //打开失败则没必要进行下一步 所以直接退出  或者想执行其他的用break
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    1. 打开文件不存在
    2. 以写方式打开只读文件(打开文件没有对应权限)
    3. 以只写方式打开目录

    #include
    printf(“erron=%d”,errno);

    3、read函数

    	ssize_t read(int fd, void *buf, size_t count);
    
    	参数:
    		fd:文件描述符
    
    		buf:存数据的缓冲区
    
    		count:缓冲区大小
    
    	返回值:
    
    		0:读到文件末尾。
    
    		成功;	> 0 读到的字节数。
    
    		失败:	-1, 设置 errno
    
    		-1: 并且 errno = EAGIN 或 EWOULDBLOCK, 说明不是read失败,而是read在以非阻塞方式读一个设备文件(网络文件),并且文件无数据。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    4、write函数

    	ssize_t write(int fd, const void *buf, size_t count);
    
    	参数:
    		fd:文件描述符
    
    		buf:待写出数据的缓冲区
    
    		count:数据大小
    
    	返回值:
    
    		成功;	写入的字节数。
    
    		失败:	-1, 设置 errno
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    5、缓冲区

    系统函数(read、write 函数)常常被称为 Unbuffered I/O。指的是无用户及缓冲区。但不保证不使用内核 缓冲区。

    系统函数(read、write)
    标库函数(fgetc、fputc)

    如果每次读一个字节进行拷贝,比较系统函数和标库函数的效率
    在这里插入图片描述

    对文件进行I/O操作,需要将数据从用户区-> 内核区 ->磁盘,从用户区到内核区需要切换 CPU的访问权级;

    系统函数:
    每次读取一个字节,切换权级,写入一个字节到内核区,大量时间浪费在切换访问权级上;

    库函数:
    有用户级缓冲区,ubuntu默认4096字节,当缓冲区满了之后,切换权级,写入内核;

    很明显由于后者有缓冲区并不是一个一个字节的写入,因此库函数比较快。
    对于两者速度的比较,可以使用strace命令跟踪程序执行,查看调用的系统函数;
    系统函数并不一定比库函数运行的快,所以如果有库函数尽量使用库函数。

    6、缓冲区

    在这里插入图片描述

    PCB本质是一个结构体,结构体的成员维护这个进程的状态。

    text段-代码段
    text段存放程序代码,运行前就已经确定(编译时确定),通常为只读。

    rodata段(read-only-data)-常量区
    rodata段存储常量数据,比如程序中定义为const的全局变量,#define定义的常量,以及诸如“Hello World”的字符串常量。只读数据,存储在ROM中。
    注意:
    const修饰的全局变量在常量区;const修饰的局部变量只是为了防止修改,没有放入常量区。
    编译器会去掉重复的字符串常量,程序的每个字符串常量只有一份。

    data段
    data存储已经初始化的全局变量,属于静态内存分配。(注意:初始化为0的全局变量还是被保存在BSS段)
    static声明的变量也存储在数据段。

    bss段
    bss段存储没有初值的全局变量或默认为0的全局变量,属于静态内存分配。执行期间必须将bss段内容全部设为0。

    stack段-栈
    stack段存储参数变量和局部变量,由系统进行申请和释放,属于静态内存分配。
    stack的特点是先进后出,可用于保存/恢复调用现场。

    heap段-堆
    heap段是程序运行过程中被动态分配的内存段,由用户申请和释放(例如malloc和free)。
    申请时至少分配虚存,当真正存储数据时才分配物理内存;释放时也不是立即释放物理内存,而是可能被重复利用。

    7、阻塞和非阻塞

    产生阻塞的场景: 读设备文件、读网络文件。(读常规文件无阻塞概念)

    1、读常规文件是不会阻塞的,不管读多少字节,read一定会在有限的时间内返回。
    2、从终端设备或网络读写可能会发生阻塞,如果从终端输入的数据没有换行符,调用read读终端设备就会阻塞,如果网络上没有接收到数据包,调用read从网络读就会阻塞,至于会阻塞多长时间也是不确定的,如果一直没有数据到达就一直阻塞在那里。

    阻塞(Block)概念

    当进程调用一个阻塞的系统函数时,该进程被置于睡眠(Sleep)状态,这时内核调度其它进程运行,直到该进程等待的事件发生了(比如网络上接收到数据包,或者调用sleep指定的睡眠时间到了)它才有可能继续运行。与睡眠状态相对的是运行(Running)状态,在Linux内核中,处于运行状态的进程分为两种情况:

    1. 正在被调度执行。CPU处于该进程的上下文环境中,程序计数器(eip)里保存着该进程的指令地址,通用寄存器里保存着该进程运算过程的中间结果,正在执行该进程的指令,正在读写该进程的地址空间。
    2. 就绪状态。该进程不需要等待什么事件发生,随时都可以执行,但CPU暂时还在执行另一个进程,所以该进程在一个就绪队列中等待被内核调度。系统中可能同时有多个就绪的进程,那么该调度谁执行呢?内核的调度算法是基于优先级和时间片的,而且会根据每个进程的运行情况动态调整它的优先级和时间片,让每个进程都能比较公平地得到机会执行,同时要兼顾用户体验,不能让和用户交互的进程响应太慢。
    fcntl函数

    改变已经打开文件的阻塞和非阻塞的属性
    比如如果open时并没有设定非阻塞,但是设备已经打开了,这个时候就可以通过fcntl进行设置

    #include 
    #include 
    
    • 1
    • 2
    
     int fcntl(int fd, int cmd, ... /* arg */ );
     
    	获取文件状态: cmd写成 F_GETFL,获取文件属性不需要额外参数 
    		int flgs = fcntl(fd,  F_GETFL);
    		返回文件的属性(位图,每一位代表一个属性),用一位表示文件是否阻塞,0 阻塞,1 非阻塞;
    		
    
    	设置文件状态: cmd写为 F_SETFL,后面需要跟一个参数 int整数,表示要设置的属性值;
    		fcntl(fd,  F_SETFL, flgs);
    		返回0
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    8、lseek函数

    打开文件,默认偏移量被设置为0。
    lseek函数是可以改变读写一个文件时读写指针位置一个系统调用。
    可以调用lseek显式地为一个打开的文件设置其偏移量

    off_t lseek(int fd, off_t offset, int whence);
    	参数:
    		fd:文件描述符
    
    		offset: 偏移量
    
    		whence:起始偏移位置: SEEK_SET/SEEK_CUR/SEEK_END
    
    	返回值:
    
    		成功:较起始位置偏移量
    
    		失败:-1 errno
    
    	应用场景:	
    		1. 文件的“读”、“写”使用同一偏移位置。
    
    		2. 使用lseek获取文件大小 
    		     lseek(fd, 0, SEEK_END)(跳到最后,返回偏移量)
    
    		4. 使用lseek拓展文件大小:要想使文件大小真正拓展,必须引起IO操作。
    			lseek(fd, i, SEEK_END) i为想增长的大小数量,若无IO操作则仍为原大小。 
    			 没填东西这些扩展的大小时空洞
    			 
    			可以使用 truncate 函数,直接拓展文件。int ret = truncate("dict.cp", 250);
    
    			
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27

    9、传入传出参数

    传入参数:
    	1. 指针作为函数参数。
    
    	2. 同常有const关键字修饰。
    
    	3. 指针指向有效区域, 在函数内部做读操作。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    传出参数:
    	1. 指针作为函数参数。
    
    	2. 在函数调用之前,指针指向的空间可以无意义,但必须有效。
    
    	3. 在函数内部,做写操作。
    
    	4。函数调用结束后,充当函数返回值。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    通俗就是传一个指针,在内部进行写,可以充当返回值

    传入传出参数:
    	1. 指针作为函数参数。
    
    	2. 在函数调用之前,指针指向的空间有实际意义。
    
    	3. 在函数内部,先做读操作,后做写操作。
    
    	4. 函数调用结束后,充当函数返回值。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    传入一个有意义的指针,并且是一个传出参数

  • 相关阅读:
    中加石墨再冲刺港交所上市:2022年初至今收入为零,陈东尧为CEO
    LeetCode --- 1496. Path Crossing 解题报告
    BUU-pwn(六)
    数组逆序.
    增速冠军 | 超云AI与信创实践典范,引领IDC中国服务器市场
    java-php-python-ssm-数字化网上报修平台-计算机毕业设计
    【halcon】外观检测总结之灰度操作
    Ghidra反编译报错Can‘t read language spec ***/***/***/mips32be.sla
    基于HTML制作的闲置交易网站设计
    Ubuntu安装c/c++编译环境
  • 原文地址:https://blog.csdn.net/baidu_41553551/article/details/126557298