linux系统编程—系统调用/文件I/O

linux系统编程—系统调用/文件I/O
目录
- 1、open函数
  open两个参数，路径+打开方式
  open两个参数，路径+创建+创建权限
  close函数
  
  2、错误处理函数
  3、read函数
  4、write函数
  5、缓冲区
  6、缓冲区
  7、阻塞和非阻塞
  阻塞（Block）概念
  fcntl函数
  
  8、lseek函数
  9、传入传出参数
  传入参数：
  传出参数：
  传入传出参数：
系统调用——内核提供的函数

 1、open函数

函数原型：
```
int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode); 
int close(int fd); 
1
2
3
```
open两个参数，路径+打开方式
```
	int open(char *pathname, int flags)  这个函数需要包含这个头文件	#include <unistd.h>

	参数：
		pathname: 欲打开的文件路径名

		flags：文件打开方式： 需要包含下面头文件	#include <fcntl.h>

			O_RDONLY|O_WRONLY|O_RDWR	O_CREAT|O_APPEND|O_TRUNC|O_EXCL|O_NONBLOCK ....

	返回值：
		成功： 打开文件所得到对应的 文件描述符（整数）

		失败： -1， 设置errno	
1
2
3
4
5
6
7
8
9
10
11
12
13
```
open两个参数，路径+创建+创建权限
```
	int open(char *pathname, int flags， mode_t mode)		123  775	

	参数：
		pathname: 欲打开的文件路径名

		flags：文件打开方式：	O_RDONLY|O_WRONLY|O_RDWR	O_CREAT|O_APPEND|O_TRUNC|O_EXCL|O_NONBLOCK ....

		mode: 参数3使用的前提， 参2指定了 O_CREAT。	取值8进制数，用来描述文件的 访问权限。 rwx    0664

			创建文件最终权限 = mode & ~umask


 
 

	返回值：
		成功： 打开文件所得到对应的 文件描述符（整数）

		失败： -1， 设置errno

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
```
例如
open(“./d.cp”,O_RDONLY | O_CREAT| O_TRUNC, 0644) 如果文件存在那么截断成0，如果文件不存在那么创造文件，并且把文件权限赋值为0644

close函数
```
int close(int fd);
1
```
2、错误处理函数
```
#include
printf("erron=%d",errno);
1
2
```
通过逻辑条件语句和perror函数结合的错误处理函数
```
if(fd==-1)
{ 
 perror("打开失败");
 exit(1);  //打开失败则没必要进行下一步 所以直接退出  或者想执行其他的用break
}
1
2
3
4
5
```
1. 打开文件不存在
2. 以写方式打开只读文件(打开文件没有对应权限)
3. 以只写方式打开目录
#include
printf(“erron=%d”,errno);

3、read函数
```
	ssize_t read(int fd, void *buf, size_t count);

	参数：
		fd：文件描述符

		buf：存数据的缓冲区

		count：缓冲区大小

	返回值：

		0：读到文件末尾。

		成功；	> 0 读到的字节数。

		失败：	-1， 设置 errno

		-1： 并且 errno = EAGIN 或 EWOULDBLOCK, 说明不是read失败，而是read在以非阻塞方式读一个设备文件（网络文件），并且文件无数据。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
```
4、write函数
```
	ssize_t write(int fd, const void *buf, size_t count);

	参数：
		fd：文件描述符

		buf：待写出数据的缓冲区

		count：数据大小

	返回值：

		成功；	写入的字节数。

		失败：	-1， 设置 errno

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
```
5、缓冲区

系统函数(read、write 函数)常常被称为 Unbuffered I/O。指的是无用户及缓冲区。但不保证不使用内核缓冲区。

系统函数（read、write）
标库函数(fgetc、fputc)

如果每次读一个字节进行拷贝，比较系统函数和标库函数的效率

对文件进行I/O操作，需要将数据从用户区-> 内核区 ->磁盘，从用户区到内核区需要切换 CPU的访问权级；

系统函数：
每次读取一个字节，切换权级，写入一个字节到内核区，大量时间浪费在切换访问权级上；

库函数：
有用户级缓冲区，ubuntu默认4096字节，当缓冲区满了之后，切换权级，写入内核；

很明显由于后者有缓冲区并不是一个一个字节的写入，因此库函数比较快。
对于两者速度的比较，可以使用strace命令跟踪程序执行，查看调用的系统函数；
系统函数并不一定比库函数运行的快，所以如果有库函数尽量使用库函数。

6、缓冲区

PCB本质是一个结构体，结构体的成员维护这个进程的状态。

text段-代码段
text段存放程序代码，运行前就已经确定（编译时确定），通常为只读。

rodata段（read-only-data）-常量区
rodata段存储常量数据，比如程序中定义为const的全局变量，#define定义的常量，以及诸如“Hello World”的字符串常量。只读数据，存储在ROM中。
注意：
const修饰的全局变量在常量区；const修饰的局部变量只是为了防止修改，没有放入常量区。
编译器会去掉重复的字符串常量，程序的每个字符串常量只有一份。

data段
data存储已经初始化的全局变量，属于静态内存分配。（注意：初始化为0的全局变量还是被保存在BSS段）
static声明的变量也存储在数据段。

bss段
bss段存储没有初值的全局变量或默认为0的全局变量，属于静态内存分配。执行期间必须将bss段内容全部设为0。

stack段-栈
stack段存储参数变量和局部变量，由系统进行申请和释放，属于静态内存分配。
stack的特点是先进后出，可用于保存/恢复调用现场。

heap段-堆
heap段是程序运行过程中被动态分配的内存段，由用户申请和释放（例如malloc和free）。
申请时至少分配虚存，当真正存储数据时才分配物理内存；释放时也不是立即释放物理内存，而是可能被重复利用。

7、阻塞和非阻塞

产生阻塞的场景：读设备文件、读网络文件。（读常规文件无阻塞概念）

1、读常规文件是不会阻塞的，不管读多少字节，read一定会在有限的时间内返回。
2、从终端设备或网络读写可能会发生阻塞，如果从终端输入的数据没有换行符，调用read读终端设备就会阻塞，如果网络上没有接收到数据包，调用read从网络读就会阻塞，至于会阻塞多长时间也是不确定的，如果一直没有数据到达就一直阻塞在那里。

阻塞（Block）概念

当进程调用一个阻塞的系统函数时，该进程被置于睡眠（Sleep）状态，这时内核调度其它进程运行，直到该进程等待的事件发生了（比如网络上接收到数据包，或者调用sleep指定的睡眠时间到了）它才有可能继续运行。与睡眠状态相对的是运行（Running）状态，在Linux内核中，处于运行状态的进程分为两种情况：
1. 正在被调度执行。CPU处于该进程的上下文环境中，程序计数器（eip）里保存着该进程的指令地址，通用寄存器里保存着该进程运算过程的中间结果，正在执行该进程的指令，正在读写该进程的地址空间。
2. 就绪状态。该进程不需要等待什么事件发生，随时都可以执行，但CPU暂时还在执行另一个进程，所以该进程在一个就绪队列中等待被内核调度。系统中可能同时有多个就绪的进程，那么该调度谁执行呢？内核的调度算法是基于优先级和时间片的，而且会根据每个进程的运行情况动态调整它的优先级和时间片，让每个进程都能比较公平地得到机会执行，同时要兼顾用户体验，不能让和用户交互的进程响应太慢。
fcntl函数

改变已经打开文件的阻塞和非阻塞的属性
比如如果open时并没有设定非阻塞，但是设备已经打开了，这个时候就可以通过fcntl进行设置
```
#include 
#include 
1
2
```
```
 int fcntl(int fd, int cmd, ... /* arg */ );
 
	获取文件状态： cmd写成 F_GETFL，获取文件属性不需要额外参数 
		int flgs = fcntl(fd,  F_GETFL);
		返回文件的属性（位图，每一位代表一个属性），用一位表示文件是否阻塞，0 阻塞，1 非阻塞；
		

	设置文件状态： cmd写为 F_SETFL，后面需要跟一个参数 int整数，表示要设置的属性值；
		fcntl(fd,  F_SETFL, flgs);
		返回0；


1
2
3
4
5
6
7
8
9
10
11
12
13
```
8、lseek函数

打开文件，默认偏移量被设置为0。
lseek函数是可以改变读写一个文件时读写指针位置一个系统调用。
可以调用lseek显式地为一个打开的文件设置其偏移量
```
off_t lseek(int fd, off_t offset, int whence);
	参数：
		fd：文件描述符

		offset： 偏移量

		whence：起始偏移位置： SEEK_SET/SEEK_CUR/SEEK_END

	返回值：

		成功：较起始位置偏移量

		失败：-1 errno

	应用场景：	
		1. 文件的“读”、“写”使用同一偏移位置。

		2. 使用lseek获取文件大小 
		     lseek(fd, 0, SEEK_END)（跳到最后，返回偏移量）

		4. 使用lseek拓展文件大小：要想使文件大小真正拓展，必须引起IO操作。
			lseek(fd, i, SEEK_END) i为想增长的大小数量，若无IO操作则仍为原大小。 
			 没填东西这些扩展的大小时空洞
			 
			可以使用 truncate 函数，直接拓展文件。int ret = truncate("dict.cp", 250);

			
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
```
9、传入传出参数

传入参数：
```
	1. 指针作为函数参数。

	2. 同常有const关键字修饰。

	3. 指针指向有效区域， 在函数内部做读操作。
1
2
3
4
5
```
传出参数：
```
	1. 指针作为函数参数。

	2. 在函数调用之前，指针指向的空间可以无意义，但必须有效。

	3. 在函数内部，做写操作。

	4。函数调用结束后，充当函数返回值。
1
2
3
4
5
6
7
```
通俗就是传一个指针，在内部进行写，可以充当返回值

传入传出参数：
```
	1. 指针作为函数参数。

	2. 在函数调用之前，指针指向的空间有实际意义。

	3. 在函数内部，先做读操作，后做写操作。

	4. 函数调用结束后，充当函数返回值。
1
2
3
4
5
6
7
```
传入一个有意义的指针，并且是一个传出参数
相关阅读:
中加石墨再冲刺港交所上市：2022年初至今收入为零，陈东尧为CEO
LeetCode --- 1496. Path Crossing 解题报告
 BUU-pwn(六)
数组逆序.
增速冠军 | 超云AI与信创实践典范，引领IDC中国服务器市场
 java-php-python-ssm-数字化网上报修平台-计算机毕业设计
 【halcon】外观检测总结之灰度操作
 Ghidra反编译报错Can‘t read language spec ***/***/***/mips32be.sla
基于HTML制作的闲置交易网站设计
 Ubuntu安装c/c++编译环境
原文地址：https://blog.csdn.net/baidu_41553551/article/details/126557298

目录

1、open函数

open两个参数，路径+打开方式

open两个参数，路径+创建+创建权限

close函数

2、错误处理函数

3、read函数

4、write函数

5、缓冲区

6、缓冲区

7、阻塞和非阻塞

阻塞（Block）概念

fcntl函数

8、lseek函数

9、传入传出参数

传入参数：

传出参数：

传入传出参数：