• 面试题——网络IO模型


    一、socket

    socket是在应用层和传输层中间的抽象层,它把传输层(TCP/UDP)的复杂操作抽象成一些简单的接口,供应用层调用实现进程在网络中的通信。Socket起源于UNIX,在Unix一切皆文件的思想下,进程间通信就被冠名为文件描述符(file desciptor),Socket是一种“打开—读/写—关闭”模式的实现,服务器和客户端各自维护一个“文件”,在建立连接打开后,可以向文件写入内容供对方读取或者读取对方内容,通讯结束时关闭文件。

     Socket就像一个电话插座,负责连通两端的电话,进行点对点通信,让电话可以进行通信,端口就像插座上的孔,端口不能同时被其他进程占用。而我们建立连接就像把插头插在这个插座上,创建一个Socket实例开始监听后,这个电话插座就时刻监听着消息的传入,谁拨通我这个“IP地址和端口”,我就接通谁。

    二、Socket通信过程

    像图中的listen()、send()等接口都为阻塞接口。

    三、网络IO模型

    1.阻塞IO(blocking I/O)

    概念:用户发出read请求时,如果数据并没有准备好,那么系统一直处于等待状态,当拿到结果后才会向下执行;否则一直处于阻塞状态。(在内核将数据准备好之前,系统调用会一直等待所有的套接字,默认的是阻塞方式。)
    形象的例子:A拿着一支鱼竿在河边钓鱼,并且一直在鱼竿前等,在等的时候不做其他的事情,十分专心。只有鱼上钩的时,才结束掉等的动作,把鱼钓上来。

    其实,我们例子中所说的鱼竿就是这一个文件描述符。这个模型是我们最常见的,程序调用和我们编写的基本程序是一致的。

    几乎所有的接口都是阻塞接口,这就造成了效率低下、CPU资源浪费等一系列问题。

    优化方法:①socket套接字一次可以accept多次②使用多进程或多线程

    2.非阻塞IO(noblocking I/O)

    概念:当用户发出read操作后,如果内部数据并没有准备好,会迅速返回一个ERROR(与阻塞IO不同点之一),用户可以马上收到一个回复,同样也会一直等待数据准备好,这期间会一直不断询问数据的准备情况(与阻塞IO不同点之二)。

    例子:B也在河边钓鱼,但是B不想将自己的所有时间都花费在钓鱼上,在等鱼上钩这个时间段中,B也在做其他的事情(一会看看书,一会读读报纸,一会又去看其他人的钓鱼等),但B在做这些事情的时候,每隔一个固定的时间检查鱼是否上钩。一旦检查到有鱼上钩,就停下手中的事情,把鱼钓上来。

    其实,B在检查鱼竿是否有鱼,是一个轮询的过程。

    每次客户询问内核是否有数据准备好,即文件描述符缓冲区是否就绪。当有数据报准备好时,就进行拷贝数据报的操作。当没有数据报准备好时,也不阻塞程序,内核直接返回未准备就绪的信号,等待用户程序的下一个轮寻。但是,轮寻对于CPU来说是较大的浪费,一般只有在特定的场景下才使用。

    3.信号驱动IO(signal blocking I/O)

    概念:发出请求后如果没有收到结果,不会继续阻塞能够做其他的工作。

    例子:C也在河边钓鱼,但与A、B不同的是,C比较聪明,他给鱼竿上挂一个铃铛,当有鱼上钩的时候,这个铃铛就会被碰响,C就会将鱼钓上来。

    信号驱动IO模型,应用进程告诉内核:当数据报准备好的时候,给我发送一个信号,对signal信号进行捕捉,并且调用我的信号处理函数来获取数据报。

    4.IO多路转接(I/O multiplexing)

    例子:D同样也在河边钓鱼,但是D生活水平比较好,D拿了很多的鱼竿,一次性有很多鱼竿在等,D不断的查看每个鱼竿是否有鱼上钩。增加了效率,减少了等待的时间。

    IO多路转接是多了一个select函数,select函数有一个参数是文件描述符集合,对这些文件描述符进行循环监听,当某个文件描述符就绪时,就对这个文件描述符进行处理。

    其中,select只负责等,recvfrom只负责拷贝。
    IO多路转接是属于阻塞IO,但可以对多个文件描述符进行阻塞监听,所以效率较阻塞IO的高。

    5.异步IO(asynchronous I/O)


    例子:E也想钓鱼,但E有事情,于是他雇来了F,让F帮他等待鱼上钩,一旦有鱼上钩,F就打电话给E,E就会将鱼钓上去。

    当应用程序调用aio_read时,内核一方面去取数据报内容返回,另一方面将程序控制权还给应用进程,应用进程继续处理其他事情,是一种非阻塞的状态。

    当内核中有数据报就绪时,由内核将数据报拷贝到应用程序中,返回aio_read中定义好的函数处理程序。

    很少有Linux系统支持,Windows的IOCP就是该模型。

    6.阻塞程度

    可以看出,阻塞程度:阻塞IO>非阻塞IO>多路复用IO>信号驱动IO>异步IO,效率是由低到高的。
    前四种都属于同步IO。

  • 相关阅读:
    分享一个在linux中运行通义千问的方法
    微信小程序-蓝牙功能
    Sermant在异地多活场景下的实践
    SSH基本概念及常见问题解决
    BERT-MRC论文笔记
    MongoDB索引
    python使用from Crypto.Random import random时候出现winrandom导入失败的解决方法
    ES写入数据报错:retrying failed action with response code: 429
    在Plesk中如何开启https
    Swagger的简单介绍,集成,以及如何在生产环境中关闭swagger,在测试和开发环境中自动打开
  • 原文地址:https://blog.csdn.net/m0_53975470/article/details/132629173