• 【计算机网络笔记】Web应用之HTTP协议(涉及HTTP连接类型和HTTP消息格式)


    系列文章目录

    什么是计算机网络?
    什么是网络协议?
    计算机网络的结构
    数据交换之电路交换
    数据交换之报文交换和分组交换
    分组交换 vs 电路交换
    计算机网络性能(1)——速率、带宽、延迟
    计算机网络性能(2)——时延带宽积、丢包率、吞吐量/率
    计算机网络体系结构概念
    OSI参考模型基本概念
    OSI参考模型中非端-端层(物理层、数据链路层、网络层)功能介绍
    OSI参考模型中端-端层(传输层、会话层、表示层、应用层)功能介绍
    TCP/IP参考模型基本概念,包括五层参考模型
    网络应用的体系结构
    网络应用进程通信
    网络应用对传输服务的需求



    什么是Web

    Web:World Wide Web(即我们常见的www),也叫万维网。由Tim Berners-Lee这位伟大的科学家发明。

    在这里插入图片描述

    Web最基本的构成要素是网页,网页之间互相链接就形成了庞大的信息网络、服务网络等等。

    网页(Web Page)包含多个对象(objects)。

    • 对象:HTML文件、JPEG图片、视频文件、动态脚本等
    • 每个网页包含基本HTML文件,这个文件又包含对其他对象引用的链接。

    互联网上有那么多的网页,那就又遇到了寻址的问题。这里就是web对象的寻址。用URL(Uniform Resoure Locator)统一资源定位器标识web对象(在RFC1738中有详细描述)。基本格式为:Scheme://host:port/path。如下所示,这里省略了协议名称,默认是http协议。

    在这里插入图片描述


    HTTP协议概述

    Web应用遵循的协议就是HTTP协议(HyperText Transfer Protocol)。

    • 即超文本传输协议。
    • 这个协议采用C/S结构。
      • 客户—Browser:请求、接收、展示Web 对象
      • 服务器—Web Server:响应客户的请求 ,发送对象。Apache web server是现在是一个标准。

    HTTP应用层协议使用的传输层协议就是TCP协议

    • 服务器在80端口等待客户的请求
    • 浏览器发起到服务器的TCP连接(创建套接字Socket)
    • 服务器接受来自浏览器的TCP连接
    • 浏览器(HTTP客户端)与Web服务器(HTTP服务器)交换HTTP消息
    • 关闭TCP连接

    HTTP应用协议是一个无状态(stateless)协议。通俗地讲就是服务器不维护任何有关客户端过去所发请求的信息。比如两分钟之前请求了百度的页面,两分钟后再次请求,服务器端对这两次请求是不区分的。服务器就是无记忆的。

    一般来说,大家更喜欢使用无状态的协议,因为有状态的协议往往更复杂。因为需要维护状态(历史信息),此外,如果客户或服务器失效,会产生状态的不一致,解决这种不一 致代价高。


    HTTP连接

    我们已经知道,web应用所遵循的应用层协议是HTTP协议,HTTP底下依靠的是TCP传输层协议建立连接。

    那在对TCP的使用上是有两种不同的方法的,我们称为HTTP连接的两种类型


    非持久性连接(Nonpersistent HTTP)

    • 每个TCP连接最多允许传输一个 对象
    • HTTP 1.0版本使用非持久性连接

    大致工作过程:

    在这里插入图片描述

    大家可能遇到过这种情况:网速较慢的情况下,我们打开一个网页,文字都出来了,但是那些图片一张一张地慢慢才出来,这从一定程度上反映了上面的工作过程。

    我们怎么来计算这个过程的时间?下面进行响应时间分析与建模

    • RTT(Round Trip Time):从客户端发送一个很小的数据包到服务器 并返回所经历的时间。

    • 响应时间(Response time):

      • 发起、建立TCP连接:1个RTT
      • 发送HTTP请求消息到HTTP响应消息的前几个字节到达:1个RTT
      • 响应消息中所含的文件/对象传输时间…
    • Total=2RTT +文件发送时间

    在这里插入图片描述

    非持久性连接的问题:

    • 每个对象需要2个RTT以上的时间才能获得。
    • 操作系统需要为每个TCP连接开销资源(overhead)。
    • 浏览器打开多个并行的TCP连接以获取网页所需对象,这个时候给服务器端带来很大的负担。

    持久性连接(Persistent HTTP)

    • 每个TCP连接允许传输多个对象
    • HTTP 1.1版本默认使用持久性连接

    建立TCP资源是有代价的,也就是说TCP连接资源是宝贵的。那我们就尽可能多利用这次连接。

    对比非持久性连接,持久性连接:发送响应后,服务器保持TCP连接的打开,后续的HTTP消息可以通过这个连接发送。

    细分的话就有两种类型:

    • 无流水(pipelining)的持久性连接:

      • 客户端只有收到前一个响应后才发送新的请求。
      • 每个被引用的对象耗时1个RTT(对比2RTT,减少了建立连接的一个RTT时间开销)。
    • 带有流水机制的持久性连接:

      • HTTP 1.1的默认选项。
      • 客户端只要遇到一个引用对象就尽快发出请求。就不用等前面那个响应来。
      • 理想情况下,收到所有的引用对象只需耗时约1个RTT。

    HTTP消息格式

    HTTP协议有两类消息:

    • 请求消息(request)
    • 响应消息(response)

    HTTP请求消息

    在这里插入图片描述

    请求消息是用ASCII码写的,所以只要有计算机基础的人就可以读懂。

    • 第一行是请求行。包括请求命令(GET、POST…)、URL、http版本

    • 接着几行是头部行。包括主机名称Host、浏览器类型和版本、连接状态、接受的语言。

    • 接着是一个空行

    • 空行下面是消息体

    什么时候请求会有消息体呢?想想我们平时登录一个网站,是不是要填写一些基本信息和密码,浏览器就会把这些数据传给服务器。那把这些用户输入信息传给服务器有哪些方法?

    主要有下面这些方法:

    • POST方法。使用POST方法,可以把网页中的表格里的数据放到请求消息的消息体里传给服务器,服务器再从消息体里提出这些数据。

    • GET方法。也叫URL方法。输入的信息比较少的话,可以把输入信息通过请求行的URL字段上传。这样URL就会有变。比如:在这里插入图片描述


    HTTP响应消息

    在这里插入图片描述

    HTTP响应消息同样是由ASCII码写的,所以我们也是可以直接读的。

    • 第一行是状态行。包括http版本和状态码以及状态码的解释。
    • 接着几行是头部行。包含的内容和请求消息的头部行差不多。注意Date字段是Web服务器生成这个响应消息的时间;Server是服务器端所使用的软件。
    • 接着是一个空行
    • 接着是响应的HTML文件数据。

    HTTP方法的类型

    • HTTP/1.0:

      • GET
      • POST
      • HEAD。要求服务器(server)不要将所请求的对象放入响应消息中。这个往往是做测试用。
    • HTTP/1.1:

      • GET、
      • PUT。将消息体中的文件上传到URL字段所指定的路径。
      • DELETE 。 删除URL字段所指定的文件
  • 相关阅读:
    瑞吉外卖 —— 8、菜品展示、购物车、下单
    关于硬盘的知识
    告别杂音干扰,享受纯净通话:华为Mate 60 Pro降噪功能体验
    Android笔记
    【C++】内联函数 ⑤ ( 内联函数总结 | 内联函数代码示例 )
    关于Greenplum为什么基于PostgreSQL而不是MySQL?
    cross compile toolchain on ubuntu 2204
    链式插补 (MICE):弥合不完整数据分析的差距
    ADSO主数据检查,到底检查什么--master data check
    Tomcat 启动闪退问题解决集(八大类详细)
  • 原文地址:https://blog.csdn.net/m0_60511809/article/details/133992321