• CDN工作原理


    1、CDN的产生及作用

            随着时代的发展,网民数量增多,访问路径过长,所以当用户与网站之间的链路被突发的大流量数据拥塞时,不同地区的用户访问网站的响应速度存在差异,为了提高用户访问的响应速度、优化现有Internet中信息的流动,需要在用户和服务器间加入中间层CDN。

            CDN将内容推送到网络边缘,大量的用户访问被分散在网络边缘,不再构成网站出口、互联互通点的资源挤占,也不再需要跨越长距离IP路由,即减少了源服务器的资源占用,企业大大提升了用户访问的响应时间,从而使用户能以最快的速度,从最接近用户的地方获得所需的信息,彻底解决网络拥塞,提高响应速度。

    CDN(Content Delivery Network),即内容分发网络。其目的是通过在现有的Internet中增加一层新的CACHE(缓存)层,将网站的内容发布到最接近用户的网络”边缘“的节点,使用户可以就近取得所需的内容,提高用户访问网站的响应速度。从技术上全面解决由于网络带宽小、用户访问量大、网点分布不均等原因,提高用户访问网站的响应速度。

    2、访问源站的过程

    在浏览器中输入edu.lagou.com,最终会将该域名解析为一个IP地址。

    DNS:域名系统,Domain Name System,核心作用就是就是将一个域名解析为IP地址。

    为了更加清楚地展示CDN的原理,我们首先回顾一下不使用缓存直接到源站请求数据的过程:

    如上图所示,如果要访问的网站名为:"www.edu.lagou.com" 

    (1)客户端首先会在本机的hosts文件和hosts缓存中查找该域名对应的IP地址;

    (2)如果本机中没有此信息,则会到我们的本地DNS 进行询问该域名对应的IP地址;

    (3)如果本地DNS中仍然没有该域名的IP信息时,则会由本地DNS依次向根DNS 、顶级域DNS、权威DNS 进行询问,最终本地DNS 将IP地址发送给客户端。

    (4)客户端通过IP地址向远程的源站服务器发出HTTP请求并获取相应的数据内容。

            以上是通过DNS的迭代解析模式获取域名对应的IP地址并发送HTTP请求的过程。源站的提供商通过配置权威DNS将源站的域名与提供服务的服务器主机进行绑定,使客户端通过DNS服务可以顺利地获取源站域名对应的IP地址并通过IP地址与源站进行通信。

    3、DNS的记录类型

    域名---->IP地址

            在DNS系统中,最常见的资源记录方式是Internet类记录,该记录由包含4个字段的数据构成:Name、Value、Type、TTL。其中Name和Value可以理解为一对键值对,但是其具体含义取决于Type的类型,TTL记录了该条记录应当从缓存中删除的时间。在资源记录的类型中中,最为常见且重要的类型Type主要有: 

    A记录(Address)

            A记录用于描述目标域名到IP地址的映射关系,将目标域名与A记录的Name字段进行匹配,将成功匹配的记录的Value字段的内容(IP地址)输出到DNS回应报文中。

    NS记录(Name Server) 

            NS记录用于描述目标域名到负责解析该域名的DNS的映射关系,根据目标域名对NS记录的Name字段进行匹配,将成功匹配的记录的Value字段(负责解析目标域名的DNS的IP地址)输出到DNS回应报文中。

    CNAME记录

            CNAME记录用于描述目的域名和别名的对应关系,如果说A记录可以将目标域名转换为对应主机的IP地址,那么CNAME记录则可以将一个域名(别名)转换为另一个域名,如果多条CNAME记录指向同一个域名,则可以将多个不同的域名的请求指向同一台服务器主机。并且,CNAME记录通常还对应了一条A记录,用于提供被转换的域名的IP地址。

    4、通过CDN获取缓存内容的过程 

    CDN将我们对源站的请求导向了距离用户较近的最优缓存节点,而非源站。 

    下图所示是通过CDN进行请求响应的过程图。通过图中可以看出:

             在DNS解析域名时新增了一个全局负载均衡系统(GSLB) ,GSLB的主要功能是根据用户的本地DNS(通常距离用户的物理位置较近)的IP地址判断用户的位置,筛选出距离用户较近的本地负载均衡系统(SLB) ,并将该SLB的IP地址作为结果返回给本地DNS。

            SLB主要负责判断缓存服务器集群中是否包含用户请求的资源数据,如果缓存服务器中存在请求的资源,则根据缓存服务器集群中节点的健康程度、负载量、连接数等因素筛选出最优的缓存节点,并将HTTP请求重定向到最优的缓存节点上。

    GSLB :Global Server Load Balancing,全局负载均衡服务器。

    SLB(Server load balancing):负载均衡服务器是对集群内物理主机的负载均衡,而GSLB是对物理集群的负载均衡。

            为了更清晰地说明CDN的工作原理,下面以客户端发起对"www.edu.lagou.com/index.html"的HTTP请求为例进行说明: 

    1. 用户发起对"www.edu.lagou.com/index.html"的HTTP请求,首先需要通过本地DNS通过"迭代解析"的方式获取域名"edu.lagou.com"的IP地址;
    2. 如果本地DNS的缓存中没有该域名的记录,则向根DNS 发送DNS查询报文;
    3. 根DNS 发现域名的前缀为"com",则给出负责解析com 的顶级DNS 的IP地址;
    4. 本地DNS向顶级DNS 发送DNS查询报文;
    5. 顶级DNS 发现域名的前缀为"lagou.com",在本地记录中查找负责该前缀的权威DNS 的IP地址并进行回复;
    6. 本地DNS向权威DNS 发送DNS查询报文;
    7. 权威DNS查找到一条NAME字段为"edu.lagou.com"的CNAME记录(由服务提供者配置,阿里云、网宿科技),该记录的Value字段为"edu.lagou.cdn.com";并且还找到另一条NAME字段为"edu.lagou.cdn.com"的A记录(域名-->IP),该记录的Value字段为GSLB的IP地址;
    8. 本地DNS向GSLB发送DNS查询报文;
    9. GSLB根据本地DNS 的IP地址判断用户的大致位置为北京,筛选出位于海淀区且综合考量最优的SLB的IP地址填入DNS回应报文,作为DNS查询的最终结果;
    10. 本地DNS回复客户端的DNS请求,将上一步的IP地址作为最终结果回复给客户端;
    11. 客户端根据IP地址向SLB发送HTTP请求:"www.edu.lagou.com/index.html";
    12. SLB综合考虑缓存服务器集群中各个节点的资源限制条件、健康度、负载情况等因素,筛选出最优的缓存节点后回应客户端的HTTP请求(状态码为302,重定向地址为最优缓存节点的IP地址);
    13. 客户端接收到SLB的HTTP回复后,重定向到该缓存节点上;
    14. 缓存节点判断请求的资源是否存在、过期,将缓存的资源直接回复给客户端,否则到源站进行数据更新再回复。

    一个普通的DNS请求:

            ① 用户提交域名
            ② 客户端解析域名
            ③ DNS服务器解析出IP
            ④ 客户端请求IP
            ⑤ 返回结束

    加入了GSLB的请求:

            ① 提交域名
            ② 客户端解析域名
            ③ NS(name server,将域名解析到另一个)解析到GSLB
            ④ GSLB解析并返回IP
            ⑤ 客户端请求IP
            ⑥ 返回结束

    5、CDN的网络架构

    CDN网络架构主要由两大部分,分为中心和边缘两部分:

            中心指CDN网关中心和DNS重定向解析中心,负责全局负载均衡,设备系统安装在管理中心机房。

    边缘主要指异地节点,CDN分发的载体,主要由Cache和负载均衡器等组成。

    中心:CDN网关中心、DNS重定向解析中心

    边缘:Cache、负载均衡器

            当用户访问加入CDN服务的网站时,域名解析请求将最终交给全局负载均衡DNS进行处理。全局负载均衡DNS通过一组预先定义好的策略,将当时最接近用户的节点地址提供给用户,使用户能够得到快速的服务。同时,它还与分布在世界各地的所有CDN节点保持通信,搜集各节点的通信状态,确保不将用户的请求分配到不可用的CDN节点上,实际上是通过DNS做全局负载均衡。

            对于普通的Internet用户来讲,每个CDN节点就相当于一个放置在它周围的WEB。通过全局负载均衡DNS的控制,用户的请求被透明地指向离他最近的节点,节点中CDN服务器会像网站的原始服务器一样,响应用户的请求。由于它离用户更近,因而响应时间必然更快。

    每个CDN节点由两部分组成:负载均衡设备和高速缓存服务器

            负载均衡设备负责每个节点中各个Cache的负载均衡,保证节点的工作效率;同时,负载均衡设备还负责收集节点与周围环境的信息,保持与全局负载DNS的通信,实现整个系统的负载均衡。

            高速缓存服务器(Cache)负责存储客户网站的大量信息,就像一个靠近用户的网站服务器一样响应本地用户的访问请求。

            理论上,最简单的CDN网络有一个负责全局负载均衡的DNS和各节点一台Cache,即可运行。DNS支持根据用户源IP地址解析不同的IP,实现就近访问。为了保证高可用性等,需要监视各节点的流量、健康状况等。一个节点的单台Cache承载数量不够时,才需要多台Cache,多台Cache同时工作,才需要负载均衡器,使Cache群协同工作。

    6、CDN相关术语

    源站:指发布内容的原始站点,也就是做 CDN 之前客户真正的服务器。

    边缘服务器(Edge Server):对于边缘服务器,CDN提供了就近访问的能力,边缘服务器节点就是实际提供给用户就近连接、访问的服务器。

    CDN命中率:CDN一般提供的是静态加速能力,静态加速能力通常通过缓存架构来实现,CDN命中指的是CDN服务器有该资源缓存存在,请求到达CDN节点时,CDN服务器可以在本地缓存获取资源直接返回客户端,如果没有命中,则需要CDN节点到源站获取资源。CDN命中的概率即CDN命中率。

    回源:当CDN没有命中缓存时,需要到源站去获取资源,这个过程称为回源,回源需要从CDN节点层层代理访问,最终到源站获取资源。

    中间层服务器:边缘节点比较松散,因此存在缓存穿透的问题。为了避免回源引起的性能大幅下降,在CDN的中间层服务器将多个CDN节点的访问进行收敛,从而大幅提高命中率。

    7、CDN应用场景

    1、网页站点加速

            网站或应用App的主要业务为图片和小文件下载,包括各类型图片、html、css、js小文件等。

    2、下载加速 

            网站或应用App的主要业务为大文件下载,平均单个文件大小在20M以上,如游戏、各类客户端下载和App下载商店等。

    3、视频点播 

            网站或应用App的主要业务为视频点播或短视频类。支持MP4、FLV等主流视频格式。

    4、视频直播 

    5、移动加速 

  • 相关阅读:
    springboot项目常用的初始化方式,看看你知道几个?
    Day53【动态规划】1143.最长公共子序列、1035.不相交的线、53.最大子序和
    Elasticsearch
    docker存储驱动
    士官类学校名录
    nginx配置文件组成
    【Python】【Fintech】用Python和蒙特卡洛法预测投资组合未来收益
    0基础转行软件测试,如何实现月薪9.5k+
    钉钉企业内部应用获取登录用户信息
    HTML5期末大作业商城网页设计与实:(手表 3页)HTML+CSS
  • 原文地址:https://blog.csdn.net/weixin_52851967/article/details/126033053