• Web缓存服务——Squid代理服务器


    正向代理:代替客户端向服务端发送请求。

    反向代理:代理服务端,将请求转发给多个服务端。

    一、Squid代理服务器介绍

    Squid 主要提供缓存加速、应用层过滤控制的功能。

    1.1 代理的工作机制(缓存网页对象,减少重复请求)

    1. 代替客户机向网站请求数据,从而可以隐藏用户的真实IP地址。
    2. 将获得的网页数据(静态 Web 元素)保存到缓存中并发送给客户机,以便下次请求相同的数据时快速响应。

    1.2 代理服务器的概念及其作用

    代理服务器是一个位于客户端和原始(资源)服务器之间的服务器,为了从原始服务器取得内容,客户端向代理服务器发送一个请求并指定目标原始服务器,然后代理服务器向原始服务器转交请求并将获得的内容返回给客户端。

    缓存代理对于Web至关重要,尤其对于大型高负载Web站点。缓存可作为性能优化的一个重要手段,可以极大减轻后端服务器的负载。通常对于静态资源,即较少经常更新的资源,如图片,css或js等进行缓存,从而在每次刷新浏览器的时候,不用重新请求,而是从缓存里面读取,这样就可以减轻服务器的压力。

    其主要作用有:

    • 资源获取: 代替客户端实现从原始服务器的资源获取;
    • 加速访问: 代理服务器可能离原始服务器更近,从而起到一定的加速作用;
    • 缓存作用: 代理服务器保存从原始服务器所获取的资源,从而实现客户端快速的获取;
    • 隐藏真实地址: 代理服务器代替客户端去获取原始服务器资源,从而隐藏客户端真实信息。

    最基本的作用:提高web访问速度,隐藏客户机的真实IP地址。

    1.3 Squid 代理的类型

    传统代理: 适用于Internet 正向代理,需在客户机指定代理服务器的地址和端口。

    透明代理: 客户机不需指定代理服务器的地址和端口,而是通过默认路由、防火墙策略将Web访问重定向给代理服务器处理。

    反向代理: 如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 WEB 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。

    二、Squid 服务的安装和运行

    2.1 编译安装Squid

    1.  #关闭防火墙和selinux
    2.  [root@yuji ~]# systemctl disable --now firewalld
    3.  [root@yuji ~]# setenforce 0
    4.  ​
    5.  #安装环境依赖包
    6.  [root@yuji ~]# yum -y install gcc gcc-c++ make
    7.  #解压squid安装包
    8.  [root@yuji ~]# tar zxvf squid-3.5.28.tar.gz -C /opt/
    9.  #切换到源码包目录,设置安装路径和安装模块
    10.  [root@yuji ~]# cd /opt/squid-3.5.28
    11.  ​
    12.  [root@yuji ~]# ./configure --prefix=/usr/local/squid \ #指定安装目录路径
    13.  --sysconfdir=/etc \ #指定配置文件路径
    14.  --enable-arp-acl \ #MAC地址管控,防止客户端使用IP欺骗
    15.  --enable-linux-netfilter \ #使用内核过滤
    16.  --enable-linux-tproxy \ #支持透明模式
    17.  --enable-async-io=100 \            #异步IO,提升存储性能。先写入缓存,再写入硬盘
    18.  --enable-err-language="Simplify_Chinese" \ #错误信息的显示语言
    19.  --enable-underscore \ #允许URL中有下划线
    20.  --disable-poll \ #关闭默认使用 poll 模式
    21.  --enable-epoll \ #开启epoll模式提升性能,epoll模式可以支持IO多路复制,异步非阻塞
    22.  --enable-gnuregex #使用GNU正则表达式
    23.  ​
    24.  ​
    25.  [root@yuji ~]# make -j2 && make install     #开2核编译安装
    26.  ​
    27.  [root@yuji ~]# ln -s /usr/local/squid/sbin/* /usr/local/sbin/   #优化路径,使系统直接能够识别squid命令
    28.  [root@yuji ~]# useradd -M -s /sbin/nologin squid             #创建squid用户,不创建家目录,不可登录系统
    29.  [root@yuji ~]# chown -R squid:squid /usr/local/squid/var/   #修改属主属组,此目录用于存放缓存文件

     

     

    2.2 修改 Squid 的配置文件

    1. [root@yuji ~]# vim /etc/squid.conf
    2.  ......
    3.  --56行--插入
    4.  http_access allow all #放在 http_access deny all 之前,允许任意客户机使用代理服务,控制规则自上而下匹配
    5.  http_access deny all
    6.  http_port 3128 #用来指定代理服务监听的地址和端口(默认的端口号为 3128)
    7.  --61行--插入
    8.  cache_effective_user squid #添加,指定程序用户,用来设置初始化、运行时缓存的账号,否则启动
    9.  cache_effective_group squid #添加,指定账号基本组
    10.  coredump_dir /usr/local/squid/var/cache/squid #指定缓存文件目录。默认有这一行,一般不做修改

     

    2.3 Squid 的运行控制

    1. #检查配置文件语法是否正确
    2.  [root@yuji ~]# squid -k parse
    3.  ​
    4.  #启动 Squid,第一次启动 Squid 服务时,会自动初始化缓存目录
    5.  [root@yuji ~]# squid -z #-z 选项用来初始化缓存目录
    6.  [root@yuji ~]# squid #启动 squid 服务
    7.  ​
    8.  [root@yuji ~]# netstat -anpt | grep "squid"    #查看是否启动成功

     

    2.4 创建 Squid 服务脚本(将Squid加入系统服务管理)

    1. [root@yuji ~]# vim /etc/init.d/squid
    2.  #!/bin/bash
    3.  #chkconfig: 2345 90 25
    4.  ​
    5.  PID="/usr/local/squid/var/run/squid.pid"
    6.  CONF="/etc/squid.conf"
    7.  CMD="/usr/local/squid/sbin/squid"
    8.  ​
    9.  case "$1" in
    10.     start)
    11.       netstat -natp | grep squid &> /dev/null
    12.       if [ $? -eq 0 ]
    13.       then
    14.         echo "squid is running"
    15.       else
    16.         echo "正在启动 squid..."
    17.         $CMD
    18.       fi
    19.     ;;
    20.     stop)
    21.       $CMD -k kill &> /dev/null
    22.       rm -rf $PID &> /dev/null      #kill命令杀死进程,不会删除PID文件,需要手动删除PID文件,不然下次启动会有问题
    23.     ;;
    24.     status)
    25.       [ -f $PID ] &> /dev/null
    26.          if [ $? -eq 0 ]
    27.            then
    28.             netstat -natp | grep squid
    29.            else
    30.              echo "squid is not running"
    31.          fi
    32.     ;;
    33.     restart)
    34.        $0 stop &> /dev/null
    35.        echo "正在关闭 squid..."
    36.        $0 start &> /dev/null
    37.        echo "正在启动 squid..."
    38.     ;;
    39.     reload)
    40.        $CMD -k reconfigure
    41.     ;;
    42.     check)
    43.        $CMD -k parse
    44.     ;;
    45.     *)
    46.        echo "用法:$0 {start|stop|status|reload|check|restart}"
    47.     ;;
    48.  esac
    49.  ​
    50.  #2345是默认自启动的运行级别,如是-代表任何运行级别都不自启动;90是启动优先级,25是停止优先级,优先级范围是0100,数字越大,优先级越低。
    51.  ​
    52.  ​
    53.  [root@yuji ~]# chmod +x /etc/init.d/squid      #为脚本增加执行权限
    54.  [root@yuji ~]# chkconfig --add squid           #加入系统服务管理
    55.  [root@yuji ~]# chkconfig --list squid          #查看在哪些运行级别下自动启动

    三、构建传统代理服务器(正向代理)

    该模式是客户已知有这个代理服务器,需要手动在浏览器中设置使用。

    1. 1、代理服务器,编辑配置文件
    2.  [root@yuji ~]# vim /etc/squid.conf
    3.  ......
    4.  http_access allow all
    5.  http_access deny all
    6.  http_port 3128
    7.  cache_effective_user squid
    8.  cache_effective_group squid
    9.  --63行--插入
    10.  cache_mem 1024 MB
    11.  #指定缓存功能所使用的内存空间大小,便于保持访问较频繁的WEB对象,容量最好为4的倍数,单位为MB,建议设为物理内存的1/4
    12.  reply_body_max_size 100 MB
    13.  #允许用户下载的最大文件大小,以字节为单位,当下载超过指定大小的Web对象时,浏览器的报错页面中会出现“请求或访问太大”的提示。默认设置0表示不进行限制,若不限制需要将此行注释掉。
    14.  maximum_object_size 100 MB
    15.  #允许保存到缓存空间的最大对象大小,以KB为单位,超过大小限制的文件将不被缓存,而是直接转发给用户。使用不多的大文件,则直接由web服务器响应,减少占用缓存服务器的空间
    16.  ​
    17.  [root@yuji ~]# service squid restart   #重启squid服务
    18.  ​
    19.  #生产环境中还需要修改防火墙规则
    20.  [root@yuji ~]# iptables -F
    21.  [root@yuji ~]# iptables -I INPUT -p tcp --dport 3128 -j ACCEPT   #允许tcp协议3128端口的流量通过
    22.  ​
    23.  2、web服务器安装apache
    24.  [root@web1 ~]# systemctl stop firewalld
    25.  [root@web1 ~]# setenforce 0
    26.  [root@web1 ~]# yum install -y httpd
    27.  [root@web1 ~]# systemctl start httpd
    28.  [root@web1 ~]# echo "tt is a girl" > /var/www/html/index.html
    29.  ​
    30.  3、客户机的代理配置,访问web服务器
    31.  打开浏览器,工具-->Internet选项-->连接-->局域网设置-->开启代理服务器
    32. (地址:Squid服务器IP地址,端口:3128
    33.  ​
    34.  4、查看 Squid 访问日志的新增记录中的缓存命中情况
    35.  [root@yuji ~]# tail -f /usr/local/squid/var/logs/access.log
    36.  TCP_MISS/200      #表示未命中缓存      
    37.  TCP_MEM_HIT/200   #表示命中缓存
    38.  ​
    39.  5、查看 Web 访问日志的新增记录
    40.  [root@web1 ~]# tail -f /var/log/httpd/access_log
    41.  在浏览器输入Web服务器IP地址访问,查看Web服务器访问日志,显示的是由代理服务器替客户机在访问。地址不是真实的客户端地址,而是代理服务器地址。

    四、构建透明代理服务器(代理服务器作为网关服务器)

    透明代理的要求:

    • 要求代理服务器是网关服务器。
    • 网关服务器至少双网卡,开启路由转发功能。
    • 防火墙iptables/firewalld 设置重定向规则。
    1. -----1、Squid服务器配置-----
    2.  [root@yuji ~]# vim /etc/squid.conf       #编辑配置文件
    3.  ......
    4.  http_access allow all
    5.  http_access deny all
    6.  #--60行--修改添加提供内网服务的IP地址,和支持透明代理选项 transparent
    7.  http_port 192.168.72.70:3128 transparent  
    8.  #填写对接客户端网段的网卡地址,即内网卡地址。监听自己内网网卡的地址,并支持透明代理选项 transparent
    9.  ​
    10.  [root@yuji ~]# systemctl restart squid   #重启squid服务
    11.  ​
    12.  #开启路由转发,实现本机中不同网段的地址转发
    13.  [root@yuji ~]# echo 'net.ipv4.ip_forward = 1' >> /etc/sysctl.conf
    14.  [root@yuji ~]# sysctl -p
    15.  ​
    16.  #修改防火墙规则,设置重定向规则
    17.  [root@yuji ~]# iptables -F
    18.  [root@yuji ~]# iptables -t nat -F
    19.  #用于转发http协议。80端口重定向到3128端口,由代理服务器进行请求
    20.  [root@yuji ~]# iptables -t nat -A PREROUTING -i ens33 -s 192.168.72.0/24 -p tcp --dport 80 -j REDIRECT --to 3128
    21.  #用于转发https协议。443端口重定向到3128端口,由代理服务器进行请求
    22.  [root@yuji ~]# iptables -t nat -A PREROUTING -i ens33 -s 192.168.72.0/24 -p tcp --dport 443 -j REDIRECT --to 3128
    23.  #接受tcp协议的3128端口传入的数据
    24.  [root@yuji ~]# iptables -A INPUT -p tcp --dport 3128 -j ACCEPT  
    25.  ​
    26.  -----2、Web服务器配置-----
    27.  [root@web1 ~]# systemctl stop firewalld
    28.  [root@web1 ~]# setenforce 0
    29.  [root@web1 ~]# yum install -y httpd
    30.  [root@web1 ~]# systemctl start httpd
    31.  [root@web1 ~]# echo "tt is a girl" > /var/www/html/index.html
    32.  ​
    33.  -----3、客户机配置,修改网关地址,浏览器不使用代理-----
    34.  网关地址修改为代理服务器的内网网卡地址:192.168.72.70
    35.  ​
    36.  关闭客户机的浏览器之前设置的代理服务器的功能后,访问 http://12.0.0.12
    37.  ​
    38.  ​
    39.  #查看 Squid 访问日志的新增记录
    40.  [root@yuji ~]# tail -f /usr/local/squid/var/logs/access.log
    41.  1654584356.658    231 192.168.72.50 TCP_MISS/200 290 GET http://detec tportal.firefox.com/success.txt - ORIGINAL_DST/34.107.221.82 text/pla in      #第一次访问未命中缓存
    42.  1654584383.003      0 192.168.72.50 TCP_MEM_HIT/200 341 GET http://12 .0.0.12/ - HIER_NONE/- text/html   #第二次访问命中缓存
    43.  ​
    44.  ​
    45.  #查看 Web 访问日志的新增记录,显示的是由代理服务器的外网口代替客户机在访问
    46.  [root@web1 ~]# tail -f /var/log/httpd/access_log

    五、ACL访问控制

    在配置文件 squid.conf 中,ACL 访问控制通过以下两个步骤来实现:

    (1)使用 acl 配置项定义需要控制的条件;

    (2)通过 http_access 配置项对已定义的列表做“允许”或“拒绝”访问的控制。

    定义访问控制列表:

    1. 格式:
    2. acl 列表名称 列表类型 列表内容 …
    1. 1、编辑配置文件,定义控制访问列表
    2.  [root@yuji ~]#vim /etc/squid.conf
    3.  ......
    4.  acl localhost src 192.168.72.50/32 #客户机源地址为 192.168.72.50
    5.  acl MYLAN src 192.168.72.0/24 192.168.1.0/24 #客户机网段
    6.  acl destinationhost dst 192.168.72.60/32 #目标地址为 192.168.72.60
    7.  acl MC20 maxconn 20 #最大并发连接 20
    8.  acl PORT port 21 #目标端口 21
    9.  acl DMBLOCK dstdomain .qq.com #目标域,匹配域内所有站点
    10.  acl BURL url_regex -i ^rtsp:// ^emule:// #以 rtsp://、emule:// 开头的目标 URL地址,-i表示忽略大小写。匹配正则表达式
    11.  acl PURL urlpath_regex -i .mp3$ .mp4$ .rmvb$ #以 .mp3、.mp4、.rmvb 结尾的目标 URL 路径
    12.  acl WORKTIME time MTWHF 08:30-17:30 #时间为周一至周五 8:30~17:30,“MTWHF”为周一至周五的英文首字母
    13.  ​
    14.  http_access deny(或allow) destinationhost #注意,如果是拒绝列表,需要放在http_access allow all前面
    15.  ​
    16.  ​
    17.  2、重启服务
    18.  [root@yuji ~]#systemctl restart squid
    19.  ​
    20.  ​
    21.  3、使用客户机192.168.72.50进行访问
    22.  浏览器访问Web服务器 http://192.168.72.60,显示被访问被拒绝。
    23.  ​
    24.  ​
    25.  ​
    26.  ----------------- # 启动对象列表管理 #--------------
    27.  #如果需要管理的地址很多,可以将多个地址先写在一个文件里
    28.  ​
    29.  #启动对象列表管理
    30.  mkdir /etc/squid
    31.  vim /etc/squid/dest.list    #写一个地址管理列表
    32.  192.168.72.50
    33.  192.168.1.0/24
    34.  ​
    35.  #编辑配置文件
    36.  vim /etc/squid.conf        
    37.  ......
    38.  acl destinationhost dst "/etc/squid/dest.list"  #调用指定文件中的列表内容
    39.  ......
    40.  http_access deny(或allow) destinationhost  #注意,如果是拒绝列表,需要放在http_access allow all前面

    5.2 ACL访问控制操作实例

    1. 1、编辑配置文件,定义控制访问列表
    2.  [root@yuji ~]# vim /etc/squid.conf
    3.  ......
    4.   25 acl CONNECT method CONNECT
    5.   26 acl myhost src 192.168.72.50/32   #定义列表名称为myhost,源址为192.168.72.50
    6.   27
    7.   28 http_access deny myhost           #拒绝myhost列表中的地址进行访问
    8.   #注意,拒绝列表需要放在http_access allow all前面
    9.  ​
    10.  ​
    11.  2、重启squid服务
    12.  [root@yuji ~]# systemctl restart squid
    13.  ​
    14.  ​
    15.  3、使用客户机192.168.72.50进行访问
    16.  浏览器访问Web服务器 http://12.0.0.12,显示被访问被拒绝。

    六、Squid 反向代理

    6.1 反向代理工作机制

    如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 Web 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。

    静态内容/可缓存内容,如果已写入缓存,由缓存服务器提供。动态内容,由代理服务器转发给web服务器进行请求。

    6.2 构建 Squid 反向代理服务器

    1)缓存服务器配置

    1.  [root@yuji ~]# vim /etc/squid.conf
    2.  ......
    3.  #--60行--修改,插入以下几行
    4.  http_port 192.168.72.70:80 accel vhost vport
    5.  cache_peer 192.168.72.60 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
    6.  cache_peer 192.168.72.40 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
    7.  cache_peer_domain web1 web2 www.yuji.com
    8.  #表示对www.yuji.com的请求,由squid向192.168.72.60192.168.72.4080端口发出请求
    9.  ​
    10.  ---------------- 虚线内是注释 ----------------------------------------------------------------------------------------
    11.  http_port 80 accel vhost vport
    12. ##squid从一个缓存变成了一个Web服务器反向代理加速模式,这个时候squid在80端口监听请求,同时和web server的请求端口(vhost vport)绑定,这个时候请求到了squid,squid是不用转发请求的,而是直接要么从缓存中拿数据、要么向绑定的端口直接请求数据。
    13.  accel :反向代理加速模式。
    14.  vhost :支持域名或主机名来表示代理节点。
    15.  vport :支持IP和端口来表示代理节点。
    16.  ​
    17.  parent :代表为父节点,上下关系,非平级关系。
    18.  80 :代理内部web服务器的80端口。
    19.  0 :没有使用icp(电信运营商),表示就一台squid服务器。
    20.  no-query :不做查询操作,直接获取数据。
    21.  originserver :指定是源服务器。
    22.  round-robin :指定 squid 通过轮询方式将请求分发到其中一台父节点。
    23.  max_conn :指定最大连接数。
    24.  weight : 指定权重。
    25.  name :设置别名。
    26.  ----------------------------------------------------------------------------------------------------------
    27.  ​
    28.  ​
    29.  #清空之前透明模式配置的 iptables 规则
    30.  [root@yuji ~]# iptables -F
    31.  [root@yuji ~]# iptables -t nat -F
    32.  ​
    33.  ​
    34.  [root@yuji ~]# netstat -natp | grep :80   #检查一下80端口是否被占用,如果被占用,需要关闭httpd
    35.  [root@yuji ~]# systemctl stop httpd       #防止 httpd 服务使用的 80 端口号和 squid 反向代理配置的监听端口冲突
    36.  [root@yuji ~]# systemctl restart squid   #重启squid服务

    2)后端两台节点服务器配置

    1. systemctl stop firewalld
    2.  setenforce 0
    3.  yum install -y httpd
    4.  systemctl start httpd
    5.  ​
    6.  #节点1
    7.  echo "tt is a girl" > /var/www/html/index.html
    8.  #节点2
    9.  echo "nn is a boy" > /var/www/html/index.html
    10.  echo "I am test02" > /var/www/html/test.html

    3)客户机的域名映射配置,进行访问验证

    1. windows系统,修改 C:\Windows\System32\drivers\etc\hosts 文件
    2.  192.168.72.70 www.yuji.com
    3.  ​
    4.  Linux系统,修改/etc/hosts文件,添加映射关系
    5.  echo "192.168.72.70 www.yuji.com" >>/etc/hosts  #squid服务器地址
    6.  ​
    7.  浏览器不开启代理访问
    8.  http://www.yuji.com
    9.  http://www.yuji.com/test.html
    10.  ​
    11.  squid服务器查看缓存命中情况:
    12.  [root@yuji ~]# tailf /usr/local/squid/var/logs/access.log
    13.  1654596933.113      1 192.168.72.10 TCP_MISS/404 448 GET http://www.yuji.com/favicon.ico - ROUNDROBIN_PARENT/192.168.72.40 text/html
    14.  1654597006.164      0 192.168.72.10 TCP_MEM_HIT/200 339 GET http://www.yuji.com/ - HIER_NONE/- text/html
    15.  1654597006.257      2 192.168.72.10 TCP_MISS/404 448 GET http://www.yuji.com/favicon.ico - ROUNDROBIN_PARENT/192.168.72.60 text/html
    16.  1654597006.279      1 192.168.72.10 TCP_MISS/404 448 GET http://www.yuji.com/favicon.ico - ROUNDROBIN_PARENT/192.168.72.40 text/html
    17.  ​
    18.  #TCP_MEM_HIT/200 表示命中缓存
    19.  #ROUNDROBIN_PARENT/192.168.72.60 自动轮询,实现负载均衡
    20.  #ROUNDROBIN_PARENT/192.168.72.40 自动轮询,实现负载均衡

  • 相关阅读:
    【排序】详解冒泡排序
    Java 同步工具与组合类的线程安全性分析
    【Java笔试强训】Day9(CM72 另类加法、HJ91 走方格的方案数)
    原生AJAX
    图解计算机内部的高速公路 —— 总线系统
    Java类的定义及定义类时可用的关键字
    springmvc-国际化&中英文切换&文件上传&下载
    算法笔记-第九章-二叉查找树
    Java项目:基于SSH的医院挂号预约系统
    程序员这样提高英语,少走很多弯路
  • 原文地址:https://blog.csdn.net/shitianyu6/article/details/127713403