• 【祝福伟大的祖国】Java Web 9.2 Request 对象 9.2.5 请求参数中文乱码问题


    Java Web

    【黑马程序员新版JavaWeb基础教程,Java web从入门到企业实战完整版】

    9 Request&Response

    9.2 Request 对象
    9.2.5 请求参数中文乱码问题

    【一个问题】

    1. 将req.html页面的请求方式修改为get

      DOCTYPE html>
      <html lang="en">
      <head>
          <meta charset="UTF-8">
          <title>获取请求体数据title>
      head>
      <body>
      
      <form action="/tomcat-demo/req2" method="get">
          <input type="text" name="username"><br>
          <input type="password" name="password"><br>
          <input type="checkbox" name="hobby" value="1"> 游泳
          <input type="checkbox" name="hobby" value="2"> 爬山 <br>
          <input type="submit">
      form>
      body>
      html>
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
      • 15
      • 16
      • 17
      • 18
      • 19
      • 20
    2. 在Servlet 方法中获取参数,并打印

      @WebServlet("/req2")
      public class RequestDemo1 extends HttpServlet {
          @Override
          protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
              //获取username
              String username = req.getParameter("username");
              System.out.println(username);
          }
      
          @Override
          protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
              this.doGet(req,resp);
          }
      }
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
    3. 启动服务

      这次用户名传去一个中文的。

      在这里插入图片描述

    4. 试试post 请求

      在这里插入图片描述

      仍然是乱码的。

    【POST 请求解决方案】

    [分析出现中文乱码的原因]

    • POST的请求参数是通过request的getReader()来获取流中的数据
    • TOMCAT在获取流的时候采用的编码是ISO-8859-1
    • ISO-8859-1编码是不支持中文的,所以会出现乱码

    [解决方案]

    • 页面设置的编码格式为UTF-8
    • 把TOMCAT在获取流数据之前的编码设置为UTF-8
    • 通过request.setCharacterEncoding(“UTF-8”)设置编码,UTF-8也可以写成小写

    [修改]

    @WebServlet("/req2")
    public class RequestDemo1 extends HttpServlet {
        @Override
        protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
            //获取username
            req.setCharacterEncoding("utf-8");
            String username = req.getParameter("username");
            System.out.println(username);
        }
    
        @Override
        protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
            this.doGet(req,resp);
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    再试一次

    在这里插入图片描述

    OK。

    【GET 请求解决方案】

    POST 的解决方案是不适用 Get 请求的。

    • GET请求获取请求参数的方式是request.getQueryString()
    • POST请求获取请求参数的方式是request.getReader()
    • request.setCharacterEncoding(“utf-8”)是设置request处理流的编码
    • getQueryString方法并没有通过流的方式获取数据

    [那如何解决]

    [get 请求出现乱码的原因]

    在这里插入图片描述

    1. 浏览器通过HTTP协议发送请求和数据给后台服务器(Tomcat)

    2. 浏览器在发送HTTP的过程中会对中文数据进行URL编码

    3. 在进行URL编码的时候会采用页面标签指定的UTF-8的方式进行编码,张三编码后的结果为%E5%BC%A0%E4%B8%89

      在这里插入图片描述

    4. 后台服务器(Tomcat)接收到%E5%BC%A0%E4%B8%89后会默认按照ISO-8859-1进行URL解码

    5. 由于前后编码与解码采用的格式不一样,就会导致后台获取到的数据为乱码。

    如果把req.html页面的标签的charset属性改成ISO-8859-1 ,后台不做操作,能解决中文乱码问题么?

    不能。因为ISO-8859-1本身是不支持中文展示的,所以改了标签的charset属性后,会导致页面上的中文内容都无法正常展示。

    [URL 编码]

    具体编码过程分两步:

    1. 将字符串按照编码方式转为二进制
    2. 每个字节转为2个16进制数并在前边加上%

    举个栗子:张三

    张三按照UTF-8的方式转换成二进制的结果为:

    1110 0101 1011 1100 1010 0000 1110 0100 1011 1000 1000 1001

    http://www.mytju.com/classcode/tools/encode_utf8.asp

    在这里插入图片描述

    输入张三

    在这里插入图片描述

    在计算的十六进制结果中,每两位前面加一个%,就可以获取到%E5%BC%A0%E4%B8%89。

    在Java中已经为开发者提供了编码和解码的API工具类可以让开发者更快速的进行编码和解码:

    举个栗子

    package com.dingjiaxing;
    
    import java.io.UnsupportedEncodingException;
    import java.net.URLDecoder;
    import java.net.URLEncoder;
    
    /**
     * ClassName: URLDemo
     * date: 2022/9/12 11:07
     *
     * @author DingJiaxiong
     */
    
    public class URLDemo {
        public static void main(String[] args) throws UnsupportedEncodingException {
            String username = "张三";
            //URL 编码
            String encode = URLEncoder.encode(username,"utf-8");
            System.out.println(encode);
    
            //URL 解码
            String decode1 = URLDecoder.decode(encode,"utf-8");
            //如果使用另一个编码进行解码
            String decode2 = URLDecoder.decode(encode,"ISO-8859-1");
    
            System.out.println(decode1);
            System.out.println(decode2);
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29

    运行结果

    在这里插入图片描述

    这样就找到了GET 请求中文参数出现乱码的原因了。

    • 浏览器把中文参数按照UTF-8进行URL编码
    • Tomcat对获取到的内容进行了ISO-8859-1的URL解码
    • 在控制台就会出现乱码å¼ ä¸‰(最后是个空格)

    [如何解决]

    在这里插入图片描述

    其实,在进行编码和解码的时候,不管使用的是哪个字符集,他们对应的%E5%BC%A0%E4%B8%89是一致的

    那么二进制也是一样的,为:

    1110 0101 1011 1100 1010 0000 1110 0100 1011 1000 1000 1001

    考虑把乱码内容转换成字节,再把字节转换成张三,在转换的过程中是它们的编码一致,就可以解决中文乱码问题。

    【实现】

    package com.dingjiaxing;
    
    import java.io.UnsupportedEncodingException;
    import java.net.URLDecoder;
    import java.net.URLEncoder;
    
    /**
     * ClassName: URLDemo
     * date: 2022/9/12 11:07
     *
     * @author DingJiaxiong
     */
    
    public class URLDemo {
        public static void main(String[] args) throws UnsupportedEncodingException {
            String username = "张三";
            //URL 编码
            String encode = URLEncoder.encode(username,"utf-8");
            System.out.println(encode);
    
            //如果使用另一个编码进行解码
            String decode = URLDecoder.decode(encode,"ISO-8859-1");
    
            System.out.println(decode); // 现在这里肯定就是å¼ ä¸‰ 个乱码
    
            //转换为字节数据,编码
            byte[] bytes = decode.getBytes("ISO-8859-1");
            for (byte b : bytes){
                System.out.print(b + " ");
            }
    
            //此处打印的是:-27 -68 -96 -28 -72 -119
            System.out.println();
            //最后将字节数组转为字符串,解码
            String s =  new String(bytes,"utf-8");
            System.out.println(s); //张三
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38

    运行结果

    在这里插入图片描述

    【分析完毕,在Servlet 代码中解决GET 请求乱码问题】

    package com.dingjiaxing.web;
    
    import javax.servlet.ServletException;
    import javax.servlet.annotation.WebServlet;
    import javax.servlet.http.HttpServlet;
    import javax.servlet.http.HttpServletRequest;
    import javax.servlet.http.HttpServletResponse;
    import java.io.BufferedReader;
    import java.io.IOException;
    import java.nio.charset.StandardCharsets;
    import java.util.Map;
    
    /**
     * ClassName: RequestDemo1
     * date: 2022/9/12 9:28
     *
     * @author DingJiaxiong
     */
    
    @WebServlet("/req2")
    public class RequestDemo1 extends HttpServlet {
        @Override
        protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
            //获取username
            String username = req.getParameter("username");
            System.out.println("解决乱码前 : " + username);
    
            username = new String(username.getBytes(StandardCharsets.ISO_8859_1),StandardCharsets.UTF_8);
    
            System.out.println("解决乱码后 : " + username);
        }
    
        @Override
        protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
            this.doGet(req,resp);
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37

    运行结果

    在这里插入图片描述

    把request.setCharacterEncoding(“UTF-8”)代码注释掉后,会发现GET请求参数乱码解决方案同时也可也把POST请求参数乱码的问题也解决了
    只不过对于POST请求参数一般都会比较多,采用这种方式解决乱码起来比较麻烦,所以对于POST请求还是建议使用设置编码的方式进行。

    另外:

    Tomcat8.0之后,已将GET请求乱码问题解决,设置默认的解码方式为UTF-8

    【小结】

    • 中文乱码解决方案

      POST请求和GET请求的参数中如果有中文,后台接收数据就会出现中文乱码问题,GET请求在Tomcat8.0以后的版本就不会出现了

      POST请求解决方案是:设置输入流的编码

      request.setCharacterEncoding("UTF-8");
      注意:设置的字符集要和页面保持一致
      
      • 1
      • 2

      通用方式(GET/POST):先解码,再编码

      new String(username.getBytes("ISO-8859-1"),"UTF-8");
      
      • 1
    • URL 编码实现方式

      编码:

      URLEncoder.encode(str,"UTF-8");
      
      • 1

      解码:

      URLDecoder.decode(s,"ISO-8859-1");
      
      • 1
  • 相关阅读:
    Ubuntu 22.04 更换内地源
    河北工业大学嵌入式系统知识点总结二
    【紫光同创国产FPGA教程】——【PGL22G第九章】HDMI环路实验例程
    【技术积累】算法中的基本概念【一】
    【无标题】
    HashMap 的哈希函数
    RPA是什么?怎么成为RPA高手?
    input控件的maxlength属性
    【无标题】
    Python 中的 with 语句用法和 Pytorch 中的 with torch.no_grad() 解析
  • 原文地址:https://blog.csdn.net/weixin_44226181/article/details/127131498