• 学习-Java输入输出之Reader类之字符数据输入


    任务描述

    本关任务:使用字符输入流读取给定路径中的文件数据。

    相关知识

    在学习字符数据输入 Reader 类之前,我们先来了解一下什么是字符。

    什么是字符

    我们想象一下,给你一串二进制码(如 1010),要你来分辨它是什么含义,是代表数字还是字母还是汉字,你能有效的分辨吗?

    显然不能,一般来说,我们是比较难以理解一串二进制码代表的含义的,而且一串二进制码是代表什么含义也无法很直观的表示出来。

    我们比较好识别的是文字、字母和符号。

    所以就有了字符,字符是指计算机中使用的文字和符号,比如1、2、3、A、B、C、~!·#¥%……—*()——+、等等。

    字符在计算机中可以看做:字节+编码表。什么意思呢?

    我们知道,计算机是只识别二进制的,但是我们日常操作电脑,需要输入文字,字母,数字这些,我们不可能先去记住一串二进制数字,比如说 A 这个字母的二进制是什么,因为这样太麻烦,也记不住,所以编码表就诞生了,编码表的作用就是在我们进行输入的时候,将我们输入的字符转换成计算机能识别的二进制,在我们阅读数据的时候,将二进制转换成我们人能识别的文字、字母和数字。

    最先普及就是如下图 1 的 ASCLL 码表,ASCLL 码表是美国信息交换标准代码,是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。

    看到这你肯定会有疑问,这 ASCLL 码表只有英语和西欧语呀,那汉语呢,其他语言呢?

    是的,自从 ASCLL 码表推出之后,很多国家也都推出了本国语言的编码表。像中国就有 GB2312 和 GBK 等等。

    现在我们一起设想一个场景,当我们编辑一个文本文件,输入了很多字符,这些字符都用 ASCLL 码表编码,然后我们查看这个文本文件的时候,是使用的 GBK 码表解码,会出现什么问题吗?

    相信你已经有答案了,这会出现软件开发中非常常见的问题:乱码

    当我们对字节进行编码的时候使用的是一种编码表,而解码的时候使用的是另一种编码表的时候,就会出现乱码的问题了,是因为每一个编码表,它的字符对应二进制的字节是不一致的。

    但是互联网是一个互联互通的平台,所以如果每个国家都使用自己的一套编码器,就会出现许多问题。

    在 1992 年的时候,推出了 UTF-8 编码规范,是一种针对 Unicode 的可变长度字符编码,又称万国码,UTF-8 用 1 到 6 个字节编码 Unicode 字符。用在网页上可以统一页面显示中文简体繁体及其它语言(如英文,日文,韩文)。它也是我们目前在应用开发中使用的最多的编码格式。

    Reader 类(字符输入流)

    Reader 类是 Java 的 IO 库提供的另一个输入流接口。它和 InputStream 类的区别是,InputStream 类是一个字节流,即以 byte 为单位读取,而 Reader 是一个字符流,即以 char 为单位读取。

    Reader 类是所有字符输入流的超类,它最重要的方法是 read() 方法,这个方法读取字符流的下一个字符,并返回字符表示的 int 值,范围是 0~65535。如果已读到末尾,返回 -1。

    常用子类

    以下表中列出了 Reader 类的常用子类。

    子类名子类说明
    FileReader() 类实现了文件字符流输入,使用时需要指定编码
    CharArrayReader()类把一个 char[] 数组变成一个字符输入流
    StringReader()类把字符串变成一个字符输入流

    和 InputStream 类类似,Reader 类也是一种资源,需要保证出错的时候也能正确关闭,所以我们需要用 try (resource) 来保证 Reader 类在无论有没有 IO 错误的时候都能够正确地关闭。

    我们以 FileReader() 类为例,演示如何完整地读取一个 FileReader 的所有字符:

     
    
    1. public static void main(String[] args) throws IOException{
    2. // 创建一个FileReader对象:
    3. Reader reader = new FileReader("/test/a.txt");
    4. for (;;) {
    5. // 反复调用read()方法,直到返回-1
    6. int n = reader.read();
    7. if (n == -1) {
    8. break;
    9. }
    10. // 打印读取到的数据
    11. System.out.print((char)n);
    12. }
    13. // 关闭流
    14. reader.close();
    15. }

    已知/test目录下的a.txt文件中的内容为一个 hello 字符串。 以上程序执行结果为:

     
    
    1. hello

    和 InputStream 一样,Reader 也是一种资源,需要保证出错的时候也能正确关闭,所以我们需要用 try (resource) 来保证 Reader 在无论有没有 IO 错误的时候都能够正确地关闭:

     
    
    1. try (Reader reader = new FileReader("/test/a.txt") {
    2. }

    Reader 还提供了一次性读取若干字符并填充到 char[] 数组的方法 read(char[] c),它返回实际读入的字符个数,最大不超过 char[] 数组的长度。返回 -1 表示流结束。利用这个方法,我们可以先设置一个缓冲区,然后,每次尽可能地填充缓冲区:

     
    
    1. public static void main(String[] args) throws IOException {
    2. // 创建 FileReader 对象
    3. try (Reader reader = new FileReader("/test/a.txt")) {
    4. // 创建缓存字符数组
    5. char[] buffer = new char[100];
    6. int n;
    7. // 打印字符个数
    8. while ((n = reader.read(buffer)) != -1) {
    9. System.out.print("读到" + n + "个字符");
    10. }
    11. }
    12. }

    已知/test目录下的a.txt文件中的内容为一个 hello 字符串。 以上程序执行结果为:

    1. 读到5个字符

      1. import java.io.*;
      2. import java.util.Scanner;
      3. public class FileTest {
      4. public static void main(String[] args) throws IOException {
      5. // 请在Begin-End间编写完整代码
      6. /********** Begin **********/
      7. // 定义变量
      8. int len;
      9. // 接收给定字符串
      10. Scanner input = new Scanner(System.in);
      11. String str = input.next();
      12. // 创建Reader对象
      13. Reader reader = new FileReader(str);
      14. // 打印字符
      15. for (;;){
      16. len = reader.read();
      17. if (len == -1){
      18. break;
      19. }
      20. System.out.print((char)len);
      21. }
      22. reader.close();
      23. /********** End **********/
      24. }
      25. }

  • 相关阅读:
    极速进化,光速转录,C++版本人工智能实时语音转文字(字幕/语音识别)Whisper.cpp实践
    Tomcat 日志乱码问题解决
    Towards Interpretable Video Anomaly Detection 论文阅读
    C# 常用功能整合-3
    【Python】【技能树评测】技巧实例-说明改进和实践【04】访问限制
    记录“在Unity动画播放协程内等待动画播放完成时回调”遇到的坑
    elementui中form表单的重置方法resetFields,resetFields不生效
    Linux安装MongoDB超详细
    基于java的学生考勤信息管理系统设计【附源码】
    HTML表格标签
  • 原文地址:https://blog.csdn.net/weixin_46075438/article/details/128074257