• \ufeff 这是个什么


    在你的CSV文件中,可能包含了一个隐藏的字节序标记(Byte Order Mark,BOM),这是一个Unicode字符(\ufeff),通常出现在文件的开头,用于指示文件的编码方式。这个字符在文件中是不可见的,但会影响文件的处理,尤其是在读取文件的头部时。

    BOM通常出现在UTF-8编码的文件中,具体是 \ufeff,这个字符可能会影响列名的读取,导致列名匹配失败。

    解决方法:

    1. 去除BOM:在读取文件时,去除BOM字符。你可以在读取CSV文件时检查并去除BOM字符。
    2. 预处理文件:在上传之前,使用文本编辑器或者编程方式去除BOM字符。

    以下是一些示例代码,展示如何在Java中去除BOM字符:

    方法1:在读取文件时去除BOM

    CsvFileUtil.readTop2List 方法中,检查并去除BOM字符。

    public static List<List<String>> readTop2List(InputStream inputStream) {
        BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream, StandardCharsets.UTF_8));
        List<List<String>> result = new ArrayList<>();
        try {
            String line;
            boolean isFirstLine = true;
            while ((line = reader.readLine()) != null && result.size() < 2) {
                if (isFirstLine) {
                    line = removeBom(line);
                    isFirstLine = false;
                }
                result.add(Arrays.asList(line.split(",")));
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        return result;
    }
    
    private static String removeBom(String line) {
        if (line.startsWith("\ufeff")) {
            return line.substring(1);
        }
        return line;
    }
    
    方法2:上传之前去除BOM

    如果你在本地处理文件,可以使用编程方式去除BOM字符,然后再上传。

    import java.nio.file.Files;
    import java.nio.file.Paths;
    import java.nio.charset.StandardCharsets;
    
    public class RemoveBom {
        public static void main(String[] args) throws Exception {
            byte[] bytes = Files.readAllBytes(Paths.get("path/to/your/file.csv"));
            String content = new String(bytes, StandardCharsets.UTF_8);
            if (content.startsWith("\ufeff")) {
                content = content.substring(1);
            }
            Files.write(Paths.get("path/to/your/file_without_bom.csv"), content.getBytes(StandardCharsets.UTF_8));
        }
    }
    

    检查BOM字符

    你可以检查你的CSV文件是否包含BOM字符。使用文本编辑器(如Notepad++、VS Code)打开文件,并选择查看文件的编码方式。如果是带BOM的UTF-8,可以转换为不带BOM的UTF-8格式。

    通过以上方法,你可以解决因BOM字符导致的列名匹配问题。

  • 相关阅读:
    上传和下载文件
    工作9年,1次转行,4次跳槽:拒绝被「稳定性」绑架
    SpringCloud阿里云实现OSS
    【SpringBoot系列】Arthas配合docker轻松实现线上热更新
    Linux学习系列--如何在Linux中进行文件的管理
    SparkCore编程RDD
    WebSocket—STOMP详解(官方原版)
    win10系统访问我的电脑&win10打开命令行
    海贝造音强势登陆深圳 助力本土原创音乐升阶
    国产小体积超低成本电动车仪表智能刷卡解锁13.56M非接触式读写芯片CI522兼容替代RC522
  • 原文地址:https://blog.csdn.net/sunyuhua_keyboard/article/details/139505473