• Jsoup解析XML文件


    1.方法介绍

    DOM树方式:

            操作为:获取Document对象,获取对应的标签Element对象,获取数据

    代码为:

    1. String path = JsoupDemo.class.getClassLoader().getResource("studnet.xml").getPath();
    2. //获取xml文件路径
    3. Document document = Jsoup.parse(new File(path), "utf-8");
    4. 解析文件并加载至内存中获取DOM树
    5. Elements elements = document.getElementsByTag("name");
    6. //获取元素对象 Element
    7. System.out.println(elements.size());
    8. Element element = elements.get(0);
    9. //获取第一个name的Element对象
    10. String name = element.text();
    11. //获取数据
    12. System.out.println(name);

    快捷查询方式:
            通过Xpath确定文档中所需位置,遍历获取所需信息

    代码为:

    1. String path = JsoupDemo6.class.getClassLoader().getResource("student.xml").getPath();
    2. //获取student.xml的path
    3. Document document = Jsoup.parse(new File(path), "utf-8");
    4. //获取Document对象
    5. JXDocument jxDocument = new JXDocument(document);
    6. //根据document对象,创建JXDocument对象
    7. //结合xpath语法查询
    8. //查询所有student标签
    9. List jxNodes = jxDocument.selN("//student");
    10. for (JXNode jxNode : jxNodes) {
    11. System.out.println(jxNode);
    12. }
    13. System.out.println("--------------------");
    14. //查询所有student标签下的name标签
    15. List jxNodes2 = jxDocument.selN("//student/name");
    16. for (JXNode jxNode : jxNodes2) {
    17. System.out.println(jxNode);
    18. }
    19. System.out.println("--------------------");
    20. //查询student标签下带有id属性的name标签
    21. List jxNodes3 = jxDocument.selN("//student/name[@id]");
    22. for (JXNode jxNode : jxNodes3) {
    23. System.out.println(jxNode);
    24. }
    25. System.out.println("--------------------");
    26. //查询student标签下带有id属性的name标签 并且id属性值为itcast
    27. List jxNodes4 = jxDocument.selN("//student/name[@id='itcast']");
    28. for (JXNode jxNode : jxNodes4) {
    29. System.out.println(jxNode);
    30. }

     

    2.解析时会出现的问题

    常见状况为:
    String path = JsoupDemo.class.getClassLoader().getResource("studnet.xml").getPath();

    编译器在该处报错,报错信息为:Exception in thread "main" java.lang.NullPointerException: Cannot invoke "java.net.URL.getPath()" because the return value of "java.lang.ClassLoader.getResource(String)" is null

    即提供的路径无法获取xml文件

    此时需要检查xml文件所在路径中是否包含空格,编译器在遇见空格时会将其转编成"%20",导致无法获取正确路径,出现编译失败的情况.对应方案为在getPath()前加上toURI方法,将空格转回来.

    若次上述方法无效则需查看项目类型,若项目类型为maven web则查看该句:

    String path=FileUtil.class.getClassLoader().getResource("resources/table.xml");

    尝试将"resources/"删除,原因是resources目录下存放的资源文件经过编译后直接放到了项目根目录下

    若依然无效:请查看xml文件名与获取路径处的文件名是否相同.

  • 相关阅读:
    基于ssm停车管理系统毕业设计-附源码171046
    Typescript学习
    STM32驱动4寸ST7796S LCD-TFT屏
    分销微信小程序介绍_分销小程序有什么作用呢
    【JVM故障问题排查心得】「内存诊断系列」JVM内存与Kubernetes中pod的内存、容器的内存不一致所引发的OOMKilled问题总结(下)
    SpringBoot+Vue项目篮球竞赛预约平台
    未解决的notebook问题
    初始Spring——Spring容器,IoC,DI
    7.堆内元组(HOT)和仅索引扫描
    java基于微信小程序的美食制作教程系统 uniapp 小程序
  • 原文地址:https://blog.csdn.net/galaxy_stella/article/details/126159031