• Python操作XML文件



    活动地址:CSDN21天学习挑战赛

    1. XML概念

    XML:可扩展标记语言 (Extensible Markup Language, XML) ,标准通用标记语言的子集,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 XML是标准通用标记语言 可扩展性良好,内容与形式分离,遵循严格的语法要求,保值性良好等优点.

    1.1 概念

    • 可扩展标记语言 可扩展:标签都是自定义的。

      (html 标签都系统是规定好的,每个标签都有不一样的含义;xml 标签没有一个是规定好的都是自定义的标签。只要符合命名规则。 )

    1.2 xml 功能

    • 存储数据

      1.配置文件

      2.在网络中传输

    1.3 xml 与 html 区别

    1. xm1标签都是自定义的,html 标签是预定义。
    2. xml的语法严格, html 语法松散
    3. xml是存储数据的,html是展示数据

    1.4 w3c:万维网联盟

    xml 与 html 是 两兄弟他们的父亲是 w3c(万维网联盟)
    早期只有html 没有xml 。早期html很火,语法简单,大部分浏览器都支持html,后来浏览器之间的竞争
    w3C后来规范出了xml. 
    xml与html竞争郁郁寡欢,之后xml与properties竞争
    
    • 1
    • 2
    • 3
    • 4
    # properties
    name=zhangsan
    age=23
    gender=nan
    
    name=lisi
    age=24
    gender=nv
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    # xml  阅读性高,不在是展示数据,而是存储数据
    <user id="1">
        <name>zhangsanname>
        <age>23age>
    user>
    
    <user id="2">
        <name>lisiname>
        <age>25age>
    user>
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    2. XML 语法

    2.1 基本语法

    1. xml文档的后缀名. xml
    2. xml第一行必须定义为文档声明
    3. xml文档中有且仅有一个根标签
    4. 属性值必须使用引号(单双都可)引起来
    5. 标签必须正确关闭
    6. xml 标签名称区分大小写

    2.2 快速入门

    
    <users>
        <user id="1">
            <name>zhangsanname>
            <age>23age>
        user>
    
        <user id="2">
            <name>lisiname>
            <age>25age>
        user>
    users>
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    检查写的有没有问题,写完文件可以直接拖到浏览器中,不报错说明格式没问题

    在这里插入图片描述

    2.3 组成部分

    1.文档声明
    2.指令
    3.标签
    4.属性
    5.文本

    1.文档声明
       1.格式:
       2.属性列表
          *version: 版本号,必须的属性
          *encoding :编码方式。告知解析引擎当前文档使用的字符集,默认值: IS0- 8859-1
          *standalone:是否独立
              *取值:
                  * yes: 不依赖其他文件
                  * no: 依赖其他文件
              
    2.指令(了解):结合css的
       < ?xml- stylesheet type= "text/css“  href="a.css'?>
    3.标签
       规则:
       *名称可以包含字母、数字以及其他的字符
       *名称不能以数字或者标点符号开始
       *名称不能以字母xml (或者XML、Xml等等)开始
       *名称不能包含空格
    4.属性
       id属性是唯一的
    5.文本
       CDATA区 :在该区域中的数据会被原样展示
           格式: 
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23

    3.XML 约束

    3.1 XML约束

    约束:规定xml文档的书写规则
    *作为框架的使用者(程序员) :
    1.能够在xm1中引入约束文档
    2.能够简单的读懂约束文档

    在这里插入图片描述

    3.2

    *分类:

    1. DTD:一种简单的约束技术

    2. Schema: -种复杂的约束技术

    *DTD:
    *引入dtd文档到xml文档中
    *内部dtd :将约束规则定义在xml文档中
    *外部dtd :将约束的规则定义在外部的dtd文件中
    *本地:
    *网络:

    4. XML 解析

    未完待续

  • 相关阅读:
    项目集锦 | 易基因近期m6A甲基化(MeRIP-seq)研究成果
    java基于ssm+vue+elementui的足球联赛会报名系统
    【代码随想录】算法训练营 第三天 第二章 链表 Part 1
    04_BFC
    LeetCode104. 二叉树的最大深度和N叉树的最大深度
    攻防世界pwn题:forgot
    【AIGC调研系列】Claude 3 Haiku 最快且最具成本效益
    阿里开源中间件一览
    论文阅读:Generative Adversarial Transformers
    聊天机器人框架Rasa资源整理
  • 原文地址:https://blog.csdn.net/u014096024/article/details/126182912