• XML DTD 初学


    一、前言

    文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。

    DTD 可被成行地声明于 XML 文档中,也可作为一个外部引用。

    二、简介

    1、内部的 DOCTYPE 声明

    假如 DTD 被包含在您的 XML 源文件中,它应当通过下面的语法包装在一个 DOCTYPE 声明中:

     
    

    带有 DTD 的 XML 文档实例(请在 IE5 以及更高的版本打开,并选择查看源代码):

    
    
      
      
      
      
    ]>
    
      George
      John
      Reminder
      Don't forget the meeting!
    

    2、外部文档声明

    假如 DTD 位于 XML 源文件的外部,那么它应通过下面的语法被封装在一个 DOCTYPE 定义中:

     
    

    这个 XML 文档和上面的 XML 文档相同,但是拥有一个外部的 DTD: (在 IE5 中打开,并选择“查看源代码”命令。)

    
    
    
    George
    John
    Reminder
    Don't forget the meeting!
     

    这是包含 DTD 的 "note.dtd" 文件:

    
    
    
    
    

    3、为什么使用 DTD?

    通过 DTD,您的每一个 XML 文件均可携带一个有关其自身格式的描述。

    通过 DTD,独立的团体可一致地使用某个标准的 DTD 来交换数据。

    而您的应用程序也可使用某个标准的 DTD 来验证从外部接收到的数据。

    您还可以使用 DTD 来验证您自身的数据。

    三、DTD - XML构建模块

    XML 以及 HTML 文档的主要构建模块是类似 .... 这样的标签。

    1、XML 文档构建模块

    所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:

    • 元素
    • 属性
    • 实体
    • PCDATA
    • CDATA

    下面是每个构建模块的简要描述。

    2、元素

    元素是 XML 以及 HTML 文档的主要构建模块

    HTML 元素的例子是 "body" 和 "table"。XML 元素的例子是 "note" 和 "message" 。元素可包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。

    实例:

    body text in between
    some message in between

    3、属性

    属性可提供有关元素的额外信息

    属性总是被置于某元素的开始标签中。属性总是以名称/值的形式成对出现的。下面的 "img" 元素拥有关于源文件的额外信息:

    元素的名称是 "img"。属性的名称是 "src"。属性的值是 "computer.gif"。由于元素本身为空,它被一个 " /" 关闭。

    4、实体

    实体是用来定义普通文本的变量。实体引用是对实体的引用。

    大多数同学都了解这个 HTML 实体引用:" "。这个“无折行空格”实体在 HTML 中被用于在某个文档中插入一个额外的空格。

    当文档被 XML 解析器解析时,实体就会被展开。

    下面的实体在 XML 中被预定义:

    实体引用字符
    <<
    >>
    &&
    ""
    ''

    PCDATA

    PCDATA 的意思是被解析的字符数据(parsed character data)。

    可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。

    PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。

    文本中的标签会被当作标记来处理,而实体会被展开。

    不过,被解析的字符数据不应当包含任何 &、< 或者 > 字符;需要使用 &、< 以及 > 实体来分别替换它们。

    CDATA

    CDATA 的意思是字符数据(character data)。

    CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。

    四、元素

    在一个 DTD 中,元素通过元素声明来进行声明。

    1、声明一个元素

    在 DTD 中,XML 元素通过元素声明来进行声明。元素声明使用下面的语法:

    或者

    2、空元素

    空元素通过类别关键词EMPTY进行声明:

    例子:

    XML例子:


    3、只有 PCDATA 的元素

    只有 PCDATA 的元素通过圆括号中的 #PCDATA 进行声明:

    例子:

    4、带有任何内容的元素

    通过类别关键词 ANY 声明的元素,可包含任何可解析数据的组合:

    例子:

    5、带有子元素(序列)的元素

    带有一个或多个子元素的元素通过圆括号中的子元素名进行声明:

    或者

    例子:

    当子元素按照由逗号分隔开的序列进行声明时,这些子元素必须按照相同的顺序出现在文档中。在一个完整的声明中,子元素也必须被声明,同时子元素也可拥有子元素。"note" 元素的完整声明是:

    
    
    
    
    

    6、声明只出现一次的元素

    例子:

    上面的例子声明了:message 子元素必须出现一次,并且必须只在 "note" 元素中出现一次。

    7、声明最少出现一次的元素

    例子:

    上面的例子中的加号声明了:message 子元素必须在 "note" 元素内出现至少一次。

    8、声明出现零次或多次的元素

    例子:

    上面的例子中的星号声明了:子元素 message 可在 "note" 元素内出现零次或多次。

    9、声明出现零次或一次的元素

    例子:

    上面的例子中的问号声明了:子元素 message 可在 "note" 元素内出现零次或一次。

    10、声明“非.../既...”类型的内容

    例子:

    上面的例子声明了:"note" 元素必须包含 "to" 元素、"from" 元素、"header" 元素,以及非 "message" 元素既 "body" 元素。

    11、声明混合型的内容

    例子:

    上面的例子声明了:"note" 元素可包含出现零次或多次的 PCDATA、"to"、"from"、"header" 或者 "message"。

    五、属性

    在 DTD 中,属性通过 ATTLIST 声明来进行声明。

    1、声明属性

    属性声明使用下列语法:

    DTD 实例:

    XML 实例:

    以下是属性类型的选项:

    类型描述
    CDATA值为字符数据 (character data)
    (en1|en2|..)此值是枚举列表中的一个值
    ID值为唯一的 id
    IDREF值为另外一个元素的 id
    IDREFS值为其他 id 的列表
    NMTOKEN值为合法的 XML 名称
    NMTOKENS值为合法的 XML 名称的列表
    ENTITY值是一个实体
    ENTITIES值是一个实体列表
    NOTATION此值是符号的名称
    xml:值是一个预定义的 XML 值

    默认值参数可使用下列值:

    解释
    属性的默认值
    #REQUIRED属性值是必需的
    #IMPLIED属性不是必需的
    #FIXED value属性值是固定的

    2、规定一个默认的属性值

    DTD:

    
    

    合法的 XML:

    在上面的例子中,"square" 被定义为带有 CDATA 类型的 "width" 属性的空元素。如果宽度没有被设定,其默认值为0 。

    3、#IMPLIED

    语法

    例子

    DTD:

    合法的 XML:

    合法的 XML:

    假如您不希望强制作者包含属性,并且您没有默认值选项的话,请使用关键词 #IMPLIED。

    4、#REQUIRED

    语法

    例子

    DTD:

    合法的 XML:

    非法的 XML:

    假如您没有默认值选项,但是仍然希望强制作者提交属性的话,请使用关键词 #REQUIRED。

    5、#FIXED

    语法

    例子

    DTD:

    合法的 XML:

    非法的 XML:

    如果您希望属性拥有固定的值,并不允许作者改变这个值,请使用 #FIXED 关键词。如果作者使用了不同的值,XML 解析器会返回错误。

    6、列举属性值

    语法:

    DTD 例子:

    XML 例子:

    或者

    如果您希望属性值为一系列固定的合法值之一,请使用列举属性值。

    六、DTD 实体

    实体是用于定义引用普通文本或特殊字符的快捷方式的变量。

    实体引用是对实体的引用。

    实体可在内部或外部进行声明。

    1、一个内部实体声明

    语法:

    例子:

    DTD 例子:

    
    

    XML 例子:

    &writer;©right;

    注释: 一个实体由三部分构成: 一个和号 (&), 一个实体名称, 以及一个分号 (;)。

    2、一个外部实体声明

    语法:

    例子:

    DTD 例子:

    
    

    XML 例子:

    &writer;©right;

    七、DTD 验证

    1、通过 XML 解析器进行验证

    当您试图打开某个 XML 文档时,XML 解析器有可能会产生错误。通过访问 parseError 对象,就可以取回引起错误的确切代码、文本甚至所在的行。

    注释:load( ) 方法用于文件,而 loadXML( ) 方法用于字符串。

    var xmlDoc = new ActiveXObject("Microsoft.XMLDOM")
    xmlDoc.async="false"
    xmlDoc.validateOnParse="true"
    xmlDoc.load("note_dtd_error.xml")
    
    document.write("
    Error Code: ") document.write(xmlDoc.parseError.errorCode) document.write("
    Error Reason: ") document.write(xmlDoc.parseError.reason) document.write("
    Error Line: ") document.write(xmlDoc.parseError.line)

    Try it Yourself 或者 仅仅看一下这个 XML 文件

    2、关闭验证

    通过把 XML 解析器的 validateOnParse 设置为 "false",就可以关闭验证。

    var xmlDoc = new ActiveXObject("Microsoft.XMLDOM")
    xmlDoc.async="false"
    xmlDoc.validateOnParse="false"
    xmlDoc.load("note_dtd_error.xml")
    
    document.write("
    Error Code: ") document.write(xmlDoc.parseError.errorCode) document.write("
    Error Reason: ") document.write(xmlDoc.parseError.reason) document.write("
    Error Line: ") document.write(xmlDoc.parseError.line)

    Try it Yourself

    3、通用的 XML 验证器

    为了帮助您验证 XML 文件,我们创建了此链接,这样你就可以验证任何 XML 文件了。

    parseError 对象

    您可以在我们的《XML DOM 教程》中阅读更多有关 parseError 对象的信息。

    八、DTD - 来自网络的实例

    1、电视节目表 DTD

    由 David Moisan 创造。拷贝自:David Moisan's Web Site

    
    
    
    
    
    
    
    
     
    
    
    
    
    
    
    
    
    ]>

    2、报纸文章 DTD

    拷贝自:Vervet Logic

    
    
    
    
    
    
     
    
    
    
    
    
    
    
    
    
    
    ]>

    3、产品目录 DTD

    拷贝自:Vervet Logic

    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    
    ]>
  • 相关阅读:
    【网络编程】基于TCP的服务器端/客户端
    export default 与export 有什么区别?
    rosbag遍历数据出错:(unicode error) 'utf-8' codec can't decode byte 0xcd in position 31: invalid continuation byte
    【每日一题】分割数组
    重构优化第三方查询接口返回大数据量的分页问题
    猿创征文|最长回文子串-力扣
    SpringBoot 整合WebService
    【编程之路】面试必刷TOP101:动态规划(67-71,Python实现)
    MapReduce基础
    论文阅读 Exploring Temporal Information for Dynamic Network Embedding
  • 原文地址:https://blog.csdn.net/weixin_42646630/article/details/126537793