本来今天想更一下CSbeacon上线多层的内网机器的,但是刚好今天是年后的第一节课,讲的是XXE的基础,那就来先盘一下基础!!
XXE全称是XML External Entity即xml外部实体注入攻击!其后果会导致用户读取服务器上的任意文件,RCE,探测内网端口,攻击内网网站,甚至会出现零元购的现象。那么既然都涉及到了XML,那就来讲一下XML吧
xml,可拓展标记语言,和html有一点相似,但是html旨在显示数据,而xml旨在传输和保存数据
XML的组成包括三个成分(成分似乎有点复杂)
光说肯定云里雾里,下面就来通过一个例子来展现这门语言的编写!!
老规矩,先给题目
首先先写一个XML的声明
其中的encoding可以省略,我就不省略了,
"1.0" encoding="UTF-8" ?>
其实一开始看的时候,你会觉得有点恐怖,但是不要慌,跟着我一步一步来!!😊😊😊
首先先确定你的对元素的根元素,这里很明显是成绩信息student,于是就可以写基本框架
student []>
接着首先你要确定你有几个元素,然后按照以下格式在上面的 [ ] 里面编写
student (根元素下一级对应的元素)>
于是就有
student (id,name,course,score)>
接着,分别对每一个元素进行限定了
- id (#PCDATA)>
- name (#PCDATA)>
- course (#PCDATA)>
- score (#PCDATA)>
所以整个DTD就已经呼之欲出了
- student[
- student (id,name,course,score)>
- id (#PCDATA)>
- name (#PCDATA)>
- course (#PCDATA)>
- score (#PCDATA)>
- ]>
在这里,顺便补充一点知识
在看到这个DTD之后,相信不少人就会说了,写这么多代码在同一页,看到眼睛都痛,有没有一种方法可以像c/c++那样直接include一个文件呢? 有!! 当然有!!!这么写就好
root-element SYSTEM "filename">
其中的file对应的如果在同一个路径下,就可以直接写filename,否则就要写绝对路劲或者../ ../../这种
所以上面的代码就可以优化成
student SYSTEM "note.dtd">
然后再相同的路径下新建一个note.dtd的文件,里面的内容可以如下
- student (id,name,course,score)>
- id (#PCDATA)>
- name (#PCDATA)>
- course (#PCDATA)>
- score (#PCDATA)>
对于元素的描述,我们有以下规定
----->这就是对元素的一般的描述 其中,有以下特性:
(1)EMPTY——表示该元素不能包含子元素和文本,但可以有属性。
(2)ANY——表示该元素可以包含任何在该DTD中定义的元素内容
(3)#PCDATA——可以包含任何字符数据,但是不能在其中包含任何子元素
补充:如果选择了#PCDATA的话,文本中的标签会被当作标记来处理,而实体会被展开
即在后面的文档内容中,不可以直接出现像< & 这种,而是需要写对应的 & < >这种
其中这里讲到了属性,那么什么是属性呢,比如有以下一串代码
<student id="1">张三student>
其中的id=1就是元素student对应得属性,而且id= 后面的值一定要双引号括起来!!!
其中对于一开始的代码,不知道大家还记不记得有这样的一行
student (id,name,course,score)>
可以概括为这样,根元素后面括号里面的都是根元素下出现的元素,并且对于这些元素
还有以上的这些的规则,所以如果代码这样改,那么意思就是?
student (id|dd,name+,course*,score?)>
在xml中,我们可以对属性进行一个声明,其格式如下:其中的元素名称与属性相对
其中对于属性的类型,有如下几种选择
1. CDATA 值为字符数据 (character data) ---->常用
2. (en1|en2|..) 此值是枚举列表中的一个值
3. ID 值为唯一的 id...
然后对于其默认值,也同样有以下几种选择
#REQUIRED 属性值是必需的
#IMPLIED 属性不是必需的
#FIXED value 属性值是固定的
补充,对于CDATA,是指的是不应由 XML 解析器进行解析的文本数据,即当我们想在文档中使用< & 这些的时候,我们可以这样写
- <元素>
- //这里的< &就不会被解析,就能成功显示了
- 元素>
对于c/c++,python这些语言来说,存在对变量赋值的操作,那么xml有没有呢??那肯定是有的
对于普通实体 ,又可以分为内部实体和外部实体!!
就是直接在DTD那里用这样的代码块来标识
"对应的值">
想要引用也很简单,只需要在对应的文档内容中加上&并且对应的名字以及一个; 即可
- <元素>&你取的变量名;元素>
- &你取的变量名 //这两种写法都可以
外部实体的话,对应的DTD的代码块就要发生改变
SYSTEM "URI">
但是引用的方法却是一样的
- <引用>&你取得名字;引用>
- &你取的名字
实体参数大部分都是为了给一般参数做铺垫,我来举个例子
- "1.0" encoding="UTF-8"?>
- root [
- param1 "">
- %param1;
- ]>
-
- <root>
- <test>[This is my site]&internal;test>
- root>
-
其中,这行代码的意思就是定义一个实体参数,当调用到实体参数之后,代码就会变成这样
- "1.0" encoding="UTF-8"?>
-
- root [
- param1 ""> #一个实体给另外一个实体赋值
- internal '123'>]>
-
- <root>
- <test>[This is my site] 123'test>
- root>
而且实体参数还不可以在文档内容中被调用,而且我用的edge浏览器还解析不成功,建议用win7
对于实体参数的外部调用,就是在的参数后面的加上SYSTEM,和普通的实体的外部调用差不多
上面补充了那么多,相信你们都快要忘了对应的题目内容了吧!! 没事我再贴一次
那于是就可以写了: 其中我这里是把id当成了一个属性去写,你也完全可以独立出来一个元素
- <score_information>
-
- <student id="1" >
- <name>张三name>
- <course>xmlcourse>
- <score>90score>
- student>
-
- <student id="2">
- <name>李四name>
- <course>htmlcourse>
- <score>80score>
- student>
-
- <student id="3" >
- <name>王五name>
- <course>jscourse>
- <score>80score>
- student>
-
- score_information>
- "1.0" encoding="UTF-8" ?>
- student[
- student (name,course,score)>
- name (#PCDATA)>
- course (#PCDATA)>
- score (#PCDATA)>
- ]>
-
- <score_information>
-
- <student id="1">
- <name>张三name>
- <course>xmlcourse>
- <score>90score>
- student>
-
- <student id="2">
- <name>李四name>
- <course>htmlcourse>
- <score>80score>
- student>
-
- <student id="3" >
- <name>王五name>
- <course>jscourse>
- <score>80score>
- student>
-
- score_information>
就有如下代码,其中
- "1" encoding="UTF-8" ?>
-
- <newspaper>
- <article author="">
- <headline>headline>
- <byline>byline>
- <lead>lead>
- <body>body>
- <notes>notes>
- article>
- newspaper>