引入模块
from lxml import etree
1)树:
2)节点:树结构中的每一个元素(标签)就是一个节点
3)根节点(根元素):html或者xml最外面的那个标签(元素)
4)节点内容:标签内容
5)节点属性:标签属性
xml和json一样,是一种通过的数据格式(绝大部分编程语言都支持的数据格式)
xml是通过标签(元素)的标签内容和标签属性来保存数据的。
注:先保存一个文件名为data.html的超市信息(模拟网页))
<supermarket name="永辉超市" address="肖家河大厦">
<staffs>
<staff id="s001">
<name>小明name>
<position>收营员position>
<salary>4000salary>
staff>
<staff id="s002">
<name>小花name>
<position>促销员position>
<salary>3500salary>
staff>
<staff id="s003">
<name>张三name>
<position>保洁position>
<salary>3000salary>
staff>
<staff id="s004">
<name>李四name>
<position>收营员position>
<salary>4000salary>
staff>
<staff id="s005">
<name>王五name>
<position>售货员position>
<salary>3800salary>
staff>
staffs>
<goodsList>
<goods discount="0.9">
<name>泡面name>
<price<