使用前需安装lxml库,打开CMD管理员命令,输入
pip install lxml
- from lxml import etree
-
- html = '''
- '''
-
- # 将HTML字符串转换为Element对象
- root = etree.HTML(html)
-
- # 使用XPATH获取文本内容
- text = root.xpath('//div[@id="timucontent"]/h2/text()')[0]
- print(text) # 输出:这是一段文本内容
-
- # 使用XPATH获取选项文本
- sl_text = root.xpath('//label')
- for p in sl_text:
- print(p.text)
-
- # 输出:这是一个选项