本次爬取的目标数据来源于天气网,数据所在的页面如下图所示,本次任务较为简单,按照正常操作流程操作即可,即抓包分析数据接口,发送请求获取数据,解析数据并持久化存储。发送请求使用requests库,解析数据使用lxml+xpath:
import requests from lxml import etree from xpinyin import Pinyin p = Pinyin() result1 = p.get_pinyin('北京'<
京公网安备 11010502049817号