【Python学习】Day-025 爬虫、requests基本用法

【Python学习】Day-025 爬虫、requests基本用法
文章目录
- 1. 爬虫介绍
  2. requests
  2.1 什么是requests
  2.2 requests基本用法
1. 爬虫介绍

爬虫用来获取网络数据(公开的数据)
爬虫的基本流程
- 第一步：获取网络数据(requests、selenium)
- 第二步：解析数据-从获取到的网络数据中提取有效数据（正则、bs4、lxml）
- 第三步：保存数据(csv、excel、数据等)
2. requests

2.1 什么是requests
- Python中获取网络数据的第三方库(基于http或者https协议的网络请求)
- 爬虫使用requests的两个场景：直接请求网页地址、对提供网页数据的数据接口发送请求
2.2 requests基本用法

对目标网页直接发送请求:
requests.get(网页地址) - 获取指定页面的数据返回一个响应对象
```
import requests
response = requests.get('https://cd.zu.ke.com/zufang')
print(response)

# 获取响应的状态码
print(response.status_code)

# 获取响应头
print(response.headers)

# 请求内容（返回的真正有用的数据）
"""
response.content        -       二进制类型的数据(图片、视频、音频等， 例如：图片下载)
response.text           -       字符串类型的数据(网页)
response.json()         -       对请求内容做完json解析后的数据（json数据接口）
"""
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
```
相关阅读:
Flowable-6.7.2：一个简单流程分析
 备战数学建模2——MATLAB导入数据，处理缺失值
 C#中引用类型的变量做为参数在方法调用时加不加 ref 关键字的不同之处
 【优化模型】求无约束多元函数最小值
 springboot依赖管理
 Java输入输出、常见场景解决方案、文件夹操作
 Linux ARM平台开发系列讲解（摄像头V4L2子系统） 2.12.7 摄像头V4L2驱动开发流程总结
 NumPy 数组复制与视图详解
 多核调度算法 - 加速因子 - 本质理解
 DetCLIP
原文地址：https://blog.csdn.net/ChenAi_140/article/details/126353398

文章目录

1. 爬虫介绍

2. requests

2.1 什么是requests

2.2 requests基本用法