• Python爬虫之Requests库


    Requests库可以获取网页源码

    requests-网络爬虫-CSDNPython入门技能树

    Get方法

    1. import requests
    2. html=requests.get("http://www.baidu.com") #获取到Response对象
    3. html_bytes=html.content #获取到bytes型网页的源代码
    4. html_str=html_bytes.decode()#获取到字符串型网页的源代码
    5. print(html_str)
    1. import requests
    2. html_str=requests.get("http://www.baidu.com").content.decode()
    3. print(html_str)

    如果不是utf-8编码格式,就需要解码

    html_str=requests.get("http://www.baidu.com").content.decode('GBK')

    get方法有很多参数

    • url:请求地址;
    • params:要发送的查询字符串,可以为字典,列表,元组,字节;
    • data:body 对象中要传递的参数,可以为字段,列表,元组,字节或者文件对象
    • json:JSON 序列化对象;
    • headers:请求头,字典格式;
    • cookies:传递 cookie,字段或 CookieJar 类型;
    • files:最复杂的一个参数,一般出现在 POST 请求中,格式举例 "name":文件对象 或者 {'name':文件对象},还可以在一个请求中发送多个文件,不过一般爬虫场景不会用到;
    • auth:指定身份验证机制;
    • timeout:服务器等待响应时间,在源码中检索到可以为元组类型,这个之前没有使用过,即 (connect timeout, read timeout)
    • allow_redirects:是否允许重定向;
    • proxies:代理;
    • verify:SSL 验证;
    • stream:流式请求,主要对接流式 API;
    • cert:证书。

     

    响应对象

    get方法返回的是一个响应对象,它有一些属性

    • ok:只要状态码 status_code 小于 400,都会返回 True;
    • is_redirect:重定向属性;
    • content:响应内容,字节类型;
    • text:响应内容,Unicode 类型;
    • status_code:响应状态码;
    • url:响应的最终 URL 位置;
    • encoding:当访问 r.text 时的编码;
    • json():将响应结果序列化为 JSON;

     

    POST方法

    1. import requests
    2. def get_response(url, data, headers=None):
    3. result=requests.post(url=url,data=data,headers=headers).text
    4. return result
    5. if __name__ == '__main__':
    6. headers = {
    7. "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36"
    8. }
    9. data = {
    10. "key1": "value1",
    11. "key2": "value2"
    12. }
    13. url = "http://httpbin.org/post"
    14. html = get_response(url, data, headers)
    15. print(html)

     

     

  • 相关阅读:
    C++模板
    JAVA Stream流
    14 C++ 二叉树创建 1 头文件 The binary tree creates1 header file
    非递归算法——快速排序、归并排序
    【优化求解】整数规划求解机票超售优化赔付问题【含Matlab源码 2182期】
    【MongoDB 新搭档 Kafka】
    2023腾讯云标准型S5云服务器简单测评,比较值!
    接口请求断言
    thsi指针用法总结
    Unity(Android)——实现手机摇杆和自由移动
  • 原文地址:https://blog.csdn.net/seanyang_/article/details/126911940