码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 爬虫之selenium


    目录

    selenium介绍

    基本使用

    selenium用法

    元素操作

    等待元素被加载

    元素各项属性

    执行js代码

    切换选项卡

    浏览器前进后退

    无界面浏览器

    xpath的使用

    简单介绍

    selenium中使用

    异常处理

    登录获取cookie保存

    动作链

    打码平台使用(验证码破解)


    selenium介绍

    由于requests模块不能执行js,有的页面内容,我们在浏览器中可以看到,但是请求下来没有。

    selenium模块:模拟操作浏览器,完成人的行为。

    selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器。

    模块安装:

    pip install selenium
    

    下载驱动

    驱动浏览器需要下载相应的驱动,谷歌要下谷歌的驱动,火狐要下火狐的驱动,并且版本要与当前浏览器对应。

    这里我选择谷歌浏览器,首先查看当前谷歌浏览器的版本:

    版本:

    下载驱动,地址:CNPM Binaries Mirror (npmmirror.com),一定要下载对应的版本驱动,比如我谷歌浏览器版本为103.0.5060.134,就要下103.0.5060.134的驱动

    下载对应操作系统即可。

    基本使用

    导入模块:

    from selenium import webdriver
    

    初始化(打开浏览器):

    browser = webdriver.Chrome(executable_path='驱动路径')
    
    1. # 不写路径,要放到项目路径下或环境变量中
    2. browser = webdriver.Chrome()

    在地址栏输入地址:

    browser.get('http://www.baidu.com')
    

    关闭标签:

    browser.close()
    

    关闭浏览器:

    browser.quit()
    

    selenium用法

    元素操作

    操作浏览器页面中的标签。

    1.搜索标签

    新版本:by=根据什么查找,value=查找的值

    • find_element(by, value):找第一个
    • find_elements(by, value):找所有
    by的参数 含义
    By.ID 根据标签id属性查找
    By.LINK_TEXT 根据a标签的文字查找
    By.PARTIAL_LINK_TEXT 根据a标签的文字模糊匹配
    By.TAG_NAME 根据标签名查找
    By.CLASS_NAME 根据标签class属性查找
    By.NAME 根据标签name属性查找
  • 相关阅读:
    lambda 的组成部分 operator==类体和全局中的细微区别 哈希容器代码 自定义哈希函数
    Opencv中goodFeaturesToTrack函数(Harris角点、Shi-Tomasi角点检测)算子速度的进一步优化(1920*1080测试图11ms处理完成)。
    [DRAFT] LLVM ThinLTO原理分析
    K8S集群再搭建
    苹果ios打包签名ipa文件应用app的验证的证书是怎么授信的原理是什么?
    【漏洞复现-coldfusion-文件读取】vulfocus/coldfusion-cve_2010_2861
    ElasticSearch - ES集成ik分词器
    [Python] 集合操作及方法总结
    程序员应了解的那些事(111)~进程、线程及堆栈关系
    tomcat-8.5.78连接oracle的步骤方式
  • 原文地址:https://blog.csdn.net/weixin_67531112/article/details/128207021
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号