• 【Python爬虫】selenium4新版本使用指南


    Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11)Mozilla FirefoxSafariGoogle ChromeOperaEdge等。这个工具的主要功能包括:测试与浏览器的兼容性——测试应用程序看是否能够很好得工作在不同浏览器和操作系统之上。

    随着时代的发展,在使用python做自动化时,与之前差生了很大的变化,这些变化都是一个老程序员所必须要踩坑的地方,也是由于已经会了老版本,在使用新版本的时候,需要多次探索,本文从当前最新版的Selenium出发,以Chrome驱动为例,总结了新版的使用方法,免得到处去搜索、踩坑。

    01、设置驱动

    当前Selenium版本:4.3.0,请核对你的版本是否是4.0以上的版本

    注意:
    请查看你的浏览器版本,然后再去下载对应的驱动,通常来说版本号时一致的,如果没有你的版本号,那就选择和你浏览器版本号最相近的版本。

    1. selenium4推荐方法

    由于传统的设置驱动方式过于繁琐,因此GitHub大佬SergeyPirogov写了浏览器驱动管理器,可以使设置驱动变得更加方便。

    首先,需要安装该管理器,使用以下命令

    pip install webdriver-manager

    然后导入该包

    from webdriver_manager.chrome import ChromeDriverManager

    设置service,通过ChromeDriverManager().install()来获取驱动,从而省去了下载驱动和设置驱动的步骤

    service = ChromeService(executable_path=ChromeDriverManager().install())

    然后驱动加载该service

    driver = webdriver.Chrome(service=service)

    此处贴出完整代码,以供参考

    1. from selenium import webdriver
    2. from selenium.webdriver.chrome.service import Service as ChromeService
    3. from webdriver_manager.chrome import ChromeDriverManager
    4. service = ChromeService(executable_path=ChromeDriverManager().install())
    5. driver = webdriver.Chrome(service=service)
    6. driver.quit()

    2. 传统方法

    这里使用传统方法来设置Selenium的驱动,也就是导入webdriver,然后设置可执行程序的路径。

    首先,在Selenium4中,设置驱动位置,不再是直接在webdriver.Chrome中直接设置,而是引入了Service。

    因此先导入Service的包

    1. from selenium import webdriver
    2. from selenium.webdriver.chrome.service import Service as ChromeService

    然后通过Service设置驱动,CHROMEDRIVER_PATH替换为你的驱动位置

    service = ChromeService(executable_path=CHROMEDRIVER_PATH)

    最后在webdriver.Chrome中调用这个service

    driver = webdriver.Chrome(service=service)

    给出完整代码予以参考

    1. from selenium import webdriver
    2. from selenium.webdriver.chrome.service import Service as ChromeService
    3. options = webdriver.ChromeOptions()
    4. options.add_experimental_option("excludeSwitches", ["enable-automation"])
    5. options.add_experimental_option("useAutomationExtension", False)
    6. service = ChromeService(executable_path=CHROMEDRIVER_PATH)
    7. driver = webdriver.Chrome(service=service, options=options)

    02、查找元素

    在selenium4中,一系列的findElement方法如findElementByClassNamefindElementById等都被整合成为了一个方法——findElement。并且通过By.method来选择你的查找元素方法,例如下。

    如果你想根据类名查找元素,你可以使用以下方法

    driver.findElement(By.className("className"));

    如果你想通过css选择器来查找元素,你可以使用以下方法

    driver.findElement(By.cssSelector(".className"));

    这里贴出与以往对应的所有查找元素方法,更新前

    1. driver.findElementByClassName("className");
    2. driver.findElementByCssSelector(".className");
    3. driver.findElementById("elementId");
    4. driver.findElementByLinkText("linkText");
    5. driver.findElementByName("elementName");
    6. driver.findElementByPartialLinkText("partialText");
    7. driver.findElementByTagName("elementTagName");
    8. driver.findElementByXPath("xPath");

    更新后

    1. driver.find_element(By.XPATH,'XPATH')
    2. driver.find_element(By.CLASS_NAME,'CLASS_NAME')
    3. driver.find_element(By.CSS_SELECTOR,'CSS_SELECTOR')
    4. driver.find_element(By.ID,'ID')
    5. driver.find_element(By.LINK_TEXT,'LINK_TEXT')
    6. driver.find_element(By.PARTIAL_LINK_TEXT,'PARTIAL_LINK_TEXT')
    7. driver.find_element(By.TAG_NAME,'TAG_NAME')

    如果你查找的是多个元素,只需要将其中的find_element替换成find_elements即可。

    等待元素出现

    有时候某个元素不是直接出现的,如果不做判断则会导致程序崩溃,因此一般可以做异常处理,这里还有等待元素出现的方法。

    首先,需要导入等待的包

    from selenium.webdriver.support.ui import WebDriverWait

    然后使用以下方法等待元素出现,driver就是浏览器驱动,timeout就是等待的时长,until后是判断元素是否出现的,

    el = WebDriverWait(driver, timeout=3).until(lambda d: d.find_element_by_tag_name("p"))

    03、动作API

    动作API是网上资料比较少的,因为之前的查找元素,调用click等已经可以解决很多的问题了,在翻看官方文档时,发现selenium还支持动作API来模拟动作。

    动作API分为四个部分,分别是键盘鼠标滚轮。这里先说明以下公共部分的。

    暂停(pause)

    光标移动,滚轮滚动期间,会有一些时间空隙,这里可以使用暂停来实现,这里是支持链式调用的,这里贴出官方给出的例子

    1. clickable = driver.find_element(By.ID, "clickable")
    2. ActionChains(driver)\
    3. .move_to_element(clickable)\
    4. .pause(1)\
    5. .click_and_hold()\
    6. .pause(1)\
    7. .send_keys("abc")\
    8. .perform()

    释放所有动作

    当前有动作执行时,可以使用以下方法停止这些动作

    ActionBuilder(driver).clear_actions()
    

    键盘

    键盘代码表

    如果你有兴趣,可以看一下,地址在这里,可以看到完整的列表。

    按下某键,以输入shift+abc为例

    1. ActionChains(driver)\
    2. .key_down(Keys.SHIFT)\
    3. .send_keys("abc")\
    4. .perform()

    弹起某键,以输入shift+a和shift+b为例

    1. ActionChains(driver)\
    2. .key_down(Keys.SHIFT)\
    3. .send_keys("a")\
    4. .key_up(Keys.SHIFT)\
    5. .send_keys("b")\
    6. .perform()

    浏览器输入某串字符(不指定元素)

    1. ActionChains(driver)\
    2. .send_keys("abc")\
    3. .perform()

    指定元素输入字符串

    1. text_input = driver.find_element(By.ID, "textInput")
    2. ActionChains(driver)\
    3. .send_keys_to_element(text_input, "abc")\
    4. .perform()

    复制和粘贴

    1. cmd_ctrl = Keys.COMMAND if sys.platform == 'darwin' else Keys.CONTROL
    2. ActionChains(driver)\
    3. .send_keys("Selenium!")\
    4. .send_keys(Keys.ARROW_LEFT)\
    5. .key_down(Keys.SHIFT)\
    6. .send_keys(Keys.ARROW_UP)\
    7. .key_up(Keys.SHIFT)\
    8. .key_down(cmd_ctrl)\
    9. .send_keys("xvv")\
    10. .key_up(cmd_ctrl)\
    11. .perform()

    鼠标

    鼠标点击保持,该方法将鼠标移动到元素中心与按下鼠标左键相结合。

    这有助于聚焦特定元素:

    1. clickable = driver.find_element(By.ID, "clickable")
    2. ActionChains(driver)\
    3. .click_and_hold(clickable)\
    4. .perform()

    鼠标点击释放

    1. clickable = driver.find_element(By.ID, "click")
    2. ActionChains(driver)\
    3. .click(clickable)\
    4. .perform()

    鼠标定义的5种按键

    • 0——鼠标左键
    • 1——鼠标中键
    • 2——鼠标右键
    • 3——X1(后退键)
    • 4——X2(前进键)

    鼠标右击

    1. clickable = driver.find_element(By.ID, "clickable")
    2. ActionChains(driver)\
    3. .context_click(clickable)\
    4. .perform()

    按下鼠标3键

    1. action = ActionBuilder(driver)
    2. action.pointer_action.pointer_down(MouseButton.BACK)
    3. action.pointer_action.pointer_up(MouseButton.BACK)
    4. action.perform()

    按下鼠标4键

    1. action = ActionBuilder(driver)
    2. action.pointer_action.pointer_down(MouseButton.FORWARD)
    3. action.pointer_action.pointer_up(MouseButton.FORWARD)
    4. action.perform()

    鼠标双击

    1. clickable = driver.find_element(By.ID, "clickable")
    2. ActionChains(driver)\
    3. .double_click(clickable)\
    4. .perform()

    鼠标移动到元素上

    1. hoverable = driver.find_element(By.ID, "hover")
    2. ActionChains(driver)\
    3. .move_to_element(hoverable)\
    4. .perform()

    鼠标位移

    就是通过像素点来进行位移操作

    从元素左顶边进行位移

    1. mouse_tracker = driver.find_element(By.ID, "mouse-tracker")
    2. ActionChains(driver)\
    3. .move_to_element_with_offset(mouse_tracker, 8, 11)\
    4. .perform()

    从元素中心进行位移(请期待)

    从当前窗口左上角位移

    1. action = ActionBuilder(driver)
    2. action.pointer_action.move_to_location(8, 12)
    3. action.perform()

    从当前鼠标位置位移

    1. ActionChains(driver)\
    2. .move_by_offset( 13, 15)\
    3. .perform()

    拖拽元素

    该方法首先单击并按住源元素,移动到目标元素的位置,然后释放鼠标。

    1. draggable = driver.find_element(By.ID, "draggable")
    2. droppable = driver.find_element(By.ID, "droppable")
    3. ActionChains(driver)\
    4. .drag_and_drop(draggable, droppable)\
    5. .perform()

    通过位移拖拽

    1. draggable = driver.find_element(By.ID, "draggable")
    2. start = draggable.location
    3. finish = driver.find_element(By.ID, "droppable").location
    4. ActionChains(driver)\
    5. .drag_and_drop_by_offset(draggable, finish['x'] - start['x'], finish['y'] - start['y'])\
    6. .perform()

    笔(部分浏览器生效)

    由于笔只在部分浏览器生效,这里就不写了,如果你感兴趣,或者有需求可以去官方文档查看,这里贴出官方文档地址。

    滚轮(只有谷歌内核浏览器生效)

    滚动到某元素位置

    1. iframe = driver.find_element(By.TAG_NAME, "iframe")
    2. ActionChains(driver)\
    3. .scroll_to_element(iframe)\
    4. .perform()

    定量滚动

    1. footer = driver.find_element(By.TAG_NAME, "footer")
    2. delta_y = footer.rect['y']
    3. ActionChains(driver)\
    4. .scroll_by_amount(0, delta_y)\
    5. .perform()

    从一个元素滚动指定量

    1. iframe = driver.find_element(By.TAG_NAME, "iframe")
    2. scroll_origin = ScrollOrigin.from_element(iframe)
    3. ActionChains(driver)\
    4. .scroll_from_origin(scroll_origin, 0, 200)\
    5. .perform()

    从一个元素滚动,并指定位移

    1. footer = driver.find_element(By.TAG_NAME, "footer")
    2. scroll_origin = ScrollOrigin.from_element(footer, 0, -50)
    3. ActionChains(driver)\
    4. .scroll_from_origin(scroll_origin, 0, 200)\
    5. .perform()

    从一个元素的原点位移

    1. ActionChains(driver)\
    2. .scroll_from_origin(scroll_origin, 0, 200)\
    3. .perform()

    总结

    以上就是本文的所有内容,总结了selenium4在使用过程中常见的一些坑,以及官方所推荐使用的方式

    最后感谢每一个认真阅读我文章的人,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

    这些资料,对于【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴上万个测试工程师们走过最艰难的路程,希望也能帮助到你! 

  • 相关阅读:
    怎样翻译文本?这三种翻译方法我经常使用
    springboot基于java的个性化推荐的电商购物商城平台设计与实现
    table的基本用法
    【前端】Vue+Element UI案例:通用后台管理系统-用户管理:Table表格增删查改、Pagination分页、搜索框
    2023.10.18 信息学日志
    基于微信小程序的警局报案便民服务平台#毕业设计
    JAVA中使用CompletableFuture进行异步编程
    【云原生】灰度发布、蓝绿发布、滚动发布、灰度发布解释
    ER 图与数据字典 – 哪个更适合记录数据模型
    【Python】初识类与对象
  • 原文地址:https://blog.csdn.net/2301_78843735/article/details/134169137