• Java使用selenium入门


    目录

    1. Selenium简介 

    2. Selenium组成 

    3. Selenium特点

    4.  java爬虫入门 

            4.1 下载驱动包 

            4.2 创建项目并导入依赖

            4.3 案例演示

            4.3.1 元素选择方式


    1. Selenium简介 

    Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。适用于自动化测试,js动态爬虫(破解反爬虫)等领域。 

    2. Selenium组成 

    1)Selenium IDE:嵌入到Firefox浏览器中的一个插件,实现简单的浏览器操作录制与回放功能,主要用于快速创建BUG及重现脚本,可转化为多种语言
    2)Selenium RC: 核心组件,支持多种不同语言编写自动化测试脚本,通过其服务器作为代理服务器去访问应用,达到测试的目的
    3)Selenium WebDriver(重点)一个浏览器自动化框架,它接受命令并将它们发送到浏览器。它是通过特定于浏览器的驱动程序实现的。它直接与浏览器通信并对其进行控制。Selenium WebDriver支持各种编程语言,如Java、C# 、PHP、Python、Perl、Ruby
    4)Selenium grid:测试辅助工具,用于做分布式测试,可以并行执行多个测试任务,提升测试效率。  

     3. Selenium特点

    1)开源、免费
    2)多浏览器支持:FireFox、Chrome、IE、Opera、Edge;
    3)多平台支持:Linux、Windows、MAC;
    4)多语言支持:Java、Python、Ruby、C#、JavaScript、C++;
    5)对Web页面有良好的支持;
    6)简单(API 简单)、灵活(用开发语言驱动);
    7)支持分布式测试用例执行。 

    4.  java爬虫入门 

    4.1 下载驱动包 

     4.2 创建项目并导入依赖

    1. <dependency>
    2. <groupId>org.seleniumhq.seleniumgroupId>
    3. <artifactId>selenium-javaartifactId>
    4. <version>3.141.59version>
    5. dependency>

     4.3 案例演示

    • 设置驱动第二个参数需要改成下载好的安装包的路径加解压后的压缩包名字(安装包解压后会生成一个压缩包)
    1. //设置驱动
    2. System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");
    3. //创建驱动
    4. WebDriver driver=new ChromeDriver();
    5. //与将要爬取的网站建立连接
    6. driver.get("https://www.baidu.com");

     4.3.1 元素选择方式

    • Class选择器
    1. List elements = driver.findElements(By.className("title-content-title"));
    2. for (WebElement element : elements) {
    3. System.out.println(element.getText());
    4. }
    •  ID选择器
    1. WebElement kw = driver.findElement(By.id("kw"));
    2. System.out.println(kw.getAttribute("class"));
    •  name选择器
    1. List wd = driver.findElements(By.name("wd"));
    2. for (WebElement webElement : wd) {
    3. System.out.println(webElement.getAttribute("class"));
    4. }
    •  tag选择器
    1. List ul = driver.findElements(By.tagName("li"));
    2. for (WebElement webElement : ul) {
    3. System.out.println(webElement.getText());
    4. }
    •  link选择器
    1. WebElement map = driver.findElement(By.linkText("地图"));
    2. System.out.println(map.getAttribute("href"));
    •  Partial link选择器
    1. List s = driver.findElements(By.partialLinkText("2"));
    2. for (WebElement webElement : s) {
    3. System.out.println(webElement.getText());
    4. }
    •  css选择器
    1. WebElement element = driver.findElement(By.cssSelector("#kw"));
    2. System.out.println(element.getAttribute("class"));
    •  xpath选择器(采用xpath请修改爬取网站为京东www.jd.com)
    1. //使用xpath 找到文本框
    2. WebElement element = driver.findElement(By.xpath("//*[@id=\"key\"]"));
    3. //文本框输入内容
    4. element.sendKeys("苹果手机");
    5. //获取文本框点击按钮
    6. WebElement element1 = driver.findElement(By.xpath("//*[@id=\"search\"]/div/div[2]/button"));
    7. //点击
    8. element1.click();
    9. //休眠!网速太慢会有错误 设置休眠事件3秒后再执行下面操作
    10. Thread.sleep(3000l);
    11. //获取点击最高销量ID
    12. WebElement element2 = driver.findElement(By.xpath("//*[@id=\"J_filter\"]/div[1]/div[1]/a[2]"));
    13. //点击销量
    14. element2.click();
    15. //设置休眠时间3秒
    16. Thread.sleep(3000l);
    17. //获取所有销量高的苹果手机定位
    18. WebElement element3 = driver.findElement(By.xpath("//*[@id=\"J_goodsList\"]/ul"));
    19. //获取文本
    20. System.out.println(element3.getText());

  • 相关阅读:
    嵌入式单片机上练手的小型图形库
    检索增强生成(RAG)技术
    备份与恢复 CR 介绍
    nodejs+vue临沂特色产品销售平台elementui
    CCRC认证是什么?
    【论文阅读笔记】NITRE 2022 Challenge on Efficient Super-Resolution: Methods and Results
    网络安全(黑客)自学
    还在找PDF合并文件的方法?这就有3个实用方法
    Leetcode191. 位1的个数
    adb使用笔记
  • 原文地址:https://blog.csdn.net/m0_63300795/article/details/126696701