哈喽鸭各位本次小無分享Selenium之入门
在分享本次内容正确之前小無先跟大家讲
会有一点失望因为效果图内容 版权问题所以所还有一点失望
在分享Selenium之前想问问大家开发时候总有一些人敲代码少找素材去了他们呢会去网上去找大量素材 例如:水果图片 采集到本地电脑上面 作为项目的素材 而找这些素材时候很多重复繁琐不做又不行为了项目更好必须要做 。
所以问 :有没有技术含量的东西来做这一件事呢?有Selenium 可以自动抓取网上图片
Selenium它不止可以爬虫还可以自动化测试(普通的测试(自己手动测试)呢是开发人员自己写完自己测试 而对于高级测试人员自己(写测试脚本以及自动化测试工具) )
好了开始回归正题先看看本次目录吧
目录
目录
Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在
操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。
适用于自动化测试,js动态爬虫(破解反爬虫)等领域。
1)Selenium IDE:嵌入到Firefox(火狐)浏览器中的一个插件,实现简单的浏览器操作录制与回放功能,主要用于快速创建BUG及重现脚本,可转化为多种语言(上课没听懂可以通过回复反复观看 ,网页上测试的BUG录视频给开发人员修改)
2)Selenium RC: 核心组件,支持多种不同语言编写自动化测试脚本,通过其服务器作为代理服务器去访问应用,达到测试的目的( 例如 你前面录得视频 测试不出来一些复杂的业务逻辑 这时候怎么办呢 这时候陈小姐写代码去测试小刘写的代码)
3)Selenium WebDriver(重点):一个浏览器自动化框架,它接受命令并将它们发送到浏览器。它是通过特定于浏览器的驱动程序实现的。它直接与浏览器通信并对其进行控制。Selenium WebDriver支持各种编程语言,如Java、C# 、PHP、Python、Perl、Ruby
4)Selenium grid:测试辅助工具,用于做分布式测试,可以并行执行多个测试任务,提升测试效率。
1)开源、免费
2)多浏览器支持:FireFox、Chrome、IE、Opera、Edge;
3)多平台支持:Linux、Windows、MAC;
4)多语言支持:Java、Python、Ruby、C#、JavaScript、C++;
5)对Web页面有良好的支持;
6)简单(API 简单)、灵活(用开发语言驱动);
7)支持分布式测试用例执行。
爬虫:数据采集、数据清晰、数据分析!!!
4.1 java爬虫入门
下载驱动包网站(点进去选择对应版本下载)
首先先看看自己浏览器的版本其次找一找对应版本我这里是 105.0.1343.53 如果没有的话选择大一点版本接近的版本下载
org.seleniumhq.selenium
selenium-java
3.141.59
//设置驱动
System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");(文件位置)
//创建驱动
WebDriver driver=new ChromeDriver();
//与将要爬取的网站建立连接
driver.get("https://www.baidu.com");
//关闭浏览器
driver.close();
//释放资源
driver.quit();
这里是效果(小無的谷歌浏览器)

这个红色区域显示被控制(Chrome 正受到自动测试软件的控制。)

4.2 相关API
1.元素选择方式
1)Class选择:driver.findElement(By.className("s_ipt"));
- package com.xiaowu.demo;
-
- import org.openqa.selenium.By;
- import org.openqa.selenium.WebDriver;
- import org.openqa.selenium.WebElement;
- import org.openqa.selenium.chrome.ChromeDriver;
-
- /**
- * @author xiaowu
- * @site www.xiaomage.com
- * @company xx公司
- * @create 2022-09-29 14:22
- */
- public class Demo1 {
- public static void main(String[] args) {
-
-
- //设置驱动
- System.setProperty("webdriver.chrome.driver", "E:\\Driver package\\chromedriver_win32\\chromedriver.exe");
- //创建驱动
- WebDriver driver = new ChromeDriver();
- //与将要爬取的网站建立连接
- driver.get("https://www.baidu.com");
- //关闭浏览器
- // driver.close();
- //释放资源
- // driver.quit();
-
- // 1)Class选择:driver.findElement(By.className("s_ipt"));
- // 通过类选择器拿到控制的页面按钮元素
- WebElement s_btn = driver.findElement(By.className("s_btn"));
- System.out.println(s_btn.getAttribute("id"));
- System.out.println(s_btn.getAttribute("value"));
-
-
- // 2)ID选择:driver.findElement(By.id("kw"));
-
- // 3)name选择:driver.findElement(By.name("wd"));
-
- // 4)tag选择:driver.findElements(By.tagName("input"));
-
- // 5)link选择:driver.findElement(By.linkText("地图"));
-
- // 6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
-
- // 7)css选择器:driver.findElement(By.cssSelector("#kw"));
-
- // 8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
-
- }
- }

2)ID选择: driver.findElement(By.id("kw"));
- package com.xiaowu.demo;
-
- import org.openqa.selenium.By;
- import org.openqa.selenium.WebDriver;
- import org.openqa.selenium.WebElement;
- import org.openqa.selenium.chrome.ChromeDriver;
-
- /**
- * @author xiaowu
- * @site www.xiaomage.com
- * @company xx公司
- * @create 2022-09-29 14:22
- */
- public class Demo1 {
- public static void main(String[] args) {
-
-
- //设置驱动
- System.setProperty("webdriver.chrome.driver", "E:\\Driver package\\chromedriver_win32\\chromedriver.exe");
- //创建驱动
- WebDriver driver = new ChromeDriver();
- //与将要爬取的网站建立连接
- driver.get("https://www.baidu.com");
- //关闭浏览器
- // driver.close();
- //释放资源
- // driver.quit();
-
- // 1)Class选择:driver.findElement(By.className("s_ipt"));
- // 通过类选择器拿到控制的页面按钮元素
- // WebElement s_btn = driver.findElement(By.className("s_btn"));
- // System.out.println(s_btn.getAttribute("id"));
- // System.out.println(s_btn.getAttribute("value"));
-
-
- // 2)ID选择:driver.findElement(By.id("kw"));
-
- WebElement su = driver.findElement(By.id("su"));
- System.out.println(su.getAttribute("class"));
- // 3)name选择:driver.findElement(By.name("wd"));
-
- // 4)tag选择:driver.findElements(By.tagName("input"));
-
- // 5)link选择:driver.findElement(By.linkText("地图"));
-
- // 6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
-
- // 7)css选择器:driver.findElement(By.cssSelector("#kw"));
-
- // 8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
-
- }
- }

3)name选择: driver.findElement(By.name("wd"));
- package com.xiaowu.demo;
-
- import org.openqa.selenium.By;
- import org.openqa.selenium.WebDriver;
- import org.openqa.selenium.WebElement;
- import org.openqa.selenium.chrome.ChromeDriver;
-
- /**
- * @author xiaowu
- * @site www.xiaomage.com
- * @company xx公司
- * @create 2022-09-29 14:22
- */
- public class Demo1 {
- public static void main(String[] args) {
-
-
- //设置驱动
- System.setProperty("webdriver.chrome.driver", "E:\\Driver package\\chromedriver_win32\\chromedriver.exe");
- //创建驱动
- WebDriver driver = new ChromeDriver();
- //与将要爬取的网站建立连接
- driver.get("https://www.baidu.com");
- //关闭浏览器
- // driver.close();
- //释放资源
- // driver.quit();
-
- // 1)Class选择:driver.findElement(By.className("s_ipt"));
- // 通过类选择器拿到控制的页面按钮元素
- // WebElement s_btn = driver.findElement(By.className("s_btn"));
- // System.out.println(s_btn.getAttribute("id"));
- // System.out.println(s_btn.getAttribute("value"));
-
-
- // 2)ID选择:driver.findElement(By.id("kw"));
-
- // WebElement su = driver.findElement(By.id("su"));
- // System.out.println(su.getAttribute("class"));
- // 3)name选择: driver.findElement(By.name("wd"));
- System.out.println(driver.findElement(By.name("rqlang")).getAttribute("value"));
-
- // 4)tag选择:driver.findElements(By.tagName("input"));
-
- // 5)link选择:driver.findElement(By.linkText("地图"));
-
- // 6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
-
- // 7)css选择器:driver.findElement(By.cssSelector("#kw"));
-
- // 8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
-
- }
- }


4)tag选择: driver.findElements(By.tagName("input"));
- package com.xiaowu.demo;
-
- import org.openqa.selenium.By;
- import org.openqa.selenium.WebDriver;
- import org.openqa.selenium.WebElement;
- import org.openqa.selenium.chrome.ChromeDriver;
-
- import java.util.List;
-
- /**
- * @author xiaowu
- * @site www.xiaomage.com
- * @company xx公司
- * @create 2022-09-29 14:22
- */
- public class Demo1 {
- public static void main(String[] args) {
-
-
- //设置驱动
- System.setProperty("webdriver.chrome.driver", "E:\\Driver package\\chromedriver_win32\\chromedriver.exe");
- //创建驱动
- WebDriver driver = new ChromeDriver();
- //与将要爬取的网站建立连接
- driver.get("https://www.baidu.com");
- //关闭浏览器
- // driver.close();
- //释放资源
- // driver.quit();
-
- // 1)Class选择:driver.findElement(By.className("s_ipt"));
- // 通过类选择器拿到控制的页面按钮元素
- // WebElement s_btn = driver.findElement(By.className("s_btn"));
- // System.out.println(s_btn.getAttribute("id"));
- // System.out.println(s_btn.getAttribute("value"));
-
-
- // 2)ID选择:driver.findElement(By.id("kw"));
-
- // WebElement su = driver.findElement(By.id("su"));
- // System.out.println(su.getAttribute("class"));
- // 3)name选择: driver.findElement(By.name("wd"));
- System.out.println(driver.findElement(By.name("rqlang")).getAttribute("value"));
-
- // 4)tag选择:driver.findElements(By.tagName("input"));
- // 获取到百度首页所有点击链接
- List
eles = driver.findElements(By.tagName("a")); - for (WebElement ele : eles) {
- // ele:指的是单个A标签
- String text=ele.getText();
- if(text!=null&&!"".equals(text.trim()))
- System.out.println(text);
- }
-
- // 5)link选择:driver.findElement(By.linkText("地图"));
-
- // 6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
-
- // 7)css选择器:driver.findElement(By.cssSelector("#kw"));
-
- // 8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
-
- }
- }

5)link选择: driver.findElement(By.linkText("地图"));
- package com.xiaowu.demo;
-
- import org.openqa.selenium.By;
- import org.openqa.selenium.WebDriver;
- import org.openqa.selenium.WebElement;
- import org.openqa.selenium.chrome.ChromeDriver;
-
- import java.util.List;
-
- /**
- * @author xiaowu
- * @site www.xiaomage.com
- * @company xx公司
- * @create 2022-09-29 14:22
- */
- public class Demo1 {
- public static void main(String[] args) {
-
-
- //设置驱动
- System.setProperty("webdriver.chrome.driver", "E:\\Driver package\\chromedriver_win32\\chromedriver.exe");
- //创建驱动
- WebDriver driver = new ChromeDriver();
- //与将要爬取的网站建立连接
- driver.get("https://www.baidu.com");
- //关闭浏览器
- // driver.close();
- //释放资源
- // driver.quit();
-
- // 1)Class选择:driver.findElement(By.className("s_ipt"));
- // 通过类选择器拿到控制的页面按钮元素
- // WebElement s_btn = driver.findElement(By.className("s_btn"));
- // System.out.println(s_btn.getAttribute("id"));
- // System.out.println(s_btn.getAttribute("value"));
-
-
- // 2)ID选择:driver.findElement(By.id("kw"));
-
- // WebElement su = driver.findElement(By.id("su"));
- // System.out.println(su.getAttribute("class"));
- // 3)name选择: driver.findElement(By.name("wd"));
- System.out.println(driver.findElement(By.name("rqlang")).getAttribute("value"));
-
- // 4)tag选择:driver.findElements(By.tagName("input"));
- // // 获取到百度首页所有点击链接
- // List
eles = driver.findElements(By.tagName("a")); - // for (WebElement ele : eles) {
- ele:指的是单个A标签
- // String text=ele.getText();
- // if(text!=null&&!"".equals(text.trim()))
- // System.out.println(text);
- // }
-
- // 5)link选择:driver.findElement(By.linkText("地图"));
- // 通过链接文字获取链接元素、模拟点击该链接
- driver.findElement(By.linkText("地图")).click();
- // 6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
-
- // 7)css选择器:driver.findElement(By.cssSelector("#kw"));
-
- // 8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
-
- }
- }

这个效果根据代码操控谷歌浏览器打开百度 自动打开百度地图(全程无鼠标操作)
6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
- package com.xiaowu.demo;
-
- import org.openqa.selenium.By;
- import org.openqa.selenium.WebDriver;
- import org.openqa.selenium.WebElement;
- import org.openqa.selenium.chrome.ChromeDriver;
-
- import java.util.List;
-
- /**
- * @author xiaowu
- * @site www.xiaomage.com
- * @company xx公司
- * @create 2022-09-29 14:22
- */
- public class Demo1 {
- public static void main(String[] args) {
-
-
- //设置驱动
- System.setProperty("webdriver.chrome.driver", "E:\\Driver package\\chromedriver_win32\\chromedriver.exe");
- //创建驱动
- WebDriver driver = new ChromeDriver();
- //与将要爬取的网站建立连接
- driver.get("https://www.baidu.com");
- //关闭浏览器
- // driver.close();
- //释放资源
- // driver.quit();
-
- // 1)Class选择:driver.findElement(By.className("s_ipt"));
- // 通过类选择器拿到控制的页面按钮元素
- // WebElement s_btn = driver.findElement(By.className("s_btn"));
- // System.out.println(s_btn.getAttribute("id"));
- // System.out.println(s_btn.getAttribute("value"));
-
-
- // 2)ID选择:driver.findElement(By.id("kw"));
-
- // WebElement su = driver.findElement(By.id("su"));
- // System.out.println(su.getAttribute("class"));
- // 3)name选择: driver.findElement(By.name("wd"));
- System.out.println(driver.findElement(By.name("rqlang")).getAttribute("value"));
-
- // 4)tag选择:driver.findElements(By.tagName("input"));
- // // 获取到百度首页所有点击链接
- // List
eles = driver.findElements(By.tagName("a")); - // for (WebElement ele : eles) {
- ele:指的是单个A标签
- // String text=ele.getText();
- // if(text!=null&&!"".equals(text.trim()))
- // System.out.println(text);
- // }
-
- // 5)link选择:driver.findElement(By.linkText("地图"));
- // 通过链接文字获取链接元素、模拟点击该链接
- // driver.findElement(By.linkText("地图")).click();
- // 6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
- // 通过3获取所有包含3的链接地址
-
- List
eles = driver.findElements(By.partialLinkText("15")); - for (WebElement ele:eles){
- System.out.println(ele.getText());
- }
- // 7)css选择器:driver.findElement(By.cssSelector("#kw"));
-
- // 8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
-
- }
- }

7)css选择器:driver.findElement(By.cssSelector("#kw"));
- package com.xiaowu.demo;
-
- import org.openqa.selenium.By;
- import org.openqa.selenium.WebDriver;
- import org.openqa.selenium.WebElement;
- import org.openqa.selenium.chrome.ChromeDriver;
-
- import java.util.List;
-
- /**
- * @author xiaowu
- * @site www.xiaomage.com
- * @company xx公司
- * @create 2022-09-29 14:22
- */
- public class Demo1 {
- public static void main(String[] args) {
-
-
- //设置驱动
- System.setProperty("webdriver.chrome.driver", "E:\\Driver package\\chromedriver_win32\\chromedriver.exe");
- //创建驱动
- WebDriver driver = new ChromeDriver();
- //与将要爬取的网站建立连接
- driver.get("https://www.baidu.com");
- //关闭浏览器
- // driver.close();
- //释放资源
- // driver.quit();
-
- // 1)Class选择:driver.findElement(By.className("s_ipt"));
- // 通过类选择器拿到控制的页面按钮元素
- // WebElement s_btn = driver.findElement(By.className("s_btn"));
- // System.out.println(s_btn.getAttribute("id"));
- // System.out.println(s_btn.getAttribute("value"));
-
-
- // 2)ID选择:driver.findElement(By.id("kw"));
-
- // WebElement su = driver.findElement(By.id("su"));
- // System.out.println(su.getAttribute("class"));
- // 3)name选择: driver.findElement(By.name("wd"));
- System.out.println(driver.findElement(By.name("rqlang")).getAttribute("value"));
-
- // 4)tag选择:driver.findElements(By.tagName("input"));
- // // 获取到百度首页所有点击链接
- // List
eles = driver.findElements(By.tagName("a")); - // for (WebElement ele : eles) {
- ele:指的是单个A标签
- // String text=ele.getText();
- // if(text!=null&&!"".equals(text.trim()))
- // System.out.println(text);
- // }
-
- // 5)link选择:driver.findElement(By.linkText("地图"));
- // 通过链接文字获取链接元素、模拟点击该链接
- // driver.findElement(By.linkText("地图")).click();
- // 6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
- // 通过3获取所有包含3的链接地址
- // List
eles = driver.findElements(By.partialLinkText("15")); - // for (WebElement ele:eles){
- // System.out.println(ele.getText());
- // }
- // 7)css选择器:driver.findElement(By.cssSelector("#kw"));
- // 通过CSS选择器获取页面元素
- WebElement ele = driver.findElement(By.cssSelector("#hotsearch-content-wrapper > li:nth-child(1) > a"));
- System.out.println(ele.getText());
-
- // 8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
- // WebElement ele = driver.findElement(By.xpath("//*[@id=\"kw\"]"));
- // System.out.println(ele.getText());
- }
- }

小無问问大家有没有在网络里看到电脑无人自动操作 大家以为是特效吗其实不是是代码
- package com.xiaowu.demo;
-
- import org.openqa.selenium.By;
- import org.openqa.selenium.WebDriver;
- import org.openqa.selenium.WebElement;
- import org.openqa.selenium.chrome.ChromeDriver;
-
- import java.util.List;
-
- /**
- * @author xiaowu
- * @site www.xiaomage.com
- * @company xx公司
- * @create 2022-09-29 14:22
- */
- public class Demo1 {
- public static void main(String[] args)throws Exception {
-
-
- //设置驱动
- System.setProperty("webdriver.chrome.driver", "E:\\Driver package\\chromedriver_win32\\chromedriver.exe");
- //创建驱动
- WebDriver driver = new ChromeDriver();
- //与将要爬取的网站建立连接
- driver.get("https://www.baidu.com");
- //关闭浏览器
- // driver.close();
- //释放资源
- // driver.quit();
-
- // 1)Class选择:driver.findElement(By.className("s_ipt"));
- // 通过类选择器拿到控制的页面按钮元素
- // WebElement s_btn = driver.findElement(By.className("s_btn"));
- // System.out.println(s_btn.getAttribute("id"));
- // System.out.println(s_btn.getAttribute("value"));
-
-
- // 2)ID选择:driver.findElement(By.id("kw"));
-
- // WebElement su = driver.findElement(By.id("su"));
- // System.out.println(su.getAttribute("class"));
- // 3)name选择: driver.findElement(By.name("wd"));
- System.out.println(driver.findElement(By.name("rqlang")).getAttribute("value"));
-
- // 4)tag选择:driver.findElements(By.tagName("input"));
- // // 获取到百度首页所有点击链接
- // List
eles = driver.findElements(By.tagName("a")); - // for (WebElement ele : eles) {
- ele:指的是单个A标签
- // String text=ele.getText();
- // if(text!=null&&!"".equals(text.trim()))
- // System.out.println(text);
- // }
-
- // 5)link选择:driver.findElement(By.linkText("地图"));
- // 通过链接文字获取链接元素、模拟点击该链接
- // driver.findElement(By.linkText("地图")).click();
- // 6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));
- // 通过3获取所有包含3的链接地址
- // List
eles = driver.findElements(By.partialLinkText("15")); - // for (WebElement ele:eles){
- // System.out.println(ele.getText());
- // }
- // 7)css选择器:driver.findElement(By.cssSelector("#kw"));
- // 通过CSS选择器获取页面元素
- // WebElement ele = driver.findElement(By.cssSelector("#hotsearch-content-wrapper > li:nth-child(1) > a"));
- // System.out.println(ele.getText());
-
- // 8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));
- // WebElement ele = driver.findElement(By.xpath("//*[@id=\"hotsearch-content-wrapper\"]/li[1]/a/span[2]"));
- // System.out.println(ele.getText());
-
-
- //拿到百度首页的input输入框
- WebElement search_input = driver.findElement(By.xpath("//*[@id=\"kw\"]"));
-
- // 往 输入框 输入搜索关键字
- search_input.sendKeys("禁止收敛URL");
- // 模拟等待
- Thread.sleep(3000);
-
- // 获取百度一下的点击按钮
- driver.findElement(By.id("su")).click();
- }
- }

好了还有一个知识点本次就分享丸了
好了本次的Selenium之入门小無就介绍到这里了我们下次见886