• Airtest-Selenium实操小课③:下载可爱猫猫图片


    1. 前言

    那么这周我们看看如何实现使用Airtest-Selenium实现自动搜索下载可爱的猫猫图片吧~

    2. 需求分析和准备

    整体的需求大致可以分为以下步骤:

    • 打开chrome浏览器

    • 打开百度网页

    • 搜索“可爱猫猫图片”

    • 定位图片元素

    • 创建存储图片的文件夹

    • 下载可爱猫猫图片到文件夹内

    在写脚本之前,我们需要准备好社区版AirtestIDE,设置好chrome.exe和对应的driver;并且确保我们的chrome浏览器版本不是太高以及selenium是4.0以下即可(这些兼容问题我们都会在后续的版本修复)。

    3. 脚本实现与运行效果

    3.1 脚本运行效果

    我们在编写脚本时,我们要先明确好代码思路,首先下载图片先要找到对应的图片,在下载前需要先确认图片存储的地方,确认好后就可以进行下载啦。在本次代码编写的时候,我们使用了requests.get的方式去下载图片,目前使用request库里的操作去获取网络上的资源,会更方便快捷,让我们看看脚本实现的效果吧~

    3.2 完整代码分享

    这里也附上完整的示例代码给大家参考,有需要的同学可以自取学习哦:

    1. # -*- encoding=utf8 -*-
    2. from airtest.core.api import *
    3. # 引入selenium的webdriver模块
    4. from airtest_selenium.proxy import WebChrome
    5. import requests
    6. from selenium.webdriver.common.by import By
    7. def download_image(url, save_path): #下载图片
    8. response = requests.get(url, stream=True)
    9. if response.status_code == 200: #网页可以正常访问
    10. with open(save_path, 'wb') as file:
    11. for chunk in response.iter_content(1024):
    12. file.write(chunk)
    13. print("图片下载完成!")
    14. else:
    15. print("下载失败。")
    16. def start_selenium():
    17. # 创建一个实例,代码运行到这里,会打开一个chrome浏览器
    18. driver = WebChrome()
    19. driver.implicitly_wait(20)
    20. driver.get("https://www.baidu.com/")
    21. # 输入搜索关键词并提交搜索
    22. search_box = driver.find_element_by_name('wd')
    23. search_box.send_keys('可爱猫猫图片')
    24. search_box.submit()
    25. # 定位搜索结果中的图片元素
    26. image_elements = driver.find_elements(By.XPATH,'//div[@id="content_left"]//div[@class="image-content_1csSY"]//a/img')
    27. # 创建存储图片的文件夹
    28. save_folder = 'image_folder'
    29. if not os.path.exists(save_folder):
    30. os.makedirs(save_folder)
    31. index = 0
    32. # 循环保存图片
    33. for i in image_elements:
    34. image_url = i.get_attribute('src') #获取图片列表的网址信息
    35. print(image_url)
    36. # 下载图片
    37. index = index + 1
    38. download_image(image_url, f'{save_folder}/image_{index}.jpg')
    39. if __name__ == "__main__":
    40. start_selenium()
    3.2 重要知识点
    1)获取下载文件

    requests.get()会将请求的响应内容全部下载到内存中,然后再返回给调用者。其中stream默认情况下是stream=False,但是如果文件过大就会导致内存不足的情况,所以这里使用流式传输的方式去进行下载。

     response = requests.get(url, stream=True)
    
    2)一块一块的遍历要下载的内容

    get函数的stream参数设置成True时,它不会立即开始下载,使用iter_content遍历内容或访问内容属性时才开始下载。

    iter_content:分块去遍历要下载的内容,括号内的数字代表chunk_size处理数据时的块大小,单位是B(字节)

    使用该函数下载大文件可以防止占用过多的内存,每次只下载小部分数据。

    1. with open(save_path, 'wb') as file:
    2. for chunk in response.iter_content(1024):
    3. file.write(chunk)
    3)创建存储图片的文件夹

    先判断文件夹是否存在,若不存在则在路径(默认为脚本文件目录下)下创建一个文件夹

    1. if not os.path.exists(save_folder):
    2. os.makedirs(save_folder)
    4)获取图片的网址信息

    element.get_attribute(name):获得element的属性值。name可以是页面元素所含的属性名。

    例如:

    src:图片

    textContent:标签之间的文本内容

    innerHTML:标签之间的完整HTML内容

    等等.....

    image_url = i.get_attribute('src') #获取图片列表的网址信息
    

    4. 注意事项与小结

    4.1 相关教程
    4.2 参考脚本的有效性

    请各位同学们不要过多依赖于我们给出的参考脚本,通常情况下,网页的控件信息可能会随着前端的改动而更新,所以我们的教程并不是永久有效的。

    更多的是参考整体脚本的知识点,查漏补缺,让自己在小实践中对web自动化的熟练程度更高。也非常欢迎热心同学给我们投稿~

  • 相关阅读:
    Jmeter分布式压测 —— 易踩坑点
    ASP.NET的WebService跨域CORS问题解决方案
    2021CCPC上海省赛题解ABCDEGHIJK
    MySQL 窗口函数
    【MySQL】insert和select单表查询详解(包含大量示例,看了必会)
    基于粒子群优化算法的微型燃气轮机冷热电联供系统优化调度(Matlab代码实现)
    Linux应用开发基础知识——输入系统应用编程(七)
    深度适配云环境,火山引擎推出云操作系统veLinux
    Mybatis-plus工具学习笔记(1)---[基本概述,入门案例搭建,通用service接口使用]
    深受欢迎的ios软件安装工具:PlayCover MacOS系统软件
  • 原文地址:https://blog.csdn.net/m0_68405758/article/details/136262421