Python爬虫中Selenium实现文件上传
作者:程序猿杂记 发布时间:2023-03-27 22:00:26
前言:大部分的文件上传功能都是用input标签实现,这样就完全可以把它看作一个输入框,可以通过send_keys()指定文件进行上传了。
本章中用到的关键方法如下:
send_keys():上传文件或者输入文本
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.get('http://file.yiyuen.com/file/')
# 定位上传按钮,添加本地文件
driver.find_element_by_name("files").send_keys('D:\\test.txt')
time.sleep(10)
driver.quit()
Web上本地上传图片,弹出的框Selenium是无法识别的,也就是说,selenium本身没有直接的方法去实现上传本地文件,这里总结了两种上传文件的方式。
一、利用Robot类处理文件上传。
其大致流程可以为:
1、 利用selenium点击web上本地文件的上传按钮;
2、 在弹出的弹框中,文件路径输入框默认的是光标的聚焦,将文件在磁盘上的路径通过拷贝和黏贴的方法写上去。
3、 通过按下回车,默认触发弹框的确定按钮,完成文件上传的功能。
这里以百度首页的利用图片搜索为例:
打开百度首页,搜索按钮左侧有一个照相机的图标,点击可以选择图片搜索,我们通过本地上传图片的过程来模拟文件自动化上传操作。准备条件,在百度图片搜索一个图片,保存到桌面,例如找到一个关于selenium的图片,然后保存在桌面,名称为selenium.jpg。
相关实现代码如下:
package first;
import java.awt.Robot;
import java.awt.Toolkit;
import java.awt.datatransfer.StringSelection;
import java.awt.event.KeyEvent;
import java.util.concurrent.TimeUnit;
import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.firefox.FirefoxDriver;
public class shangchuang {
public static void main(String[] args)throws Exception {
WebDriver driver=new FirefoxDriver();
driver.manage().window().maximize();
driver.manage().timeouts().implicitlyWait(4, TimeUnit.SECONDS);
driver.get("https://www.baidu.com");
//指定图片路径
StringSelection selection=new StringSelection("C:\\Users\\你的用户名\\Desktop\\selenium.jpg");
//把图片路径复制到剪切板
Toolkit.getDefaultToolkit().getSystemClipboard().setContents(selection, null);
System.out.println("selection"+selection);
//点击照相机这个工具
driver.findElement(By.xpath("//*/span[@class='soutu-btn']")).click();
//点击本地上传图片
driver.findElement(By.xpath("//*/div[@class='upload-wrap']")).click();
//新建一个Robot类的对象
Robot robot=new Robot();
Thread.sleep(1000);
//按下Ctrl+V
robot.keyPress(KeyEvent.VK_CONTROL);
robot.keyPress(KeyEvent.VK_V);
//释放Ctrl+V
robot.keyRelease(KeyEvent.VK_CONTROL);
robot.keyRelease(KeyEvent.VK_V);
Thread.sleep(2000);
//点击回车
robot.keyPress(KeyEvent.VK_ENTER);
robot.keyRelease(KeyEvent.VK_ENTER);
}
}
二、利用AutoIt上传文件
以上是第一种方的实现,第二种方式是利用AutoIt这个工具。这是一个能支持桌面GUI自动化的工具,它支持脚本语言编写。在Selenium脚本中如果需要AutoIt来协助这个文件上传功能,大概步骤是这样的:
1. Selenium点击web产品上的文件上传按钮,弹窗上传框。
2.执行AutoIt实现准备好的脚本文件,这个脚本文件写了关于上传什么文件的一个.exe文件。
在一切测试工作之前,我们先下载和安装AutoIt。
1)打开AutoIt的官网下载地址
https://www.autoitscript.com/site/autoit/downloads/
2)点击下载zip,当然也可以下载Editor。
解压得到的效果如图:
3)点击SciTe文件夹,我们打开脚本编辑器。双击SciTE.exe
4)打开百度图片上传窗口,同时打开AutoIt 脚本编辑器和元素 * 。拖动元素 * 上那个靶点形状按钮到文件上传弹窗,能够捕获到一些元素信息。
5)在AutoIt脚本编辑器里输入如下脚本,绿色部分为解释的,不需要写。
6)编译成一个.exe文件
先保存到本地,例如默认路径保存,名称为UploadFile.au3,然后在AutoIt脚本编辑器中点击Tools菜单,选择compile,会在同路径下生成一个UploadFile.exe的文件,待会在Selenium脚本要使用。
7)Selenium脚本执行UploadFile.exe文件,观察文件是否上传。
package first;
import java.util.concurrent.TimeUnit;
import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.firefox.FirefoxDriver;
public class AutoIt {
public static void main(String[] args) throws Exception{
WebDriver driver=new FirefoxDriver();
driver.manage().window().maximize();
driver.manage().timeouts().implicitlyWait(4, TimeUnit.SECONDS);
driver.get("http://www.baidu.com");
//点击照相机这个工具
driver.findElement(By.xpath("//*/span[@class='soutu-btn']")).click();
//点击本地上传图片
driver.findElement(By.xpath("//*/div[@class='upload-wrap']")).click();
// 执行桌面的AutoIt封装的脚本
Runtime.getRuntime().exec("C:\\Users\\你的用户名\\Desktop\\UploadFile.exe");
}
}
我用的是火狐62,最终的效果如图所示:
Selenium文集传送门:
标题 | 简介 |
---|---|
Python爬虫 - Selenium(1)安装和简单使用 | 详细介绍Selenium的依赖环境在Windows和Centos7上的安装及简单使用 |
Python爬虫 - Selenium(2)元素定位和WebDriver常用方法 | 详细介绍定位元素的8种方式并配合点击和输入、提交、获取断言信息等方法的使用 |
Python爬虫 - Selenium(3)控制浏览器的常用方法 | 详细介绍自定义浏览器窗口大小或全屏、控制浏览器后退、前进、刷新浏览器等方法的使用 |
Python爬虫 - Selenium(4)配置启动项参数 | 详细介绍Selenium启动项参数的配置,其中包括 * 面模式、浏览器窗口大小设置、浏览器User-Agent (请求头)等等 |
Python爬虫 - Selenium(5)鼠标事件 | 详细介绍鼠标右击、双击、拖动、鼠标悬停等方法的使用 |
Python爬虫 - Selenium(6)键盘事件 | 详细介绍键盘的操作,几乎包含所有常用按键以及组合键 |
Python爬虫 - Selenium(7)多窗口切换 | 详细介绍Selenium是如何实现在不同的窗口之间自由切换 |
Python爬虫 - Selenium(8)frame/iframe表单嵌套页面 | 详细介绍如何从当前定位的主体切换为frame/iframe表单的内嵌页面中 |
Python爬虫 - Selenium(9)警告框(弹窗)处理 | 详细介绍如何定位并处理多类警告弹窗 |
Python爬虫 - Selenium(10)下拉框处理 | 详细介绍如何灵活的定位并处理下拉框 |
Python爬虫 - Selenium(11)文件上传 | 详细介绍如何优雅的通过send_keys()指定文件进行上传 |
Python爬虫 - Selenium(12)获取登录Cookies,并添加Cookies自动登录 | 详细介绍如何获取Cookies和使用Cookies进行自动登录 |
Python爬虫 - Selenium(13)设置元素等待 | 详细介绍如何优雅的设置元素等待时间,防止程序运行过快而导致元素定位失败 |
Python爬虫 - Selenium(14)窗口截图 | 详细介绍如何使用窗口截图 |
Python爬虫 - Selenium(15)关闭浏览器 | 详细介绍两种关闭窗口的区别 |
来源:https://blog.csdn.net/weixin_44110998/article/details/103695805


猜你喜欢
- 回文利用python 自带的翻转 函数 reversed()def is_plalindrome(string): return
- 简单的并发控制利用 channel 的缓冲设定,我们就可以来实现并发的限制。我们只要在执行并发的同时,往一个带有缓冲的 chann
- 今天在学习vue的过程中,发现一个有趣的现象。在某一组件下的某一数据通过点击事件被动态修改的时候,对应view中的数据同步的进行了修改,没错
- if exists (select * from dbo.sysobjects where id = object_id(N'[db
- 1、数据驱动介绍:@ddt.ddt(类装饰器,申明当前类使用ddt框架)@ddt.data(函数装饰器,用于给测试用例传递数据),支持传py
- 1.什么是ORMORM 全拼Object-Relation Mapping.中文意为 对象-关系映射.在MVC/MVT设
- 互联网时代数据是 * 式增长,我们常常需要把结构化数据和非结构化数据(如文档,演示文稿,视频,音频,图像)存储在一起。通常有几种方案: 1。在
- 具体代码如下所示:import requestsimport jsonfrom pyecharts.charts import Map, G
- 场景描述:场景描述:一个接口(IPerson)有很多个的字段,可能有几百。而且这些字段都是必须的。我们需要使用这个接口,但是我又不可能使用它
- Phar是什么在百度中得到介绍是这样的:在软件中,PHAR(PHP归档)文件是一种打包格式,通过将许多PHP代码文件和其他资源(例如图像,样
- 在工作中碰到这么一个问题:给定一个已经排序的数组(升序),删除数组中重复的数据,但是只能使用一个数组,这个数组的大小可以变化. 例子:&nb
- MySQL安全性指南(3) 作 者: 晏子2.4 不用GRANT设置用户如果你有一个早于3.22.11的MySQL版本,你不能使用GRANT
- js模拟随机抽奖程序代码!相关文章推荐:随机6+1选号码摇奖程序 <html><title>模拟抽奖-asp之家&l
- 最近为数据库服务器增加了内存,达到了最大支持的8G,数据库用的是mssql 2005 ,之前内存一直是4G的,不存在内存大和32位操作系统冲
- 前言9月份,开始开发微信小程序,也曾调研过wepy/mpvue,考虑到后期跨端的需求,最终选择使用了uni-app,本文主要介绍如何使用un
- 今天是边复习边创作博客的第三天,我今年大二,我们专业开的有这门课程,因为喜欢所以更加认真学习,本以为没人看呢,看了后台浏览量让我更加认真创作
- 用过vuex的肯定会有这样一个痛点,就是刷新以后vuex里面存储的state就会被浏览器释放掉,因为我们的state都是存储在内存中的。所以
- 在使用pip安装Tensorflow后,在其目录中没有找到model目录,重复安装了两遍依然没有,原因未知。于是,使用源码安装的方法:(1)
- 一、下载MySQL数据库并进行安装和配置下载地址:https://dev.mysql.com/downloads/installer/二、下
- python中的os.mkdir和os.makedirs的使用区别以及如何查看某个模块中的某些字母开头的属性方法1 os.mkdir的使用o