教你如何使用Python selenium
作者:布小禅 发布时间:2022-05-15 11:13:50
一、了解selenium
Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safar等浏览器(需要下载驱动),之前是用来做测试网站的,后来发现也可以用来爬取数据(估计开发者都没想到他开发的selenium被别人广泛适用于爬虫领域——笑)。
二、selenium的下载
1.我这里是使用的Chrom浏览器 !注意不要忽视这个地方
2.python中selenium库的下载(pycharm系列)
由于我用的pycharm的虚拟环境,所以我只需要在pycharm的终端下载第三方库就行了,简单,方便,pycharm真是个好用的东西——O(∩_∩)O~
打开pycharm
打开pycharm的终端
输入pip install selenium -i https://pypi.doubanio.com/simple (这是使用国内镜像网站下载selenium,下载速度较快)
等待片刻,结束
pip list ——查看自己下载的第三方库,检查是否成功
3.python中selenium库的下载(cmd系列)
win+R输入cmd
打开cmd
输入pip install selenium -i https://pypi.doubanio.com/simple (这是使用国内镜像网站下载selenium,下载速度较快)
等待片刻,结束
pip list ——查看自己下载的第三方库,检查是否成功
4.selenium驱动的下载(官网都是英文,看不懂)
打开你的Chrom浏览器查看你是什么版本的(帮助->about chrom),查看版本号
点击右边这个蓝色的小可爱,没错我是小可爱 ,找到与你的chrom浏览器版本相匹配的(没有匹配的,相近的也可以,win都是32位的),下载
没了,没错,你没看错,真的没了
5.selenium的环境配置,没错又是这个烦人的环境配置 真想给他一脚
想必,这个时候已经下载好了吧
下载好以后,很简单,解压,然后——看3
最好(但是不是必要)创建一个文件夹放你解压出来的geckodriver,然后复制你这个文件当前的路径(ctrl + c)
打开环境变量(此电脑->右键->属性->高级系统配置->环境变量),在系统变量找到path,新建,ctrl + v
完事
6.打开你的pycharm,新建一个py文件去写出以下代码
from selenium import webdriver
import time
# 导入时间包和selenium包
huohu = webdriver.Chrome()
# 创建一个chome的selenium对象
huohu.get("http://www.elong.com/")
# 打开网站
huohu.quit()
# 退出
写好后,运行
好,报错了,对,报错了,可能你们不会报错,反正我报错了
报错信息是:selenium.common.exceptions.WebDriverException: Message: ‘chromedriver' executable needs to be in PATH.
意思是,你需要吧chromdriver放到路径,我照着做了,可是呢,还是这个报错!
这是什么情况??明明我是按照教程来的啊
着急的我去群里请求大佬,大佬们直接无视我——::>_<::
然后又去找它——>脚本之家,左翻翻,右找找,终于找到了解决方案:
将chromdriver放在python解释器的位置,我照着做了之后,就成功了。。。
好家伙,上面教程不是说随便放的吗?…
哎,人与人之间最基本的信任都没有了
三、selenium的基本使用
from selenium import webdriver
# 导包
driver = webdriver.Chrome()
# 创建一个浏览器对象
driver.get("https://m.elong.com/")
# 访问艺龙网
driver.quit()
# 关闭浏览器,也可以不关闭,但是最好关闭,养成一个打开后不忘记关闭的好习惯
然后我们就会发现,浏览器界面一闪而过(为什么?因为页面渲染完成后,就直接退出了),那么如何才能让我们能够观察到呢?有请我们的time模块,让它睡会儿,就能观察到了
这样改
from selenium import webdriver
import time
# 导包
driver = webdriver.Chrome()
driver.get("https://m.elong.com/")
time.sleep(5)
# 页面渲染完成后让它睡5s,这样就能观察到了
driver.quit()
OK,看到,代码替我们打开了这个网址,并且展示了5s后关闭了
四、结语
来源:https://blog.csdn.net/m0_52883898/article/details/115680676


猜你喜欢
- 网络通信中,为了防止长时间无响应的情况,经常会用到网络连接超时、读写超时的设置。本文结合例子简介golang的连接超时和读写超时设置。1.超
- 学习目标1.掌握pytorch模型转换到onnx模型2.顺利运行onnx模型3.比对onnx模型和pytorch模型的输出结果学习大纲pyt
- 这个仿msn的右下角popup提示窗口效果很久以前收集的,现在整理出来给大家分享,需要的朋友可以拿去用,特点,提示窗口内容和js代码分离容易
- 文章目录 微信登录问题Python chrome driver操作导入库并声明浏览器:完整流程:用js来预约生成js代码 主函数——程序出错
- js代码如下: <script type="text/javascript"> //禁用右键菜单 docum
- 在 python2 中,如果想要自定义评价标准的话,可以这么做def cmp(a, b): # 如果逻辑上认为 a < b ,返回 -
- 将通过各种例子来了解如何在 Python 中使用 type() 函数。你好类型打印 "Hello World "几乎是你
- python常见的错误有1.NameError变量名错误2.IndentationError代码缩进错误3.AttributeError对象
- 共4个页面:form.asp; chk.asp; num.asp; count.asp,得到一个随即数字。加密解密后成成XBM图片,利用 s
- 一、前言我们今天要安装的selenium 就是浏览器自动化测试框架,是一个用于Web应用程序的测试工具,就是模拟用户操作。支持的浏览器包括C
- python 3.10支持match语句,3,10以下不支持。match语句接受一个表达式,并将其值与作为一个或多个case块给出的连续模式
- 本文实例讲述了RC4文件加密的python实现方法。分享给大家供大家参考。具体分析如下:基于RC4流加密算法,使用扩展的16*16的S盒,3
- 如果你的Pycharm提示过期可以使用下面这个最新的Pycharm激活码,适用最新版的Pycharm 2020.2.3,老版本的Pychar
- 这最近在PJ的function库里看到的这个函数,感觉思路差了点,不过相对比较完美,只是闭合标签时的顺序问题,呵呵 修改一下数组arrTag
- 什么是注意力机制注意力机制是一个非常有效的trick,注意力机制的实现方式有许多,我们一起来学习一 * 意力机制是深度学习常用的一个小技巧,它
- 当我们写用例断言时,往往一个断言结果是不够的,所以需要加入多重断言,而多重断言,当断言中间出现断言结果False时,会中断后续的断言执行,会
- 提到numpy数组就不得不说到np.hstack()与np.dstack()的问题。这里我们研究一下它们的使用方法。我们先来看 一下np.h
- 一. 删除完全重复的记录完全重复的数据,通常是由于没有设置主键/唯一键约束导致的。测试数据:if OBJECT_ID('duplic
- 笔者认为,在创建索引时要做到三个适当,即在适当的表上、适当的列上创建适当数量的索引。虽然这可以通过一句话来概括优化的索引的基本准则,但是要做
- 现在就摘录一下sql2005联机丛书里的关于这几个数据类型的解释字符数据类型(nchar 长度固定,nvarchar 长度可变)和 Unic