Python Playwright的使用详解
作者:梦想橡皮擦 发布时间:2021-10-10 03:30:44
实战场景
本篇博客为大家介绍一款新的自动化测试工具,效果类似 selenium
,但是这个模块年轻。
模块名称为 playwright-python
,微软开源的,是针对 Python 语言的纯自动化工具,可以通过 API 调用浏览器,github 地址在本文末尾。
接下来将通过 3 篇博客为大家详细介绍该 playwright-python
,彻彻底底了解它。
正式开始前依旧是模块安装:
pip install playwright
该模块安装非常快,但完整体验还需要安装浏览器相关驱动,这个有点大,命令如下:
python -m playwright install
安装时注意使用国内源!
等待过程中,可以查阅输出日志,核对安装了哪些模块:
Downloading FFMPEG
:FFMPEG;Downloading Firefox 104.0
:火狐浏览器驱动;Downloading Chromium
:谷歌浏览器驱动;Downloading Webkit 16.0
:Webkit 浏览器驱动。
实战操作
第一次实战操作,先从不写代码开始,通过下述命令启动浏览器,然后【录制】我们的操作过程。
python -m playwright codegen
运行代码之后,弹出默认浏览器和一个代码录制展示框,具体如下所示:
下面就可以在左侧的浏览器窗口中进行操作,然后观察右侧自动生成的代码段。
在地址栏输入 baidu.com 跳转到百度首页,然后输入 航天员,点击搜索按钮,生成的代码如下所示。
将生成的代码复制到开发工具中,直接运行就可以得到刚刚相同的操作。
from playwright.sync_api import Playwright, sync_playwright, expect
def run(playwright: Playwright) -> None:
browser = playwright.chromium.launch(headless=False)
context = browser.new_context()
# Open new page
page = context.new_page()
# Go to https://www.baidu.com/
page.goto("https://www.baidu.com/")
# Click input[name="wd"]
page.locator("input[name=\"wd\"]").click()
# Fill input[name="wd"]
page.locator("input[name=\"wd\"]").fill("航天员")
# Press Enter
page.locator("input[name=\"wd\"]").press("Enter")
page.wait_for_url(
"https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E8%88%AA%E5%A4%A9%E5%91%98&fenlei=256&rsv_pq=0xfde7decb0011bfe6&rsv_t=3a67vLT%2Buti4VKw0mDppSrydbnq6CGsyOVNNxN%2F39naR6lYvxacuqvbYKRs0&rqlang=en&rsv_enter=1&rsv_dl=tb&rsv_sug3=24&rsv_sug1=24&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&prefixsug=%25E8%2588%25AA%25E5%25A4%25A9%25E5%2591%2598&rsp=5&inputT=5824&rsv_sug4=6786&rsv_jmp=fail")
# ---------------------
context.close()
browser.close()
with sync_playwright() as playwright:
run(playwright)
接下来我们分析一下其生成的代码含义。
from playwright.sync_api import Playwright, sync_playwright
从 playwright.sync_api
模块导入 Playwright
和 sync_playwright
,看到关键字 sync
,可以猜测这是一个同步操作,那与之对应的,也是未来我们要对比学习的,就是异步接口相关内容,这里先埋下一个伏笔,下篇博客在进行讨论。
browser = playwright.chromium.launch(headless=False)
初始化一个谷歌浏览器对象,并且不是无头浏览器,即在桌面打开浏览器窗口。launch()
方法包含很多参数,常用的有以下内容:
headless
:是否为无头浏览器,即是否显示浏览器窗口,默认为不显示;channel
:浏览器版本,"chrome", "chrome-beta", "chrome-dev", "chrome-canary";proxy
:代理设置;timeout
:超时时间,默认 30s。
context = browser.new_context()
page = context.new_page()
打开一个新浏览器,创建一个新页面,其中 browser.new_context()
的参数都是与浏览器配置相关的内容,实践的时候需要特别设置的在这里设置,例如下述参数:
user_agent
:UA 代理;viewport
:页面大小,比例,例 1024*768;offline
:离线模式加载。
page.goto("https://www.baidu.com/")
page.locator("input[name=\"wd\"]").click()
……
page.wait_for_url(……)
goto()
:地址跳转,即浏览器跳转;locator()
:定位元素;wait_for_url()
:等待页面加载完毕。
本文末尾重点介绍一下 goto()
相关内容,剩余函数下篇博客继续说明。 goto()
函数的重要参数:
url
:跳转地址,必须包含协议,例如http://
或者https://
;referer
:请求头中的referer
参数;timeout
:最大操作时间(毫秒),默认为 30 秒;wait_until
:默认操作成功时,执行的内容,还有几个事件,分别是domcontentloaded
,networkidle
,commit
项目开源地址:https://github.com/microsoft/playwright-python
官方手册:https://playwright.dev/python/docs/intro
来源:https://juejin.cn/post/7154188909574881310


猜你喜欢
- 本文实例讲述了python使用PyGame模块播放声音的方法。分享给大家供大家参考。具体实现方法如下:import pygamepygame
- __new__ 方法是什么?如果将类比喻为工厂,那么__init__()方法则是该工厂的生产工人,__init__()方法接受的初始化参 数
- 下面给大家分享python 字符串string的内置方法,具体内容详情如下所示:#__author: "Pizer Wang&qu
- 在一些情况下,MySQL可以直接使用索引来满足一个 ORDER BY 或 GROUP BY 子句而无需做额外的排序。尽管 ORDER BY
- Django的数据库层从Python代码生成SQL schemas—但是对于遗留数据库,你已经拥有SQL schemas. 这种情况,你需要
- 1)去重指定多列去重,这是在dataframe没有独一无二的字段作为PK(主键)时,需要指定多个字段一起作为该行的PK,在这种情况下对整体数
- 一、数据完整性简介1、数据完整性简介数据冗余是指数据库中存在一些重复的数据,数据完整性是指数据库中的数据能够正确反应实际情况。数据完整性是指
- Python最基本的数据结构是序列(列表/元组)。一个序列中的每个元素都分配有一个数字- 它的位置或索引。第一个索引是0,第二个
- 这篇文章主要介绍了python调用摄像头的示例代码,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下一、打开摄像头import
- 非常好的一篇技术文档,翻译自Louis Lazaris 2009年9月15日发表的《The Z-Index CSS Property: A
- 1、python多进程编程背景python中的多进程最大的好处就是充分利用多核cpu的资源,不像python中的多线程,受制于GIL的限制,
- 一、打包多个1、将需要打包的项目为anjuke_sd目录下的所有python文件,其中excute_main.py为主文件。2、生成主函数对
- 笔者日积月累了许多精彩、实用的Web特效的制作,这些特效几乎都是比较常用的网页特效。现在我就把这些经过
- 作为站长而言,有时候我们可能会碰到更换服务器或者为网站做一个整体布局修改和升级,我们首先需要做的就是对数据库和整个wordpress网站的
- Cookie 对象是一种以文件(Cookie文件)的形式保存在客户端硬盘的Cookies文件夹中的数据信息(Cookie数据)。Cookie
- 本文为大家分享了pygame游戏之旅的第6篇,供大家参考,具体内容如下定义一个障碍模型函数:def things(thingx, thing
- Matplotlib 是 Python 的二维绘图库,用于生成符合出版质量或跨平台交互环境的各类图形。图形解析与工作流图形解析 工
- 运行多进程 每个子进程的内存空间是互相隔离的 进程之间数据不能共享的互斥锁但是进程之间都是运行在一个操作系统上,进程之间数据不共享,但是共享
- 实现效果将位于/img目录下的1000张.png图片,转换成.webp格式,并存放于img_webp文件夹内。源图片目录目标图片目录关于批量
- 今天的文章来自 盏茶作酒 同学。他在老电脑中发现了一个加密的 zip 文件,于是用 Python 破解了文件密码。在破解的过程中出现了内存爆