微软开源最强Python自动化神器Playwright(不用写一行代码)
作者:Python数据科学 发布时间:2024-01-02 00:38:00
相信玩过爬虫的朋友都知道selenium
,一个自动化测试的神器工具。写个Python
自动化脚本解放双手基本上是常规的操作了,爬虫爬不了的,就用自动化测试凑一凑。
虽然selenium
有完备的文档,但也需要一定的学习成本,对于一个纯小白来讲还是有些门槛的。
最近,微软开源了一个项目叫「playwright-python
」,简直碉堡了!这个项目是针对Python
语言的纯自动化工具,连代码都不用写,就能实现自动化功能。
可能你会觉得有点不可思议,但它就是这么厉害。下面我们一起看下这个神器。
1. Playwright介绍
Playwright
是一个强大的Python库,仅用一个API即可自动执行Chromium
、Firefox
、WebKit
等主流浏览器自动化操作,并同时支持以无头模式、有头模式运行。
Playwright提供的自动化技术是绿色的、功能强大、可靠且快速,支持Linux
、Mac
以及Windows
操作系统。
2. Playwright使用
安装
Playwright
的安装非常简单,两步走。
# 安装playwright库
pip install playwright
# 安装浏览器驱动文件(安装过程稍微有点慢)
python -m playwright install
上面两个pip操作分别安装:
安装Playwright依赖库,需要Python3.7+
安装Chromium、Firefox、WebKit等浏览器的驱动文件
录制
使用Playwright
无需写一行代码,我们只需手动操作浏览器,它会录制我们的操作,然后自动生成代码脚本。
下面就是录制的命令codegen
,仅仅一行。
# 命令行键入 --help 可看到所有选项
python -m playwright codegen
codegen
的用法可以使用--help
查看,如果简单使用就是直接在命令后面加上url链接,如果有其他需要可以添加options
。
python -m playwright codegen --help
Usage: index codegen [options] [url]
open page and generate code for user actions
Options:
-o, --output <file name> saves the generated script to a file
--target <language> language to use, one of javascript, python, python-async, csharp (default: "python")
-h, --help display help for command
Examples:
$ codegen
$ codegen --target=python
$ -b webkit codegen https://example.com
options含义:
-o:将录制的脚本保存到一个文件
–target:规定生成脚本的语言,有
JS
和Python
两种,默认为Python-b:指定浏览器驱动
比如,我要在baidu.com
搜索,用chromium
驱动,将结果保存为my.py
的python
文件。
python -m playwright codegen --target python -o 'my.py' -b chromium https://www.baidu.com
命令行输入后会自动打开浏览器,然后可以看见在浏览器上的一举一动都会被自动翻译成代码,如下所示。
结束后自动关闭浏览器,保存生成的自动化脚本到py文件。
from playwright import sync_playwright
def run(playwright):
browser = playwright.chromium.launch(headless=False)
context = browser.newContext()
# Open new page
page = context.newPage()
page.goto("https://www.baidu.com/")
page.click("input[name=\"wd\"]")
page.fill("input[name=\"wd\"]", "jingdong")
page.click("text=\"京东\"")
# Click //a[normalize-space(.)='京东JD.COM官网 多快好省 只为品质生活']
with page.expect_navigation():
with page.expect_popup() as popup_info:
page.click("//a[normalize-space(.)='京东JD.COM官网 多快好省 只为品质生活']")
page1 = popup_info.value
# ---------------------
context.close()
browser.close()
with sync_playwright() as playwright:
run(playwright)
此外,playwright
还提供了同步和异步的API接口,文档如下。
链接:https://microsoft.github.io/playwright-python/index.html
同步
下面示例代码:依次打开三个浏览器,前往baidu搜索,截图后退出。
from playwright import sync_playwright
with sync_playwright() as p:
for browser_type in [p.chromium, p.firefox, p.webkit]:
browser = browser_type.launch()
page = browser.newPage()
page.goto('https://baidu.com/')
page.screenshot(path=f'example-{browser_type.name}.png')
browser.close()
异步
异步操作可结合asyncio
同时进行三个浏览器操作。
import asyncio
from playwright import async_playwright
async def main():
async with async_playwright() as p:
for browser_type in [p.chromium, p.firefox, p.webkit]:
browser = await browser_type.launch()
page = await browser.newPage()
await page.goto('http://baidu.com/')
await page.screenshot(path=f'example-{browser_type.name}.png')
await browser.close()
asyncio.get_event_loop().run_until_complete(main())
移动端
更厉害的是,playwright
还可支持移动端的浏览器模拟。
下面是官方文档提供的一段代码,模拟在给定地理位置上手机iphone 11 pro上的Safari浏览器,首先导航到maps.google.com
,然后执行定位并截图。
from playwright import sync_playwright
with sync_playwright() as p:
iphone_11 = p.devices['iPhone 11 Pro']
browser = p.webkit.launch(headless=False)
context = browser.newContext(
**iphone_11,
locale='en-US',
geolocation={ 'longitude': 12.492507, 'latitude': 41.889938 },
permissions=['geolocation']
)
page = context.newPage()
page.goto('https://maps.google.com')
page.click('text="Your location"')
page.screenshot(path='colosseum-iphone.png')
browser.close()
另外,还可以配合pytest
插件一起使用,感兴趣可以自己试一下。
3. 总结
playwright
相比已有的自动化测试工具有很多优势,比如:
跨浏览器,支持Chromium、Firefox、WebKit
跨操作系统,支持Linux、Mac、Windows
可提供录制生成代码功能,解放双手
可用于移动端
目前存在的缺点就是生态和文档还不是非常完备,比如没有API中文文档、没有较好的教程和示例供学习。不过相信,随着知道的人越来越多,未来会越来越好。
GitHub链接:https://github.com/microsoft/playwright-python
开源组织:Microsoft
来源:https://blog.csdn.net/yuxiaosmd/article/details/111147119
猜你喜欢
- 前言在制作论文插图时,有时要求将图片的局部放大来展示细节内容,同时将放大图拼接在原图上以方便观察对比。当然直接利用电脑自带的画图软件或者别的
- 一,十进制(decimal system)转换函数说明 1,十进制转二进制 decbin() 函数,如下实例 echo decbin(12)
- 使用的类库pip install openpyxl操作实现•工作簿操作# coding: utf-8from openpyxl import
- 如何用POP3接收电子邮件?POP3大行其道,我看见朋友已经用Jmail和POP3接收邮件了。该如何做?以Jmail4.1为例,我们演示一下
- Software as a service 软件即服务,21世纪开始兴起的一种完全创新的软件应用模式。客户通过互联网向厂商定购所需的应用软件
- 前言:中文编码问题一直是程序员头疼的问题,而Python2中的字符编码足矣令新手抓狂。本文将尽量用通俗的语言带大家彻底的了解字符编码以及Py
- 0. 命令行参数通常,对于大型项目程序而言,执行程序的一个必要的步骤是正确处理命令行参数,这些命令行参数是提供给包含某种参数化信息的程序或脚
- pycharm是一款很流行的编写Python程序的编程软件,这篇文章给大家介绍Pycharm使用教程。1、下载pycharmpycharm是
- 目录连接池是什么?为什么需要连接池?连接池的原理是什么?使用python语言自制简易mysql连接池开始使用自定义配置文件名 & 配
- 进程、线程和协程之间的关系和区别也困扰我一阵子了,最近有一些心得,写一下。进程拥有自己独立的堆和栈,既不共享堆,亦不共享栈,进程由操作系统调
- 看书笔记db file scattered read DB ,db file sequential read DB,free buffer
- 本文将介绍使用Dreamweaver来制作滑动菜单的方法,言归正传,废话少说。准备工作如下: 1. 在dw中新建一个空白文档(或者打开你要添
- 我想大多数的人在编写ASP程序的时候,都碰到过类似的错误信息: Error Num
- 问题1:使用.net2005自带的SQL-Express连接不上。解决方法:1.网络防火墙阻止数据库连接;2.默认SQL-Express没有
- 本文中的示例主要是解决在函数间不能传递多个(32个以上)参数的问题,解题的具体思路就是采用记录类型作为函数的输入和返回值,所以我们需要先定义
- 前言我们知道当文件不存在的时候,open()方法的写模式与追加模式都会新建文件,但是对文件进行判断的场景还有很多,比如,在爬虫下载图片的时候
- <script>var d = '2013-07-21';var nd = d.replace(new RegE
- 最近我因为要安装 Firebug 1.4 导致我不得不安装了 Firefox 3.5 ,所以很不小心地接触到了Wordpress后台那漂亮的
- 1.H5 download属性function downFile(content, filename) { // 创建隐藏的可下
- 最近,随着数据库的日益庞大,本来两个差不多的数据库,我开始发现我的数据库查询起来越来越比我朋友网站的慢了,经过初步对照,问题好像出在访问记录