位置：首页>> 网络编程>> Python编程>> Python中使用 Selenium 实现网页截图实例

Python中使用 Selenium 实现网页截图实例

作者：junjie　　发布时间：2022-07-04 06:28:16　

标签：Python,Selenium,网页截图

Selenium 是一个可以让浏览器自动化地执行一系列任务的工具，常用于自动化测试。不过，也可以用来给网页截图。目前，它支持 Java、C#、Ruby 以及 Python 四种客户端语言。如果你使用 Python，则只需要在命令行里输入“sudo easy_install selenium”并回车，即可安装 selenium 的 Python 版本的客户端支持。

以 Python 为例，我们可以使用下面的脚本来给指定页面（比如脚本之家首页）截图：

# -*- coding: utf-8 -*-
#
# author: oldj <oldj.wu@gmail.com>
#

from selenium import webdriver
import time

def capture(url, save_fn="capture.png"):
browser = webdriver.Firefox() # Get local session of firefox
browser.set_window_size(1200, 900)
browser.get(url) # Load page
browser.execute_script("""
(function () {
var y = 0;
var step = 100;
window.scroll(0, 0);

function f() {
if (y < document.body.scrollHeight) {
y += step;
window.scroll(0, y);
setTimeout(f, 50);
} else {
window.scroll(0, 0);
document.title += "scroll-done";
}
}

setTimeout(f, 1000);
})();
""")

for i in xrange(30):
if "scroll-done" in browser.title:
break
time.sleep(1)

browser.save_screenshot(save_fn)
browser.close()

if __name__ == "__main__":

capture("https://www.jb51.net")

注意到，上面的代码中，我并没有在打开页面后立即截图，而是先在页面上执行了一段 JavaScript 脚本，先将页面的滚动条拖到最下方，再拖回顶部，然后才截图。这样的好处是如果页面下方有一些延迟加载的内容，在这个操作之后一般也都已加载了。

与 PageSaver 等浏览器插件相比，Selenium 功能更为强大，例如，它可以在页面上注入并执行一段 JS，还可以模拟鼠标点击等行为，而且可以同时运行多个实例（多个线程同时截图）。这样看来，使用 Selenium 来给页面截图似乎是一个不错的选择。

0

投稿

猜你喜欢

也谈网页圆角的背景图法
网页的圆角处理，其实最开始的九宫格的表格处理是挺方便的，只是现在都不用表格布局了，自然就被非法取缔了。呵呵。微软的有VML画圆角，由于只是它
Hello! 404
1. 什么是404404是一个 http 错误代码，即请求的网页不存在。代码404的第一个“4”代表客户端的错误，如错误的网页位址；后两的数
asp 隐藏并修改文件的最后修改时间
源码：代码如下: <％ '隐藏并修改文件的最后修改时间的aspshell '原理:通过FSO可以修改文件的属性，比
发现一个不错的11px字体：PMingLiu
今天闲逛在网上时，看到一个11px大小的字体，显示却很清晰，赶紧查看站点的CSS，这字体称叫做：PMingLiu。效果相当不错，相比于我们使
面向对象的 Javascript
阅读前：Pro Javascript Techniques翻译连载说明和目录JavaScript的演化是渐进而稳固的。历经过去十年的进程，J
mysql使用LOAD语句批量录入数据方法
本章的前面讨论如何使用SQL向一个表中插入数据。但是，如果你需要向一个表中添加许多条记录，使用SQL语句输入数据是很不方便的。幸运的是，My
ecshop百度编辑器远程下载无后缀的图片，并且加水印
<?php /** * Created by JetBrains Ph
php strftime函数的详细用法
定义和用法strftime() 函数根据区域设置格式化本地时间／日期。语法strftime(format,timestamp)参数描述 f
br玩转清除浮动
先看一下br怎么玩转“清除浮动”了。使用以下代码<br clear="all" />以下是代码效果演示：运行
检测你的SQL Server是否有特洛伊木马
你的SQL Server最近是否运行不正常?不，我指的不是我们肯定会遇到的通常的数据库和操作系统问题。我的意思是，你是否经历过服务器的反应迟
VBScript WeekdayName 函数语法
The WeekdayName function returns the weekday name of a specified day o
比较全面的PHP数组的使用方法小结
一、什么是数组数组就是一组数据的集合，把一系列数据组织起来，形成一个可操作的整体。数组的每个实体都包含两项：键和值。二、声明数据在PHP中声
sql 查询记录数结果集某个区间内记录
以查询前20到30条为例,主键名为id 方法一: 先正查,再反查 select top 10 * from (select top 30 *
元素层叠级别及z-index剖析
声明定位元素：position属性值设置除默认值static以外的元素，包括relative，absolute，fixed。平台：win/I
JavaScript几种弹窗事件的使用
一、弹窗事件是什么？弹窗事件就是在我们执行某操作的时候,弹出信息框给出提示。或收集数据的时候,弹出窗口收集信息,不想收集可以取消隐藏。二、简
RDFa介绍——构建更友好的web页面
看着这个题目可能大家会有点陌生，不知道是什么，说的直白一点，RDFa就是让你的页面更好的被机器所理解，而不简简单单是展示你的页面，下面就关于
EF Core基础入门教程
EF Core 是一个ORM（对象关系映射），它使 .NET 开发人员可以使用 .NET对象操作数据库，避免了像ADO.NET访问数据库的代
Python3中常用的处理时间和实现定时任务的方法的介绍
无论哪种编程语言，时间肯定都是非常重要的部分，今天来看一下python如何来处理时间和python定时任务，注意咯：本篇所讲是python3
MYSQL教程:检查数据表和修复数据表
数据库在运行中，会因为人为因素或一些不可抗力因素造成数据损坏。所以为了保护数据的安全和最小停机时间，我们需制定详细的备份/恢复计划，并定期对
Laravel框架数据库CURD操作、连贯操作总结
一、Selects检索表中的所有行$users = DB::table('users')->get();foreach

关于python的对象序列化介绍

python安装模块如何通过setup.py安装(超简单)

python中super()函数的理解与基本使用

python3中eval函数用法使用简介

python2 与 python3 实现共存的方法

python数据类型之间怎么转换技巧分享

python实现上传样本到virustotal并查询扫描信息的方法

Python实现网络自动化eNSP

解决python中os.system调用exe文件的问题

Django框架基础认证模块auth应用示例

在WPS文字中巧妙去除来自WORD文档的水印的方法

如何做一个优秀的设计？

Android编程实现状态保存的方法分析

学生站长该如何创业

微信新年红包不提现怎么办?

win7电脑安全模式下怎么还原系统还原？

Word如何插入键盘上没有的符号?

Win10 X如何设置电脑休眠时间？Win10 X设置电脑休眠时间的方法

如何使excel表格自动计算我持有股票的时间

iPhone如何关闭隐私追踪？iPhone关闭隐私追踪有用吗？

手机版 网络编程 asp之家 www.aspxhome.com