Python实现的网页截图功能【PyQt4与selenium组件】
作者:wang1472jian1110 发布时间:2021-04-13 16:21:56
标签:Python,网页截图
本文实例讲述了Python实现的网页截图功能。分享给大家供大家参考,具体如下:
方法一、使用PyQt4的QtWebKit组件
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
import sys
import os.path
from PyQt4 import QtGui,QtCore,QtWebKit
class PageShotter(QtGui.QWidget):
def __init__(self,url,filename,parent=None):
QtGui.QWidget.__init__(self,parent)
self.url = url
self.filename = filename
self.webpage = None
def shot(self):
webview = QtWebKit.QWebView(self)
webview.load(QtCore.QUrl(self.url))
self.webpage = webview.page()
self.connect(webview,QtCore.SIGNAL("loadFinished(bool)"),self.save_page)
def save_page(self,finished):
#print finished
if finished:
print u"开始截图!"
size = self.webpage.mainFrame().contentsSize()
print u"页面宽:%d,页面高:%d" % (size.width(),size.height())
self.webpage.setViewportSize(QtCore.QSize(size.width()+16,size.height()))
img = QtGui.QImage(size, QtGui.QImage.Format_ARGB32)
painter = QtGui.QPainter(img)
self.webpage.mainFrame().render(painter)
painter.end()
filename= self.filename;
if img.save(filename):
filepath = os.path.join(os.path.dirname(__file__), filename)
print u"截图完毕:%s" % filepath
else:
print u"截图失败";
else:
print u"网页加载失败!"
self.close()
if __name__=="__main__":
app = QtGui.QApplication(sys.argv)
shotter = PageShotter("https://www.jb51.net/", 'shot.png')
shotter.shot()
sys.exit(app.exec_())
运行后输出:
QFont::setPixelSize: Pixel size <= 0 (0)
开始截图!
页面宽:1058,页面高:9819
截图完毕:C:\py\jb51PyDemo\src\Demo\shot.png
注:
Python2的32位操作系统安装包可至此下载:https://www.jb51.net/softs/548192.html
64位操作系统下对应PyQt安装包可至此下载:https://www.jb51.net/softs/548197.html)
Python3可直接使用pip命令安装PyQt5库,如:
pip3 install PyQt5-sip
方法二、使用selenium
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
import time
from selenium import webdriver
browser = webdriver.Firefox()
browser.set_window_size(1055, 800)
browser.get("https://www.jb51.net/")
browser.find_element_by_id("idClose").click()
time.sleep(5)
browser.save_screenshot("shot.png")
browser.quit()
PS:selenium
库同样可以使用pip命令安装:
pip install selenium
另外,使用selenium时还需要下载geckodriver来驱动第三方浏览器,对于selenium3.x版本都会使用geckodriver来驱动firefox,所以需要下载geckodriver.exe,下载地址:https://github.com/mozilla/geckodriver/releases
下载后将geckodriver.exe放在C:\Python27即可(查看环境变量path中是否添加C:\Python27该路径)
希望本文所述对大家Python程序设计有所帮助。
来源:https://blog.csdn.net/wang1472jian1110/article/details/72642605
0
投稿
猜你喜欢
- 首先,来看每次处理一个字符的情况,可以有如下方法去实现:方法一: >>> a='
- 本文实例为大家分享了Python密码强弱判断的具体代码,供大家参考,具体内容如下程序说明:通过获取用户输入,判断密码长度是否大于8,同时判断
- 如何在ADO中客户端利用好缓存技术?具体应用见下例:global.asa< !--METADATA TYPE=&q
- 一、Python的字典在项目的开发过程中,如果遇到有映射关系的内容可以考虑使用Python中的字典进行存储数据,字典中冒号前的数据称为【键】
- 现在我们已经知道了,fixtures是一个非常强大的功能。那么有的时候,我们可能会写一个fixture,而这个fixture所有的测试函数都
- 项目开发中文件的读写是必不可少的下面来简单介绍一下文件的读读文件,首先我们要有文件那我首先自己创建了一个文本文件password.txt内容
- 本文实例讲述了Python列表list操作符。分享给大家供大家参考,具体如下:#coding=utf8''''
- PHP有一组进程控制函数(编译时需要–enable-pcntl与posix扩展),使得php能实现跟c
- 下面这段代码,不会替换ld<sad中间的<,所以内容仍然是正常的 <% function nohtml(str) dim
- mysql4.1以上版本连接时出现Client does not support authentic
- df.dropna()函数用于删除dataframe数据中的缺失数据,即 删除NaN数据.官方函数说明:DataFrame.dropna(a
- 查找二分查找二分搜索是一种在有序数组中查找某一特定元素的搜索算法。搜索过程从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结
- 摘 要: 恢复丢失的数据库文件在很大程度上取决于所采用的备份策略。本文从恢复的灵活性出发,对Oracle8数据库的备份及恢复策略进行了探讨,
- 如下所示:Description:将一个矩阵(二维数组)按对角线向右进行打印。(搜了一下发现好像是美团某次面试要求半小时手撕的题)Examp
- 有时你需临时搭建一个简单的 Web Server,但你又不想去安装 Apache、Nginx 等这类功能较复杂的 HTTP 服务程序时。这时
- 线程Threading用于提供线程相关的操作。线程是应用程序中工作的最小单元,它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程
- 升序import pandas as pdimport numpy as npdata = np.random.randint(low=2,
- 上线 Django 项目记录,超简单,避免无意义的踩坑!第一步:安装python管理器在宝塔在线面板安装“ python项目管理器 ”第二步
- 本文实例讲述了Python反射和内置方法重写操作。分享给大家供大家参考,具体如下:isinstance和issubclassisinstan
- 通常我们在制作上图的时候,会分别给四个div加上不同的css属性,来实现中间间隔。但我们更希望的是不需要对html标签做标识,直接能通过cs