网络编程
位置:首页>> 网络编程>> Python编程>> 使用Python保存网页上的图片或者保存页面为截图

使用Python保存网页上的图片或者保存页面为截图

作者:j_akill  发布时间:2022-04-08 10:45:19 

标签:Python,图片

Python保存网页图片
这个是个比较简单的例子,网页中的图片地址都是使用'http://。。。。.jpg'这种方式直接定义的。

使用前,可以先建立好一个文件夹用于保存图片,本例子中使用的文件夹是 d:\\pythonPath这个文件夹

代码如下:


# -*- coding: UTF-8 -*-
import os,re,urllib,uuid

#首先定义云端的网页,以及本地保存的文件夹地址
urlPath='http://gamebar.com/'
localPath='d:\\pythonPath'

#从一个网页url中获取图片的地址,保存在
#一个list中返回
def getUrlList(urlParam):
 urlStream=urllib.urlopen(urlParam)
 htmlString=urlStream.read()
 if( len(htmlString)!=0 ):
   patternString=r'http://.{0,50}\.jpg'
   searchPattern=re.compile(patternString)
   imgUrlList=searchPattern.findall(htmlString)
   return imgUrlList

#生成一个文件名字符串  
def generateFileName():
 return str(uuid.uuid1())

#根据文件名创建文件  
def createFileWithFileName(localPathParam,fileName):
 totalPath=localPathParam+'\\'+fileName
 if not os.path.exists(totalPath):
   file=open(totalPath,'a+')
   file.close()
   return totalPath

#根据图片的地址,下载图片并保存在本地  
def getAndSaveImg(imgUrl):
 if( len(imgUrl)!= 0 ):
   fileName=generateFileName()+'.jpg'
   urllib.urlretrieve(imgUrl,createFileWithFileName(localPath,fileName))

#下载函数
def downloadImg(url):
 urlList=getUrlList(url)
 for urlString in urlList:
   getAndSaveImg(urlString)

downloadImg(urlPath)

保存的文件如下:

使用Python保存网页上的图片或者保存页面为截图


网页的一部分保存为图片
主要思路是selenium+phantomjs(中文网页需要设置字体)+PIL切图


def webscreen():
 url = 'http://www.xxx.com'
 driver = webdriver.PhantomJS()
 driver.set_page_load_timeout(300)
 driver.set_window_size(1280,800)
 driver.get(url)
 imgelement = driver.find_element_by_id('XXXX')
 location = imgelement.location
 size = imgelement.size
 savepath = r'XXXX.png'
 driver.save_screenshot(savepath)
 im = Image.open(savepath)
 left = location['x']
 top = location['y']
 right = left + size['width']
 bottom = location['y'] + size['height']
 im = im.crop((left,top,right,bottom))
 im.save(savepath)
0
投稿

猜你喜欢

手机版 网络编程 asp之家 www.aspxhome.com