编写Python脚本批量下载DesktopNexus壁纸的教程
作者:goldensun 发布时间:2022-05-27 01:17:38
标签:Python
DesktopNexus 是我最喜爱的一个壁纸下载网站,上面有许多高质量的壁纸,几乎每天必上, 每月也必会坚持分享我这个月来收集的壁纸
但是 DesktopNexus 壁纸的下载很麻烦,而且因为壁纸会通过浏览器检测你当前分辨率来展示 合适你当前分辨率的壁纸,再加上是国外的网站,速度上很不乐观。
于是我写了个脚本,检测输入的页面中壁纸页面的链接,然后批量下载到指定文件夹中。
脚本使用 python 写的,所以需要机器上安装有 python 。
用法:
$ python desktop_nexus.py -p http://www.desktopnexus.com/tag/cat/ -s 1280x800 -o wallpapers
-p 包含 DesktopNexus 壁纸链接的页面,比如我的壁纸分享
-s 壁纸尺寸,可选,缺省为 1440x900
-o 壁纸输出的文件夹,可选,缺省为当前目录下的 wallpapers, 如果不存在会自动创建
代码:
#-*- coding: utf-8 -*-
from argparse import ArgumentParser
import os, re, sys
import urllib2, cookielib, urlparse
RE_WALLPAPER = r'http\:\/\/[^\/\.]+\.desktopnexus\.com\/wallpaper\/\d+\/'
CHUNK_SIZE = 1024 * 3
class DesktopNexus:
def __init__(self, page=None, size=None, output_dir=None):
self.page = page
self.size = size
self.output_dir = output_dir
def start(self):
print 'Making output directory:', self.output_dir
if not os.path.exists(self.output_dir):
os.makedirs(self.output_dir)
# Setup cookie
cookie = cookielib.CookieJar()
processer = urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(processer)
urllib2.install_opener(opener)
self._read_page()
def _get_pic_info(self, url):
pic_id = url.split('/')[-2]
html = urllib2.urlopen(url).read()
pattern = r'<a href=\"\/get\/%s\/\?t=(?P<token>.*?)\"' % pic_id
match = re.search(pattern, html, flags=re.I|re.M|re.S)
if match:
return {'id': pic_id,
'token': match.group('token'),
'size': self.size}
else:
raise Exception('Cound not find wallpaper')
def _get_pic_file(self, pic_info):
redirect_url = 'http://www.desktopnexus.com/dl/inline/%(id)s/%(size)s/%(token)s' % pic_info
request = urllib2.urlopen(redirect_url)
return request.geturl()
def _download_pic(self, url):
pic_info = self._get_pic_info(url)
pic_file = self._get_pic_file(pic_info)
filename = os.path.split(urlparse.urlparse(pic_file).path)[-1]
filename = os.path.join(self.output_dir, filename)
with open(filename, 'wb') as output:
resp = urllib2.urlopen(pic_file)
total_size = int(resp.info().get('Content-Length'))
saved_size = 0.0
while saved_size != total_size:
chunk = resp.read(CHUNK_SIZE)
saved_size += len(chunk)
output.write(chunk)
self._print_progress('Saving file: %s' % filename, \
saved_size / total_size * 100)
def _print_progress(self, msg, progress):
sys.stdout.write('%-71s%3d%%\r' \
% (len(msg) <= 70 and msg or msg[:67] + '...', progress))
sys.stdout.flush()
if progress >= 100:
sys.stdout.write('\n')
def _read_page(self):
try:
print 'Fetching content:', self.page
html = urllib2.urlopen(self.page).read()
links = set(re.findall(RE_WALLPAPER, html, re.M|re.I))
count = len(links)
print 'Downloading wallpapers:'
for i, link in enumerate(links):
print '[%d/%d]: %s' % (i + 1, count, link)
try:
self._download_pic(link)
except Exception as e:
print 'Error downloading wallpaper.', e.message
except Exception as e:
print 'Error fetching content.', e
if __name__ == '__main__':
# Setup argparser
parser = ArgumentParser('python desktop_nexus.py')
parser.add_argument('-p', '--page', dest='page', required=True, \
help='specific a page that includes wallpaper list')
parser.add_argument('-s', '--size', dest='size', default='1440x900', \
help='specific the wallpaper size, default to 1440x900')
parser.add_argument('-o', '--output', dest='output_dir', default='wallpapers', \
help='specific the output directory, default to "wallpapers"')
args = parser.parse_args()
dn = DesktopNexus(**args.__dict__)
dn.start()
0
投稿
猜你喜欢
- 0. 前言数据处理过程中,可视化可以更直观得感受数据,因此打算结合自己的一些实践经理,以效果为准写这篇博客。内容应该会不断扩充。1. mat
- 很开心可以和导师阿坚在08gui大赛中一起去完成《fight》的图标设计,在这个过程中真的是受益匪浅!这里我谈一下在这个过程的一些小小心得。
- 解析html是爬虫后的重要的一个处理数据的环节。一下记录解析html的几种方式。先介绍基础的辅助函数,主要用于获取html并输入解析后的结束
- IE下window.lcoation可以被重写而不重新定向,具体方法是: var location = {},然后就可以重写具体的属性了,这
- 1,定义和注册中间件在注册的中间件中使用:from django.http import HttpResponseRedirect'
- 本文实例总结了Python2与Python3的区别。分享给大家供大家参考,具体如下:Python的3??.0版本相对于Python的早期版本
- 如果您在试图打开一个.MDF数据库文件时,却发现自己没有安装SQL Server数据库,该怎么办呢?这时候,如果恰巧您的机子上装有Visua
- 本文实例为大家分享了vue动态控制el-table表格列的展示与隐藏的具体代码,供大家参考,具体内容如下1.引入el-table组件,这里我
- PHP下载图片后文件打开显示损坏问题用php写个图片下载方法,测试发现下载的图片大小都没问题,但是无法打开文件。解决方法如下:首先打开文件下
- 本文介绍一下 Pytorch 中常用乘法的 TensorRT 实现。pytorch 用于训练,TensorRT 用于推理是很多 AI 应用开
- Elasticsearch 是一个分布式的开源搜索和分析引擎,适用于所有类型的数据,包括文本、数字、地理空间、结构化和非结构化数据。Elas
- 前言通过pandas的使用,我们经常要交互式地展示表格(dataframe)、分析表格。而表格的格式就显得尤为重要了,因为大部分时候如果我们
- 延时摄影(英语:Time-lapse photography)是以一种较低的帧率拍 下图像或者视频,然后用正常或者较快的速率播放画面的摄影技
- 本文为大家分享了mysql8.0下载与安装,供大家参考,具体内容如下首先要做的是下载8.0版本的mysql,可以到官网上去下,直接百度搜索m
- <%@ Language=VBScript %><HTML><HEAD>
- 1.pickle对象串行化pickle模块实现了一个算法可以将任意的Python对象转换为一系列字节。这个过程也被称为串行化对象。可以传输或
- 前言前几天去我姐家里蹭饭吃,发现我姐家里的小外甥女儿已经上小学了,正在疯狂赶作业,加减乘除还有很多题目都经常出错。我姐说老师每天给他们布置了
- 进程想要执行任务就需要依赖线程。换句话说,就是进程中的最小执行单位就是线程,并且一个进程中至少有一个线程。那什么是多线程?提到多线程这里要说
- 一、Python简介1.python介绍Python由荷兰数学和计算机科学研究学会的Guido van Rossum 于1990 年代初设计
- 关于窗口函数的基础,请看文章SQL窗口函数取值窗口函数可以用于返回窗口内指定位置的数据行。常见的取值窗口函数如下:LAG函数可以返回窗口内当