用python制作个论文下载器(图形化界面)
作者:不正经的kimol君 发布时间:2022-08-01 00:04:15
目录
一、使用说明
二、代码分析
1. 功能函数
2. 回调函数
3. 线程生成函数
4. 效果展示
写在最后
在科研学习的过程中,我们难免需要查询相关的文献资料,而想必很多小伙伴都知道SCI-HUB,此乃一大神器,它可以帮助我们搜索相关论文并下载其原文。可以说,SCI-HUB造福了众多科研人员,用起来也是“美滋滋”。
在上一篇文章中介绍了分析过程以及相应的函数代码。根据小伙伴们的反映发现了一些问题,毕竟命令框的形式用起来难免没那么“丝滑”。为了让大家更方便地使用,可以“纵享丝滑”,kimol君决定写一个图形界面(GUI):
PS.由于近期实属忙到晕厥,这是kimol君用疯狂压榨出来的时间写的,所以界面比较简陋,还望大家多多体谅哦~
一、使用说明
这个小玩意儿我们姑且称之为“SCI-Downloader”好了~
它支持单篇论文下载和批量论文下载:
单篇下载:在论文标题栏输入论文的标题、DOI号或PMID号,然后选择论文存储的目录,点击开始即可!
批量下载:在论文标题那里选择一个.txt文本,文本里面包含了每篇需要下载的论文,其格式如下:
然后,emmm…没有然后了~
就是这么简单快捷,还不快来试试看,等啥呢?
二、代码分析
本次图形界面的开发是基于PyQT5的,具体界面的布置这里就不过多的介绍了,主要是对其中的功能实现进行说明:
其实思路很简单,由于之前已经有了论文下载的相关函数,我们只需要定义一个Button,然后将其绑定到下载函数即可。
这有啥?完全没难度嘛。然而,你试过就会知道,界面卡顿了。这是因为下载函数所消耗的时间较长,如果让它直接在主线程里面执行的话,将会和维持界面的主程序冲突,从而出现卡顿。因此,我们将要用到QThread来执行功能函数,回调函数来进行界面更新,示意图如下:
当然,这个示意图并不是那么严谨,大家辩证地看看就好了。这么一来,每个功能即可分为三个部分:Qthread类的功能函数、回调函数、线程生成函数(该函数与Button直接绑定)。
1. 功能函数
继承Qthread类,并对其中的run函数进行重定义,这是实现具体功能的模块,并且把状态通过signal的方式传递给回调函数:
class runthread(QtCore.QThread):
# 通过类成员对象定义信号对象
_signal = QtCore.pyqtSignal(str)
def __init__(self, titleText, saveText):
super(runthread, self).__init__()
self.titleText = titleText
self.saveText = saveText
def __del__(self):
self.wait()
def run(self):
if self.titleText == '' or self.saveText == '': # 如果为空
self._signal.emit('EMPTY')
return
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0',
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
'Accept-Encoding':'gzip, deflate, br',
'Connection':'keep-alive',
'Upgrade-Insecure-Requests':'1'}
if not self.titleText.endswith('.txt'): # 如果不为目录(即单篇论文标题)
self._signal.emit('SEARCH')
downUrl = search_article(self.titleText)
if downUrl == '': # 如果搜索结果为空
self._signal.emit('NULL')
return
else:
try:
self._signal.emit('DOWNLOAD')
res = requests.get(downUrl, headers=headers, stream=True)
fileSize = int(res.headers['Content-Length'])
print(fileSize)
savedSize = 0
saveName = change_title(self.titleText)
with open('%s/%s.pdf'%(self.saveText,saveName), 'wb') as f:
for chunk in res.iter_content(chunk_size=1024):
if chunk:
f.write(chunk)
savedSize += len(chunk)
progress = int(savedSize/fileSize*100)
self._signal.emit('PRO-%d'%progress)
self._signal.emit('SUCCESS')
except:
self._signal.emit('FAILED')
else:
paperList = read_file(self.titleText)
if paperList == '':
self._signal.emit('FILEWRONG')
else:
error = [] # 用于记录失败的论文
self._signal.emit('BATCH-%d'%len(paperList))
for i in range(len(paperList)):
try:
downUrl = search_article(paperList[i])
print(downUrl)
pdf = download_article(downUrl)
saveName = change_title(paperList[i])
with open('%s/%s.pdf'%(self.saveText,saveName), 'wb') as f:
f.write(pdf)
except:
error.append(paperList[i])
self._signal.emit('NUM-%d'%(i+1))
with open('./errors.txt', 'w') as f:
for e in error:
f.write(e+'\n')
self._signal.emit('COMPLETED-%d'%len(error))
2. 回调函数
通过监听来自功能函数的信号,对界面进行相应的更新,例如错误提醒或者下载完毕提示等等:
def call_backrun(self, msg):
if msg == 'EMPTY':
QtWidgets.QMessageBox.warning(self.centralwidget, '警告', '标题或目录为空!')
if msg == 'SEARCH':
self.runButton.setVisible(False)
self.quitButton.setVisible(False)
self.searchLabel.setVisible(True)
if msg == 'NULL':
self.runButton.setVisible(True)
self.quitButton.setVisible(True)
self.searchLabel.setVisible(False)
QtWidgets.QMessageBox.information(self.centralwidget, '提示', '未搜到相应论文!')
if msg == 'DOWNLOAD':
self.searchLabel.setVisible(False)
self.progressBar.setVisible(True)
self.progressBar.setFormat('%%p')
self.progressBar.setValue(0)
if 'PRO' in msg:
pro = int(msg.split('-')[-1])
self.progressBar.setValue(pro)
if msg == 'SUCCESS':
self.progressBar.setVisible(False)
self.runButton.setVisible(True)
self.quitButton.setVisible(True)
self.titleEdit.setText('')
QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载完毕!')
if msg == 'FAILED':
self.progressBar.setVisible(False)
self.runButton.setVisible(True)
self.quitButton.setVisible(True)
QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载失败!')
if msg == 'FILEWRONG':
QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文列表错误!')
if 'BATCH' in msg:
sumNumber = msg.split('-')[-1]
self.runButton.setVisible(False)
self.quitButton.setVisible(False)
self.progressBar.setVisible(True)
self.progressBar.setFormat('【%v/'+sumNumber+'】')
self.progressBar.setMinimum(0)
self.progressBar.setMaximum(int(sumNumber))
self.progressBar.setValue(0)
if 'NUM' in msg:
num = int(msg.split('-')[-1])
self.progressBar.setValue(num)
if 'COMPLETED' in msg:
errorNum = int(msg.split('-')[-1])
self.progressBar.setVisible(False)
self.runButton.setVisible(True)
self.quitButton.setVisible(True)
self.titleEdit.setText('')
QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载完毕!\n(%d个失败)'%errorNum)
3. 线程生成函数
这个函数与相应的按钮(Button)绑定,当触发时即创建一个对应的功能函数线程:
def run(self):
titleText = self.titleEdit.text()
saveText = self.saveEdit.text()
# 创建线程
self.runthread = runthread(titleText, saveText)
# 连接信号
self.runthread._signal.connect(self.call_backrun) # 进程连接回传到GUI的事件
# 开始线程
self.runthread.start()
4. 效果展示
大功告成之后,点击开始按钮,一键入魂:
无数的论文正在快马加鞭地向我奔来~
写在最后
通过简单地测试,功能基本上没有太大的问题,就是界面可能相对比较简陋,后续如果有时间的话我也将持续更新,当然也欢迎各位大大提出宝贵的意见呀~
此外,为了让大家更方便地使用,我已经将代码打包exe可执行文件,双击即可开启新世界的大门,不爽吗?
下载地址:https://wws.lanzous.com/iQE7Akpafid
来源:https://blog.csdn.net/kimol_justdo/article/details/112996678
猜你喜欢
- 如下所示://动态删除select中的所有options: function delAllOptions(){&nb
- 前言sort包中实现了3种基本的排序算法:插入排序.快排和堆排序.和其他语言中一样,这三种方式都是不公开的,他们只在sort包内部使用.所以
- 1、使用+加号+加号是将两个list列表相加,返回一个新的列表对象,会消耗额外的内存。#!/usr/bin/env python# -*-
- 很多人一直都有个想法,要是可以随心所欲的操作iframe就好了。这样静态页面也就有了相当于后台动态页面php,jsp,asp中include
- 打开链接是在新窗口还是原窗口是一个最基础的交互方式。但是很多项目进行中,我们的原型设计并没有仔细考虑链接打开方式。而为了满足运营的需要,选择
- 一、Celery介绍和基本使用 Celery 是一个 基于python开发的分布式异步消息任务队列,通过它可以轻松的实现任务的异步处理, 如
- 获取评论贴的请求头与表单数据下一篇在这里这里,我们随便选取一个网站,获取该贴评论后的请求头,表单数据以及评论贴链接。(因为涉及敏感信息,自己
- 一. 什么是Selenium?网络爬虫是Python编程中一个非常有用的技巧,它可以让您自动获取网页上的数据。在本文中,我们将介绍如何使用S
- Unsafe code是一种绕过go类型安全和内存安全检查的Go代码。大多数情况,unsafe code是和指针相关的。但是要记住使用uns
- 锟拷码和口字码说到乱码问题就不得不提到锟斤拷,这算是非常常见的一种乱码形式,那么它到底是经过何种错误操作产生的呢?下面我们一步步探究。看一个
- 导语:除夕除夕,就是除去烦脑,迎接新的希望!在这里小编先祝大家除夕快乐,岁岁常欢笑,事事皆如意!正文:创建画布setup和draw是p5.j
- 核心导出作业的 代码 和 作业备份是相似的 代码如下:alter PROC DumpJob (@job VARCHAR(100)
- 这本入门手册是否合适你?我只想告诉你我非常喜欢这本书。我对Microsoft Access的经验足以让我跳过这本傻瓜系列教材,但是实际情况是
- ASP有一个最重要的功能,就是它可以让你非常轻松地连接数据库。通常都是和一个Access或者一个SQL数据库相连。因为Access是最容易起
- 如何用表单在线建立目录?很简单,两个文件就搞定了:creatfolder.htm' 表单文件<form n
- 1、实现 __getitem__(self)class Library(object): def __init__(self):
- 前言随着 Kotlin 1.4 正式发布,关于 SAM 转换的一些问题就可以盖棺定论了。因为这里要讲的都是些旧的东西,所以这是一篇灌水文。K
- 1、python代码实现图片分割成九宫格需要包含的库,没有下载安装的,需要自己安装哦。实现原理很简单,就是用PIL库不断画小区域,切下来存储
- Logo是品牌图形区别的点睛之处,我们每天都要接触很多logo - 在高速公路上,在购买商品时,以及浏览各种网站。我们查看很多logo设计,
- 我使用的是anaconda安装的环境,其中有一个是h5py,自动安装的是2.7.0的版本,这个版本会导致保存模型时python奔溃。cond