利用PyQt5制作一个豆瓣电影信息查看器
作者:Python集中营 发布时间:2021-03-05 05:57:28
标签:PyQt5,电影,信息查看
制作一个查看器可以查看豆瓣前100名电影的信息,当然这个爬取信息比较简单。所以重点放在 QThread 多线程的应用上面。
QThread 子线程是 PyQt5 自带的一个线程使用,因为如果使用 PyQt5 的主线程去做所有的事情。如果处理速度太慢的情况下主线程就会直接出现卡死状态。
网络信息提取的相关模块有下面这些,主要是一个获取 Html 信息,另一个解析 Html5 的页面信息。
import requests # 网络请求库
from bs4 import BeautifulSoup # H5页面元素解析库
from fake_useragent import UserAgent # 身份信息生成库
UI 界面布局相关的模块。
from PyQt5.QtWidgets import *
from PyQt5.QtGui import *
from PyQt5.QtCore import *
应用操作相关的模块。
import sys
先把专门用于信息爬取的独立线程写好。新建一个线程类继承自 QThread,其中最重要的是要写上 init、del、run这几个函数。这几个函数对线程类 QThread 里面的函数重写的,业务逻辑是通过 run 函数实现的。
'''
独立线程处理信息爬取
'''
class DouBanWorker(QThread):
trigger = pyqtSignal(str)
finished = pyqtSignal(bool)
def __init__(self, parent=None):
super(DouBanWorker, self).__init__(parent)
self.parent = parent
self.url = 'https://movie.douban.com/top250?start={}&filter='
self.working = True
def __del__(self):
self.working = False
self.wait()
def run(self):
# 构造useragent身份设备信息
headers = {
"User-Agent": str(UserAgent().random),
}
for page in range(4):
url = self.url.format(page * 25)
response = requests.get(url, headers=headers)
bs = BeautifulSoup(response.text, 'html.parser')
movie_list = bs.find_all('div', class_='item')
for movie in movie_list:
movie_seq = movie.find('em').text
movie_name = movie.find('span').text
movie_score = movie.find("span", class_='rating_num').text
movie_inst = movie.find("span", class_='inq').text
movie_link = movie.find('a')['href']
self.trigger.emit('\n')
self.trigger.emit('排名:' + movie_seq + '\n')
self.trigger.emit('名称:' + movie_name + '\n')
self.trigger.emit('评分:' + movie_score + '\n')
self.trigger.emit('描述:' + movie_inst + '\n')
movie_link = "<font color='blue'>" + movie_link + "</font>"
self.trigger.emit('链接:' + movie_link + '\n')
self.finished.emit(True)
主界面的 UI 布局信息比较简单,主要是一个文本浏览器和一个开始的按钮组成的。
def init_ui(self):
'''
初始化UI界面布局
:return:
'''
self.setWindowTitle('豆瓣电影排名')
self.setWindowIcon(QIcon('电影.ico'))
self.resize(400, 300)
vbox = QVBoxLayout()
self.result_brower = QTextBrowser()
self.result_brower.setFont(QFont('宋体', 8))
self.result_brower.setReadOnly(True)
self.result_brower.setPlaceholderText('信息展示区域')
self.result_brower.ensureCursorVisible()
vbox.addWidget(self.result_brower)
self.thread_ = DouBanWorker(self)
self.thread_.trigger.connect(self.update_log)
self.thread_.finished.connect(self.finished)
self.start_btn = QPushButton()
self.start_btn.setText('获取前100名豆瓣电影详细信息')
self.start_btn.clicked.connect(self.start_btn_click)
vbox.addWidget(self.start_btn)
self.setLayout(vbox)
文本浏览器内容保持追加更新的槽函数,将电影信息获取的实施进度追加到页面上可以看到。
def update_log(self, text):
'''
槽函数:向文本浏览器中写入内容
:param text:
:return:
'''
cursor = self.result_brower.textCursor()
cursor.movePosition(QTextCursor.End)
self.result_brower.append(text)
self.result_brower.setTextCursor(cursor)
self.result_brower.ensureCursorVisible()
开始按钮上关联的槽函数,用这个函数在收到主线程的开始命令时来启动子线程的运行,子线程就会自动去爬取豆瓣上面的排名信息。
def start_btn_click(self):
'''
槽函数:启动子线程爬取豆瓣电影信息
:return:
'''
self.start_btn.setEnabled(False)
self.thread_.start()
在收到子线程执行完成的信息时,将开始按钮完成可用的状态可以点击再次执行。
def finished(self, finished):
'''
槽函数:处理完成时将开始按钮变成可点击状态
:param finished:
:return:
'''
if finished is True:
self.start_btn.setEnabled(True)
完成后,启动后台入口函数,最后看一下入口函数的写法和往常是一样的。
if __name__ == '__main__':
'''
主函数入口
'''
app = QApplication(sys.argv)
main = DouBanUI()
main.show()
sys.exit(app.exec_())
来源:https://www.cnblogs.com/lwsbc/p/15815656.html
0
投稿
猜你喜欢
- 今天重新研究了下VB里面的ScriptControl组件,发现asp里面也能调用。研究了下方法,后来和lcx讨论了下。得到了如下代码,在此感
- 一、打包多个1、将需要打包的项目为anjuke_sd目录下的所有python文件,其中excute_main.py为主文件。2、生成主函数对
- SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它
- 由于卷积神经网络的设计是用于探索图像数据,本节我们将以图像为例。互相关运算严格来说,卷积层是个错误的叫法,因为它所表达的运算其实是互相关运算
- 用phpMyAdmin时在导入和导出MySQL5数据时,有一个SQL compatibility mode选项,其可选值为NONE、ANSI
- 一、先看最简单的情况。有两个数组: $arr1 = array(1,9,5); $arr2 = array(6,2,4); array_mu
- 如何使用数组来显示下拉菜单?可以这样,如下:Sub DoDropDown(Arr(), strSelName, 
- 使用Python绘制正态分布曲线,借助matplotlib绘图工具;#-*-coding:utf-8-*-"""
- 本文实例讲述了Python装饰器。分享给大家供大家参考。具体分析如下:这是在Python学习小组上介绍的内容,现学现卖、多练习是好的学习方式
- 注意主窗口一定要为tk.Tk(),在主窗口上通过button的点击相应子函数创建子窗口,注意此时创建出来的窗口必须是Toplevel,否则出
- 本文要点:爬虫的基本流程requests模块的使用保存csv可视化分析展示环境介绍python 3.8pycharm 2021专业版 激活码
- 要将身份证的正反面图片合并为一张图片,你可以使用PHP的GD库来完成。演示了如何合并两张图片下面是一个示例代码,演示了如何合并两张图片://
- 1 获取轮廓OpenCV2获取轮廓主要是用cv2.findContoursimport numpy as npimport cv2im =
- 无论是Windows、Linux、还是树莓派 。配置python3的opencv环境都是让人头大的一件事情,尤其是许多人用pip安装以后,发
- 运行多进程 每个子进程的内存空间是互相隔离的 进程之间数据不能共享的互斥锁但是进程之间都是运行在一个操作系统上,进程之间数据不共享,但是共享
- 前言 可迭代对象就像密闭容器里的水,有货倒不出itertools是python内置的标准模块,提供了很多简洁又高效的专用功能,使用
- django-admin基本介绍Django 提供了基于 web 的管理工具。Django 自动管理工具是 django.contrib 的
- 本文详细介绍了array_slice函数的详细用法以及一些常用的array_slice实例程序,分享给大家供大家参考。具体分析如下:arra
- 如下所示:str='abcdef'print(str.endswith('f'))print(str.sta
- 前言python 文件操作、文件读写(write、read、readlines、readline)、文件的相关操作,简单易懂1 文件操作文件