Skip to content

🚀 使用PyQt5图形界面的Python多线程nhentai爬虫

Notifications You must be signed in to change notification settings

chenyuqin-dlut/nhentai-imgcollect

Repository files navigation

🚀 使用PyQt5图形界面的Python多线程nhentai爬虫

Python PyQt5 界面与逻辑分离 信号与槽函数 多线程 Queue消息队列 爬虫 pyinstaller

⚠️ 本程序仅供交流学习之用,请勿用于其他用途

0. 基本信息

  • Python 3.7.4
  • PyQt5 (控制台版本不需要)

本软件是用于批量下载 ⬇️ 漫画网站 nhentai 画册的 python 爬虫 🕷️ 程序,带有图形界面(也提供不带图形界面的小体积版本),支持自定义多线程功能,使用 pyinstaller 进行了打包 📥 ,可以在未安装 python 的电脑上运行

1. 运行演示

1.1. 图形界面单任务多线程下载

上图为使用 20 线程下载一个有 20 张图的图册,可以看到,速度极快 ⚡ ,只要你的设备网络带宽够大 🌐 ,性能够强,你看的速度就赶不上下的速度 😆

1.2. 图形界面多任务多线程下载

没错,这个小玩意儿程序不光支持单任务多线程下载 ✈️ ,还支持多任务多线程下载 🚀 ,你可以在上一个任务还未结束之时就启动下一个任务,这也是将图形界面与业务逻辑进行分离带来的好处之一

这次,只要你复制粘贴的速度够快,下载的速度就追不上你 😜

1.3. 控制台版本

以下两个版本均支持单任务多线程,但不支持多任务

1.3.1. 运行时获取信息

对于 manual_main.py 及由其打包出来的独立程序 manual_mail.exe 在运行程序之后会提示输入画册简介页URL和使用线程数

1.3.2. 命令行直接传参

对于 main.py ,使用如下命令格式进行下载:

python main.py 简介页url 线程数

如:

python main.py https://xxxxtai.net/g/297941/ 5

⚠️ 请务必用完整、准确的简介页url指导下载工作

2. 程序框架

2.1. 单任务多线程的实现

如图所示,使用了 python 自带的 Thread 来创建下载线程并阻塞主线程,使用了 Queue 来填充任务队列,每个下载线程自行从任务队列中取出下载链接,当队列为空且本次下载已完成时,下载线程结束,当每一个下载线程均结束时,主线程不再阻塞,提示下载信息并等待用户输入回车结束程序

2.2. 多任务多线程的实现

🤫 千万别说这是 8051 通过 74138 片选存储器示意图:smiling_imp:

如图所示,在主界面点下下载按钮时,将会创建一个下载任务的实例并为它传入参数,这个任务的主线程将会根据传入的参数创建下载线程,每一个下载线程均能独立的发送信号,并通过绑定在信号上的槽函数 handleDisplay 向界面中的显示控件 textBrowser 追加文字

图中没有画出主线程发送信号的线,但实际上下载完成的信息是由主线程发送的信号来触发槽函数显示的

2.1. 图形界面

使用 Qt Creator 4.11.1 进行界面制作得到 mainwindow.ui 文件,再使用 pyuic5 命令将其转换为 layout.py 文件

pyuic5 -o layout.py mainwindow.ui

由于我使用的是 surface book 笔记本电脑,所以一下子就发现 Qt 并没有自动的适配高分屏(布局很挤,有些字只显示了半截),所以需要在实例化图形界面的代码之前加上一句:

QtCore.QCoreApplication.setAttribute(QtCore.Qt.AA_EnableHighDpiScaling)

由于在 Qt Creator 里面设计时采用的是栅格布局,而且给必要的控件设置了自适应,所以任摔任打,效果还行