一文详解Python中多进程和进程池的使用方法
作者:小小鸟爱吃辣条 发布时间:2023-12-01 04:10:12
Python是一种高级编程语言,它在众多编程语言中,拥有极高的人气和使用率。Python中的多进程和进程池是其强大的功能之一,可以让我们更加高效地利用CPU资源,提高程序的运行速度。本篇博客将介绍Python中多进程和进程池的使用方法,并提供一些实用的案例供读者参考。
一、多进程
多进程是指在同一计算机上,有多个进程同时执行不同的任务。Python中的多进程是通过multiprocessing模块来实现的。下面是一个简单的多进程示例:
import multiprocessing
def task(num):
print('Task %d is running.' % num)
if __name__ == '__main__':
for i in range(5):
p = multiprocessing.Process(target=task, args=(i,))
p.start()
上述代码中,我们定义了一个task函数,它接受一个参数num,用于标识任务。在主程序中,我们创建了5个进程,每个进程都执行task函数,并传入不同的参数。通过start()方法启动进程。运行上述代码,可以看到输出结果类似于下面这样:
Task 0 is running.
Task 1 is running.
Task 2 is running.
Task 3 is running.
Task 4 is running.
由于多进程是并发执行的,因此输出结果的顺序可能会有所不同。
二、进程池
进程池是一种管理多进程的机制,它可以预先创建一定数量的进程,并将任务分配给这些进程执行。Python中的进程池是通过ProcessPoolExecutor类来实现的。下面是一个简单的进程池示例:
import concurrent.futures
def task(num):
print('Task %d is running.' % num)
if __name__ == '__main__':
with concurrent.futures.ProcessPoolExecutor(max_workers=3) as executor:
for i in range(5):
executor.submit(task, i)
上述代码中,我们使用了with语句创建了一个ProcessPoolExecutor对象,其中max_workers参数指定了进程池中最大的进程数量。在主程序中,我们创建了5个任务,每个任务都通过executor.submit()方法提交给进程池执行。运行上述代码,可以看到输出结果类似于下面这样:
Task 0 is running.
Task 1 is running.
Task 2 is running.
Task 3 is running.
Task 4 is running.
由于进程池中最大的进程数量为3,因此只有3个任务可以同时执行,其他任务需要等待进程池中的进程空闲后再执行。
三、使用案例
下面是一个实际的案例,展示了如何使用多进程和进程池来加速数据处理过程。假设我们有一个包含1000个元素的列表,需要对每个元素进行某种运算,并将结果保存到另一个列表中。我们可以使用单进程的方式来实现:
def process(data):
result = []
for item in data:
result.append(item * 2)
return result
if __name__ == '__main__':
data = list(range(1000))
result = process(data)
print(result)
上述代码中,我们定义了一个process函数,它接受一个列表作为参数,对列表中的每个元素进行运算,并将结果保存到另一个列表中。在主程序中,我们创建了一个包含1000个元素的列表,并将其传递给process函数。运行上述代码,可以看到输出结果类似于下面这样:
[0, 2, 4, 6, 8, ..., 1996, 1998]
由于这是单进程的方式,因此处理1000个元素的时间可能会比较长。我们可以通过多进程和进程池来加速这个过程:
import concurrent.futures
def process_chunk(chunk):
result = []
for item in chunk:
result.append(item * 2)
return result
def process(data):
result = []
chunk_size = 100
chunks = [data[i:i+chunk_size] for i in range(0, len(data), chunk_size)]
with concurrent.futures.ProcessPoolExecutor(max_workers=4) as executor:
futures = [executor.submit(process_chunk, chunk) for chunk in chunks]
for future in concurrent.futures.as_completed(futures):
result += future.result()
return result
if __name__ == '__main__':
data = list(range(1000))
result = process(data)
print(result)
上述代码中,我们首先将原始列表按照一定大小(这里是100)进行分块,然后将每个块提交给进程池中的进程执行。最后,我们使用concurrent.futures.as_completed()方法等待所有进程执行完毕,并将它们的结果合并到一个列表中。运行上述代码,可以看到输出结果与之前相同,但是处理时间可能会缩短很多。
来源:https://juejin.cn/post/7221969436885483577


猜你喜欢
- 前言最近有人对自动上传与发布很感兴趣,都私下找我说了好几次了。今天,必须把他安排,必须实力宠粉。“本篇依次介绍目前主流的
- 需求是:针对三篇英文文章进行分析,计算出现次数最多的 10 个单词逻辑很清晰简单,不算难, 使用 python 读取多个 txt 文件,将文
- 为了庆祝自己的博客重新开放,我在这里放一个自己刚刚写的jquery日期插件, 也许人们会说:日期选取插件已
- webp 格式的图片显示异常webp介绍WebP,谷歌(google)开发的一种旨在加快图片加载速度的图片格式。提供了有损压缩与无损压缩(可
- 通过变量ID得到变量的值已知获得变量的id用函数id(),那么它的反函数是什么?答案是:PyObj_FromPtr,据此,写了一个函数di(
- 最近在项目中出现golang内存溢出的问题,master刚开始运行时只有10多M,运行几天后,竟然达到了10多个G。而且到凌晨流量变少内存也
- 1.ROOT_URLCONF = '总路由所在路径(比如untitled.urls)'<===默认情况是这样根路由的路
- 引言如果熟悉使用JDBC来连接数据库的同学一定很清楚连接数据库的代码中一定会有依据Class.forName("com.mysql
- 一、多层前向神经网络多层前向神经网络由三部分组成:输出层、隐藏层、输出层,每层由单元组成;输入层由训练集的实例特征向量传入,经过连接结点的权
- 首先是数据源:#需要求加权平均值的数据列表elements = []#对应的权值列表weights = []使用numpy直接求:impor
- 一个网站的导航就相当于是一条路的路标,不同的是,网站的不同栏目页的入口远远比马路要来得复杂,所以一个清晰的导航设计对于一个网站的意义远远大于
- 项目需要,做一个和今日头条一样的导航栏,可以横行滚动,幸好再weui里面看到了类似的例子地址:https://weui.shanliwawa
- 问题1问题描述:TypeError: default_collate: batch must contain tensors, numpy
- Lightbox里面的一个函数,能把页面实际的高宽与浏览器可视面积的高宽保存在一个数组中..非常好用.什么是Lightbox?下载light
- ADO也提供更有效率方法来取得数据。GetRows 方法传回一个二维的数组变量,每一行对应Recordset中的一笔记录,且每
- Django1.11配合uni-app发起微信支付!经过三天的断断续续的奋战,我终于是干动了微信支付。为了以后不忘记,现在来一篇教程,来来来
- APScheduler简介在平常的工作中几乎有一半的功能模块都需要定时任务来推动,例如项目中有一个定时统计程序,定时爬出网站的URL程序,定
- [Q]怎么样查询特殊字符,如通配符%与_ [Q]如何插入单引号到数据库表中 [Q]怎样设置事务一致性 [Q]怎么样利用光标更新数据 [Q]怎
- 最近在D4得到一本(美) Penny Mcintire写的《Visual Design for the Modern Web》.突然觉得可用
- 假设你想设计一个模块集(也就是一个“包”)来统一处理声音文件和声音数据。通常由它们的扩展有不同的声音格式,例如:WAV,AIFF,AU),所