Python使用多进程运行含有任意个参数的函数
作者:Jayce~ 发布时间:2023-10-14 23:22:12
1. 问题引出
许多时候,我们对程序的速度都是有要求的,速度自然是越快越好。对于Python的话,一般都是使用multiprocessing这个库来实现程序的多进程化,例如:
我们有一个函数my_print,它的作用是打印我们的输入:
def my_print(x):
print(x)
但是我们嫌它的速度太慢了,因此我们要将这个程序多进程化:
from multiprocessing import Pool
def my_print(x):
print(x)
if __name__ == "__main__":
x = [1, 2, 3, 4, 5]
pool = Pool()
pool.map(my_print, x)
pool.close()
pool.join()
很好,现在速度与之前的单进程相比提升非常的快,但是问题来了,如果我们的参数不只有一个x,而是有多个,这样能行吗?比如现在my_print新增一个参数y:
def my_print(x, y):
print(x + y)
查看pool.map的函数说明:
def map(self, func, iterable, chunksize=None):
'''
Apply `func` to each element in `iterable`, collecting the results
in a list that is returned.
'''
return self._map_async(func, iterable, mapstar, chunksize).get()
发现函数的参数是作为iter传进去的,但是我们现在有两个参数,自然想到使用zip将参数进行打包:
if __name__ == "__main__":
x = [1, 2, 3, 4, 5]
y = [1, 1, 1, 1, 1]
zip_args = list(zip(x, y))
pool = Pool()
pool.map(my_print, zip_args)
pool.close()
pool.join()
可是执行后却发现,y参数并没有被传进去:
那么如何传入多个参数呢?这也就是本文的重点,接着往下看吧。
2. 解决方案
2.1 使用偏函数(partial)
偏函数有点像数学中的偏导数,可以让我们只关注其中的某一个变量而不考虑其他变量的影响。上面的例子中,Y始终等于1,那么我们在传入参数的时候,只需要考虑X的变化即可。
例如你有一个函数,该函数有两个参数a,b,a是不同路径的下的图片的路径,b是输出的路径。很明显,a是一直在变化的,但是因为我们要将所有图片保存在同一个文件夹下,那么b很可能一直都没变。
具体如下:
if __name__ == '__main__':# 多线程,多参数,partial版本
x = [1, 2, 3, 4, 5]
y = 1
partial_func = partial(my_print, y=y)
pool = Pool()
pool.map(partial_func, x)
pool.close()
pool.join()
2.2 使用可变参数
在Python函数中,函数可以定义可变参数。顾名思义,可变参数就是传入的参数个数是可变的,可以是1个、2个到任意个,这就直接给我们提供了一种思路。具体如下:
def multi_wrapper(args):
return my_print(*args)
def my_print(x, y):
print(x + y)
if __name__ == "__main__": # 多线程,多参数,可变参数版本
x = [1, 2, 3, 4, 5]
y = [1, 1, 1, 1, 1]
zip_args = list(zip(x, y))
pool = Pool()
pool.map(multi_wrapper, zip_args)
pool.close()
pool.join()
2.3 使用pathos提供的多进程库
from pathos.multiprocessing import ProcessingPool as newPool
if __name__ == '__main__':# 多线程,多参数,pathos版本
x = [1, 2, 3, 4, 5]
y = [1, 1, 1, 1, 1]
pool = newPool()
pool.map(my_print, x, y)
pool.close()
pool.join()
在该库的map函数下,可以看到,它允许多参数输入,其实也就是使用了可变参数:
def map(self, f, *args, **kwds):
AbstractWorkerPool._AbstractWorkerPool__map(self, f, *args, **kwds)
_pool = self._serve()
return _pool.map(star(f), zip(*args)) # chunksize
2.4 使用starmap函数
if __name__ == '__main__': # 多线程,多参数,starmap版本
x = [1, 2, 3, 4, 5]
y = [1, 1, 1, 1, 1]
zip_args = list(zip(x, y))
pool = Pool()
pool.starmap(my_print, zip_args)
pool.close()
pool.join()
3. 总结
其实在以上4种实现方法中 ,第1种方法的限制较多,如果该函数的其它参数都在变化的话,那么它就不能很好地工作,而剩下的方法从体验上来讲是依次递增的,它们都可以接受任意多参数的输入,但是第2种需要额外写一个函数,扣分;第3种方法需要额外安装pathos包,扣分;而最后一种方法不需要任何额外不择就可以完成,所以,推荐大家选择第4种方法!
来源:https://blog.csdn.net/qq_15969343/article/details/84672527


猜你喜欢
- Payment Card Industry,即支付卡行业,PCI行业表示借记卡、信用卡、预付卡、电子钱包、ATM和POS卡及相关的业务。 P
- 很多朋友在做特效网页的时候需要用到雪花飘落的效果,我们这里给大家整理了分别用JS还有JQuery两种代码实现这个效果的方式。我们先来看一下需
- 获得当前时间时间戳# 注意时区的设置import time# 获得当前时间时间戳now = int(time.time())# 转换为其他日
- 本文实例为大家分享了JavaScript实现前端倒计时效果的具体代码,供大家参考,具体内容如下代码:<!DOCTYPE html>
- 描述在linux中获取进程cmdline时遇到隐藏符号问题,如下:[root@vm010066016161 /root]#cat /proc
- namedtuple 就是命名的 tuple,比较像 C 语言中 struct。一般情况下的 tuple 是 (item1, item2,
- 前言我们可以给视图函数加装饰器来判断是用户是否登录,把没有登录的用户请求跳转到登录页面等等。我们通过给几个特定视图函数加装饰器实现了这个需求
- 学一些比较知名的模型对身体有好处噢!什么是VGG16模型VGG是由Simonyan 和Zisserman在文献《Very Deep Conv
- 本文实例讲述了php简单实现批量上传图片的方法。分享给大家供大家参考,具体如下:<?phpfunction upload_multi(
- 1、下载安装包-根据自己电脑系统选择合适的版本:https://dev.mysql.com/downloads/mysql/2、配置环境变量
- 最简单的例子:a = [1,1,1,1,2,2,2,3,3,1,1,1,3]# 问:计算a中最多有几个连续的1很明显,答案是4如果用代码实现
- NumPy Python数值计算重要库在图像处理领域,NumPy可以帮助我们高效地对图像进行处理。通过使用NumPy
- Encode将一个对象编码成JSON数据,接受一个interface{}对象,返回[]byte和error:func Marshal(v i
- django和webpy都是python的web开发框架。Django的主要目的是简便、快速的开发数据库驱动的网站。它强调代码复用,多个组件
- 众神殿内,依次坐着Editplus、Atom、Sublime、Vscode、JetBrains家族、Comodo等等一众编辑器界的大佬们,偌
- 目录简介js 中的迭代器是什么样子的迭代协议可迭代协议迭代器协议迭代过程迭代总结自定义迭代传统写法生成器函数写法简介迭代器是一种设计模式,可
- 概述Golang 是一个跨平台的新生编程语言. 今天小白就带大家一起携手走进 Golang 的世界.数据类型转换数据类型转换可以帮助我们将一
- 前言我们有时候会编写Python脚本来辅助我们执行一些重复的操作。但是这些脚本在实际使用中会有一些不方便:我们通常需要进入终端或者IDE中来
- Python中进行Base64编码和解码要用base64模块,代码示例:#-*- coding: utf-8 -*-import base6
- 今天早上起来写爬虫,基本框架已经搭好,添加多线程爬取功能时,发现出错:比如在下载文件的url列表中加入200个url,开启50个线程。我的爬