五个提升Python的执行效率的技巧分享
作者:Python 发布时间:2021-01-07 09:52:45
python作为使用最广泛的编程语言之一,有着无穷无尽的第三方非标准库的支持。
简单的语法、优雅的代码块使其在各个业务领域都混的风生水起,除了这些优点,python有一个经常被人诟病的缺点那就是运行速度。
小伙伴通过下面的五个python开发技巧,来充分提高python代码块的运行速度,并且提供了各个python技巧的使用后的运行时间的统计来佐证。
开始之前小伙伴先可以开发一个统计函数运行时间的python装饰器用于后面我们对各个python技巧使用后的时间统计。
# 导入时间提取的time模块
from time import time
import dis
def compute_time(func_):
'''
计算函数的运行时间
'''
def func_time(*arg, **kw):
t1 = time()
result = func_(*arg, **kw)
t2 = time()
print(f"{func_.__name__: >10} : {t2 - t1:.6f} 秒")
return result
return func_time
上述的compute_time时间计算函数我们开发好了,可以开发一个hello_world函数测试一下使用是否正常。
@compute_time
def hello_world():
print("hello_world!")
hello_world()
# hello_world!
# hello_world : 0.000000 秒
通过hello_world函数的测试,证明我们的时间装饰器compute_time能够正常统计出函数所运行的时间。
接下来,我们开始正式的介绍下面的五种方式来提高python的运行速度并提供时间运行的结果。
1、合理使用标准或非标准库
在开发过程中绝对不能小看python的标准或非标准库,说实话我们自己有时候写的同样的业务代码块确实是没有大佬们完美。
比如下面这个业务我们需要将一个python列表中的值转换成字符串,首先看看下面的代码块的写法。
# 初始化一个list列表
list_ = ['a', 'b', 'c'] * 10000
@compute_time
def func_1(list_=None):
'''
列表元素转字符串函数
'''
str_ = ''
for s in list_:
str_ = str_ + s
return str_
func_1(list_)
# func_1 : 0.001999 秒
通过上面的func_1函数的执行情况使用自己写的传统的方式来转换步骤比较繁杂,并且花费了0.001999 秒的时间。
@compute_time
def func_2(list_=None):
'''
列表元素转字符串
'''
return ''.join(list_)
func_2(list_)
# func_2 : 0.000000 秒
相比func_1函数的运行时间,func_2运行的时间几乎可以忽略不计,六位数的小数根本看不出来变化。
2、减少循环的使用
从平常开发的过程中其实已经发现,使用列表推导式、迭代式等的可序列化数据处理方式要比for循环更加的便捷、高效。
下面我们同样可以通过一个例子来说明问题,比如我们需要挑选出一个list列表中可以被2整除的数。
# 初始化循环次数n
n = 100000
@compute_time
def func_3(n=None):
list_ = []
for m in range(n):
if m % 2 == 0:
list_.append(m)
return list_
@compute_time
def func_4(n=None):
return [m for m in range(n) if m % 2 == 0]
func_3(n)
func_4(n)
# func_3 : 0.004986 秒
# func_4 : 0.003014 秒
通过func_3函数、func_4函数的比较,首先func_4的方式比func_3精简了许多。
并且时间上func_4使用列表推导式的方式比普通的for循环运行速度上快了1/4的时间。
3、注意重复代码运行
关于代码的重复运行这个在我们通常的开发方式中都能体会到,也就是本可以作为公共代码块运行一次就可以。
可以却将能够公共使用的代码块加入到了循环当中,这样只会影响代码块的执行效率。
比如我们需要使用python的re模块去搜索字符串中的某一些元素,下面通过两种方式来比较时间结果。
# 导入正则表达式匹配模块
import re
@compute_time
def func_5(str_=None):
for s in str_:
result = re.search(r'a*[a-z]?c', s)
@compute_time
def func_6(str_=None):
repx = re.compile(r'a*[a-z]?c')
for s in str_:
result = repx.search(s)
func_5('abcdefg1234oks' * 1000)
func_6('abcdefg1234oks' * 1000)
# func_5 : 0.006999 秒
# func_6 : 0.002000 秒
对比func_5和func_6的业务实现方式,我们将re模块的compile正则匹配对象直接放到for循环的外层,运行时间直接就减少了3倍不止。
是因为在循环中直接使用search匹配正则对象,会在循环中不断地创建正则匹配对象,这样就
增加了for循环的处理负担,导致速度变慢。
4、减少全局变量使用
在说明这一点的时候,我们要明白全局变量在程序运行的过程中是一直存在的不会消失。
全局变量太多就会导致运行期间占用的内存太大,相比全局变量使用局部变量就会变得更加的高效。
下面我们通过两种方式的使用实例,来对比全局变量和局部变量的运行时间。
mes_1 = 'ss1'
mes_2 = 'ss2'
mes_3 = 'ss3'
@compute_time
def func_7():
result = mes_1 + mes_2 + mes_3
return result
@compute_time
def func_8():
me_1 = 'ss1'
me_2 = 'ss2'
me_3 = 'ss3'
result = me_1 + me_2 + me_3
return result
func_7()
func_8()
# func_7 : 0.000997 秒
# func_8 : 0.000000 秒
上面我们做了一个普通的加法计算已经说明了问题,func_8函数使用局部变量的方式确实速度更快。
5、使用合理的数据结构
在大多数的python开发过程中,想必很多人都是为了方便更多的时候使用的是list列表的方式来处理数据。
Python 有四种内置的数据结构:列表、元组、集合、字典,在合适的业务场景中使用合适的数据结构来处理数据同样能提高计算的执行效率。
比如:下面我们将从一个list列表和tuple元组来提取对应索引位置上面的值。
@compute_time
def func_9():
data = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']
print(data[3])
@compute_time
def func_10():
data = ('a', 'b', 'c', 'd', 'e', 'f', 'g', 'h')
print(data[3])
func_9()
func_10()
# func_9 : 0.000000 秒
# func_10 : 0.000000 秒
通过执行func_9和func_10函数,我们发现时间上两者的差距不大,起码在六位小数之内是分辨不出结果的。
print('func_9汇编产生的机器码:')
dis.dis(func_9)
print('func_10汇编产生的机器码:')
dis.dis(func_10)
最后,我们分别查看了func_9和func_10的汇编机器码,发现明显list列表处理产生的机器码更多。
# func_9汇编产生的机器码:
# 30 0 LOAD_GLOBAL 0 (time)
# 2 CALL_FUNCTION 0
# 4 STORE_FAST 2 (t1)
#
# 31 6 LOAD_DEREF 0 (func_)
# 8 LOAD_FAST 0 (arg)
# 10 LOAD_FAST 1 (kw)
# 12 CALL_FUNCTION_EX 1
# 14 STORE_FAST 3 (result)
#
# 32 16 LOAD_GLOBAL 0 (time)
# 18 CALL_FUNCTION 0
# 20 STORE_FAST 4 (t2)
#
# 33 22 LOAD_GLOBAL 1 (print)
# 24 LOAD_DEREF 0 (func_)
# 26 LOAD_ATTR 2 (__name__)
# 28 LOAD_CONST 1 (' >10')
# 30 FORMAT_VALUE 4 (with format)
# 32 LOAD_CONST 2 (' : ')
# 34 LOAD_FAST 4 (t2)
# 36 LOAD_FAST 2 (t1)
# 38 BINARY_SUBTRACT
# 40 LOAD_CONST 3 ('.6f')
# 42 FORMAT_VALUE 4 (with format)
# 44 LOAD_CONST 4 (' 秒')
# 46 BUILD_STRING 4
# 48 CALL_FUNCTION 1
# 50 POP_TOP
#
# 34 52 LOAD_FAST 3 (result)
# 54 RETURN_VALUE
# func_10汇编产生的机器码:
# 30 0 LOAD_GLOBAL 0 (time)
# 2 CALL_FUNCTION 0
# 4 STORE_FAST 2 (t1)
#
# 31 6 LOAD_DEREF 0 (func_)
# 8 LOAD_FAST 0 (arg)
# 10 LOAD_FAST 1 (kw)
# 12 CALL_FUNCTION_EX 1
# 14 STORE_FAST 3 (result)
来源:https://mp.weixin.qq.com/s/ZaXD8xPURfHSS03kKFJPAA


猜你喜欢
- 前言今天在开发时发现一个奇怪的问题,我手动改完数据库竟然不生效,反复确认环境无误后猜测是缓存的问题,因为是新接手的项目,代码还不熟悉,仔细一
- 序 言哈喽兄弟们,好久不见!最近实在太忙了,所以又双叒叕断更了~表弟大学快毕业了,学了一个学期Python居然还不会写学生管理系统,真的给我
- 印刷和网络是不一样的。传统的布局排版并不适于网络,因为传统的印刷布局,几乎只想要什么样的平面效果都能很好的达到,但在网络上设计就很困难,尽管
- CSS对浏览器器的兼容性具有很高的价值,通常情况下IE和Firefox存在很大的解析差异,这里介绍一下兼容要点。常见兼容问题:1、DOCTY
- mybatis分页插件pageHelper详解及简单实例工作的框架spring springmvc mybatis3首先使用分页插件必须先引
- 参考服务器安装的是Centos 系统。uwsgi是使用pip安装的。nginx是使用yum install nginx安装。python 2
- 搭建lnmp完lnmp环境后,测试时出现502报错,看到这个问题,我立刻想到是php-fpm没有起来,但是我用 ps -ef | grep
- 前言要将图片转换为字符图其实很简单,我们首先将图片转换为灰度图像,这样图片的每个像素点的颜色值都是0到255,然后我们选用一些在文字矩形框内
- 最近,某水果手机厂在万众期待中开了一场没有发布万众期待的手机产品的发布会,发布了除手机外的其他一些产品,也包括最新的水果14系统。几天后,更
- requests模块是一个用于访问网络的模块,其实类似的模块还有很多,不在一一在这里解释。这么多的相似的模块为什么都说只有这个好用呢,因为他
- // NewTimer creates a new Timer that will send// the current time on i
- 一、环境准备1、安装node.js下载地址:https://nodejs.org/zh-cn/界面展示2、检查node.js版本查看版本的两
- 1.项目开发流程2.项目需求说明模拟实现基于文本界面的《家庭记账软件》该软件能够记录家庭的收入,支出,并能够打印收支明细表3.项目的界面4.
- 本文实例讲述了Python实现获取磁盘剩余空间的2种方法。分享给大家供大家参考,具体如下:方法1:import ctypesimport o
- 【源码GitHub地址】:点击进入1. 问题描述之前写了一篇关于《pytorch Dataset, DataLoader产生自定义的训练数据
- python中注释在python中的注释一般分为单行注释、多行注释以及文档注释。注释描述在实际开发过程中,有效的代码注释不仅可以提升个人的工
- *#type.jsfunction Person(name, age) { this.name = name; this
- html 页面<html lang="en"><head> <meta charset=&
- 以前在一个图书类网站看到这样一个功能:客户可以按条件搜索书目的信息,服务器会将符合条件的信息筛选出来保存为一个Excel文件供客户下载。今天
- 0x00 字符的编码计算机毕竟是西方国家的发明,最开始并没有想到会普及到全世界,只用一个字节中的7位(ASCII)来表示字符对于现在庞大的文