提升Python运行速度的5个小技巧
作者:pythontip 发布时间:2021-07-28 20:25:24
目录
1. 选择合适的数据结构
2. 善用强大的内置函数和第三方库
3. 少用循环
4. 避免循环重复计算
5. 少用内存、少用全局变量
总结
官方原文,代码均可运行
Python 是世界上使用最广泛的编程语言之一。它是一种解释型高级通用编程语言,具有广泛的用途,几乎可以将其用于所有事物。其以简单的语法、优雅的代码和丰富的第三方库而闻名。python除了有很多优点外,但在速度上还有一个非常大的缺点。
虽然Python代码运行缓慢,但可以通过下面分享的5个小技巧提升Python运行速度!
首先,定义一个计时函数timeshow,通过简单的装饰,可以打印指定函数的运行时间。
这个函数在下面的例子中会被多次使用。
def timeshow(func):
from time import time
def newfunc(*arg, **kw):
t1 = time()
res = func(*arg, **kw)
t2 = time()
print(f"{func.__name__: >10} : {t2-t1:.6f} sec")
return res
return newfunc
@timeshow
def test_it():
print("hello pytip")
test_it()
1. 选择合适的数据结构
使用正确的数据结构对python脚本的运行时间有显着影响。Python 有四种内置的数据结构:
列表:
List
元组:
Tuple
集合:
Set
字典:
Dictionary
但是,大多数开发人员在所有情况下都使用列表。这是不正确的做法,应该根据任务使用合适数据结构。
运行下面的代码,可以看到元组执行简单检索操作的速度比列表快。其中dis模块反汇编了一个函数的字节码,这有利于查看列表和元组之间的区别。
import dis
def a():
data = [1, 2, 3, 4, 5,6,7,8,9,10]
x =data[5]
return x
def b():
data = (1, 2, 3, 4, 5,6,7,8,9,10)
x =data[5]
return x
print("-----:使用列表的机器码:------")
dis.dis(a)
print("-----:使用元组的机器码:------")
dis.dis(b)
运行输出:
-----:使用列表的机器码:------
3 0 LOAD_CONST 1 (1)
2 LOAD_CONST 2 (2)
4 LOAD_CONST 3 (3)
6 LOAD_CONST 4 (4)
8 LOAD_CONST 5 (5)
10 LOAD_CONST 6 (6)
12 LOAD_CONST 7 (7)
14 LOAD_CONST 8 (8)
16 LOAD_CONST 9 (9)
18 LOAD_CONST 10 (10)
20 BUILD_LIST 10
22 STORE_FAST 0 (data)
4 24 LOAD_FAST 0 (data)
26 LOAD_CONST 5 (5)
28 BINARY_SUBSCR
30 STORE_FAST 1 (x)
5 32 LOAD_FAST 1 (x)
34 RETURN_VALUE
-----:使用元组的机器码:------
7 0 LOAD_CONST 1 ((1, 2, 3, 4, 5, 6, 7, 8, 9, 10))
2 STORE_FAST 0 (data)
8 4 LOAD_FAST 0 (data)
6 LOAD_CONST 2 (5)
8 BINARY_SUBSCR
10 STORE_FAST 1 (x)
9 12 LOAD_FAST 1 (x)
14 RETURN_VALUE
看下列表的机器码,冗长而多余!
2. 善用强大的内置函数和第三方库
如果你正在使用python并且仍在自己编写一些通用函数(比如加法、减法),那么是在侮辱python。 Python有大量的库和内置函数来帮助你不用编写这些函数。 如果研究下,那么你会惊奇地发现几乎90%的问题已经有第三方包或内置函数来解决。
可以通过访问官方文档查看所有内置函数。你也可以在wiki python上找到更多使用内置函数的场景。
比如,现在我们想合并列表中的所有单词为一个句子,比较法自己编写和调用库函数的区别:
# ❌ 正常人能想到的方法
@timeshow
def f1(list):
s =""
for substring in list:
s += substring
return s
# ✅ pythonic 的方法
@timeshow
def f2(list):
s = "".join(list)
return s
l = ["I", "Love", "Python"] * 1000 # 为了看到差异,我们把这个列表放大了
f1(l)
f2(l)
运行输出:
f1 : 0.000227 sec
f2 : 0.000031 sec
3. 少用循环
用 列表推导式 代替循环
用 迭代器 代替循环
用 filter() 代替循环
减少循环次数,精确控制,不浪费CPU
## 返回n以内的可以被7整除的所有数字。
# ❌ 正常人能想到的方法:
@timeshow
def f_loop(n):
L=[]
for i in range(n):
if i % 7 ==0:
L.append(i)
return L
# ✅ 列表推导式
@timeshow
def f_list(n):
L = [i for i in range(n) if i % 7 == 0]
return L
# ✅ 迭代器
@timeshow
def f_iter(n):
L = (i for i in range(n) if i % 7 == 0)
return L
# ✅ 过滤器
@timeshow
def f_filter(n):
L = filter(lambda x: x % 7 == 0, range(n))
return L
# ✅ 精确控制循环次数
@timeshow
def f_mind(n):
L = (i*7 for i in range(n//7))
return L
n = 1_000_000
f_loop(n)
f_list(n)
f_iter(n)
f_filter(n)
f_mind(n)
输出为:
f_loop : 0.083017 sec
f_list : 0.056110 sec
f_iter : 0.000015 sec
f_filter : 0.000003 sec
f_mind : 0.000002 sec
谁快谁慢,一眼便知!
filter
配合lambda
* 就是 * !!!
4. 避免循环重复计算
如果你有一个迭代器,必须用它的元素做一些耗时计算,比如匹配正则表达式。你应该将正则表达式模式定义在循环之外,因为最好只编译一次模式,而不是在循环的每次迭代中一次又一次地编译它。
只要有可能,就应该尝试在循环外进行尽可能多的运算,比如将函数计算分配给局部变量,然后在函数中使用它。
# ❌ 应改避免的方式:
@timeshow
def f_more(s):
import re
for i in s:
m = re.search(r'a*[a-z]?c', i)
# ✅ 更好的方式:
@timeshow
def f_less(s):
import re
regex = re.compile(r'a*[a-z]?c')
for i in s:
m = regex.search(i)
s = ["abctestabc"] * 1_000
f_more(s)
f_less(s)
输出为:
f_more : 0.001068 sec
f_less : 0.000365 sec
5. 少用内存、少用全局变量
内存占用是指程序运行时使用的内存量。为了让Python代码运行得更快,应该减少程序的内存使用量,即尽量减少变量或对象的数量。
Python 访问局部变量比全局变量更有效。在有必要之前,应该始终尝试忽略声明全局变量。一个在程序中定义过的全局变量会一直存在,直到整个程序编译完成,所以它一直占据着内存空间。另一方面,局部变量访问更快,且函数完成后即可回收。因此,使用多个局部变量比使用全局变量会更好。
# ❌ 应该避免的方式:
message = "Line1\n"
message += "Line2\n"
message += "Line3\n"
# ✅ 更好的方式:
l = ["Line1","Line2","Line3"]
message = '\n'.join(l)
# ❌ 应该避免的方式:
x = 5
y = 6
def add():
return x+y
add()
# ✅ 更好的方式:
def add():
x = 5
y = 6
return x+y
add()
总结
本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注脚本之家的更多内容!
来源:https://blog.csdn.net/pythontip/article/details/121917196


猜你喜欢
- 一、跨域是什么从一个域名去请求另一个域名,这个过程称之为跨域。浏览器从一个域名的网页去请求另一个域名的资源,域名、端口、协议有一个不一样,请
- 作为面向对象编程中实现控制反转(Inversion of Control,下文称IoC)最常见的技术手段之一,依赖注入(Dependency
- 让我们描绘一下本文的情节:假设您要在本地机器上运行一个进程,而部分程序逻辑却在另一处。让我们特别假设这个程序逻辑会不时更新, 而您运行进程时
- position属性可以让你让你随意控制一个特定元素在浏览器何处以及如何显示。比方说我们用position:fixed 让一个图片显示在浏览
- 前言微服务中的日志采集方案ELK(EFK)已经是基本事实标准了,但是单体服务中却没有像ELK这样的成熟采集方案,这与单体性质有关,单体毕竟涉
- 本文实例为大家分享了pyqt实现右下角弹出框的具体代码,供大家参考,具体内容如下构造函数中:self.desktop=QDesktopWid
- FLASH 全屏有二类四种:1、不用浏览器直接用FLASH播放器播放的类型:A、不显示FLASH播放器菜单栏的全屏(类似屏保效果),在第一帧
- 首先初始化页面$(function(){ $('#archives-table').bootstrapTable
- 我就废话不多说了,直接上代码吧!import turtleturtle.pensize(5)turtle.pencolor("ye
- 本文实例讲述了python实现在sqlite动态创建表的方法。分享给大家供大家参考。具体实现方法如下:import sqlite3 as d
- 现在很多CMS系统因为安全原因会把后台编辑器里的上传功能给去除,但这样一来对实际使用过程造成了很多麻烦,今天我们以ASPCMS系统的FCKe
- 南京的炎炎夏日也未能挡住书友会朋友们的参与,下午两点半我们正式开始了这个月的话题:“浏览器”。一开始大家大致上说了一些自己认为各浏览器中各自
- 什么是 PycharmPycharm 是目前最好用的 Python 编辑器,自带文本高亮、版本管理、数据库连接、断点调试、虚拟环境和包管理的
- Internet Explorer 9 Platform 1.9.7916.6000 Preview 4微软今天公布了IE9 Platfor
- 本文实例讲述了php+jQuery实现的 * 导航栏下拉菜单显示效果。分享给大家供大家参考,具体如下:首先看看效果图:1.数据配置文件 db.
- 深入认识Python内建类型——dict注:本篇是根据教程学习记录的笔记,部分内容与教程是相同的,因
- WordPress 的插件机制实际上只的就是这个 Hook 了,它中文被翻译成钩子,允许你参与 WordPress 核心的运行,是一个非常棒
- 包括安装时提示有挂起的操作、收缩数据库、压缩数据库、转移数据库给新用户以已存在用户权限、检查备份集、修复数据库等 (一)挂起操作 在安装Sq
- Background高斯噪声,顾名思义是指服从高斯分布(正态分布)的一类噪声。有的时候我们需要向标准数据中加入合适的高斯噪声让数据更加符合实
- 我看blog里,还有很多地方都引用过我写的这个类,转了不少,但自己一直也没发表过,这次正式发表一下。在蓝色理想中有人不懂怎么用,我在baid