位置：首页>> 网络编程>> Python编程>> 关于Python下载大文件时哪种方式速度更快

关于Python下载大文件时哪种方式速度更快

作者：程序员老华　　发布时间：2021-03-15 05:46:37　

标签：Python,下载,大文件,方式

方法一

使用以下流式代码，无论下载文件的大小如何，Python 内存占用都不会增加：

def download_file(url):
local_filename = url.split('/')[-1]
# 注意传入参数 stream=True
with requests.get(url, stream=True) as r:
r.raise_for_status()
with open(local_filename, 'wb') as f:
for chunk in r.iter_content(chunk_size=8192):
f.write(chunk)
return local_filename

如果你有对 chunk 编码的需求，那就不该传入 chunk_size 参数，且应该有 if 判断。

def download_file(url):
local_filename = url.split('/')[-1]
# 注意传入参数 stream=True
with requests.get(url, stream=True) as r:
r.raise_for_status()
with open(local_filename, 'w') as f:
for chunk in r.iter_content():
if chunk:
f.write(chunk.decode("utf-8"))
return local_filename

iter_content [1] 函数本身也可以解码，只需要传入参数 decode_unicode = True 即可。

请注意，使用 iter_content 返回的字节数并不完全是 chunk_size，它是一个通常更大的随机数，并且预计在每次迭代中都会有所不同。

方法二

使用 Response.raw 和 shutil.copyfileobj

import requests
import shutil

def download_file(url):
local_filename = url.split('/')[-1]
with requests.get(url, stream=True) as r:
with open(local_filename, 'wb') as f:
shutil.copyfileobj(r.raw, f)

return local_filename

这将文件流式传输到磁盘而不使用过多的内存，并且代码更简单。

注意：根据文档，Response.raw 不会解码，因此如果需要可以手动替换 r.raw.read 方法

response.raw.read = functools.partial(response.raw.read, decode_content=True)

速度

方法二更快。方法一如果 2-3 MB/s 的话，方法二可以达到近 40 MB/s。

来源：https://blog.csdn.net/m0_72557783/article/details/126389520

0

投稿

猜你喜欢

ACCESS 2007出现“错误 '80040e14'“
好久没有写ASP代码了，今天在做一个简单的留言本时，出现了一下错误：Microsoft Office Access Database Eng
解决IE中长按钮的显示问题
有没有曾经为IE浏览器中长按钮莫名其妙的padding感到困扰？在分析解决方法之前，我们首先来看一下问题所在。在IE中，如果按钮文本比较长，
goland中使用leetcode插件实现
goland leetcode 插件安装可以提高刷题效率，对于学习算法的同学是个不错的选择安装使用步骤：安装插件：a. 左上角Goland
Flume监听oracle表增量的步骤详解
需求：获取oracle表增量信息，发送至udp514端口，支持ip配置步骤：（1）需要的jar oracle的 odbc5.ja
SQL Server 2008的一些新特点及独到之处
SQL Server 2008的一些新特点及独到之处：设置和安装SQL Server 2008的设置和安装也有所改进。配置数据和引擎位已经分
python输入中文的实例方法
解决中文输入的两种应用：在脚本中加语言编码声明 “-*- coding: uft-8 -*-”应用一：print中出现中文方法一：用unic
JS中模拟函数重载
在面向对象的编程中，很多语言都支持函数重载，能根据函数传递的不同个数、类型的参数来做不同的操作，JS对它却不支持，需要我们额外做些小动作。在
python pprint模块中print()和pprint()两者的区别
pprint的英文全称Data pretty printer，顾名思义就是让显示结果更漂亮。print()和pprint()都是python
初衷和结果
PRD的作用之一在于，保留产品设计初衷，期望达到什么样的目的，起到事后验证的效果。产品初衷需要做到利益最大化，找最大的蛋糕，为最大目标人群服
基于PHP RSA密文过长加密解密越过1024的解决方法
如下所示：<?phpnamespace helpers;class OpensslRSA{ //echo $private_key 私
Python3 实现文件批量重命名示例代码
在Python中os模块里，os.renames() 方法用于递归重命名目录或文件。类似rename()。rename()方法语法格式如下：
pygame学习笔记（4）：声音控制
pygame.mixer是一个用来处理声音的模块，其含义为“混音器”。游戏中对声音的处理一般包括制造声音和播放声音两部分，这里仅学习了播放声
Python 文本文件与csv文件的读取与写入
一、文本文件读取与写入1 读取文件的 read() 方法file_object.read([size])file_object 表示文件对象
Data URI 和 MHTML
Data URIData URI是由RFC 2397定义的一种把小文件直接嵌入文档的方案。通过如下语法就可以把小文件变成指定编码直接嵌入到页
go实现脚本解释器gscript
前言最近又在重新学习编译原理了，其实两年前也复习过，当初是为了能实现通过 MySQL 的 DDL 生
对Python使用mfcc的两种方式详解
1、Librosaimport librosa filepath = "/Users/birenjianmo/Desktop/le
在Mac中PyCharm配置python Anaconda环境过程图解
在 python 开发中我们最常用的IDE就是PyCharm，有关PyCharm的优点这里就不在赘述。在项目开发中我们经常用到许多第三方库，
asp如何去除HTML标签
如何剔除HTML标识？这里没有使用正则表达式来去除，当然大家用正则"<.+?>"也可以实现这个功能只留下干净
MySQL (root@％) does not exist的问题
在使用mysql视图是出现问题： The user specified as a definer ('root'@'
ASP中 ADODB.Stream 语法速查
本文介绍了asp中 adpbe.stream 的语法，各种参数使用说明，方便大家查阅。更多请看：VBScript 速查手册(语言参考) ch

人工智能学习pyTorch的ResNet残差模块示例详解

对pandas replace函数的使用方法小结

从Python的源码来解析Python下的freeblock

Python实现基于SVM的分类器的方法

新手学python应该下哪个版本

Python复制文件操作实例详解

对python同一个文件夹里面不同.py文件的交叉引用方法详解

python中安装django模块的方法

利用一个简单的例子窥探CPython内核的运行机制

Win10环境中如何实现python2和python3并存

Photoshop CC 2019( ps cc)新增功能使用方法介绍

Word 2013的文本对齐方式

java多线程实现下载图片并压缩

Word文档设置段前分页的方法教学

Rxjava功能操作符的使用方法详解

Win10组家庭局域网如何操作？

Windows7系统下软件界面显示不完整如何解决

win10个性化打不开怎么办_win10个性化打不开如何解决？

excel表格文字怎么换行

Win11任务栏时间怎么显示出秒 Win11时间显示秒的解决方法

手机版 网络编程 asp之家 www.aspxhome.com