位置：首页>> 网络编程>> Python编程>> python递归下载文件夹下所有文件

python递归下载文件夹下所有文件

作者：春江暮客　　发布时间：2023-08-07 07:21:55　

标签：python,递归,文件夹

最近想备份网站，但是php下载文件的大小是有大小限制的，而我也懒得装ftp再下载了，就想着暂时弄个二级域名站，然后用python(python3)的requests库直接下载网站根目录下的所有文件以及文件夹。（0-0就是这么任性）

1.安装requests库

pip install requests

2.下载文件夹下所有文件及文件夹

这里需要处理的地方主要是文件夹，这里我们判断出该链接是文件夹时，自动创建文件夹，并递归继续进行操作，否则判断该链接是文件，直接使用requests get方法下载，话不多说，看代码

####春江暮客 www.bobobk.com
import requests
import re
import os
import sys
def help(script):
text = 'python3 ％s https://www.bobobk.com ./' ％ script

print(text)
def get_file(url,path):##文件下载函数
content = requests.get(url)
print("write ％s in ％s" ％ (url,path))
filew = open(path+url.split("/")[-1],'wb')
for chunk in content.iter_content(chunk_size=512 * 1024):
if chunk: # filter out keep-alive new chunks
filew.write(chunk)
filew.close()
def get_dir(url,path): #文件夹处理逻辑
content = requests.get(url).text
if "<title>Index of" in content:
sub_url = re.findall('href="(.*?)" rel="external nofollow" ',content)

print(sub_url)
for i in sub_url:
if "/" in i:

i = i.split("/")[0]
print(i)
if i!="." and i!="..":

if not os.direxists(path+i):
os.mkdir(path+i)

get_dir(url+"/"+i,path+i+"/")
print("url:"+url+"/"+i+"\nurl_path:"+path+i+"/")
else:
get_file(url+"/"+i,path)
else:
get_file(url,path)
if __name__ == '__main__':
if not sys.argv[1]:
help(sys.argv[0])
exit(0)
else:
get_dir(sys.argv[1],"./")

至此，就在本地目录完全还原下载原网站的路径和文件了。

来源：https://blog.csdn.net/ztb8541/article/details/84890295

0

投稿

猜你喜欢

用SELECT... INTO OUTFILE语句导出MySQL数据的教程
表数据导出到一个文本文件最简单的方法是使用SELECT... INTO OUTFILE语句的查询结果直接导出到一个文件在服务器主机上。导出数
vue项目中如何引入cesium
vue项目中引入cesium市面上的前端框架中，Vue+Cesium 可谓是最佳搭档，一般做 Cesium B 端产品的公司都会使用 Vue
分析Python读取文件时的路径问题
Python在读取文件内容时的路径问题，值得深究一下.我想讨论的重点还是在绝对路径上面.在这之前我们先看一下1：相对路径这张图演示了在相对路
python实战之用emoji表情生成文字
一、前言昨夜刷b站的时候，看到了一条评论，形式如下图，于是心血来潮写了个python脚本，可以根据文字来生成这种由emoji拼接成的“文字”
OpenCV中resize函数插值算法的实现过程(五种)
最新版OpenCV2.4.7中，cv::resize函数有五种插值算法：最近邻、双线性、双三次、基于像素区域关系、兰索斯插值。下面用for循
Python中变量的作用域的具体使用
前言变量的作用域是指程序代码能够访问该变量的区域，如果超出该区域，再访问时就会出现错误。在程序中，一般会根据变量的 “有
详解NodeJS框架express的路径映射（路由）功能及控制
我们知道Express是一个基于NodeJS的非常优秀的服务端开发框架，本篇CSSer将提供express框架的route和route c
conda创建环境、安装包、删除环境步骤详细记录
前言在跑项目时，常常会安装很多的包，也通常会遇到需要安装指定版本的包，以及包与包不兼容的问题。比如：在项目1中安装librosa时，会自动安
pandas string转dataframe的方法
今天业务上碰到用pandas处理一个大文件的内存不够问题，需要做concat 合并多个文件，每个文件数据在1.4亿行左右。当时第一反应是把d
php 常用类整理
图表库下面的类库可以让你很简单就能创建复杂的图表和图片。当然，它们需要GD库的支持。pChart - 一个可以创建统计图的库。Libchar
操作mysql数据库的类
适用环境： PHP5.2.x / mysql 5.0.xclass Mysql { priva
python中字符串变二维数组的实例讲解
有一道算法题题目的意思是在二维数组里找到一个峰值。要求复杂度为n。解题思路是找田字（四边和中间横竖两行）中最大值，用分治法递归下一个象限的田
微信小程序与php 实现微信支付的简单实例
微信小程序与php 实现微信支付的简单实例小程序访问地址：payfee.PHP:include 'WeixinPay.php'
php 使用 __call实现重载功能示例
本文实例讲述了php 使用 __call实现重载功能。分享给大家供大家参考，具体如下：<?php/** * Created by Ph
vue使用Print.js打印页面样式不出现的解决
vue Print.js打印页面样式不出现解决方案加上这句就好了！完美！vue-print-nb打印问题总结1、表格的列缺失（element
C#实例代码之抽奖升级版可以经表格数据导入数据库，抽奖设置，补抽
我写代码一直是这个风格，废话不多，直接给大家贴代码，现在还是老规矩，具体代码如下所示：using System;using System.C
用Python的Django框架完成视频处理任务的教程
Stickyworld 的网页应用已经支持视频拨放一段时间，但都是通过YouTube的嵌入模式实现。我们开始提供新的版本支持视频操作，可以让
基于Python实现智能停车场车牌识别计费系统
前段时间练习过的一个小项目，今天再看看，记录一下~项目结构说明：datefile文件夹：保存车辆信息表的xlsx文件file文件夹：保存图片
python调用ffmpeg命令行工具便捷操作视频示例实现过程
文 | 李晓飞来源：Python 技术「ID: pythonall」最近有了一个新任务，需要将赛事视频，拆分成两分钟以内的小段，用
Python无损音乐搜索引擎实现代码
研究了一段时间酷狗音乐的接口，完美破解了其vip音乐下载方式，想着能更好的追求开源，故写下此篇文章，本文仅供学习参考。虽然没什么

详解python的sorted函数对字典按key排序和按value排序

Python pandas处理缺失值方法详解(dropna、drop、fillna)

Python Django框架实现应用添加logging日志操作示例

解决python 找不到module的问题

对Python新手编程过程中如何规避一些常见问题的建议

详解python-docx处理Word必备工具

如何用定值 Cookie 实现反爬详解

Python无损音乐搜索引擎实现代码

python中单下划线(_)和双下划线（__）的特殊用法

python中将正则过滤的内容输出写入到文件中的实例

我在博客过程中学到的99件事

Vue 通过自定义指令回顾v-内置指令(小结)

筑梦公馆5-9-1支线怎么解锁

python 返回列表中某个值的索引方法

电脑分区都是从C盘开始，为什么没有A盘和B盘？

Win10专业版蓝屏错误rtwlane.sys怎么解决？

在BIOS中关闭软驱的方法(禁用软驱)

Win10怎么进行在线一键重装电脑系统？

【Mac实用技巧】无需第三方快速压缩Mac文件

MySQL导入与导出备份详解

手机版 网络编程 asp之家 www.aspxhome.com