Python实现连接FTP并下载文件夹
作者:挣扎的蓝藻 发布时间:2021-02-28 01:56:26
第一章:连接 FTP 服务器并实现文件夹下载
① 连接 FTP 服务器
如果 FTP 不用用户名密码就直接可以访问,那就是用的默认用户名 Anonymous,密码为空。
# -*- coding: UTF8 -*-
# 2022-3-8
# 作者:小蓝枣
# python连接ftp服务器
from ftplib import FTP
def conn_ftp():
'''
作用:连接ftp服务器
参数:无
返回:ftp服务器连接的对象
'''
# FTP连接信息
ftp_ip = "xx.xx.xx.xx"
# 默认端口21
ftp_port = 21
# 如果未指定,使用默认用户名为Anonymous,密码为空
ftp_user = "Anonymous"
ftp_password = ""
ftp = FTP()
# 连接ftp
ftp.connect(ftp_ip, ftp_port)
# ftp登录
ftp.login(ftp_user, ftp_password)
# 查看欢迎信息
print(ftp.getwelcome())
return ftp
ftp = conn_ftp()
② 进入指定目录并显示文件信息
方法 ftp.dir() 返回结果的结尾会默认带个 None,目录下没有内容的话直接会返回个 None。
def display_dir(ftp, path):
'''
作用:进入并展示指定的目录内容
参数1:ftp连接对象
参数2:要展示的目录
返回:无
'''
# 进入指定目录
ftp.cwd(path)
# 显示当前所在位置
print("当前所在位置为:")
print(ftp.pwd())
# 展示目录内容
print("\n显示目录内容:")
print(ftp.dir())
# 展示目录下的文件名,*文件夹和文件都会显示
print("\n文件和文件夹名为:")
for i in ftp.nlst():
print(i)
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
display_dir(ftp, path)
这是原始目录。
③ 区分文件和文件夹名
从上面方法 ftp.dir() 返回结果可以看到包含 <DIR> 标识的为文件夹,我们根据这个特征来进行文件夹区分。
def diff_dir(ftp, path):
'''
作用:区分文件和文件夹
参数1:ftp连接对象
参数2:要展示的目录
返回:无
'''
# 进入指定目录
ftp.cwd(path)
# 显示当前所在位置
print("当前所在位置为:")
print(ftp.pwd())
# 展示目录内容
print("\n显示目录内容:")
dirs = []
ftp.dir(".", dirs.append)
for i in dirs:
# 区分文件和文件夹
if("<DIR>" in i):
print("目录为:" + i.split(" ")[-1])
else:
print("文件为:" + i.split(" ")[-1])
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
diff_dir(ftp, path)
④ 文件夹名包含空格处理
split(" ")[-1] 方法有个缺陷,如果文件或文件夹名里包含空格,得到到的文件夹名就不对了,下面的方法可以有效的解决这个问题
def get_dir_name(s):
'''
作用:需要文件或文件夹名
参数1:需要截取的字符串
返回:文件或文件夹名
'''
dir_name = ""
k = 0
record = ""
for i in s:
if(record == " " and i != " "):
k = k + 1;
if(k >= 3):
dir_name = dir_name + i;
record = i
print(dir_name)
return dir_name
# 测试两条数据
get_dir_name("03-08-22 09:52AM <DIR> C2021.11_ZDHJC_004a")
get_dir_name("03-08-25 10:32AM 89098 hello .exe")
⑤ 使用递归实现:FTP服务器里的文件夹下载到本地
思路:
首先是看目录或文件里是否包含关键词,包含关键词进行下载。
并判断是否是目录,如果是目录的话,本地根据目录结构进行递归,同时本地创建文件夹。
使用了 2 个方法,下面的方法用来判断是否包含关键词,上面的方法就是目录结构下的递归。
注意:由于是一个 ftp 连接对象,递归过程中进去某个目录下,递归结束要回到之前的目录。
import pathlib
def download_dir(ftp, path, local_path):
'''
作用: 下载目录
参数1:ftp连接对象
参数2:要展示的目录
参数3:本地存放路径
返回:无
'''
# 进入指定目录
ftp.cwd(path)
# 区分文件和文件夹
dirs = []
ftp.dir(".", dirs.append)
for i in dirs:
try:
# 识别为目录进行递归
if("<DIR>" in i):
dir_name = get_dir_name(i)
local_path_new = local_path + "/" + dir_name
# 本地创建文件夹
pathlib.Path(local_path_new).mkdir(parents=True, exist_ok=True)
# 调用下载目录方法
download_dir(ftp, dir_name, local_path_new)
# 识别为文件进行下载
else:
file_name = get_dir_name(i)
local_filename = local_path + "/" + file_name
f = open(local_filename, "wb")
# 下载ftp文件
ftp.retrbinary('RETR ' + file_name, f.write)
f.close()
except Exception as e:
print(e)
# 退出当前目录
ftp.cwd("..")
def download_file(ftp, key, path, local_path):
'''
作用: 根据关键词下载文件
参数1:ftp连接对象
参数2:下载的关键词
参数3:要展示的目录
参数4:本地存放路径
返回:无
'''
# 进入指定目录
ftp.cwd(path)
# 区分文件和文件夹
dirs = []
ftp.dir(".", dirs.append)
for i in dirs:
if(key in i):
try:
# 识别为目录进行递归
if("<DIR>" in i):
dir_name = get_dir_name(i)
local_path_new = local_path + "/" + dir_name
# 本地创建文件夹
pathlib.Path(local_path_new).mkdir(parents=True, exist_ok=True)
# 调用下载目录方法
download_dir(ftp, dir_name, local_path_new)
else:
file_name = get_dir_name(i)
local_filename = local_path + "/" + file_name
f = open(local_filename, "wb")
# 下载ftp文件
ftp.retrbinary('RETR ' + file_name, f.write)
f.close()
except Exception as e:
print(e)
# 设置编码,解决上传的文件包含中文的问题
ftp.encoding = 'GBK'
key = "C2021.11_ZDHJC"
path = "/CaseData/nc.vo.sdp.testcase.testcase.TestcaseHVO/"
local_path = "D:/ftp下载"
download_file(ftp, key, path, local_path)
可以看到符合关键词的目录被下载到本地了。
并且里面的嵌套目录也同步被下载了。
第二章:问题解决
① 下载的文件名包含中文【‘utf-8’ codec can’t decode byte …】
设置下 FTP 对象的编码为 GBK 即可。
ftp.encoding = 'GBK'
不然会报如下错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 114: invalid continuation byte
② 指定的路径存在问题【550 The system cannot find the file specified.】
开始我用 split(" ")[-1] 方法截取文件名,由于有的文件含有中文,截取后的文件名称不对了。
就报了 ftplib.error_perm: 550 The system cannot find the file specified. 的错误。
③ 下载文件前未加RETR标识【500 Command not understood.】
下载文件时 FTP 路径前要加个 'RETR ',不然就会报 500 错误,注意后面还跟了个空格。
# 下载ftp文件
ftp.retrbinary('RETR ' + file_name, f.write)
不然就报 ftplib.error_perm: 500 Command not understood. 错误了。
来源:https://blog.csdn.net/qq_38161040/article/details/123346360
猜你喜欢
- 孤立帐户,就是某个数据库的帐户只有用户名而没有登录名,这样的用户在用户库的sysusers系统表中存在,而在master数据库的syslog
- 摘要PIL.Image.open读入的是RGB顺序,而opencv中cv2.imread读入的是BGR通道顺序 。cv2.imread会显示
- 真的很重要,栽了个跟头!!!(虽然以前好像知道。。。)print(True or False and False)print((True o
- 我就废话不多说了,直接上代码吧!#方法一def list_cut(mylist,count): length=len(mylis
- 注:代码用 jupyter notebook跑的,分割线线上为代码,分割线下为运行结果1.导入库生成缺失值通过pandas生成一个6行4列的
- 初学python,对python的对齐很重视,为了防止出错,使用spyder工具提供的功能下面是方法:1、首先打开Tools菜单栏下的Pre
- 1. 非 matlab v7.3 files 读写import scipy.io as sioimport numpy# matFile 读
- 如果说哪个开源程序不需要介绍大家就认识,那一定是phpMyAdmin,一款流行的MySQL数据库的Web管理界面。MySQL是全球最流行的W
- var getWindow = function(obj) { var&nbs
- 前两天看见有人问静态网页加密问题,就写了这个代码稍微有些长,解释一下思路:加密时:先把用户的密钥A用md5加密为B,然后用B异或源文件S0得
- 本文我们以一个登录例子来说明Flask对 post请求的处理机制。1、创建应用目录,如mkdir examplecd example2、在应
- you-get是github上python的一个开源库(https://github.com/soimort/you-get),使用you-
- JavaScript中没有Trim函数,VBScript语言中才有这个函数,就是去掉字符串头和尾的空格。您可以访问这篇文章:《增加 java
- 一、问题由来工作的局域网中,会接入很多设备,机器人上的网络设备就2个了,一个巨哥红外,一个海康可见光。机器人还有自身的ip。有时候机器人挂的
- python爬虫模块Request的安装在cmd中,使用如下指令安装requests:pip install requestspython爬
- 目录1.引言2.获取目标网站3.爬取目标网站4.解析爬取内容4.1. 解析全国今日总况4.2. 解析全国各省份疫情情况4.3. 解析江苏各地
- 信息架构的组件可以拆分成四类组织系统 如何组织信息,例如,依据主题或年代顺序。标签系统 如何表示信息,例如,科学术语(“Acer”)或通俗术
- 1.安装好JDK下载并安装好jdk-12.0.1_windows-x64_bin.exe,配置环境变量:新建系统变量JAVA_HOME,值为
- 一、前言1.1.环境python版本:3.6Django版本:1.11.61.2.预览效果最终搭建的blog的样子,基本上满足需求了。框架搭
- 百度,谷歌之后都说用setHintSize(self,QCore.QSize(width,height)),然并卵,后来用qss修改就可以了