使用python实现正则匹配检索远端FTP目录下的文件
作者:阿库纳玛塔塔 发布时间:2022-03-27 07:29:15
标签:python,正则,检索,FTP
遇到一个问题,需要正则匹配远端FTP目录下的文件,如果使用ftp客户端可以通过命令行很容易的做到这一点,但是暂时没有一个工具支持这样的需求,于是通过python对FTP的支持和对正则表达式的支持,写了这么一个简单的工具,用于使用正则表达式来匹配远端目录的文件。
代码如下
# coding=utf-8
#########################################################################
# File Name: reg_url.py
# Author: WangWeilong
# Company: Baidu
#########################################################################
import re
import sys
import os
from ftplib import FTP
dhccmd = "http://xxx/api/submit"
class DHC_FTP():
def __init__(self, hostname, username="", passwd=""):
self.hostname = hostname
try:
self.ftp = FTP(self.hostname)
except:
print "hostname error!"
exit(-1)
self.username = username
self.passwd = passwd
self.filelist = []
self.reg_pattern = ""
def getftpfilelist(self, path):
self.ftp.login(self.username, self.passwd)
self.ftp.cwd(path)
self.filelist = self.ftp.nlst()
def matchnames(self, regpattern):
pattern = re.compile(regpattern)
matchedfiles = []
for file in self.filelist:
match = pattern.search(file)
if match:
matchedfiles.append(match.string)
return matchedfiles
if __name__ == "__main__":
if len(sys.argv) != 4:
print 'usage:python reg_url.py $ftpurldir $regular'
else:
#解析ftpurl字符串
head = sys.argv[1].split("@")[1].split("/")[0]
username = sys.argv[1].split("//")[1].split(":")[0]
passwd = sys.argv[1].split("//")[1].split(":")[1].split("@")[0]
pathdir = sys.argv[1].split(head)[1]
dhc_ftp = DHC_FTP(head, username, passwd)
dhc_ftp.getftpfilelist("./" + pathdir)
#获取正则表达式
regpattern = r'%s' % sys.argv[2]
matchedfiles = dhc_ftp.matchnames(regpattern)
for files in matchedfiles:
ftpname = sys.argv[1] + "/" + files
print ftpname
通过输入想要的检索的远端目录地址和想要用来匹配的正则表达式,就能获取到远端的文件了,至于用这些文件来干嘛,那就是需求问题了。
以上所述就是本文的全部内容了,希望大家能够喜欢。
请您花一点时间将文章分享给您的朋友或者留下评论。我们将会由衷感谢您的支持!


猜你喜欢
- <% set conn=server.createobject("adodb.connect
- 要实现标题的功能,总共分四步:1.创建html错误页2.配置settings3.编写视图4.配置url我的开发环境:django1.10.3
- [参与测试的浏览器:IE6 / IE7 / IE8 / FF3 / OP9.6 / SF3 / Chrome2 ][操作系统:Windows
- 一、多项式拟合多项式拟合的话,用的的是numpy这个库的polyfit这个函数。那么多项式拟合,最简单的当然是,一次多项式拟合了,就是线性回
- python断言assert语句assert语句的格式是【assert 表达式,返回数据】,当表达式为False时则触发AssertionE
- 概览因工作场景,需要在python代码里调用Jar包来实现一些功能,调研下来主要有两种方式:java -jar xx.jarJPype环境配
- 本文实例讲述了Python selenium的基本使用方法。分享给大家供大家参考,具体如下:selenium是一个web自动化测试工具,se
- step函数概述step函数用于绘制阶梯图。根据源码可知,step函数是对plot函数的轻量级封装,很多概念和用法与plot函数非常相似。d
- 解释一个机器学习模型是一个困难的任务,因为我们不知道这个模型在那个黑匣子里是如何工作的。解释是必需的,这样我们可以选择最佳的模型,同时也使其
- scrollHeight: 获取对象的滚动高度。 scrollLeft:设置或获取位于对象左边界和窗口中目前可见内容的最左端之间的距离 sc
- 遇到一个小问题,记录一下问题:在微信小程序中使用scroll-view标签时,用height:cale(xx - xx)设置高度无效,在pa
- Python heapq 详解Python有一个内置的模块,heapq标准的封装了最小堆的算法实现。下面看两个不错的应用。小顶堆
- IE 的 Cookie 文件保存在 ?:\Documents and Settings\<user>\Cookies 目录,后缀
- 1、从数据库表中检索信息实际上,前面我们已经用到了SELECT语句,它用来从数据库表中检索信息。select语句格式一般为:SELECT 检
- 从官网下载mysql-5.6.12-linux-glibc2.5-x86_64.tar.gz创建mysql用户[root@Master ho
- 前言如果采用前后端分离的架构开发, 后端几乎不负责任何展现界面的工作,只负责对数据进行管理 。 数据的管理,主要就是:响应前端的请求, 对数
- 因文件格式要求,需要将docx 与doc文件相互转换,特寻找python代码,与大家共分享from win32com import clie
- java连接Access数据库的方法,分享给大家步骤:1.现在我们一般使用的编译环境是java SE 1.8,不支持odbc的连接方式,所以
- 在读取中文的情况下,通常会遇到一些编码的问题,但是首先需要了解目前的编码方式是什么,然后再用decode或者encode去编码和解码,下面是
- 前言多表查询,也称为关联查询,指两个或更多个表一起完成查询操作。前提条件:这些一起查询的表之间是有关系的(一对一、一对多),它们之间一定是有