详解python实现读取邮件数据并下载附件的实例
作者:SunnyMarkLiu 发布时间:2022-04-21 00:59:14
标签:python,读取邮件
详解python实现读取邮件数据并下载附件的实例
实现结果图:
实现代码:
#!/usr/bin/python2.7
# _*_ coding: utf-8 _*_
"""
@Author: MarkLiu
"""
import poplib
import email
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr
def decode_str(s):
value, charset = decode_header(s)[0]
if charset:
value = value.decode(charset)
return value
def guess_charset(msg):
# 先从msg对象获取编码:
charset = msg.get_charset()
if charset is None:
# 如果获取不到,再从Content-Type字段获取:
content_type = msg.get('Content-Type', '').lower()
pos = content_type.find('charset=')
if pos >= 0:
charset = content_type[pos + 8:].strip()
return charset
def get_email_headers(msg):
# 邮件的From, To, Subject存在于根对象上:
headers = {}
for header in ['From', 'To', 'Subject', 'Date']:
value = msg.get(header, '')
if value:
if header == 'Date':
headers['date'] = value
if header == 'Subject':
# 需要解码Subject字符串:
subject = decode_str(value)
headers['subject'] = subject
else:
# 需要解码Email地址:
hdr, addr = parseaddr(value)
name = decode_str(hdr)
value = u'%s <%s>' % (name, addr)
if header == 'From':
from_address = value
headers['from'] = from_address
else:
to_address = value
headers['to'] = to_address
content_type = msg.get_content_type()
print 'head content_type: ', content_type
return headers
# indent用于缩进显示:
def get_email_cntent(message, base_save_path):
j = 0
content = ''
attachment_files = []
for part in message.walk():
j = j + 1
file_name = part.get_filename()
contentType = part.get_content_type()
# 保存附件
if file_name: # Attachment
# Decode filename
h = email.Header.Header(file_name)
dh = email.Header.decode_header(h)
filename = dh[0][0]
if dh[0][1]: # 如果包含编码的格式,则按照该格式解码
filename = unicode(filename, dh[0][1])
filename = filename.encode("utf-8")
data = part.get_payload(decode=True)
att_file = open(base_save_path + filename, 'wb')
attachment_files.append(filename)
att_file.write(data)
att_file.close()
elif contentType == 'text/plain' or contentType == 'text/html':
# 保存正文
data = part.get_payload(decode=True)
charset = guess_charset(part)
if charset:
charset = charset.strip().split(';')[0]
print 'charset:', charset
data = data.decode(charset)
content = data
return content, attachment_files
if __name__ == '__main__':
# 输入邮件地址, 口令和POP3服务器地址:
emailaddress = 'xxxxxx@163.com'
# 注意使用开通POP,SMTP等的授权码
password = 'xxxxxx'
pop3_server = 'pop.163.com'
# 连接到POP3服务器:
server = poplib.POP3(pop3_server)
# 可以打开或关闭调试信息:
# server.set_debuglevel(1)
# POP3服务器的欢迎文字:
print server.getwelcome()
# 身份认证:
server.user(emailaddress)
server.pass_(password)
# stat()返回邮件数量和占用空间:
messagesCount, messagesSize = server.stat()
print 'messagesCount:', messagesCount
print 'messagesSize:', messagesSize
# list()返回所有邮件的编号:
resp, mails, octets = server.list()
print '------ resp ------'
print resp # +OK 46 964346 响应的状态 邮件数量 邮件占用的空间大小
print '------ mails ------'
print mails # 所有邮件的编号及大小的编号list,['1 2211', '2 29908', ...]
print '------ octets ------'
print octets
# 获取最新一封邮件, 注意索引号从1开始:
length = len(mails)
for i in range(length):
resp, lines, octets = server.retr(i + 1)
# lines存储了邮件的原始文本的每一行,
# 可以获得整个邮件的原始文本:
msg_content = '\n'.join(lines)
# 把邮件内容解析为Message对象:
msg = Parser().parsestr(msg_content)
# 但是这个Message对象本身可能是一个MIMEMultipart对象,即包含嵌套的其他MIMEBase对象,
# 嵌套可能还不止一层。所以我们要递归地打印出Message对象的层次结构:
print '---------- 解析之后 ----------'
base_save_path = '/media/markliu/Entertainment/email_attachments/'
msg_headers = get_email_headers(msg)
content, attachment_files = get_email_cntent(msg, base_save_path)
print 'subject:', msg_headers['subject']
print 'from_address:', msg_headers['from']
print 'to_address:', msg_headers['to']
print 'date:', msg_headers['date']
print 'content:', content
print 'attachment_files: ', attachment_files
# 关闭连接:
server.quit()
来源:http://blog.csdn.net/mark_lq/article/details/51204081


猜你喜欢
- Nonetype和空值是不一致的,可以理解为Nonetype为不存在这个参数,空值表示参数存在,但是值为空判断方式如下:if hostip
- 引言阿刁是一个自动化测试用例,从一出生他就被赋予终生使命,去测试一个叫登录的过程是否合理。他一直就被关在一个小黑屋里面,从来也没有出去过,小
- JavaScript闭包,是JS开发工程师必须深入了解的知识。3月份自己曾撰写博客《JavaScript闭包》,博客中只是简单阐述了闭包的工
- 基本概念gcache模块默认提供的是一个高速的内存缓存,操作效率非常高效,CPU性能损耗在ns纳秒级别。使用简单易上手,非常适合单机应用使用
- 1.ResNet的创新现在重新稍微系统的介绍一下ResNet网络结构。 ResNet结构首先通过一个卷积层然后有一个池化层,然后通过一系列的
- 登陆万事开头难,做什么事都要有个起点,后面才能更好的进行下去,因此我选择的起点就是最为直观的登陆页面 /login/index.vue/sr
- 1.假设已经有mysql-5.5.10.tar.gz以及cmake-2.8.4.tar.gz两个源文件(1)先安装cmake(mysql5.
- python 实现单例的方法第一种方法:使用基类New 是真正创建实例对象的方法,所以重写基类的new 方法,以此保证创建对象的时候只生成一
- 要防止同一用户同时登陆,首页应该记录在线用户的信息(这里与用户名为例),然后判断正在登陆的用户里面是否已存在。在这里使用一个cache存放已
- 1、创建Django项目打开pycharm,新建Django项目,可以选择一个虚拟环境建完之后目录如下:2、创建应用,我这里命名为demo在
- 一、噪声 我们将常会听到平滑(去噪),锐化(和平滑是相反的),那我们就会有疑惑?什么是噪声呢?图像噪声是指存在于图像数
- #!/usr/bin/env python # coding=utf-8 #--------------------------------
- 一、给定一个日期值,求出此日期所在星期的星期一和星期天的日期数据 例如给定一个日期 2010-09-01,求出它所在星期的星期一是2010-
- 在数据处理过程中比如从CSV文件中导入数据data_df = pd.read_csv("names.csv")在处理之前
- 1. 定义用一行构建代码例题# 构建一个1-100的列表l1 = [i for i in range(1,101)]print(l1)# 输
- Django生成数据库表时报错 __init__() missing 1 required positional argument:
- 如: 2000-1-1==> 2000-01-01、2000-01-1==>2000-01-01、2000-1-01==>
- pyecharts显示数据为百分比的柱状图pyecharts是做数据分析的好帮手,柱状图比较简单,网站例子不够多,一般柱状图就是直接传两组数
- 前言最近的一个项目中需要在图片上添加文字,使用了OpenCV,结果发现利用opencv给图像添加文字有局限。可利用的字体类型比较少,需要安装
- 疫情还没结束,小编只能宅在家里,哪哪也去不了,今天突发奇想给大家分享一篇教程关于Python paramiko 模块浅谈与SSH主要功能模拟