作者: wyh草样
出处:https://www.cnblogs.com/wyh0923/p/14084898.html
什么是文件
文件是系统存储区域的一个命名位置,用来存储一些信息,便于后续访问。能够在非易失性存储器中实现持续性存储,比如在硬盘上。当我们要读取或者写入文件时,我们需要打开文件;在操作完毕时,我们需要关闭文件,以便释放和文件操作相关的系统资源,因此,文件操作的主要包括以下:
打开文件
读取或者写入
关闭文件
打开文件
Python使用内置的open()函数打开一个文件,并且返回一个文件对象,也叫句柄(handle)。
f = open("test.txt") # 在本文件夹下面的一个文件
f = open("C:/Python33/README.txt") # 全路径
再打开文件时,我们需要指定文件打开的模式,当我们需要读取文件时,使用f = open("test.txt", 'r'),写入文件时,使用f = open("test.txt", 'w'),追加输入时f = open("test.txt", 'a'),这里的a就是append的意思。追加模式和写入模式的区别就是,写入模式打开一个文件时,无论这个文件是否有内容,都会被清空再写入;在使用追加模式时,打开的文件,只是在原有的内容上继续进行写入。同时我们也要制定以文本模式打开还是二进制模式打开。
文本模式(text mode)和二进制(binary mode)模式的区别
文本模式中,读取时操作系统的换行符('\n' on Unix,'\r\n' on Windows)会被转换成Python的默认换行符\n,写入时会将默认的换行符转换为操作系统的换行符;在二进制模式中不会转换。这个转化在对文本文件没有影响,但是对于二进制数据会有影响,比如图像文件或者EXE文件等。因此, 再打开这类文件时,一般使用二进制模式进行读写
常用模式
r | 文本模式,读取 | |
rb | 二进制模式,读取 | |
w | 文本模式,写入 | |
wb | 二进制模式,写入 | |
a | 文本模式,追加 | |
ab | 二进制模式,追加 | |
+ | 可读可写 |
f = open("test.txt", 'r') # 读模式
f = open("test.txt", 'w') # 写模式
f = open("img.bmp",'r+') # 可读可写
f = open("img.bmp",'w+') # 可读可写
f = open("img.bmp",'rb') # 二进制读取
如何关闭文件
当文件操作结束时,我们最好主动关闭文件。尽管Python有垃圾回收(garbage collector)机制,去清理不用的对象,但是最好还是自己关闭文件。
最简单的方法就是:
f = open("app.log", 'r')
do_something()
f.close()
但是这个办法不安全,因为在进行其他操作时,可能会出现异常,程序退出,那么关闭文件的语句就不会被执行。
因此,可以用语句来处理:
try:
f = open('app.log', 'r')
do_something()
finally:
f.close()
无论是否发生异常,关闭文件的指令都会被执行。
但是python官方给出的最佳用法是:
with open('app.log', 'r') as f:
do_something()
使用这种用法,我们不必调用close()方法,在with语句程序内部就会执行,无论内部是否出现异常。with语句被称为上下文管理器,我们可以暂且不管这个的原理,只需要知道使用with语句,关闭文件的操作会被自动执行,这也是官方推荐的最佳用法,比用语句写起来简单。
文件操作
写入文件
主要介绍两个方法:
1.write()方法
这个方法的参数是一个单独的字符串,比如:
lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
s = ''
for data in lines:
s += data
s += '\n'
f.write(s)
其实更好的写法是使用join函数:
lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
f.write('\n'.join(lines))
其实更加优雅的写法,可以使用生成器:
lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
f.writelines("%s\n" % l for l in lines)
读取文件
这里介绍四种用法,后面都默认文件已经被打开了:
1.read()方法
result = f.read()
这里返回的是文件内容,是str类型的结果,这个方法还带一个数值类型的参数,指定读取多少内容,如果省略了或者是负数,那么就返回文件的全部内容。
2.readline()方法
result = f.readline()
返回的也是字符串,不过是一行内容,继续调用,就会返回下一行内容
3.readlines()方法
result = f.readlines()
这里返回的是一个列表,但是当数据较大时,这样的用法会很占用内存,不推荐在数据量大时使用
4.直接循环文件对象
for line in f:
print line
do_something()
这样的用法节省内存,快速,并且代码还简单
result = f.readlines()
------------------------
result = list(f)
这两种写法返回的结果是一样的
显然我们推荐第四种用法。
如何处理大文件
大文件主要问题在于占用内存较大,我们不能一下子将文件全部内容读入内存,最好的做法如下:
with open("log.txt") as f:
for line in f:
do_something_with(line)
一行一行读取,内存不会爆,同时速度也更快,使用with语句,无论内部是否出现异常,在结束时,文件对象都会被关闭,因此在处理大文件时,最好这样来做。
来源:https://www.cnblogs.com/wyh0923/p/14084898.html
猜你喜欢
- 在asp.net 2.0中,很多情况下,使用gridview控件的话,甚至只需要拖拉控件,设置属性就可
- class Helper_Page{ /** 总信息数 */ var $infoCount; /** 总页数 */ var $pageCou
- 前言你可能不需要经常处理分数,但当你需要时,Python的Fraction类会给你很大的帮助。本文将给大家详细介绍关于利用标准库fracti
- 本文给出了MySQL数据库中定义外键的必要性、具体的定义步骤和相关的一些基本操作,供大家参考!定义数据表假如某个电脑生产商,它的数据库中保存
- SQL Server具有强大的复制功能,除了将数据和数据库对象从一个数据库复制并准确分发的另一个数据库中,还要实行数据库之间的同步。SQL
- 之前用Crystal做了一个数字转English Word的Formula刚刚心血来潮, 大半个晚上写了JS版本的数字转换, 由于JS的Bu
- 在web开发中常常要使用js,为了提高效率一般都会制作js的类文件。这样在使用中更新复用都很方便。下面按照我工作中的一个案例,介绍如何定义j
- 权限级别划分如下:①、院长和财务科长:不能输入,可以无限制查询、统计;②、副院长:不能输入,可以查询、统计其分管部门的帐务;③、部门领导:不
- 最近有Win10系统用户反映,由于自己的电脑安装有两个python软件,所以想要卸载掉其中一个,不过在卸载的时候却发现无法卸载,并且出现提示
- 本文通过实例代码介绍了如何在jscript和vbscript中使用操作FileSystemObject(fso)对象模式来编程.
- 2.彻底弄懂CSS盒子模式二(导航栏实例) 3.彻底弄懂CSS盒子模式三(浮动的表演和清除的自述) 4.彻底弄懂CSS盒子模式四(绝对定位和
- 层的八条定律当然,这些并非真正的定律,而只是一些有益的忠告,使你免陷于使用层时可能的困顿中。原来有九条定律的,我们精简掉一条,还有下面的八条
- 本文介绍如何利用带进度条的ASP无组件实现断点续传下载大文件。<%@LANGUAGE="VBSCRIPT"&nbs
- 没注意到MooTools的Cookie类在写的时候自己做了一次encode,在读的时候做了一次decode,在一般的情况下,这个不会有什么问
- MySQL支持大量的列类型,它可以被分为3类:数字类型、日期和时间类型以及字符串(字符)类型。本节首先给出可用类型的一个概述,并且总结每个列
- HTML在线编辑器相信大家见得多了,有些流行的在线编辑器具有很丰富的功能。但美中不足的是,现有的HTML在线编辑器设置字号大小通常只限于1-
- 注:本次实验的数据在文章最后面,我已上传至百度网盘一.json模块对数据进行处理 上面三个txt文本是这三个国家疫情爆发相关的数据
- PEP 3107引入了功能注释的语法,PEP 484 加入了类型检查标准库 typing 为类型提示指定的运行时提供支持。示例:def f(
- 本文实例为大家分享了Python实现学生成绩管理系统的具体代码,供大家参考,具体内容如下基本功能:输入并存储学生的信息:通过输入学生的学号、
- 使用py时可能需要连续运行多条shell 命令1.# coding: UTF-8import sysreload(sys)sys.setde