Python读取文件内容为字符串的方法(多种方法详解)
作者:刘娟娟 发布时间:2023-05-18 18:16:27
标签:python,文件,字符串
以下笔记是我在 xue.cn 学习群之数据分析小组所整理分享的心得。相关背景是:我选择中文词频统计案例作为考察大家python基础功掌握程度。
以小见大,下面是2个小技能的具体实战:
如何灵活地处理文件读取
如何把数据处理为自己想要的数据类型
方法1:
拷贝文章时,直接把内容赋值给一个变量,保存到一个 .py 文件中。然后在脚本中,导入它。
存储文章的文件 article.py
content = """ 复制的文章内容 """
存储脚本的文件 my_code.py
from article import content
方法2:
拷贝文章内容到一个txt文件(通常人们都这么干)。直接读取文件内容。
用 read() 方法能直接生成字符串。
with open('test.txt','r',encoding='utf-8') as f:
content = f.read()
方法3:
用 readlines() 或 readline() 结合 for 迭代 来自己构成 字符串。
比如 bsdzsz 的代码片段:
data = ''
with open('test.txt', 'r',encoding='utf-8') as f:
for line in f.readlines():
line = line.strip()
data += line
当然,还有更多方法。以上3种方法对于零基础新人都很友好,刚刚掌握一点皮毛就可以搞定。
从这个方法举例中,大家可以初步建立一个意识:同一个数据(文章内容),其存储形式可能是多样的(.py文件的一个字符串变量被别的.py文件调用,或一个常规的txt文件),我们去取那个数据的方法也是多样的。
知识点补充:python读取txt文件中字符串,字符串用空格分隔
python3.6
代码如下:
with open('C:\\Users\\***\\Desktop\\test.txt') as f:
read_data=f.read()
a=read_data.split()
print(a[5])#这一行可以单独打印第几个字符串
f.closed
比如test.txt文件里只有一行:
1 123 1.1 a abc p+=b
上面代码运行结果是:
p+=b
今天有同事问我一个处理大数据按照一定格式打印的问题,我顺便学习了一下python,惭愧……
来源:https://juejin.im/post/5e5e7e7951882549652d58ed


猜你喜欢
- 业务背景: 基本业务场景是这样的,请求数据(车辆vin信息)进入到接口中,需要先判断其在数据库中的状态,如果库中不存在该vin,或者该vin
- 基本概念gcache模块默认提供的是一个高速的内存缓存,操作效率非常高效,CPU性能损耗在ns纳秒级别。使用简单易上手,非常适合单机应用使用
- 导读准备一个Server2008,通过Metasploit获取system访问权限,进入meterpreter交互界面。通过shell命令,
- 本文实例讲述了微信小程序使用slider设置数据值及switch开关组件功能。分享给大家供大家参考,具体如下:1、效果展示2、关键代码① i
- mutations的调用方法直接通过$store.commit调用<button @click="$store.commit
- 这个效果用的很频繁,经常都会有人问我这个问题,所以要把它写成文章。下次再有人问就直接把这篇文章的URL丢出去就好了。这个效果很简单所以我就不
- 1、注释单行注释,使用#,#号后面的都是注射,例如#我是单行注释print("Hello Python world")多
- 反射是 Go 语言的高级主题之一。我会尽可能让它变得简单易懂。本教程分为如下小节。什么是反射?为何需要检查变量,确定变量的类型?reflec
- mktime()方法是localtime()反函数。它的参数是struct_time或全9元组,它返回一个浮点数,为了兼容时ti
- 1. test.txt文件,数据以逗号分割,第一个数据为x坐标,第二个为y坐标,数据如下:1.1,22.1,23.1,34.1,540,38
- 在说到什么是回表查询的时候,有两个概念需要先解释清楚:分别是聚集索引(聚簇索引)和非聚集索引(非聚簇索引)聚集索引和非聚集索引MySQL规定
- <style type="text/css"> <!-- body,td,th {
- 如下所示:import logging # 创建一个logger logger = logging.getLogger('mylog
- 将dataframe中的NaN替换成希望的值import pandas as pddf1 = pd.DataFrame([{'col
- 1.由于设置了slave的配置信息,mysql在数据库data目录下生成master.info,所以如有要修改相关slave的配置要先删除该
- Python使用pandas导入xlsx格式的excel文件内容1. 基本导入在 Python中使用pandas导入.xlsx文件的方法是r
- 本文以一个完整实例的形式实现了视频文件上传的功能。虽然是比较基础的应用,仍有一定的参考价值。分享给大家供大家参考之用。具体方法如下:首先,对
- ADF是oracle提供的一套企业开发的解决方案。 最近做性能测试, 需要获取当前页面有多少SQL 查询,花费多少时间。首先想到的就是常用的
- 1.怎么样查看数据库字符集 [A]数据库服务器字符集select * from nls_database_parameters,其来源于pr
- 电影之类的长视频好像都用m3u8格式了,这就导致了多线程下载视频的意义不是很大,都是短视频,线不线程就没什么意义了嘛。我们知道,m3u8的链