python利用pandas将excel文件转换为txt文件的方法
作者:NStock20133 发布时间:2022-04-05 18:49:01
标签:python,pandas,excel,txt
python将数据换为txt的方法有很多,可以用xlrd库实现。本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件。
直接上代码:
'''
function:将excel文件转换为text
author:Nstock
date:2018/3/1
'''
import pandas as pd
import re
import codecs
#将excel转化为txt文件
def exceltotxt(excel_dir, txt_dir):
with codecs.open(txt_dir, 'w', 'utf-8') as f:
neg=pd.read_excel(excel_dir, header=None, index=None)
f.write(neg.to_string())
#去除记录行首的数字和空格
def del_linehead_number_speace(orig_txt_dir,saveas_txt_dir):
with open(orig_txt_dir,'r+') as f, open(saveas_txt_dir,'r+') as fw:
lines = f.readlines()
print(len(lines)) #行数
texts = [re.sub(r'(\d)+(\s)+','',lines[num]) for num in range(len(lines)) ]
texts = list(set(texts)) #去重如果要保留重复记录注释该行
line_num = len(texts)
# for num in range(line_num): #查看转化后的文本
# print(texts[num])
fw.writelines(texts)
exceltotxt('./data/neg.xls', './data/neg_temp.txt')
del_linehead_number_speace('./data/neg_temp.txt','./data/neg.txt')
说明:xxx_dir带目标文件名为:xxx_dir='保存路径/'+'文件名'
来源:https://blog.csdn.net/teacher20133/article/details/79410464


猜你喜欢
- 2006-10-8表数据:tab1id name numA  
- 行和列的位置都在以下三个列表中的一列中,则对应位置为1,其余位置全为0——[7-56,239-327,438-454,522-556,574
- 如下所示:sum = 0n = 99while n > 0: sum = sum + n n = n - 2p
- 1.plt.pie()饼图 常常用来显示 整体中各部分所占的比例,在python-matplotlib库中通过plt.pie()方法来实现。
- tensorflow中的conv2有padding=‘SAME'这个参数。吴恩达讲课中说到当padding=(f-1)/2(f为卷积
- 微软今天宣布正式发布SQL Server 2008服务器软件,这将帮助微软与Oracle 11g,IBM DB2 9.5数据库产品对抗.此前
- Python pip安装lxml出错的问题解决办法1. 在使用pip安装lxml过程中出现了一下错误: &
- 本文实例讲述了MySQL关于字符串中数字排序的问题。分享给大家供大家参考,具体如下:MySQL字符串相信大家都不陌生,在MySQL字符串排序
- filetype.pySmall and dependency free Python package to infer file type
- 一、字典转dataFrame1、字典转dataFrame比较简单,直接给出示例:import pandas as pddic = {'
- 数据库SQL优化是老生常谈的问题,在面对百万级数据量的分页查询,又有什么好的优化建议呢?下面将列举了一些常用的方法,供大家参考学习!方法1:
- 1. MySQL慢查询介绍 MySQL的慢查询日志是MySQL提供的一种日志记录,它用来记录在MySQL中响应时间超
- 之前在网上查找了很多相关资料,有说设置icon高度来支持item的,有说要添加自己写指定高度的view来填充的,但是对于一个只有文字的Qco
- 本文实例讲述了python中尾递归用法。分享给大家供大家参考。具体分析如下:如果一个函数中所有递归形式的调用都出现在函数的末尾,我们称这个递
- Python的安装并不难,但是要正确安装它的库以及配置环境变量则有些麻烦。对于刚刚开始想要学习Python的小伙伴来说,用Anaconda这
- 具体用法如下: -- ============================================= -- Author: cy
- 在 Python 的项目中,如何管理所用的全部依赖库呢?最主流的做法是维护一份“requirements.txt”,记录下依赖库的名字及其版
- asp网站程序在国内运用很广,但是类似于im286.asp?id=20050307213811这样的url有点不利于搜索引擎的收录,也就是说
- 模块的相关概念 1. 什么是模块模块就好比是工具包,要想使用这个工具包中的工具(就好比函数),就需要导入这个模块模块的英文名叫:
- 问题当浏览SQL Server 2008的新特性时,我们看到了透明数据加密。这看起来很有趣。您能为我们解释一下并介绍下执行它的细节吗?专家解