Pandas操作CSV文件的读写实现方法
作者:XHHP 发布时间:2022-05-12 09:48:05
标签:Pandas,操作,CSV
(1)、导库
import pandas as pd
from pandas import Series
(2)、读取csv文件的两种方式
#读取csv文件的两种方式
f = open('E:/建模/第5周/data/ex1.csv') #方法一
df = pd.read_csv(f)
print(df)
f.close
f = open('E:/建模/第5周/data/ex1.csv') #方法二,必须指定分隔符为',',否则会读取失败
df = pd.read_table(f,sep=',')
print(df)
f.close
(2)、根据需要条件读取csv文件
#根据需要条件读取csv文件
f = open('E:/建模/第5周/data/csv_mindex.csv')
df = pd.read_csv(f,header=None) #不需要表头
df = pd.read_csv(f,names=['a','b','c','d','message']) #添加表头
df = pd.read_csv(f,names=['a','b','c','d','message'],index_col = 'message') #指定某一列作为行索引
df = pd.read_csv(f,index_col = ['key1','key2']) #指定多列作为行索引
print(df)
f.close
(3)、利用正则表达式读取不同含有不同分隔符的文件
#利用正则表达式读取不同含有不同分隔符的文件
f = open('E:/建模/第5周/data/ex3.txt')
df = pd.read_table(f,sep='\s+')
print(df)
(4)、根据需要选择需要读的行
#根据需要选择需要读的行
f = open('E:/建模/第5周/data/ex4.csv')
df = pd.read_table(f,sep=',',skiprows=[0,2,3]) #跳过不想读的行
print(df)
(5)、处理缺失值
#处理缺失值
f = open('E:/建模/第5周/data/ex5.csv')
df = pd.read_table(f,sep=',',na_values='world') #如果数据中有'world',也会视为缺失值
print(df)
(6)、逐行读取文件
#逐行读取文件
f = open('E:/建模/第5周/data/ex6.csv')
df = pd.read_table(f,sep=',',nrows=5) #只读取前面5行
print(df)
(7)、将dataframe数据写入csv文件
#将dataframe数据写入csv文件
f = open('E:/建模/第5周/data/ex5.csv')
data = pd.read_csv(f)
data.to_csv('E:/建模/第5周/data/out.csv') #将dataframe输出到csv文件中
data.to_csv('E:/建模/第5周/data/out.csv',na_rep='ok') #将缺失值补上‘ok'
data.to_csv('E:/建模/第5周/data/out.csv',header=None) #不设置表头
data.to_csv('E:/建模/第5周/data/out.csv',columns=['a','b']) #写出指定的列
(8)、将csv文件读取位Series
#将csv文件读取位Series
f = open('E:/建模/第5周/data/tseries.csv')
series = Series.from_csv(f,parse_dates=True)
print(series)
来源:https://blog.csdn.net/weixin_41799019/article/details/96870504


猜你喜欢
- 本文实例讲述了python实现生成Word、docx文件的方法。分享给大家供大家参考,具体如下:http://python-docx.rea
- 1. 线程的概念线程,有时被称为轻量级进程(Lightweight Process,LWP),是程序执行流的最小单元。一个标准的线程由线程I
- 前言最近几天,研究了一下一直很好奇的爬虫算法。这里写一下最近几天的点点心得。下面进入正文:你可能需要的工作环境:Python 3.6官网下载
- 大家好,今天给大家分享一下明哥整理的一篇 Python 参数的内容,内容非常的干,全文通过案例的形式来理解知识点,自认为比网上 80% 的文
- 模仿IE自动完成功能,支持Firefox.支持方向键操作运行代码框<!DOCTYPE HTML PUBLIC "-//W3C
- 从这里开始我的博客,后台数据库是什么?没错,就是MySQL,服务器端使用的脚本就是PHP,整个框架使用的是WordPress。PHP和MyS
- 场景:1.计算SimHash值,及Hamming距离。2.SimHash适用于较长文本(大于三五百字)的相似性比较,文本越短误判率越高。Py
- 到目前为止,我已经开发了两个HTML编辑器了,一个用在公司的CMS项目,另一个用在这个Blog(TidyEditor,暂时没有单独发布)。下
- 层次聚类算法顾名思义,层次聚类就是一层一层的进行聚类,可以由上向下把大的类别(cluster)分割,叫作分裂法;也可以由下向上对小的类别进行
- 300来行python代码实现简易版学生成绩管理系统,供大家参考,具体内容如下使用链表来实现class Node(object): def
- 开发web应用程序是一件非常辛苦的事情,你需要花大把大把的时间来做无数的事情。假如你不运用有条理的方法,尤其是在复杂的项目中,你会承受忽视项
- __new__ 方法是什么?如果将类比喻为工厂,那么__init__()方法则是该工厂的生产工人,__init__()方法接受的初始化参 数
- 在这篇asp之数学函数里,我们将会以表格的形式,让大家了解到关于ASP中能用到的数学函数,里面包括一个数的绝对值、一个数的平方根
- 前言为了满足用户渠道推广分析和用户账号绑定等场景的需要,公众平台提供了生成带参数二维码的接口。使用该接口可以获得多个带不同场景值的二维码,用
- 目录简介Spare data的例子SparseArraySparseDtypeSparse的属性Sparse的计算SparseSeries
- keras 模块里面为我们提供了一个预训练好的模型,也就是开箱即可使用的图像识别模型趁着国庆假期有时间我们就来看看这个预训练模型如何使用吧可
- 本文实例为大家分享了python学生管理系统的具体代码,供大家参考,具体内容如下```name_list = [] # 存储学生信息字典,学
- 数据库并行访问,也就是两个或两以上用户同时访问同一数据,这也是数据库引擎如何设计和实现适度反应所面临的最大问题。设计优良、性能卓越的数据库引
- 一、Matplotlib 绘图在数据分析中,数据可视化也非常重要,通过直观的展示过程、结果数据,可以帮助我们清晰的理解数据,进而更好的进行分
- 方法一:读取文件时设置代码如下:Data = pd.read_excel(level_path, sheet_name=0, encodin