使用pandas读取csv文件的指定列方法
作者:grey_csdn 发布时间:2023-07-07 13:11:26
标签:pandas,读取,csv,指定列
根据教程实现了读取csv文件前面的几行数据,一下就想到了是不是可以实现前面几列的数据。经过多番尝试总算试出来了一种方法。
之所以想实现读取前面的几列是因为我手头的一个csv文件恰好有后面几列没有可用数据,但是却一直存在着。原来的数据如下:
GreydeMac-mini:chapter06 greyzhang$ cat data.csv
1,name_01,coment_01,,,,
2,name_02,coment_02,,,,
3,name_03,coment_03,,,,
4,name_04,coment_04,,,,
5,name_05,coment_05,,,,
6,name_06,coment_06,,,,
7,name_07,coment_07,,,,
8,name_08,coment_08,,,,
9,name_09,coment_09,,,,
10,name_10,coment_10,,,,
11,name_11,coment_11,,,,
12,name_12,coment_12,,,,
13,name_13,coment_13,,,,
14,name_14,coment_14,,,,
15,name_15,coment_15,,,,
16,name_16,coment_16,,,,
17,name_17,coment_17,,,,
18,name_18,coment_18,,,,
19,name_19,coment_19,,,,
20,name_20,coment_20,,,,
21,name_21,coment_21,,,,
如果使用pandas读取出全部的数据,打印的时候会出现以下结果:
In [41]: data = pd.read_csv('data.csv')
In [42]: data
Out[42]:
1 name_01 coment_01 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6
0 2 name_02 coment_02 NaN NaN NaN NaN
1 3 name_03 coment_03 NaN NaN NaN NaN
2 4 name_04 coment_04 NaN NaN NaN NaN
3 5 name_05 coment_05 NaN NaN NaN NaN
4 6 name_06 coment_06 NaN NaN NaN NaN
5 7 name_07 coment_07 NaN NaN NaN NaN
6 8 name_08 coment_08 NaN NaN NaN NaN
7 9 name_09 coment_09 NaN NaN NaN NaN
8 10 name_10 coment_10 NaN NaN NaN NaN
9 11 name_11 coment_11 NaN NaN NaN NaN
10 12 name_12 coment_12 NaN NaN NaN NaN
11 13 name_13 coment_13 NaN NaN NaN NaN
12 14 name_14 coment_14 NaN NaN NaN NaN
13 15 name_15 coment_15 NaN NaN NaN NaN
14 16 name_16 coment_16 NaN NaN NaN NaN
15 17 name_17 coment_17 NaN NaN NaN NaN
16 18 name_18 coment_18 NaN NaN NaN NaN
17 19 name_19 coment_19 NaN NaN NaN NaN
18 20 name_20 coment_20 NaN NaN NaN NaN
19 21 name_21 coment_21 NaN NaN NaN NaN
所说在学习的过程中这并不会给我带来什么障碍,但是在命令行终端界面呆久了总喜欢稍微清爽一点的风格。使用read_csv的参数usecols能够在一定程度上减少这种混乱感。
In [45]: data = pd.read_csv('data.csv',usecols=[0,1,2,3])
In [46]: data
Out[46]:
1 name_01 coment_01 Unnamed: 3
0 2 name_02 coment_02 NaN
1 3 name_03 coment_03 NaN
2 4 name_04 coment_04 NaN
3 5 name_05 coment_05 NaN
4 6 name_06 coment_06 NaN
5 7 name_07 coment_07 NaN
6 8 name_08 coment_08 NaN
7 9 name_09 coment_09 NaN
8 10 name_10 coment_10 NaN
9 11 name_11 coment_11 NaN
10 12 name_12 coment_12 NaN
11 13 name_13 coment_13 NaN
12 14 name_14 coment_14 NaN
13 15 name_15 coment_15 NaN
14 16 name_16 coment_16 NaN
15 17 name_17 coment_17 NaN
16 18 name_18 coment_18 NaN
17 19 name_19 coment_19 NaN
18 20 name_20 coment_20 NaN
19 21 name_21 coment_21 NaN
为了能够看到数据的“边界”,读取的时候显示了第一列无效的数据。正常的使用中,或许我们是想连上面结果中最后一列的信息也去掉的,那只需要在参数重去掉最后一列的列号。
In [47]: data = pd.read_csv('data.csv',usecols=[0,1,2])
In [48]: data
Out[48]:
1 name_01 coment_01
0 2 name_02 coment_02
1 3 name_03 coment_03
2 4 name_04 coment_04
3 5 name_05 coment_05
4 6 name_06 coment_06
5 7 name_07 coment_07
6 8 name_08 coment_08
7 9 name_09 coment_09
8 10 name_10 coment_10
9 11 name_11 coment_11
10 12 name_12 coment_12
11 13 name_13 coment_13
12 14 name_14 coment_14
13 15 name_15 coment_15
14 16 name_16 coment_16
15 17 name_17 coment_17
16 18 name_18 coment_18
17 19 name_19 coment_19
18 20 name_20 coment_20
19 21 name_21 coment_21
来源:https://blog.csdn.net/grey_csdn/article/details/70186735


猜你喜欢
- 首先看一下super()函数的定义:super([type [,object-or-type]])Return a **proxy obje
- Create a Simple API Using Django REST Framework in PythonWHAT IS AN AP
- 前言老照片上色其实很早之前就想写了,也有不少人问了我这个项目。最近把DeOldify项目好好弄了弄。项目地址:DeOldify项目地址先看看
- 前言在搜集了很多文本语料之后,会开始漫长的数据清洗过程,通常要不断迭代。1. 问题描述有些文本数据中,会包含一些特殊符号。猜想可能是从某些富
- 有时候我们需要使用python执行一些脚本,可能需要让程序自动按键或自动点击鼠标,下面的代码实现了对键盘的模拟按键,需要安装pypiwin3
- 本篇文章将讨论使用 Python 中的四种不同方法来使用、管理秒并将其转换为天、小时、分钟和秒。现在,让我们开始讨论这些方法并在一些示例中使
- 本文实例为大家分享了python3音乐播放器的关键代码,供大家参考,具体内容如下from tkinter import *from trac
- Vue-router是伴随着Vue框架出现的路由系统,它也是公认的一种优秀的路由解决方案。在使用Vue-router时候,我们常常会使用其自
- 问题分析在关闭数据库的命令发现mysql关不了,提示Warning: World-writable config file '/et
- 今天在做sql Server 2005的实验的时候碰到的问题,问题描述很清楚,怀疑是我以前给计算机修改了名称而导致的.可以用select @
- 1、chr(i)chr()函数返回ASCII码对应的字符串。>>> print chr(65)A>>>
- 操作步骤进入命令行环境。我使用的是conda。有两种方式进入命令行。方法1:通过anconda navigator界面,选择environm
- 前言在 Qt 中可以使用信号和槽机制很方便地实现部件之间的通信,考虑下面这样的场景:我想要点击任意一个专辑卡并通知主界面跳转到专辑界面,那么
- 深入作用域链与闭包为什么要把作用域链和闭包放在一起讲呢,它们有什么关联吗?试想,我们如果在一个内部的函数使用了外部的变量,是通过[[oute
- 1、首先停止mysql服务管理员身份开启CMD下命令关闭或者windows服务页面关闭C:\Users\xxx>net stop my
- 事物绝非十全十美总有强差人意的一面,之前针对浮动分析了其引起文本重影的怪异问题,而作为浮动布局的最佳搭档定位布局也存在一定的缺陷。围绕着定位
- join 方法用于连接字符串数组 s = ['a', 'b', 'c', 'd
- 在实际开发中经常需要对前端传递的多个参数进行不为空校验,可以使用python提供的all()函数if not all([arg1, arg2
- 众所周知道,IE向来是我们在制作网页时最难搞定的对手。但又迫于其用户群数量之多,我们不得不想法设法搞定它。下面,将介绍的将是利用其特点而被发
- 如下所示:# -*- coding: UTF-8 -*-import waveimport numpy as npimport matplo