使用pandas读取csv文件的指定列方法
作者:grey_csdn 发布时间:2023-07-07 13:11:26
标签:pandas,读取,csv,指定列
根据教程实现了读取csv文件前面的几行数据,一下就想到了是不是可以实现前面几列的数据。经过多番尝试总算试出来了一种方法。
之所以想实现读取前面的几列是因为我手头的一个csv文件恰好有后面几列没有可用数据,但是却一直存在着。原来的数据如下:
GreydeMac-mini:chapter06 greyzhang$ cat data.csv
1,name_01,coment_01,,,,
2,name_02,coment_02,,,,
3,name_03,coment_03,,,,
4,name_04,coment_04,,,,
5,name_05,coment_05,,,,
6,name_06,coment_06,,,,
7,name_07,coment_07,,,,
8,name_08,coment_08,,,,
9,name_09,coment_09,,,,
10,name_10,coment_10,,,,
11,name_11,coment_11,,,,
12,name_12,coment_12,,,,
13,name_13,coment_13,,,,
14,name_14,coment_14,,,,
15,name_15,coment_15,,,,
16,name_16,coment_16,,,,
17,name_17,coment_17,,,,
18,name_18,coment_18,,,,
19,name_19,coment_19,,,,
20,name_20,coment_20,,,,
21,name_21,coment_21,,,,
如果使用pandas读取出全部的数据,打印的时候会出现以下结果:
In [41]: data = pd.read_csv('data.csv')
In [42]: data
Out[42]:
1 name_01 coment_01 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6
0 2 name_02 coment_02 NaN NaN NaN NaN
1 3 name_03 coment_03 NaN NaN NaN NaN
2 4 name_04 coment_04 NaN NaN NaN NaN
3 5 name_05 coment_05 NaN NaN NaN NaN
4 6 name_06 coment_06 NaN NaN NaN NaN
5 7 name_07 coment_07 NaN NaN NaN NaN
6 8 name_08 coment_08 NaN NaN NaN NaN
7 9 name_09 coment_09 NaN NaN NaN NaN
8 10 name_10 coment_10 NaN NaN NaN NaN
9 11 name_11 coment_11 NaN NaN NaN NaN
10 12 name_12 coment_12 NaN NaN NaN NaN
11 13 name_13 coment_13 NaN NaN NaN NaN
12 14 name_14 coment_14 NaN NaN NaN NaN
13 15 name_15 coment_15 NaN NaN NaN NaN
14 16 name_16 coment_16 NaN NaN NaN NaN
15 17 name_17 coment_17 NaN NaN NaN NaN
16 18 name_18 coment_18 NaN NaN NaN NaN
17 19 name_19 coment_19 NaN NaN NaN NaN
18 20 name_20 coment_20 NaN NaN NaN NaN
19 21 name_21 coment_21 NaN NaN NaN NaN
所说在学习的过程中这并不会给我带来什么障碍,但是在命令行终端界面呆久了总喜欢稍微清爽一点的风格。使用read_csv的参数usecols能够在一定程度上减少这种混乱感。
In [45]: data = pd.read_csv('data.csv',usecols=[0,1,2,3])
In [46]: data
Out[46]:
1 name_01 coment_01 Unnamed: 3
0 2 name_02 coment_02 NaN
1 3 name_03 coment_03 NaN
2 4 name_04 coment_04 NaN
3 5 name_05 coment_05 NaN
4 6 name_06 coment_06 NaN
5 7 name_07 coment_07 NaN
6 8 name_08 coment_08 NaN
7 9 name_09 coment_09 NaN
8 10 name_10 coment_10 NaN
9 11 name_11 coment_11 NaN
10 12 name_12 coment_12 NaN
11 13 name_13 coment_13 NaN
12 14 name_14 coment_14 NaN
13 15 name_15 coment_15 NaN
14 16 name_16 coment_16 NaN
15 17 name_17 coment_17 NaN
16 18 name_18 coment_18 NaN
17 19 name_19 coment_19 NaN
18 20 name_20 coment_20 NaN
19 21 name_21 coment_21 NaN
为了能够看到数据的“边界”,读取的时候显示了第一列无效的数据。正常的使用中,或许我们是想连上面结果中最后一列的信息也去掉的,那只需要在参数重去掉最后一列的列号。
In [47]: data = pd.read_csv('data.csv',usecols=[0,1,2])
In [48]: data
Out[48]:
1 name_01 coment_01
0 2 name_02 coment_02
1 3 name_03 coment_03
2 4 name_04 coment_04
3 5 name_05 coment_05
4 6 name_06 coment_06
5 7 name_07 coment_07
6 8 name_08 coment_08
7 9 name_09 coment_09
8 10 name_10 coment_10
9 11 name_11 coment_11
10 12 name_12 coment_12
11 13 name_13 coment_13
12 14 name_14 coment_14
13 15 name_15 coment_15
14 16 name_16 coment_16
15 17 name_17 coment_17
16 18 name_18 coment_18
17 19 name_19 coment_19
18 20 name_20 coment_20
19 21 name_21 coment_21
来源:https://blog.csdn.net/grey_csdn/article/details/70186735
0
投稿
猜你喜欢
- asp如何用Jmail的发送电子邮件?asp源码见下:<% Set mail1
- 一、背景有些情况下,我们面对实时更新的数据,希望能够在一个窗口中可视化出来,并且能够实时更新,方便我们观察数据的变化,从而进行数据分析,例如
- XML虽然比JSON复杂,在Web中应用也不如以前多了,不过仍有很多地方在用,所以,有必要了解如何操作XML。DOM vs SAX操作XML
- RDPY 是基于 Twisted Python 实现的微软 RDP 远程桌面协议。RDPY 提供了如下 RDP 和 VNC 支持:●RDP
- 接着上一篇,这里继续整合交易类。import datetime#交易类,后期需要整合公钥,私钥class Transaction: &nbs
- 本文实例为大家分享了python opencv实现图像配准与比较的具体代码,供大家参考,具体内容如下代码 from skimage
- 自定义比较排序/运算符Python3和Python2相比有挺多变化。在Python2中可以直接写一个cmp函数作为参数传入sort来自定义排
- 总有人认为linux搭建php环境很复杂,然后尝试安装lnmp一键安装包。其实说白了就是安装一个web服务器,然后支持php即可,很简单的,
- 1.Python虚拟环境创建首先我们为什么要创建虚拟环境呢?因为不同的项目所依赖的环境不一样,他们需要不同的第三方库等等。为了避免冲突,所以
- 作者认为最快的学习区块链的方式是自己创建一个,本文就跟随作者用Python来创建一个区块链。对数字货币的崛起感到新奇的我们,并且想知道其背后
- 本篇文章是作者关于在学习了《Python学习手册》以后,分享的学习心得,在此之前,我们先给大家分享一下这本书:下载地址:Python学习手册
- uuid str int 之间的转换import uudi#str 转 uuiduuid.UUID('123456781234567
- 本文实例讲述了PHP扩展Swoole实现实时异步任务队列。分享给大家供大家参考,具体如下:假如要发100封邮件,for循环100遍,用户直接
- 1:strip()方法去除字符串开头或者结尾的空格>>> a = " a b c ">>&
- import retext='V101_renow.Android.2.2.Normal.1.Alpha.apk?IMSI=4600
- pil版:from PIL import Imagefilename = r'E:\data\yangben\0.jpg'i
- 本文实例讲述了Django框架首页和登录页分离操作。分享给大家供大家参考,具体如下:1.登录模板login.html<!DOCTYPE
- 首先我的环境已配置好:GO的目录结构是:add.gopackage calc//函数名必须大写首字母,不然外部包找不到func Add(a
- 静态文件配置概述:静态文件交由Web服务器处理,Django本身不处理静态文件。简单的处理逻辑如下(以nginx为例):URI请求 --&g
- 大家是否还记得1983年任天堂的著名游戏《超级玛丽》里那个留着胡子的意大利水管工人,还有日本konami公司1987年发行的射击游戏《魂斗罗