删除pandas中产生Unnamed:0列的操作
作者:敲代码的乔帮主 发布时间:2021-07-27 03:12:03
标签:pandas,Unnamed:0
我们在数据处理,往往不小心,pandas会“主动”加上行和列的名称,我现在就遇到了这个问题。
这个是pandas中to_csv生成的数据各种拼接之后的最终数据(默认参数,index=True,column=True)
Unnamed: 0 ip Unnamed: 0.1 ... 766 767 class
0 0 google.com 0 ... 0.376452 0.148091 0
1 1 facebook.com 1 ... -0.044634 -0.180167 0
2 2 youtube.com 2 ... 0.172028 0.002102 0
3 3 yahoo.com 3 ... 0.286067 -0.269647 0
4 4 baidu.com 4 ... 0.034892 0.445554 0
我们可以看到,第一列 Unnamed:0 ,第三列Unnamed:0,这两列是我们不想需要的数据,产生原因是我们在生成csv文件的时候,采用的是默认参数,我们可以在生成csv时候,可以使用下面参数解决这一个问题。
to_csv()时候,设置index=False。或者加上index=True, index_label="id"
另外有其他同学会说了,我不想重复的再进行一遍数据处理工作,我就想在我们生成这个CSV中处理,一样是可以的,事实是我也是这么做的。
import pandas as pd
data = pd.read_csv('finalData.csv')
print('一共有多少个样本呢?', len(data))
print('展示样本前4个数据')
print(data.head())
print('打印样本集的其他详细信息:')
print(data.info())
print('=============================开始处理:==============================')
newData = data.loc[:, ~data.columns.str.contains('^Unnamed')]
print(newData.head())
newData.to_csv('myVecData.csv', index=False)
别忘了index=False,不然又生成一列新的这个不讨人喜欢的东西了。列处理也是一样,有参数column=False,不再赘述。
最后效果:
=============================开始处理:==============================
ip 0 1 ... 766 767 class
0 google.com 0.282674 -0.359200 ... 0.376452 0.148091 0
1 facebook.com 0.542586 -0.390693 ... -0.044634 -0.180167 0
2 youtube.com 0.598675 -0.679748 ... 0.172028 0.002102 0
3 yahoo.com 0.212740 -0.823602 ... 0.286067 -0.269647 0
4 baidu.com 0.017386 -0.355357 ... 0.034892 0.445554 0
补充:【pandas】pandas每次使用append追加行时都生成一个Unnamed列
pandas每次使用append追加行时多出一个Unnamed列!
解决办法:
追加行数据前,read_csv函数读取数据时, 增加 index_col 参数,指定哪一行为索引行。
如:
test = pd.read_csv(filename,index_col=0)
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。
来源:https://blank.blog.csdn.net/article/details/102980056
猜你喜欢
- 最近在做文章页盖楼显示的项目,数据来源是跟贴系统生成的UTF8格式的JSON数据。文章页的HTML编码格式是GB2312,在javascri
- Float(浮动)概念也许是CSS中最让人迷惑的一个概念吧。Float经常被错误理解,而且因为将上下文元素全部浮动导致的可读性、
- 本文实例分析了Go语言中普通函数与方法的区别。分享给大家供大家参考。具体分析如下:1.对于普通函数,接收者为值类型时,不能将指针类型的数据直
- 第一个测试 “Hello Test!”首先,在我们$GOPATH/src目录下创建hello目录,作为本文涉及到的所有示例代码的根目录。然后
- 曾有位网友遇到这样一个问题:产品名称为“A&T Plastic”,在产品列表中需要做这样的超链接,<a href="
- 如下所示:import numpy as npZ=np.random.random((5,5))Zmax,Zmin=Z.max(axis=0
- global.asa<SCRIPT LANGUAGE="VBScript" RUNAT=&qu
- 前言在pytorch中, 想删除tensor中的指定行列,原本以为有个函数或者直接把某一行赋值为[]就可以,结果发现没这么简单,因此用了一个
- 最近一段时间都在学django,现在的网站基本都要使用到富文本编辑器,今天就记录下使用django的管理后台的一个富文本编辑器的第三方库 D
- 【问题描述】在系统管理进行手工备份时,出现提示“无法打开备份设备'E:\自动备份\ufidau8xTmp\UFDATA.BAK
- 前言新手程序员大概有如下特点if嵌套经常超过3层、经常出现重复代码、单个函数代码特别长。只会crud,对语言特性和语言的边界不了解。不懂面向
- 解析器解析器的作用就是服务端接收客户端传过来的数据,把数据解析成自己想要的数据类型的过程.本质就是对请求体中的数据进行解析.Content-
- 1.先检查系统是否装有mysqlrpm -qa | grep mysql2.下载mysql的repo源(5.7)wget -i -c htt
- 在sql语句中,我们难免会用到单引号嵌套的时候,但是直接嵌套肯定是不行的,java中用反斜杠做转义符也是不行的,在sql中是用单引号来做转义
- 测试系统环境 Windows 2003 python 2.5.1
- Python是一种解释型、面向对象、动态数据类型的高级程序设计语言,本文就举一例Python类继承的实例。实例代码如下:#! /usr/bi
- 本文实例讲述了Laravel框架实现定时发布任务的方法。分享给大家供大家参考,具体如下:背景:需要每隔一小时新建一个任务http://lar
- 如下所示:# -*-coding:utf-8-*-from pandas import DataFrameimport pandas as
- Bootstrap提供了四种用于<img>类的样式,分别是:.img-rounded:圆角 (IE8 不支持),添加 borde
- Xajax是PHP一个不用刷新或者跳到其他页面,就能通过点击组件等与后台后台数据库交互的技术Xajax是php的一个插件,要想使用Xajax






